प्रौद्योगिकी

Claude Fable 5 18 दिनों बाद वापस ऑनलाइन: Anthropic ने जेलब्रेक रोका, मॉडल को नहीं

Adrian Kessler

Anthropic का सबसे सक्षम सार्वजनिक AI मॉडल Claude Fable 5 अब दुनिया भर में उपलब्ध है। यह वापसी अट्ठारह दिनों के पूर्ण निलंबन के बाद हुई है, जो तब शुरू हुई जब अमेरिकी सरकार ने निर्यात नियंत्रण लागू किए जिनके तहत Anthropic को वास्तविक समय में उपयोगकर्ताओं की नागरिकता सत्यापित करना था। Claude के वैश्विक उपयोगकर्ता आधार के पैमाने पर यह संभव न पाते हुए कंपनी ने आंशिक अनुपालन के बजाय पूर्ण पहुंच निलंबन का विकल्प चुना।

नियंत्रणों को ट्रिगर करने वाली तकनीक Amazon के शोधकर्ताओं द्वारा खोजी गई एक विशेष जेलब्रेक विधि थी। इस विधि ने Fable 5 का उपयोग सॉफ्टवेयर कमजोरियों की मैपिंग के लिए किया, जो अमेरिकी निर्यात प्रतिबंधों के तहत कुछ विदेशी नागरिकों के लिए निषिद्ध है। आंतरिक जांच में कुछ ऐसा सामने आया जो नियामक तर्क को जटिल बनाता है: समान श्रेणी की कमजोरियों की पहचान बहुत कम सक्षम मॉडलों जैसे Opus 4.8, GPT-5.5 और Kimi K2.7 से भी की जा सकती थी। दूसरे शब्दों में, यह क्षमता Fable 5 के लिए विशेष नहीं थी।

वह समाधान जिसने नियंत्रणों को खोला

जो बदला वह है एक नया सुरक्षा वर्गीकरणकर्ता जो Amazon द्वारा प्रलेखित बाईपास तकनीक को विशेष रूप से ब्लॉक करने के लिए प्रशिक्षित किया गया है। Anthropic के अनुसार यह प्रकट की गई विधि को 99 प्रतिशत से अधिक मामलों में पकड़ता है। यह भविष्य के जेलब्रेक के खिलाफ संपूर्ण सुरक्षा का दावा नहीं है — यह एक ज्ञात कमजोरी के लिए एक लक्षित सुधार है। वर्गीकरणकर्ता इनपुट स्तर पर काम करता है, प्रलेखित पैटर्न से मेल खाने वाले अनुरोधों को मॉडल द्वारा संसाधित करने से पहले पुनर्निर्देशित करता है।

व्यापक निहितार्थ AI नियमन के विकास के लिए महत्वपूर्ण है। Fable 5 पर निर्यात नियंत्रण इसलिए नहीं लगाए गए क्योंकि मॉडल विशेष रूप से नुकसान को सक्षम करता था, बल्कि इसलिए कि एक ज्ञात तकनीक ने इसका शोषण किया। वे इसलिए नहीं हटाए गए क्योंकि नियामक ढांचे ने वह प्रश्न हल किया, बल्कि इसलिए कि एक वर्गीकरणकर्ता ने प्रलेखित अंतराल को बंद किया। Anthropic Amazon, Microsoft और Google के साथ AI जेलब्रेक की गंभीरता के मूल्यांकन के लिए एक साझा ढांचे पर काम कर रहा है, चार मानदंडों पर: क्षमता लाभ, उस लाभ की व्यापकता, हथियारीकरण की आसानी, और पता लगाने योग्यता। वह ढांचा अभी सार्वजनिक मानक के रूप में मौजूद नहीं है।

मॉडल क्या करता है और इसकी लागत कितनी है

मॉडल स्वयं अपरिवर्तित है। Fable 5 मांगलिक दीर्घकालिक तर्क और एजेंटिक कार्य के लिए बनाया गया है — ऐसे कार्य जिनके लिए प्रत्येक चरण पर मानव हस्तक्षेप के बिना लंबी अनुक्रमों में योजना, निष्पादन और पाठ्यक्रम सुधार की आवश्यकता होती है। इसकी संदर्भ विंडो दस लाख टोकन है, जो डिफ़ॉल्ट मान भी है। प्रति प्रतिक्रिया अधिकतम आउटपुट 1,28,000 टोकन है। सोच हमेशा सक्रिय रहती है और कच्ची तर्क श्रृंखला के बजाय पठनीय सारांश के रूप में वापस की जाती है।

पहुंच उन शर्तों के साथ आती है जो निलंबन से पहले लागू नहीं थीं। Fable 5 अब 30 दिन के डेटा प्रतिधारण की आवश्यकता है — यह शून्य-प्रतिधारण समझौतों के तहत उपलब्ध नहीं है। यह स्वास्थ्य सेवा, कानूनी और सरकारी संदर्भों में संगठनों को सीधे प्रभावित करता है जहां शून्य-प्रतिधारण समझौते अक्सर AI उपकरण अपनाने के लिए आधार आवश्यकता होती है। कीमत Opus स्तर से ऊपर है: प्रति दस लाख इनपुट टोकन दस डॉलर, प्रति दस लाख आउटपुट पचास डॉलर। सुरक्षा वर्गीकरणकर्ताओं को ट्रिगर करने वाले अनुरोधों को अस्वीकार करने के बजाय एक फ़ॉलबैक मॉडल द्वारा पूरा किया जा सकता है, और वह प्रतिस्थापन अंत उपयोगकर्ता को दिखाई देता है या नहीं यह प्रत्येक ऑपरेटर की कॉन्फ़िगरेशन पर निर्भर करता है।

उपलब्धता

Fable 5 का एक सहोदर मॉडल है, Claude Mythos 5, जिसमें समान बुनियादी क्षमताएं और समान मूल्य निर्धारण है, लेकिन आक्रामक साइबर सुरक्षा कार्य हैं जो Fable 5 में नहीं हैं। Mythos 5 एक अलग पहुंच स्तर, Project Glasswing के माध्यम से उपलब्ध है। दोनों मॉडल एक साथ वापस नहीं आए: Mythos 5 की पहुंच Fable 5 की वैश्विक वापसी से एक सप्ताह पहले कुछ अमेरिकी संगठनों के लिए बहाल की गई थी।

Fable 5 अभी Claude Platform, Claude.ai, Claude Code और Claude Cowork पर उपलब्ध है। Pro, Max, Team और कुछ Enterprise प्लान के लिए मॉडल 7 जुलाई तक साप्ताहिक उपयोग सीमाओं के 50 प्रतिशत तक शामिल है, जिसके बाद यह उपयोग-क्रेडिट मूल्य निर्धारण में बदल जाता है। AWS, Google Cloud और Microsoft Foundry के माध्यम से पहुंच चरणों में बहाल की जा रही है। अगली बाईपास तकनीक सामने आने पर क्या होगा इसे नियंत्रित करने वाला ढांचा अभी निर्माणाधीन है।

टैग: , , , , ,

चर्चा

0 टिप्पणियाँ हैं।