प्रौद्योगिकी

DeepSeek V4: GPT-5 से पाँच गुना सस्ता, Nvidia चिप के बिना चलता है

Susan Hill

R1 के साथ Nvidia के शेयर गिराने वाली चीनी प्रयोगशाला अब और बड़ा, बहुत सस्ता और चीनी हार्डवेयर के लिए ख़ास तौर पर तैयार किया गया संस्करण लेकर लौटी है। V4-Pro अब तक बना सबसे बड़ा ओपन सोर्स AI मॉडल है, और दोनों संस्करण MIT लाइसेंस के साथ Hugging Face पर मौजूद हैं। क़ीमत OpenAI और Anthropic की मौजूदा दरों से कहीं नीचे है।

DeepSeek ने V4-Pro और V4-Flash का प्रीव्यू संस्करण जारी कर दिया है। ये दोनों ओपन सोर्स भाषा मॉडल एक साफ़ बात कह रहे हैं — दस लाख टोकन का संदर्भ संभालना अब क्षमता का सवाल नहीं रहा, सिर्फ़ कार्यक्षमता का सवाल है। V4-Pro में कुल 1.6 ट्रिलियन पैरामीटर हैं, जिनमें से हर क्वेरी पर 49 अरब सक्रिय रहते हैं — पूरे कोडबेस या एक पूरी किताब को एक ही प्रॉम्प्ट में संभालने के लिए काफ़ी। यह पहली बार है जब कोई ओपन मॉडल गणित, प्रोग्रामिंग और एजेंट कार्यों में शीर्ष के बंद मॉडलों से सीधे टक्कर ले रहा है — और वो भी OpenAI और Anthropic की मौजूदा क़ीमत के एक छोटे हिस्से पर।

YouTube video

दो मॉडल, अलग रूप

दोनों मॉडल MIT लाइसेंस के तहत आते हैं और वज़न पहले ही Hugging Face पर सार्वजनिक हो चुके हैं। V4-Flash कुशल संस्करण है — कुल 284 अरब पैरामीटर और 13 अरब सक्रिय, यानी इतना कॉम्पैक्ट कि क्वांटाइज़्ड संस्करण एक हाई-एंड लैपटॉप पर भी चल सके। V4-Pro फ़्लैगशिप है — डिस्क पर 865 गीगाबाइट, क्लाउड डिप्लॉयमेंट और अनुसंधान प्रयोगशालाओं के लिए डिज़ाइन किया गया। दोनों मॉडलों में दस लाख टोकन का एक जैसा संदर्भ विंडो है — यह छलांग Google के Gemini की बराबरी करती है, और ज़्यादातर प्रतिस्पर्धी ओपन मॉडलों की तुलना में दोगुना है।

हाइब्रिड अटेंशन का असर

मुख्य आर्किटेक्चरल डिज़ाइन का नाम है हाइब्रिड अटेंशन। DeepSeek ने दो कम्प्रेशन तकनीकें मिलाकर मेमोरी की लागत इतनी आक्रामक तरीके से नीचे लायी है कि V4-Pro उसी संदर्भ लंबाई पर V3.2 की केवल 27 प्रतिशत कंप्यूट और 10 प्रतिशत कैश इस्तेमाल करता है। V4-Flash इससे भी आगे जाता है।

असर सीधा है — V4-Pro पर दस लाख टोकन वाला प्रॉम्प्ट चलाने की लागत आज पिछली पीढ़ी पर एक लाख टोकन वाला प्रॉम्प्ट चलाने से कम है। यह सिर्फ़ तकनीकी बारीकी नहीं है — यह वो आर्थिक शर्त है जिसके बिना लंबे संदर्भ वाले मॉडल प्रयोगशाला के डेमो से बाहर निकलकर असली व्यापारिक उत्पाद नहीं बन सकते।

क़ीमतों का झटका

इस लॉन्च का सबसे तीखा वार क़ीमतों के मोर्चे पर है। V4-Flash की क़ीमत प्रति दस लाख इनपुट टोकन सिर्फ़ 0.14 डॉलर है — OpenAI के GPT-5.4 Nano से भी कम। V4-Pro प्रति दस लाख इनपुट टोकन के लिए 1.74 डॉलर और प्रति दस लाख आउटपुट टोकन के लिए 3.48 डॉलर लेता है — Anthropic Claude Opus 4.7 के लिए जो वसूलता है उसका तीसरा हिस्सा, और OpenAI GPT-5.5 के लिए जो वसूलता है उसका पाँचवाँ हिस्सा।

प्रोग्रामिंग बेंचमार्क में V4-Pro ने Codeforces पर 3,206 की रेटिंग दर्ज की है। DeepSeek के मुताबिक़ यह आंकड़ा इस मॉडल को दुनिया भर के मानव प्रतियोगी प्रोग्रामरों के बीच 23वें स्थान पर रखेगा।

भू-राजनीतिक मायने

भू-राजनीतिक नज़रिया बेंचमार्क के आँकड़ों से कम भारी नहीं है। DeepSeek ने V4 को Huawei की Ascend 950 चिप और चीनी कंपनी Cambricon के सिलिकॉन के लिए ऑप्टिमाइज़ किया, और Nvidia या AMD को परफ़ॉर्मेंस कैलिब्रेशन के लिए शुरुआती पहुँच नहीं दी — यह उद्योग की मानक प्रथा का उल्टा क़दम है।

यह लॉन्च असल में चीन की उस पूरी तकनीकी आपूर्ति श्रृंखला का व्यावसायिक स्ट्रेस टेस्ट है जो सालों से वॉशिंगटन के निर्यात प्रतिबंधों के तहत काम कर रही है। यूरोप के लिए सवाल और गहरा हो जाता है — जब बीजिंग खुले वज़न, घरेलू चिप और अपना ख़ुद का इन्फ़रेंस सॉफ़्टवेयर वाली एक सम्पूर्ण संप्रभु श्रृंखला खड़ी कर रहा है, और वॉशिंगटन अपनी वाली श्रृंखला को क़ानून के ज़रिए बंद कर रहा है, तब यूरोप की डिजिटल संप्रभुता ढाँचागत स्तर पर दोनों खेमों के बुनियादी ढाँचे पर निर्भर रह जाती है।

एहतियात के पहलू

कुछ अहम आपत्तियाँ भी हैं। V4 अभी प्रीव्यू संस्करण है, प्रोडक्शन रिलीज़ नहीं। तीसरे पक्ष के स्वतंत्र बेंचमार्क अभी पूरे नहीं हुए हैं। DeepSeek की अपनी तकनीकी रिपोर्ट यह स्वीकार करती है कि अग्रिम-पंक्ति क्षमता के मामले में यह मॉडल GPT-5.4 और Gemini 3.1 Pro से तीन से छह महीने पीछे है।

इसका पूर्ववर्ती R1 लॉन्च के कुछ ही हफ़्तों के भीतर अमेरिका के कई राज्यों, ऑस्ट्रेलिया, ताइवान, दक्षिण कोरिया, डेनमार्क और इटली में प्रतिबंधित या सीमित कर दिया गया था — V4 इन्हीं बाज़ारों में वही नियामक जोखिम पूरी तरह विरासत में पाता है। पेंटागन के ठेकेदारों पर अमेरिका के 2026 के NDAA क़ानून के तहत DeepSeek के मॉडलों के इस्तेमाल पर भी प्रतिबंध है — सिवाय इसके कि उन्हें कोई स्पष्ट छूट मिले।

इन सीमित दायरों के बाहर पहुँच फ़ौरन उपलब्ध है। DeepSeek का वेब चैटबॉट Expert मोड में V4-Pro और Instant मोड में V4-Flash मुफ़्त उपलब्ध कराता है, और डेवलपर्स API कॉल में मॉडल का नाम बदलकर deepseek-v4-pro या deepseek-v4-flash करके सीधे इस्तेमाल कर सकते हैं।

यह लॉन्च ठीक उस दिन के एक साल बाद हुआ है जब DeepSeek-R1 ने 20 जनवरी 2025 को दुनिया भर के AI बाज़ारों को हिला दिया था — कैलेंडर सोच-समझकर चुना गया है। प्रीव्यू चरण के बाद की आख़िरी API क़ीमत अभी तय नहीं हुई है, और पुराने एंडपॉइंट deepseek-chat और deepseek-reasoner 24 जुलाई 2026 को बंद कर दिए जाएंगे — उसी दिन सारा ट्रैफ़िक अपने आप V4 पर शिफ़्ट हो जाएगा।

यहाँ जो दाँव पर है वह किसी एक बेंचमार्क से बहुत बड़ा है — यह पहला सार्वजनिक प्रमाण है कि एक प्रतिस्पर्धी महाशक्ति अमेरिकी आपूर्तिकर्ताओं पर निर्भर हुए बिना एक मुकम्मल, प्रतिस्पर्धी और सस्ते AI स्टैक की डिलीवरी कर सकती है। और यही एक प्रमाण आगे की हर संप्रभु AI रणनीति के निर्देशांक नए सिरे से तय करने के लिए काफ़ी है।

चर्चा

0 टिप्पणियाँ हैं।