प्रौद्योगिकी

Ollama 0.22.1 ने Gemma 4 का टूल कॉलिंग बिना API key के लैपटॉप पर ला दिया

Susan Hill

Ollama 0.22.1 एक अद्यतन Gemma 4 रेंडरर लेकर आता है, जो आख़िरकार स्थानीय AI के गंभीर काम के लिए मायने रखने वाली दो क्षमताओं का समर्थन करता है: स्पष्ट थिंकिंग मोड और फ़ंक्शन या टूल कॉलिंग। टूल कॉलिंग मॉडल को ख़ुद यह तय करने देती है कि कब किसी बाहरी फ़ंक्शन को बुलाया जाए — कोई वेबपेज खोलना, किसी डेटाबेस से सवाल पूछना, कोई गणना चलाना — और फिर वह नतीजे को अपनी ही तर्क-रेखा में बुन लेता है। थिंकिंग मोड मॉडल के बीच के चरणों को सामने रख देता है ताकि कोई एप्लिकेशन उन्हें पकड़कर उन पर काम कर सके। दोनों ही अब तक उन सुविधाओं में थे, जिनके लिए बड़े क्लाउड API पैसे लेते थे। दोनों अब बिना किसी बाहरी सेवा के, Gemma 4 के साथ स्थानीय रूप से चलते हैं।

यह ख़बर किसी और मॉडल रिलीज़ से ज़्यादा भारी इसलिए है क्योंकि हार्डवेयर का हिसाब बदलता है। Google ने Apache-2.0 लाइसेंस के तहत जो Gemma 4 परिवार जारी किया है, वह चार आकारों को समेटता है: E2B, E4B, 26B A4B और 31B। छोटे रूप एकीकृत ग्राफ़िक्स और बारह से सोलह गीगाबाइट RAM वाले हाल के लैपटॉप पर चलते हैं। 26B A4B और 31B संस्करण एक डेस्कटॉप GPU माँगते हैं, पर फिर भी साफ़ तौर पर उपभोक्ता क्षेत्र के भीतर बने रहते हैं। वही आर्किटेक्चर जिसके लिए पहले पेड API अनुबंध या चार अंकों वाला होम सर्वर ज़रूरी था, अब किसी भी क़ायदे-क़ाबिल मशीन वाले व्यक्ति के लिए एक शनिवार दोपहर का इंस्टॉल बन गया है।

जो लोग प्रोग्रामिंग नहीं करते उनके लिए असली नतीजा यह है कि एजेंट जैसी एप्लिकेशनों की पूरी एक श्रेणी — जो आपका ईमेल पढ़ती है, जवाब का मसौदा बनाती है, दस्तावेज़ खींचती है, फ़ॉर्म भरती है, मीटिंगों का सार बनाती है — को अब वह डेटा किसी तीसरे पक्ष के सर्वर पर भेजने की ज़रूरत नहीं। गोपनीयता को लेकर सजग कोई उपयोगकर्ता जो असली एजेंट ऑटोमेशन चाहता था, उसके पास अब तक दो रास्ते थे: किसी क्लाउड प्रदाता की डेटा नीति पर भरोसा करना, या टूल कॉलिंग के बिना स्थानीय रूप से कहीं कमज़ोर मॉडल चलाना। बीच का रास्ता एक छेद था और Ollama 0.22.1 इस छेद को Gemma 4 की वज़न श्रेणी के लिए बंद करता है।

संदेहवादी पाठ यह है कि Ollama और Gemma 4 क्लाउड के अग्रिम मोर्चे के बराबर नहीं हैं। स्थानीय रूप से चलाया गया 31B मॉडल जटिल तर्क में Anthropic के Claude या OpenAI के GPT-5 के स्तर तक नहीं पहुँचता। लंबी श्रृंखलाओं पर टूल कॉल की सटीकता छोटे रूपों में स्पष्ट रूप से कमज़ोर है। बहु-माध्यम इनपुट चलते तो हैं, पर धीमे। और एकीकरण का बोझ उपयोगकर्ता पर ही पड़ता है: Gemma 4 जोड़ Ollama पर बना कोई एजेंट ऐप, जो किसी तैयार SaaS वर्कफ़्लो से होड़ कर सके, इतना तराशा हुआ अभी तक किसी ने नहीं बनाया है। हार्डवेयर की छत और सॉफ़्टवेयर की चमक अब भी असली कमज़ोरियाँ हैं।

यह रिलीज़ अभी macOS, Linux और Windows के लिए Ollama के मानक इंस्टॉलर के ज़रिए उपलब्ध है। Gemma 4 के वज़न Ollama की मॉडल लाइब्रेरी में gemma4 नेमस्पेस के तहत रखे हैं और 0.22.1 का रनटाइम बदलाव डाउनलोड होते ही किसी भी आकार पर अपने आप लागू हो जाता है।

चर्चा

0 टिप्पणियाँ हैं।