Ollama 0.22.1 ने Gemma 4 का टूल कॉलिंग बिना API key के लैपटॉप पर ला दिया

Ollama 0.22.1 एक अद्यतन Gemma 4 रेंडरर लेकर आता है, जो आख़िरकार स्थानीय AI के गंभीर काम के लिए मायने रखने वाली दो क्षमताओं का समर्थन करता है: स्पष्ट थिंकिंग मोड और फ़ंक्शन या टूल कॉलिंग। टूल कॉलिंग मॉडल को ख़ुद यह तय करने देती है कि कब किसी बाहरी फ़ंक्शन को बुलाया जाए — कोई वेबपेज खोलना, किसी डेटाबेस से सवाल पूछना, कोई गणना चलाना — और फिर वह नतीजे को अपनी ही तर्क-रेखा में बुन लेता है। थिंकिंग मोड मॉडल के बीच के चरणों को सामने रख देता है ताकि कोई एप्लिकेशन उन्हें पकड़कर उन पर काम कर सके। दोनों ही अब तक उन सुविधाओं में थे, जिनके लिए बड़े क्लाउड API पैसे लेते थे। दोनों अब बिना किसी बाहरी सेवा के, Gemma 4 के साथ स्थानीय रूप से चलते हैं।

यह ख़बर किसी और मॉडल रिलीज़ से ज़्यादा भारी इसलिए है क्योंकि हार्डवेयर का हिसाब बदलता है। Google ने Apache-2.0 लाइसेंस के तहत जो Gemma 4 परिवार जारी किया है, वह चार आकारों को समेटता है: E2B, E4B, 26B A4B और 31B। छोटे रूप एकीकृत ग्राफ़िक्स और बारह से सोलह गीगाबाइट RAM वाले हाल के लैपटॉप पर चलते हैं। 26B A4B और 31B संस्करण एक डेस्कटॉप GPU माँगते हैं, पर फिर भी साफ़ तौर पर उपभोक्ता क्षेत्र के भीतर बने रहते हैं। वही आर्किटेक्चर जिसके लिए पहले पेड API अनुबंध या चार अंकों वाला होम सर्वर ज़रूरी था, अब किसी भी क़ायदे-क़ाबिल मशीन वाले व्यक्ति के लिए एक शनिवार दोपहर का इंस्टॉल बन गया है।

जो लोग प्रोग्रामिंग नहीं करते उनके लिए असली नतीजा यह है कि एजेंट जैसी एप्लिकेशनों की पूरी एक श्रेणी — जो आपका ईमेल पढ़ती है, जवाब का मसौदा बनाती है, दस्तावेज़ खींचती है, फ़ॉर्म भरती है, मीटिंगों का सार बनाती है — को अब वह डेटा किसी तीसरे पक्ष के सर्वर पर भेजने की ज़रूरत नहीं। गोपनीयता को लेकर सजग कोई उपयोगकर्ता जो असली एजेंट ऑटोमेशन चाहता था, उसके पास अब तक दो रास्ते थे: किसी क्लाउड प्रदाता की डेटा नीति पर भरोसा करना, या टूल कॉलिंग के बिना स्थानीय रूप से कहीं कमज़ोर मॉडल चलाना। बीच का रास्ता एक छेद था और Ollama 0.22.1 इस छेद को Gemma 4 की वज़न श्रेणी के लिए बंद करता है।

संदेहवादी पाठ यह है कि Ollama और Gemma 4 क्लाउड के अग्रिम मोर्चे के बराबर नहीं हैं। स्थानीय रूप से चलाया गया 31B मॉडल जटिल तर्क में Anthropic के Claude या OpenAI के GPT-5 के स्तर तक नहीं पहुँचता। लंबी श्रृंखलाओं पर टूल कॉल की सटीकता छोटे रूपों में स्पष्ट रूप से कमज़ोर है। बहु-माध्यम इनपुट चलते तो हैं, पर धीमे। और एकीकरण का बोझ उपयोगकर्ता पर ही पड़ता है: Gemma 4 जोड़ Ollama पर बना कोई एजेंट ऐप, जो किसी तैयार SaaS वर्कफ़्लो से होड़ कर सके, इतना तराशा हुआ अभी तक किसी ने नहीं बनाया है। हार्डवेयर की छत और सॉफ़्टवेयर की चमक अब भी असली कमज़ोरियाँ हैं।

यह रिलीज़ अभी macOS, Linux और Windows के लिए Ollama के मानक इंस्टॉलर के ज़रिए उपलब्ध है। Gemma 4 के वज़न Ollama की मॉडल लाइब्रेरी में gemma4 नेमस्पेस के तहत रखे हैं और 0.22.1 का रनटाइम बदलाव डाउनलोड होते ही किसी भी आकार पर अपने आप लागू हो जाता है।

Ollama 0.22.1 ने Gemma 4 का टूल कॉलिंग बिना API key के लैपटॉप पर ला दिया

इसी तरह के लेख

SpaceX के IPO दस्तावेज़ में Anthropic की सालाना 15 अरब डॉलर की Colossus लागत उजागर

हो सकता है आपका फ़ोन या राउटर उन 1.7 करोड़ डिवाइस में से एक था जिन्हें चुपके से किराये पर दिया गया

एप्पल ने TinyGPU को मंजूरी दी, Mac Mini बना AI का पावरहाउस

मोटोरोला का Razr Ultra महज़ 8 मिनट में पूरे दिन की बैटरी चार्ज करता है — कीमत 1,499 डॉलर

xAI का 99 डॉलर का Grok Build CLI आपके टर्मिनल में सीधे Claude Code पर हमला बोलता है

Spotify Premium पर अब Peloton के 1,400 वर्कआउट मुफ़्त — साइकिल की भी ज़रूरत नहीं

चर्चा