भारत में घरेलू आर्टिफ़िशियल इंटेलिजेंस फाउंडेशनल मॉडल होने की सोच को तब बल मिला जब Google समेत ग्लोबल टेक कम्पनियों द्वारा बनाए गए कुछ लार्ज लैंगुएज मॉडल्स (LLMs) के खिलाफ सटीकता और पक्षपात को लेकर सवाल खड़े होने लगे। अब भारत अपना खुद का ChatGPT AI मॉडल Hanooman लॉन्च करने वाला है।
‘Hanooman’ ओपन-सोर्स इंडिक लैंगुएज AI मॉडल्स की एक शृंखला है जिसका नाम हिन्दू देवता हनुमान के नाम पर रखा गया है और यह बॉम्बे के भारतीय तकनीकी संस्थान द्वारा एक ऐसे ही प्रोजेक्ट का नतीजा है। Hanooman को Seetha Mahalakshmi Healthcare (SML) के साथ पार्टनरशिप में विकसित किया गया है और यह कई सारी भारतीय भाषाओं में टेक्स्ट और स्पीच दोनों जनरेट कर सकता है। इस मॉडल के पहले वर्जन को मार्च के आखिर में लॉन्च किया जाएगा। SML में प्रोजेक्ट्स के निर्देशक Amol Gite ने कहा कि इस ओपन-सोर्स मॉडल के पहले वर्जन को संभावित तौर पर 7 बिलियन पैरामीटर के साथ लॉन्च किया जाएगा।
केंद्र सरकार का AI मिशन, जिसके तहत यह 10000 ग्राफिक्स प्रोसेसिंग यूनिट (GPU) स्थापित करने की योजना बना रही है, ऐसे प्रोजेक्ट्स के लिए काम आ सकता है। Hanooman का पहला वर्जन 11 भारतीय भाषाओं में बातचीत करेगा। आगे आने वाले वर्जन्स में इस क्षमता को सभी 22 आधिकारिक भारतीय भाषाओं तक बढ़ा दिया जाएगा।
Gite ने कहा कि, अब तक कई राज्यों जैसे तमिलनाडू, कर्नाटक और तेलंगाना ने हनुमान परियोजना के साथ सहयोग करने में दिलचस्पी दिखाई है।
हनुमान वर्तमान में स्वास्थ्य देखभाल पेशेवरों के सामने आने वाली चुनौतियों को समझने पर ध्यान दे रहा है, जिससे यह डॉक्टरों की बातचीत को रिकॉर्ड करने और समराइज़ करने के लिए ऑटोमैटिक स्पीच समराइजेशन का लाभ देगा।
वहीं शिक्षा क्षेत्र में इस मॉडल का इस्तेमाल छात्रों के होमवर्क को लेकर उनकी मदद करने और शिक्षकों को परिणाम गतिविधियों को सीखने में मदद करने के लिए किया जा सकता है।
Ramakrishnan ने कहा, “हर क्षेत्र की अपनी अलग बारीकियाँ हैं। आपके केवल फाउंडेशनल मॉडल बना दिया इसका मतलब यह नहीं है कि आपका काम हो गया…शिक्षा क्षेत्र में आपको स्पीच मॉडलिटी से निपटना होगा। इसके अलावा आपको अलग-अलग समय पर अलग-अलग एक्सेंट और अलग-अलग बोलियों को कैप्चर करने में भी सक्षम होना जरूरी है।”
इस प्रोजेक्ट में बैंकिंग और फाइनेंस और मनोरंजन जैसी अनुवाद संबंधी चुनौतियों जैसे अन्य उद्योगों की ओर से भी दिलचस्पी देखी गई है। हनुमान ने पहले ही उद्योगों के साथ जुड़ना शुरू कर दिया है उनमें से कुछ के लिए सॉल्यूशन देना भी शुरू कर दिया है। साथ ही यह एंटरप्राइज़ ग्राहकों के लिए एक क्लोज़्ड-सोर्स मॉडल पेश करने की भी सोच रहा है।
Gite ने कहा, “एंटरप्राइज़ वर्तमान में ChatGPT जैसे मॉडल्स का इस्तेमाल करते हैं और हर ट्रांजैक्शन के लिए भारी रकम चुकाते हैं। साथ ही उनके लिए सबसे बड़ी चिंता डेटा साझा होने की है। अगर हम कुछ ऐसा पेश कर रहे हैं जो उनके अपने परिसर में होगा, तो मुझे नहीं लगता कि इसका मुद्दा लागत होगा, बल्कि क्षमता एक सवाल होगी।”
आगे उन्होंने कहा कि उद्योग की मांग के आधार पर हनुमान GPUs की संख्या को वर्तमान की 1,024 से बढ़ाने की योजना बना रहा है।
Ramakrishnan ने कहा, SML फाउंडर Vishnu Vardhan हनुमान परियोजना में एक निवेशक हैं।
Vardhan स्वास्थ्य देखभाल के लिए फाउंडेशन मॉडल्स बनाने के लिए IIT-B के साथ जुड़े। उन्होंने बड़े पैमाने पर कंप्युटेशनल क्षमता प्राप्त करने के लिए हनुमान परियोजना में निवेश किया, जो इस तरह के मॉडल्स बनाने के लिए आवश्यक है। उन्होंने कहा कि बाकी योगदानों पर अभी चर्चा चल रही है और उन्हें फाइनलाइज़ किया जाना अभी बाकी है।
जनता को मुंबई में सालाना नैसकॉम IT उद्योग सम्मेलन के दौरान हनुमान की पहली झलक मिली। प्रदर्शित वीडियो में AI मॉडल की क्षमताओं को दर्शाया गया था जिसमें एक मोटरसाइकल मकैनिक, बैंकर और एक डेवलपर अपनी मूल भाषाओं में टूल से बातचीत कर रहे थे।
भारतीय उद्यमी फाउंडेशनल लैंगुएज मॉडल्स की ट्रेनिंग के लिए भारतीय भाषाओं में डेटासेट्स की उपलब्धता पर पहले सवाल उठा चुके हैं। एक AI स्टार्टअप के फाउंडर ने कहा, “अंग्रेजी-आधारित चैटबॉट्स सिस्टम में काफी समय से हैं लेकिन प्रमुख समस्या स्थानीय भाषाओं के लिए बॉट्स बनाने में आती है, खासकर जिनके स्रोत कम हैं। LLMs को बनाने और ट्रेन करने के लिए स्रोतों की आवश्यकता होती है लेकिन सवाल यह उठता है कि डेटासेट्स कहाँ से आएंगे।”
नोट: यहाँ दर्शाई गई सभी इमेजेस काल्पनिक हैं!