ChatGPT Hanooman: भारत का अपना AI मॉडल हर मामले में होगा सबसे अडवांस, इसी महीने हो रहा लॉन्च
'Hanooman' ओपन-सोर्स इंडिक लैंगुएज AI मॉडल्स की एक शृंखला है जिसका नाम हिन्दू देवता हनुमान के नाम पर रखा गया है।
Hanooman का पहला वर्जन 11 भारतीय भाषाओं में बातचीत करेगा।
केंद्र सरकार अपने AI मिशन के तहत 10000 ग्राफिक्स प्रोसेसिंग यूनिट (GPU) स्थापित करने की योजना बना रही है।
भारत में घरेलू आर्टिफ़िशियल इंटेलिजेंस फाउंडेशनल मॉडल होने की सोच को तब बल मिला जब Google समेत ग्लोबल टेक कम्पनियों द्वारा बनाए गए कुछ लार्ज लैंगुएज मॉडल्स (LLMs) के खिलाफ सटीकता और पक्षपात को लेकर सवाल खड़े होने लगे। अब भारत अपना खुद का ChatGPT AI मॉडल Hanooman लॉन्च करने वाला है।
ChatGPT Hanooman क्या है?
‘Hanooman’ ओपन-सोर्स इंडिक लैंगुएज AI मॉडल्स की एक शृंखला है जिसका नाम हिन्दू देवता हनुमान के नाम पर रखा गया है और यह बॉम्बे के भारतीय तकनीकी संस्थान द्वारा एक ऐसे ही प्रोजेक्ट का नतीजा है। Hanooman को Seetha Mahalakshmi Healthcare (SML) के साथ पार्टनरशिप में विकसित किया गया है और यह कई सारी भारतीय भाषाओं में टेक्स्ट और स्पीच दोनों जनरेट कर सकता है। इस मॉडल के पहले वर्जन को मार्च के आखिर में लॉन्च किया जाएगा। SML में प्रोजेक्ट्स के निर्देशक Amol Gite ने कहा कि इस ओपन-सोर्स मॉडल के पहले वर्जन को संभावित तौर पर 7 बिलियन पैरामीटर के साथ लॉन्च किया जाएगा।
केंद्र सरकार का AI मिशन, जिसके तहत यह 10000 ग्राफिक्स प्रोसेसिंग यूनिट (GPU) स्थापित करने की योजना बना रही है, ऐसे प्रोजेक्ट्स के लिए काम आ सकता है। Hanooman का पहला वर्जन 11 भारतीय भाषाओं में बातचीत करेगा। आगे आने वाले वर्जन्स में इस क्षमता को सभी 22 आधिकारिक भारतीय भाषाओं तक बढ़ा दिया जाएगा।
Gite ने कहा कि, अब तक कई राज्यों जैसे तमिलनाडू, कर्नाटक और तेलंगाना ने हनुमान परियोजना के साथ सहयोग करने में दिलचस्पी दिखाई है।
Hanooman का इस्तेमाल कहाँ-कहाँ किया जा सकता है?
हनुमान वर्तमान में स्वास्थ्य देखभाल पेशेवरों के सामने आने वाली चुनौतियों को समझने पर ध्यान दे रहा है, जिससे यह डॉक्टरों की बातचीत को रिकॉर्ड करने और समराइज़ करने के लिए ऑटोमैटिक स्पीच समराइजेशन का लाभ देगा।
वहीं शिक्षा क्षेत्र में इस मॉडल का इस्तेमाल छात्रों के होमवर्क को लेकर उनकी मदद करने और शिक्षकों को परिणाम गतिविधियों को सीखने में मदद करने के लिए किया जा सकता है।
Ramakrishnan ने कहा, “हर क्षेत्र की अपनी अलग बारीकियाँ हैं। आपके केवल फाउंडेशनल मॉडल बना दिया इसका मतलब यह नहीं है कि आपका काम हो गया…शिक्षा क्षेत्र में आपको स्पीच मॉडलिटी से निपटना होगा। इसके अलावा आपको अलग-अलग समय पर अलग-अलग एक्सेंट और अलग-अलग बोलियों को कैप्चर करने में भी सक्षम होना जरूरी है।”
इस प्रोजेक्ट में बैंकिंग और फाइनेंस और मनोरंजन जैसी अनुवाद संबंधी चुनौतियों जैसे अन्य उद्योगों की ओर से भी दिलचस्पी देखी गई है। हनुमान ने पहले ही उद्योगों के साथ जुड़ना शुरू कर दिया है उनमें से कुछ के लिए सॉल्यूशन देना भी शुरू कर दिया है। साथ ही यह एंटरप्राइज़ ग्राहकों के लिए एक क्लोज़्ड-सोर्स मॉडल पेश करने की भी सोच रहा है।
Gite ने कहा, “एंटरप्राइज़ वर्तमान में ChatGPT जैसे मॉडल्स का इस्तेमाल करते हैं और हर ट्रांजैक्शन के लिए भारी रकम चुकाते हैं। साथ ही उनके लिए सबसे बड़ी चिंता डेटा साझा होने की है। अगर हम कुछ ऐसा पेश कर रहे हैं जो उनके अपने परिसर में होगा, तो मुझे नहीं लगता कि इसका मुद्दा लागत होगा, बल्कि क्षमता एक सवाल होगी।”
आगे उन्होंने कहा कि उद्योग की मांग के आधार पर हनुमान GPUs की संख्या को वर्तमान की 1,024 से बढ़ाने की योजना बना रहा है।
SML के साथ पार्टनरशिप
Ramakrishnan ने कहा, SML फाउंडर Vishnu Vardhan हनुमान परियोजना में एक निवेशक हैं।
Vardhan स्वास्थ्य देखभाल के लिए फाउंडेशन मॉडल्स बनाने के लिए IIT-B के साथ जुड़े। उन्होंने बड़े पैमाने पर कंप्युटेशनल क्षमता प्राप्त करने के लिए हनुमान परियोजना में निवेश किया, जो इस तरह के मॉडल्स बनाने के लिए आवश्यक है। उन्होंने कहा कि बाकी योगदानों पर अभी चर्चा चल रही है और उन्हें फाइनलाइज़ किया जाना अभी बाकी है।
जनता को मुंबई में सालाना नैसकॉम IT उद्योग सम्मेलन के दौरान हनुमान की पहली झलक मिली। प्रदर्शित वीडियो में AI मॉडल की क्षमताओं को दर्शाया गया था जिसमें एक मोटरसाइकल मकैनिक, बैंकर और एक डेवलपर अपनी मूल भाषाओं में टूल से बातचीत कर रहे थे।
भारतीय उद्यमी फाउंडेशनल लैंगुएज मॉडल्स की ट्रेनिंग के लिए भारतीय भाषाओं में डेटासेट्स की उपलब्धता पर पहले सवाल उठा चुके हैं। एक AI स्टार्टअप के फाउंडर ने कहा, “अंग्रेजी-आधारित चैटबॉट्स सिस्टम में काफी समय से हैं लेकिन प्रमुख समस्या स्थानीय भाषाओं के लिए बॉट्स बनाने में आती है, खासकर जिनके स्रोत कम हैं। LLMs को बनाने और ट्रेन करने के लिए स्रोतों की आवश्यकता होती है लेकिन सवाल यह उठता है कि डेटासेट्स कहाँ से आएंगे।”
नोट: यहाँ दर्शाई गई सभी इमेजेस काल्पनिक हैं!
Faiza Parveen
फाईज़ा परवीन डिजिट हिंदी में एक कॉन्टेन्ट राइटर हैं। वह 2023 से डिजिट में काम कर रही हैं और इससे पहले वह 6 महीने डिजिट में फ्रीलांसर जर्नलिस्ट के तौर पर भी काम कर चुकी हैं। वह दिल्ली विश्वविद्यालय से स्नातक स्तर की पढ़ाई कर रही हैं, और उनके पसंदीदा तकनीकी विषयों में स्मार्टफोन, टेलिकॉम और मोबाइल ऐप शामिल हैं। उन्हें हमारे हिंदी पाठकों को वेब पर किसी डिवाइस या सेवा का उपयोग करने का तरीका सीखने में मदद करने के लिए लेख लिखने में आनंद आता है। सोशल मीडिया की दीवानी फाईज़ा को अक्सर अपने छोटे वीडियो की लत के कारण स्क्रॉलिंग करते हुए देखा जाता है। वह थ्रिलर फ्लिक्स देखना भी काफी पसंद करती हैं। View Full Profile