अहमदाबाद: चैटजीपीटी से एक संकेत लेते हुए जिसने दुनिया को तूफान से घेर लिया है, यह दर्शाता है कि प्राकृतिक भाषा प्रसंस्करण (एनएलपी) के साथ मिलकर एक अच्छा डेटाबेस क्या कर सकता है, कई अन्य परियोजनाएं अनुवाद के क्षेत्र में इसी तरह की तकनीक का इस्तेमाल कर रही हैं।
गांधीनगर स्थित धीरूभाई अंबानी इंस्टीट्यूट ऑफ इंफॉर्मेशन एंड कम्युनिकेशन टेक्नोलॉजी (DAIICT) के शोधकर्ताओं ने हिंदी और चीनी को गुजराती में और इसके विपरीत अनुवाद करने के लिए सफलतापूर्वक मॉडल तैयार किए हैं। वे अब मिश्रण में हिब्रू जोड़ने पर विचार कर रहे हैं।
इलेक्ट्रॉनिक्स और सूचना प्रौद्योगिकी मंत्रालय के राष्ट्रीय अनुवाद मिशन (NTM) के हिस्से के रूप में, DAIICT को गुजराती भाषा के लिए एल्गोरिदम विकसित करने के लिए 2 करोड़ रुपये मिले थे।
इस परियोजना का ई-गवर्नेंस, स्वास्थ्य और कानून के क्षेत्र में प्रभाव पड़ेगा।
डीएआईआईसीटी में आईआरएलपी लैब के मुख्य जांचकर्ता प्रोफेसर प्रसेनजीत मजूमदार ने कहा कि यह परियोजना मशीन लर्निंग और आर्टिफिशियल इंटेलिजेंस (एआई) का उपयोग करती है।
“तब से गुजरात चीन और इज़राइल में व्यावसायिक हित हैं, ऐसे उपकरण समझने में काम आएंगे, उदाहरण के लिए, अनुबंधों या उनके देश के कानूनों का ठीक प्रिंट, “उन्होंने कहा।
प्रयोगशाला इस वर्ष के अंत तक भारतीय भाषाओं के लिए एक राष्ट्रव्यापी मशीनी अनुवाद चुनौती आयोजित करने की योजना बना रही है।
क्या हम जल्द ही कभी भी गुजराती चैटजीपीटी देखेंगे? प्रो मजूमदार ने कहा कि यह दूर की संभावना है। उन्होंने कहा, “किसी को यह समझना चाहिए कि चैटजीपीटी को जीपीटी-3 पर विकसित किया गया है, जो एक तंत्रिका भाषा मॉडल है जो प्रवचन उत्पन्न कर सकता है और इसके लिए व्यापक प्रशिक्षण डेटा की आवश्यकता होती है। यह गुजराती सहित अधिकांश भारतीय भाषाओं के लिए एक चुनौती बनी हुई है।”
प्रयोगशाला एनएलपी के विषय पर बड़े पैमाने पर काम कर रही है – एक जर्मन विश्वविद्यालय के सहयोग से एक हालिया प्रकाशन ने एक अभद्र भाषा डिटेक्टर विकसित किया – या अधिक विशेष रूप से कृत्रिम बुद्धि का उपयोग करके ट्विटर जैसे प्लेटफार्मों पर आक्रामक पाठ।
“सामान्य धारणा के विपरीत, कृत्रिम बुद्धिमत्ता या मेटा लैंग्वेज (एमएल) मानवीय हस्तक्षेप को पूरी तरह से समाप्त नहीं करती है।
प्राध्यापक मजुमदार ने कहा, “यह समाधानों को तेजी से छानने में मदद करता है और बिना किसी पूर्वाग्रह के बेहतर परिणाम प्रदान करता है। मशीनों का उपयोग करके प्राकृतिक भाषा डेटा उत्पन्न करना अब विज्ञान कथा नहीं है और एआई गुजराती सहित भाषाओं को कैसे देखता है, इस पर इसका प्रभाव पड़ेगा।”
गांधीनगर स्थित धीरूभाई अंबानी इंस्टीट्यूट ऑफ इंफॉर्मेशन एंड कम्युनिकेशन टेक्नोलॉजी (DAIICT) के शोधकर्ताओं ने हिंदी और चीनी को गुजराती में और इसके विपरीत अनुवाद करने के लिए सफलतापूर्वक मॉडल तैयार किए हैं। वे अब मिश्रण में हिब्रू जोड़ने पर विचार कर रहे हैं।
इलेक्ट्रॉनिक्स और सूचना प्रौद्योगिकी मंत्रालय के राष्ट्रीय अनुवाद मिशन (NTM) के हिस्से के रूप में, DAIICT को गुजराती भाषा के लिए एल्गोरिदम विकसित करने के लिए 2 करोड़ रुपये मिले थे।
इस परियोजना का ई-गवर्नेंस, स्वास्थ्य और कानून के क्षेत्र में प्रभाव पड़ेगा।
डीएआईआईसीटी में आईआरएलपी लैब के मुख्य जांचकर्ता प्रोफेसर प्रसेनजीत मजूमदार ने कहा कि यह परियोजना मशीन लर्निंग और आर्टिफिशियल इंटेलिजेंस (एआई) का उपयोग करती है।
“तब से गुजरात चीन और इज़राइल में व्यावसायिक हित हैं, ऐसे उपकरण समझने में काम आएंगे, उदाहरण के लिए, अनुबंधों या उनके देश के कानूनों का ठीक प्रिंट, “उन्होंने कहा।
प्रयोगशाला इस वर्ष के अंत तक भारतीय भाषाओं के लिए एक राष्ट्रव्यापी मशीनी अनुवाद चुनौती आयोजित करने की योजना बना रही है।
क्या हम जल्द ही कभी भी गुजराती चैटजीपीटी देखेंगे? प्रो मजूमदार ने कहा कि यह दूर की संभावना है। उन्होंने कहा, “किसी को यह समझना चाहिए कि चैटजीपीटी को जीपीटी-3 पर विकसित किया गया है, जो एक तंत्रिका भाषा मॉडल है जो प्रवचन उत्पन्न कर सकता है और इसके लिए व्यापक प्रशिक्षण डेटा की आवश्यकता होती है। यह गुजराती सहित अधिकांश भारतीय भाषाओं के लिए एक चुनौती बनी हुई है।”
प्रयोगशाला एनएलपी के विषय पर बड़े पैमाने पर काम कर रही है – एक जर्मन विश्वविद्यालय के सहयोग से एक हालिया प्रकाशन ने एक अभद्र भाषा डिटेक्टर विकसित किया – या अधिक विशेष रूप से कृत्रिम बुद्धि का उपयोग करके ट्विटर जैसे प्लेटफार्मों पर आक्रामक पाठ।
“सामान्य धारणा के विपरीत, कृत्रिम बुद्धिमत्ता या मेटा लैंग्वेज (एमएल) मानवीय हस्तक्षेप को पूरी तरह से समाप्त नहीं करती है।
प्राध्यापक मजुमदार ने कहा, “यह समाधानों को तेजी से छानने में मदद करता है और बिना किसी पूर्वाग्रह के बेहतर परिणाम प्रदान करता है। मशीनों का उपयोग करके प्राकृतिक भाषा डेटा उत्पन्न करना अब विज्ञान कथा नहीं है और एआई गुजराती सहित भाषाओं को कैसे देखता है, इस पर इसका प्रभाव पड़ेगा।”