9वें विश्व हिन्दी सम्मेलन के प्रतिभागियों से 10 यक्ष प्रश्न
निम्न कुछ तथ्यपरक व चुनौतीपूर्ण प्रश्न
9वें विश्व हिन्दी सम्मेलन में पधारे विद्वानों से करते हुए इनका
उत्तर एवं समाधान मांगा जाना चाहिए...
(1)
हिन्दी को संयुक्त राष्ट्र संघ की भाषा बनाने के लिए कई वर्षों से आवाज
उठती आ रही है, कहा जाता है कि इसमें कई सौ करोड़ का खर्चा आएगा...
बिजली व पानी की तरह भाषा/राष्ट्रभाषा/राजभाषा भी एक इन्फ्रास्ट्रक्चर
(आनुषंगिक सुविधा) होती है....
अतः चाहे कितना भी खर्च हो, भारत सरकार को इसकी व्यवस्था के लिए
प्राथमिकता देनी चाहिए।
(2)
-- हिन्दी की तकनीकी रूप से जटिल (Complex)
मानी गई है, इसे सरल बनाने के लिए क्या उपाय किए जा रहे हैं?
-- कम्प्यूटरीकरण के बाद से हिन्दी का आम प्रयोग काफी कम होता जा रहा
है...
-- -- हिन्दी का सर्वाधिक प्रयोग डाकघरों (post offices) में होता था,
विशेषकर हिन्दी में पते लिखे पत्र की रजिस्ट्री एवं स्पीड पोस्ट की
रसीद अधिकांश डाकघरों में हिन्दी में ही दी जाती थी तथा वितरण हेतु
सूची आदि हिन्दी में ही बनाई जाती थी, लेकिन जबसे रजिस्ट्री और स्पीड
पोस्ट कम्प्यूटरीकृत हो गए, रसीद कम्प्यूटर से दी जाने लगी, तब से
लिफाफों पर भले ही पता हिन्दी (या अन्य भाषा) में लिखा हो, अधिकांश
डाकघरों में बुकिंग क्लर्क डैटाबेस में अंग्रेजी में लिप्यन्तरण करके
ही कम्प्यूटर में एण्ट्री कर पाता है, रसीद अंग्रेजी में ही दी जाने
लगी है, डेलिवरी हेतु सूची अंग्रेजी में प्रिंट होती है।
-- -- अंग्रेजी लिप्यन्तरण के दौरान पता गलत भी हो जाता है और
रजिस्टर्ड पत्र या स्पीड पोस्ट के पत्र गंतव्य स्थान तक कभी नहीं पहुँच
पाते या काफी विलम्ब से पहुँचते हैं।
-- -- अतः मजबूर होकर लोग लिफाफों पर पता अंग्रेजी में ही लिखने लगे
है।
डाकघरों में मूलतः हिन्दी में कम्प्यूटर में
डैटा प्रविष्टि के लिए क्या उपाय किए जा रहे हैं?
(3)
-- -- रेलवे रिजर्वेशन की पर्चियाँ त्रिभाषी रूप में छपी होती हैं, कोई
व्यक्ति यदि पर्ची हिन्दी (या अन्य भारतीय भाषा) में भरके देता है, तो
भी बुकिंग क्लर्क कम्प्यूटर डैटाबेस में अंग्रेजी में ही एण्ट्री कर
पाता है। टिकट भले ही द्विभाषी रूप में मुद्रित मिल जाती है, लेकिन
उसमें गाड़ी व स्टेशन आदि का नाम ही हिन्दी में मुद्रित मिलते हैं, जो
कि पहले से कम्प्यूटर के डैटा में स्टोर होते हैं, रिजर्वेशन चार्ट में
नाम भले ही द्विभाषी मुद्रित मिलता है, लेकिन "नेमट्रांस" नामक
सॉफ्टवेयर के माध्यम से लिप्यन्तरित होने के कारण हिन्दी में नाम
गलत-सलत छपे होते हैं। मूलतः हिन्दी में भी डैटा एण्ट्री हो, डैटाबेस
प्रोग्राम हो, इसके लिए व्यवस्थाएँ क्या की जा
रही है?
(4)
-- -- मोबाईल फोन आज लगभग सभी के पास है, सस्ते स्मार्टफोन में भी
हिन्दी में एसएमएस/इंटरनेट/ईमेल की सुविधा होती है, लेकिन अधिकांश लोग
हिन्दी भाषा के सन्देश भी लेटिन/रोमन लिपि में लिखकर एसएमएस आदि करते
हैं। क्योंकि हिन्दी में एण्ट्री कठिन होती है... और फिर हिन्दी में एक
वर्ण/स्ट्रोक तीन बाईट का स्थान घेरता है। यदि किसी एक प्लान में
अंग्रेजी में 150 अक्षरों के एक सन्देश के 50 पैसे लगते हैं, तो हिन्दी
में 150 अक्षरों का एक सन्देश भेजने पर वह 450 बाईट्स का स्थान घेरने
के कारण तीन सन्देशों में बँटकर पहुँचता है और तीन गुने पैसे लगते
हैं... क्योंकि हिन्दी (अन्य भारतीय भाषा) के सन्देश UTF8 encoding में
ही वेब में भण्डारित/प्रसारित होते हैं।
हिन्दी सन्देशों को सस्ता बनाने के लिए क्या
उपाय किए जा रहे हैं?
(5)
-- -- अंग्रेजी शब्दकोश में अकारादि क्रम में शब्द ढूँढना आम जनता के
लिेए सरल है, हम सभी भी अंग्रेजी-हिन्दी शब्दकोश में जल्दी से इच्छित
शब्द खोज लेते हैं,
-- -- लेकिन हमें यदि हिन्दी-अंग्रेजी शब्दकोश में कोई शब्द खोजना हो
तो दिमाग को काफी परिश्रम करना पड़ता है और समय ज्यादा लगता है, आम
जनता/हिन्दीतर भाषी लोगों को तो काफी तकलीफ होती है। हिन्दी
संयुक्ताक्षर/पूर्णाक्षर को पहले मन ही मन वर्णों में विभाजित करना
पड़ता है, फिर अकारादि क्रम में सजाकर तलाशना पड़ता है...
विभिन्न डैटाबेस देवनागरी के विभिन्न sorting order का उपयोग करते हैं।
हिन्दी (देवनागरी) को अकारादि क्रम युनिकोड
में मानकीकृत करने तथा सभी के उपयोग के लिए उपलब्ध कराने के लिए
क्या कदम उठाए जा रहे हैं?
(6)
-- -- चाहे ऑन लाइन आयकर रिटर्न फार्म भरना हो, चाहे किसी भी वेबसाइट
में कोई फार्म ऑनलाइन भरना हो, अधिकांशतः अंग्रेजी में ही भरना पड़ता
है...
-- -- Sybase, powerbuilder आदि डैटाबेस अभी तक हिन्दी युनिकोड का
समर्थन नहीं दे पाते। MS SQL Server में भी हिन्दी में ऑनलाइन डैटाबेस
में काफी समस्याएँ आती हैं... अतः मजबूरन् सभी बड़े संस्थान अपने
वित्तीय संसाधन, Accounting, production, marketing, tendering,
purchasing आदि के सारे डैटाबेस अंग्रेजी में ही कम्प्यूटरीकृत कर पाते
हैं। जो संस्थान पहले हाथ से लिखे हुए हिसाब के खातों में हिन्दी में
लिखते थे। किन्तु कम्प्यूटरीकरण होने के बाद से वे अंग्रेजी में ही
करने लगे हैं।
हिन्दी (देवनागरी) में भी ऑनलाइन फार्म आदि
पेश करने के लिए उपयुक्त डैटाबेस उपलब्ध कराने के लिए क्या कदम
उठाए जा रहे हैं?
(7)
सन् 2000 से कम्प्यूटर आपरेटिंग सीस्टम्स स्तर पर हिन्दी का समर्थन
इन-बिल्ट उपलब्ध हो जाने के बाद आज 12 वर्ष बीत जाने के बाद भी अभी तक
अधिकांश जनता/उपयोक्ता इससे अनभिज्ञ है। आम
जनता को जानकारी देने के लिए क्या कदम उठाए जा रहे हैं?
(8)
भारत IT से लगभग 20% आय करता है, देश में हजारों/लाखों IITs या
प्राईवेट तकनीकी संस्थान हैं, अनेक कम्प्यूटर शिक्षण संस्थान हैं, अनेक
कम्प्टूर संबंधित पाठ्यक्रम प्रचलित हैं, लेकिन किसी भी पाठ्यक्रम में
हिन्दी (या अन्य भारतीय भाषा) में कैसे पाठ/डैटा संसाधित किया जाए?
ISCII codes, Unicode Indic क्या हैं? हिन्दी का रेण्डरिंग इंजन कैसे
कार्य करता है? 16 bit Open Type font और 8 bit TTF font क्या हैं,
इनमें हिन्दी व अन्य भारतीय भाषाएँ कैसे संसाधित होती हैं? ऐसी जानकारी
देनेवाला कोई एक भी पाठ किसी भी कम्प्यूटर पाठ्यक्रम के विषय में शामिल
नहीं है। ऐसे पाठ्यक्रम के विषय अनिवार्य रूप से हरेक computer courses
में शामिल किए जाने चाहिए। हालांकि केन्द्रीय विद्यालयों के लिए CBSE
के पाठ्यक्रम में हिन्दी कम्प्यूटर के कुछ पाठ बनाए गए हैं, पर यह सभी
स्कूलों/कालेजों/शिक्षण संस्थानों अनिवार्य रूप से लागू होना चाहिए।
इस्की और युनिकोड(इण्डिक) पाठ्यक्रम अनिवार्य
करने के लिए क्या कदम उठाए जा रहे हैं?
(9)
हिन्दी की परिशोधित मानक वर्तनी के आधार पर समग्र भारतवर्ष में पहली
कक्षा की हिन्दी "वर्णमाला" की पुस्तक का संशोधन होना चाहिए।
कम्प्यूटरीकरण व डैटाबेस की "वर्णात्मक" अकारादि क्रम विन्यास की जरूरत
के अनुसार पहली कक्षा की "वर्णमाला" पुस्तिका में संशोधन किया जाना
चाहिए। सभी हिन्दी शिक्षकों के लिए अनिवार्य रूप से तत्संबंधी
प्रशिक्षण प्रदान किए जाने चाहिए।
इसके लिए क्या कदम उठाए जा रहे हैं?
(10)
अभी तक हिन्दी की मानक वर्तनी के अनुसार युनिकोड आधारित कोई भी
वर्तनी संशोधक प्रोग्राम/सुविधा वाला साफ्टवेयर आम जनता के उपयोग
के लिए निःशुल्क डाउनलोड व उपयोग हेतु उपलब्ध नहीं कराया जा सका
है। जिसके कारण हिन्दी में अनेक अशुद्धियाँ के प्रयोग पाए जाते
हैं।
इसके लिए क्या व्यवस्थाएँ की जा रही हैं?
प्रगत-भारत (Progressed India) के निर्माण हेतु कुछ विचार-बिन्दू
शिव भगवानुवाच : सत्ययुग में संसार-भर में एक ही भाषा होगी- 'हिन्दी'
15 May 2012
एडोबे ईनडिजाइन सीएस-6 में भारतीय लिपियों का समर्थन
Indic Support in InDesign CS6
एडोबे ईनडिजाइन सीएस-6 में भारतीय लिपियों का समर्थन
इसके वर्ल्ड रेडी कम्पोजर (WRC) के द्वारा 10 भारतीय भाषाओं (हिन्दी, मराठी, गुजराती, तमिल, पंजाबी, बंगला, तेलगु, ओड़िआ, मलयालम एवं कन्नड़) में पाठ के सही रूप में शब्द-संयोजन को प्रकट करने का सामर्थ्य हासिल हो गया है।
देवनागरी फोंट समुदाय में Hunspell के माध्यम से वर्तनीशोधक (spell cheking) और शब्द-जोड़ी-विभाजक (Hyphenation) की सुविधा भी प्रदान कर दी गई है।
भारतीय लिपियों में काम करने की सुविधाओं को सुस्थापित या डिफॉल्ट रूप में सेट करने के लिए एक प्रोग्राम भी प्राथमिकताओं (Preferences) में दे दिया गया है। साथ ही इसमें अन्य सॉफ्टवेयरों में सम्पादित पाठ को आयात (Import) करने की सुविधा भी प्रदान की गई है।
यदि किसी फोंट में कोई विशेष संयुक्ताक्षर का ग्लीफ उपलब्ध न हो तो इसकी चेतावनी भी स्वचालित रूप से प्रकट हो जाती है।
हालांकि अभी फोटोशॉप और इल्यूस्ट्रेटर सीएस-6 (Photoshop & Illustrator CS6) आदि में युनिकोडित भारतीय लिपियों के समर्थन की कोई घोषणा नहीं हुई है।
एडोबे क्रीएटिव श्यूट मुख्यतः मीडिया, प्रकाशन और मनोरंजन उद्योग के पेशेवर महारथियों को ध्यान में रखकर बनाया गया है, जो मुख्यतः चार पैकेजों में उपलब्ध है- मास्टर कलेक्शन (रु. 1.56 लाख), डिजाइन एवं वेब प्रीमियम और प्रोडक्शन प्रीमियम (रु. 1.14 लाख) और डिजाइन स्टैण्डर्ड (रु. 78,288). ये उत्पाद इनके इन्स्टालेशन के बाद ऑनलाइन रजिस्ट्रेशन करने के बाद ही कार्यक्षम होने के शर्ताधीन होंगे।
ये मूल्य भारतीय छोटे प्रेस तथा अखबारों के लिए अत्यन्त भारी लग रहे हैं। फिर भी यह एक अच्छी खबर है भारतीय प्रकाशन उद्योग के लिए। युनिकोड में कार्य करना अधिकांश लोगों के लिए सरल हो जाएगा। विशेषकर अखबारों को दोहरा कार्य नहीं करना पड़ेगा- ऑनलाइन वेब संस्करण के लिए युनिकोड में और मुद्रित अखबार के लिए पुराने 8-बिट ASCII आधारित ttf फोंट में।
फोंट कनवर्टरों का बारम्बार उपयोग तथा तत्संबंधी समस्याओं का निराकरण काफी हद तक हो जाएगा।
एडोबे सीस्टम्स के दक्षिण एशिया के प्रबन्ध-निदेशक श्री उमंग बेदी ने पत्रकारों को बताया कि फिक्की-केपीएमजी की एक रिपोर्ट के अनुसार सन् 2016 तक भारतीय मीडिया तथा मनोरंजन उद्योग का कारोबार 1457 अरब रुपये तक पहुँचने की आशा है। अतः उन्हें अपने ऐसे उत्पादों की भारतीय बाजार में बिक्री से हजारों करोड़ रुपये का लाभ होने की उम्मीद है।
सन्दर्भ : http://www.thehindu.com/sci-tech/article3349487.ece
एडोबे ईनडिजाइन सीएस-6 में भारतीय लिपियों का समर्थन
भारतीय प्रकाशन उद्योग के लिए खुशी की खबर है कि उनकी बहु-प्रतीक्षित आवश्यकता
पूरी हो रही है। विश्व में सबसे लोकप्रिय प्री-प्रेस डिजाइन-पैकेज Adobe InDesign
CS6 में भारतीय लिपियों के समर्थन की घोषणा की गई है।
इसके वर्ल्ड रेडी कम्पोजर (WRC) के द्वारा 10 भारतीय भाषाओं (हिन्दी, मराठी, गुजराती, तमिल, पंजाबी, बंगला, तेलगु, ओड़िआ, मलयालम एवं कन्नड़) में पाठ के सही रूप में शब्द-संयोजन को प्रकट करने का सामर्थ्य हासिल हो गया है।
देवनागरी फोंट समुदाय में Hunspell के माध्यम से वर्तनीशोधक (spell cheking) और शब्द-जोड़ी-विभाजक (Hyphenation) की सुविधा भी प्रदान कर दी गई है।
भारतीय लिपियों में काम करने की सुविधाओं को सुस्थापित या डिफॉल्ट रूप में सेट करने के लिए एक प्रोग्राम भी प्राथमिकताओं (Preferences) में दे दिया गया है। साथ ही इसमें अन्य सॉफ्टवेयरों में सम्पादित पाठ को आयात (Import) करने की सुविधा भी प्रदान की गई है।
यदि किसी फोंट में कोई विशेष संयुक्ताक्षर का ग्लीफ उपलब्ध न हो तो इसकी चेतावनी भी स्वचालित रूप से प्रकट हो जाती है।
हालांकि अभी फोटोशॉप और इल्यूस्ट्रेटर सीएस-6 (Photoshop & Illustrator CS6) आदि में युनिकोडित भारतीय लिपियों के समर्थन की कोई घोषणा नहीं हुई है।
एडोबे क्रीएटिव श्यूट मुख्यतः मीडिया, प्रकाशन और मनोरंजन उद्योग के पेशेवर महारथियों को ध्यान में रखकर बनाया गया है, जो मुख्यतः चार पैकेजों में उपलब्ध है- मास्टर कलेक्शन (रु. 1.56 लाख), डिजाइन एवं वेब प्रीमियम और प्रोडक्शन प्रीमियम (रु. 1.14 लाख) और डिजाइन स्टैण्डर्ड (रु. 78,288). ये उत्पाद इनके इन्स्टालेशन के बाद ऑनलाइन रजिस्ट्रेशन करने के बाद ही कार्यक्षम होने के शर्ताधीन होंगे।
ये मूल्य भारतीय छोटे प्रेस तथा अखबारों के लिए अत्यन्त भारी लग रहे हैं। फिर भी यह एक अच्छी खबर है भारतीय प्रकाशन उद्योग के लिए। युनिकोड में कार्य करना अधिकांश लोगों के लिए सरल हो जाएगा। विशेषकर अखबारों को दोहरा कार्य नहीं करना पड़ेगा- ऑनलाइन वेब संस्करण के लिए युनिकोड में और मुद्रित अखबार के लिए पुराने 8-बिट ASCII आधारित ttf फोंट में।
फोंट कनवर्टरों का बारम्बार उपयोग तथा तत्संबंधी समस्याओं का निराकरण काफी हद तक हो जाएगा।
सन्दर्भ : http://www.thehindu.com/sci-tech/article3349487.ece
19 Jan 2012
Speech to text SMS
Speech to text SMS
सिर्फ बोल कर भेज सकेंगे लिखित एसएमएस
भारत के आंध्र प्रदेश में हैदराबाद स्थित अंतरराष्ट्रीय सूचना प्रौद्योगिकी संस्थान [आईआईआईटी] (http://iiit.net) एक ऐसी मोबाइल प्रौद्योगिकी विकसित करने पर काम कर रहा है जो बोले गए शब्दों को 'इनपुट' के तौर पर ग्रहण करेगी और इसे भारतीय भाषाओं के लिखित पाठ में तब्दील कर देगी जिसे एसएमएस के तौर पर भेजा जा सकेगा।
आईआईआईटी के निदेशक श्री राजीव संगल ने बताया कि परियोजना अगले दो साल में तैयार हो जाएगी और इसके लिए सूचना एवं प्रौद्योगिकी मंत्रालय वित्तीय सहायता मुहैया करा रहा है।
श्री संगल ने कहा कि अगर कोई पढ़ना या लिखना नहीं जानता है तो जो संदेश वह किसी अन्य व्यक्ति के पास भेजना चाहता है उसे वह नई प्रौद्योगिकी की मदद से फोन पर या एसएमएस पर बोल कर लिखवा सकेगा। इसके लिए पहले उसे अपनी बात बोलनी होगी और मोबाइल फोन उसे लिखित पाठ में तब्दील कर संदेश के तौर पर भेज देगा।
उन्होंने बताया कि इस परियोजना पर सात अन्य संस्थान काम कर रहे हैं। संगल ने कहा कि यह प्रौद्योगिकी मोबाइल फोन में उपयोगी रहेगी जिनमें छोटे स्क्रीन और छोटे कीबोर्ड होते हैं जिसकी वजह से अक्षर टाइप करने में दिक्कत होती है।
संकाय के एक वरिष्ठ सदस्य ने कहा कि आईआईआईटी की स्पीच लैब का उद्देश्य ऐसी प्रणालियों का विकास करना है जो बोले गए शब्दों का लिप्यंतरण कर सकें, भारतीय भाषाओं के लिए सही ध्वनि एवं उच्चारण उत्पन्न कर सकें, शरीर के चिह्नों जैसे उंगली के निशानों अथवा आखों की पुतलियों द्वारा व्यक्ति विशेष की पहचान कर सकें और वाक शैली में संवाद स्पष्ट कर सकें।
श्री संगल ने संस्थान की एक और परियोजना के बारे में बताया। उन्होंने कहा कि अनुसंधान दल मोबाइल फोनों के लिए लिखित शब्दों को पढ़ने वाली एक प्रणाली 'ऑप्टिकल कैरेक्टर रीडर' भी विकसित करने के लिए प्रयासरत है।
उन्होंने बताया कि ऑप्टिकल कैरेक्टर रीडर स्क्रीन पर लिखे शब्दों को हस्तलिपि पहचानने वाले एक उपकरण की मदद से पढ़ेगा। हम शलाका की मदद से मोबाइल फोन पर किसी भी भाषा में लिख सकते हैं। सेल फोन इसे पहचानेगा और उसके अनुसार ऑप्टिकल कैरेक्टर रीडर आगे का कदम उठाएगा।
संगल ने बताया कि संस्थान ने एक अंतर्राष्ट्रीय मोबाइल निर्माता के लिए एक ऐसा सॉफ्टवेयर विकसित किया है जो हिंदी में लिखे एसएमएस पढ़ सकेगा। बहरहाल, उन्होंने मोबाइल फोन निर्माता का नाम नहीं बताया। विश्लेषकों का कहना है कि यह प्रौद्योगिकी ग्रामीण भारतीय बाजारों के विस्तार के लिए उपयोगी साबित होगी जहा मोबाइल फोन निरक्षरता की वजह से अभी भी अपनी गहरी पैठ नहीं बना पाए हैं।
सौजन्य : दैनिक जागरण, 19 जनवरी, 2012 http://www.jagran.com/news/national-technology-for-converting-speech-into-text-msg-8782895.html>
सन्दर्भ हेतु देखें क्या कम्प्यूटर क्रान्ति लायेगी हिन्दी क्रान्ति?
उल्लेखनीय है कि हिन्दी तथा ब्राह्मी लिपि आधारित अन्य भारतीय भाषाओँ की लिपियाँ ध्वनिविज्ञान की कसौटी पर खरी उतरती हैं। इनमें जैसे बोला जाता है वैसे ही लिखा जाता है। इसके विपरीत अंग्रेजी में एक शब्द का उच्चारण कुछ और होता है तो जिन अक्षरों को मिलकर वह शब्द बना है उन अक्षरों के एक एक कर उच्चारण किया जाए तो कुछ और ही होता है।
अतः बोलकर लिखित पाठ में बदलने के श्रुतलेखन सॉफ्टवेयर अंग्रेजी भाषा (लेटिन लिपि) में सही काम नहीं करते, 50 से 70 प्रतिशत तक ही सही शब्द प्रकट कर पाते हैं। बाकी को फिर से मैनुअल सम्पादन/सुधार करना पड़ता है। जबकि हिन्दी व भारतीय भाषाओं में श्रुतलेखन सॉफ्टवेयर 90 से 98 प्रतिशत तक शुद्ध पाठ प्रदान कर पाते हैं।
साथ ही अंग्रेजी में बोलकर पाठ प्रविष्टि करके लिखित पाठ में बदलनेवाले श्रुतलेखन सॉफ्टवेयर की निर्माण विधि शब्दकोश में शब्दों की उच्चारण की गई ध्वनि-क्लिप के डैटाबेस फील्ड को वर्तनी (स्पेलिंग) के लिखित पाठ में बदलने की पद्धति पर आधारित होती है, इसलिए ऐसे सॉफ्टवेयर भारी-भारीकम तथा अधिक हार्डडिस्क स्पेस और अधिक मेमोरी घेरते हैं।
इसके विपरीत भारतीय भाषाओं के श्रुतलेखन सॉफ्टवेयर केवल मूल वर्णों के ध्वनि-अणुओं को लिपि के मूल वर्णों में बदलने की सूक्ष्म तकनीक पर आधारित होते हैं, इसलिए अत्यन्त कम भंडारण स्पेस एवं अति कम मेमोरी घेरते हैं और मोबाईल फोन पर भी चल पाने में सफल होते हैं।
आशा है कि इन सॉफ्टवेयरों के बाजार में आने पर भारतीय भाषाओं के प्रयोग में क्रान्ति दिखाई देगी।
सिर्फ बोल कर भेज सकेंगे लिखित एसएमएस
भारत के आंध्र प्रदेश में हैदराबाद स्थित अंतरराष्ट्रीय सूचना प्रौद्योगिकी संस्थान [आईआईआईटी] (http://iiit.net) एक ऐसी मोबाइल प्रौद्योगिकी विकसित करने पर काम कर रहा है जो बोले गए शब्दों को 'इनपुट' के तौर पर ग्रहण करेगी और इसे भारतीय भाषाओं के लिखित पाठ में तब्दील कर देगी जिसे एसएमएस के तौर पर भेजा जा सकेगा।
आईआईआईटी के निदेशक श्री राजीव संगल ने बताया कि परियोजना अगले दो साल में तैयार हो जाएगी और इसके लिए सूचना एवं प्रौद्योगिकी मंत्रालय वित्तीय सहायता मुहैया करा रहा है।
श्री संगल ने कहा कि अगर कोई पढ़ना या लिखना नहीं जानता है तो जो संदेश वह किसी अन्य व्यक्ति के पास भेजना चाहता है उसे वह नई प्रौद्योगिकी की मदद से फोन पर या एसएमएस पर बोल कर लिखवा सकेगा। इसके लिए पहले उसे अपनी बात बोलनी होगी और मोबाइल फोन उसे लिखित पाठ में तब्दील कर संदेश के तौर पर भेज देगा।
उन्होंने बताया कि इस परियोजना पर सात अन्य संस्थान काम कर रहे हैं। संगल ने कहा कि यह प्रौद्योगिकी मोबाइल फोन में उपयोगी रहेगी जिनमें छोटे स्क्रीन और छोटे कीबोर्ड होते हैं जिसकी वजह से अक्षर टाइप करने में दिक्कत होती है।
संकाय के एक वरिष्ठ सदस्य ने कहा कि आईआईआईटी की स्पीच लैब का उद्देश्य ऐसी प्रणालियों का विकास करना है जो बोले गए शब्दों का लिप्यंतरण कर सकें, भारतीय भाषाओं के लिए सही ध्वनि एवं उच्चारण उत्पन्न कर सकें, शरीर के चिह्नों जैसे उंगली के निशानों अथवा आखों की पुतलियों द्वारा व्यक्ति विशेष की पहचान कर सकें और वाक शैली में संवाद स्पष्ट कर सकें।
श्री संगल ने संस्थान की एक और परियोजना के बारे में बताया। उन्होंने कहा कि अनुसंधान दल मोबाइल फोनों के लिए लिखित शब्दों को पढ़ने वाली एक प्रणाली 'ऑप्टिकल कैरेक्टर रीडर' भी विकसित करने के लिए प्रयासरत है।
उन्होंने बताया कि ऑप्टिकल कैरेक्टर रीडर स्क्रीन पर लिखे शब्दों को हस्तलिपि पहचानने वाले एक उपकरण की मदद से पढ़ेगा। हम शलाका की मदद से मोबाइल फोन पर किसी भी भाषा में लिख सकते हैं। सेल फोन इसे पहचानेगा और उसके अनुसार ऑप्टिकल कैरेक्टर रीडर आगे का कदम उठाएगा।
संगल ने बताया कि संस्थान ने एक अंतर्राष्ट्रीय मोबाइल निर्माता के लिए एक ऐसा सॉफ्टवेयर विकसित किया है जो हिंदी में लिखे एसएमएस पढ़ सकेगा। बहरहाल, उन्होंने मोबाइल फोन निर्माता का नाम नहीं बताया। विश्लेषकों का कहना है कि यह प्रौद्योगिकी ग्रामीण भारतीय बाजारों के विस्तार के लिए उपयोगी साबित होगी जहा मोबाइल फोन निरक्षरता की वजह से अभी भी अपनी गहरी पैठ नहीं बना पाए हैं।
सौजन्य : दैनिक जागरण, 19 जनवरी, 2012 http://www.jagran.com/news/national-technology-for-converting-speech-into-text-msg-8782895.html>
तथा
सन्मार्ग, 19 जनवरी, 2012, पृ.11
सन्दर्भ हेतु देखें क्या कम्प्यूटर क्रान्ति लायेगी हिन्दी क्रान्ति?
उल्लेखनीय है कि हिन्दी तथा ब्राह्मी लिपि आधारित अन्य भारतीय भाषाओँ की लिपियाँ ध्वनिविज्ञान की कसौटी पर खरी उतरती हैं। इनमें जैसे बोला जाता है वैसे ही लिखा जाता है। इसके विपरीत अंग्रेजी में एक शब्द का उच्चारण कुछ और होता है तो जिन अक्षरों को मिलकर वह शब्द बना है उन अक्षरों के एक एक कर उच्चारण किया जाए तो कुछ और ही होता है।
अतः बोलकर लिखित पाठ में बदलने के श्रुतलेखन सॉफ्टवेयर अंग्रेजी भाषा (लेटिन लिपि) में सही काम नहीं करते, 50 से 70 प्रतिशत तक ही सही शब्द प्रकट कर पाते हैं। बाकी को फिर से मैनुअल सम्पादन/सुधार करना पड़ता है। जबकि हिन्दी व भारतीय भाषाओं में श्रुतलेखन सॉफ्टवेयर 90 से 98 प्रतिशत तक शुद्ध पाठ प्रदान कर पाते हैं।
साथ ही अंग्रेजी में बोलकर पाठ प्रविष्टि करके लिखित पाठ में बदलनेवाले श्रुतलेखन सॉफ्टवेयर की निर्माण विधि शब्दकोश में शब्दों की उच्चारण की गई ध्वनि-क्लिप के डैटाबेस फील्ड को वर्तनी (स्पेलिंग) के लिखित पाठ में बदलने की पद्धति पर आधारित होती है, इसलिए ऐसे सॉफ्टवेयर भारी-भारीकम तथा अधिक हार्डडिस्क स्पेस और अधिक मेमोरी घेरते हैं।
इसके विपरीत भारतीय भाषाओं के श्रुतलेखन सॉफ्टवेयर केवल मूल वर्णों के ध्वनि-अणुओं को लिपि के मूल वर्णों में बदलने की सूक्ष्म तकनीक पर आधारित होते हैं, इसलिए अत्यन्त कम भंडारण स्पेस एवं अति कम मेमोरी घेरते हैं और मोबाईल फोन पर भी चल पाने में सफल होते हैं।
आशा है कि इन सॉफ्टवेयरों के बाजार में आने पर भारतीय भाषाओं के प्रयोग में क्रान्ति दिखाई देगी।