प्रगत भारत: 2012

24 Sept 2012

9वें विश्व हिन्दी सम्मेलन के विद्वानों से 10 यक्ष प्रश्न

9वें विश्व हिन्दी सम्मेलन के प्रतिभागियों से 10 यक्ष प्रश्न

निम्न कुछ तथ्यपरक व चुनौतीपूर्ण प्रश्न 9वें विश्व हिन्दी सम्मेलन में पधारे विद्वानों से करते हुए इनका उत्तर एवं समाधान मांगा जाना चाहिए...
(1)
हिन्दी को संयुक्त राष्ट्र संघ की भाषा बनाने के लिए कई वर्षों से आवाज उठती आ रही है, कहा जाता है कि इसमें कई सौ करोड़ का खर्चा आएगा...
बिजली व पानी की तरह भाषा/राष्ट्रभाषा/राजभाषा भी एक इन्फ्रास्ट्रक्चर (आनुषंगिक सुविधा) होती है....
अतः चाहे कितना भी खर्च हो, भारत सरकार को इसकी व्यवस्था के लिए प्राथमिकता देनी चाहिए।

(2)
-- हिन्दी की तकनीकी रूप से जटिल (Complex) मानी गई है, इसे सरल बनाने के लिए क्या उपाय किए जा रहे हैं?

-- कम्प्यूटरीकरण के बाद से हिन्दी का आम प्रयोग काफी कम होता जा रहा है...
-- -- हिन्दी का सर्वाधिक प्रयोग डाकघरों (post offices) में होता था, विशेषकर हिन्दी में पते लिखे पत्र की रजिस्ट्री एवं स्पीड पोस्ट की रसीद अधिकांश डाकघरों में हिन्दी में ही दी जाती थी तथा वितरण हेतु सूची आदि हिन्दी में ही बनाई जाती थी, लेकिन जबसे रजिस्ट्री और स्पीड पोस्ट कम्प्यूटरीकृत हो गए, रसीद कम्प्यूटर से दी जाने लगी, तब से लिफाफों पर भले ही पता हिन्दी (या अन्य भाषा) में लिखा हो, अधिकांश डाकघरों में बुकिंग क्लर्क डैटाबेस में अंग्रेजी में लिप्यन्तरण करके ही कम्प्यूटर में एण्ट्री कर पाता है, रसीद अंग्रेजी में ही दी जाने लगी है, डेलिवरी हेतु सूची अंग्रेजी में प्रिंट होती है।
-- -- अंग्रेजी लिप्यन्तरण के दौरान पता गलत भी हो जाता है और रजिस्टर्ड पत्र या स्पीड पोस्ट के पत्र गंतव्य स्थान तक कभी नहीं पहुँच पाते या काफी विलम्ब से पहुँचते हैं।
-- -- अतः मजबूर होकर लोग लिफाफों पर पता अंग्रेजी में ही लिखने लगे है।
डाकघरों में मूलतः हिन्दी में कम्प्यूटर में डैटा प्रविष्टि के लिए क्या उपाय किए जा रहे हैं?

(3)
-- -- रेलवे रिजर्वेशन की पर्चियाँ त्रिभाषी रूप में छपी होती हैं, कोई व्यक्ति यदि पर्ची हिन्दी (या अन्य भारतीय भाषा) में भरके देता है, तो भी बुकिंग क्लर्क कम्प्यूटर डैटाबेस में अंग्रेजी में ही एण्ट्री कर पाता है। टिकट भले ही द्विभाषी रूप में मुद्रित मिल जाती है, लेकिन उसमें गाड़ी व स्टेशन आदि का नाम ही हिन्दी में मुद्रित मिलते हैं, जो कि पहले से कम्प्यूटर के डैटा में स्टोर होते हैं, रिजर्वेशन चार्ट में नाम भले ही द्विभाषी मुद्रित मिलता है, लेकिन "नेमट्रांस" नामक सॉफ्टवेयर के माध्यम से लिप्यन्तरित होने के कारण हिन्दी में नाम गलत-सलत छपे होते हैं। मूलतः हिन्दी में भी डैटा एण्ट्री हो, डैटाबेस प्रोग्राम हो, इसके लिए व्यवस्थाएँ क्या की जा रही है?

(4)
-- -- मोबाईल फोन आज लगभग सभी के पास है, सस्ते स्मार्टफोन में भी हिन्दी में एसएमएस/इंटरनेट/ईमेल की सुविधा होती है, लेकिन अधिकांश लोग हिन्दी भाषा के सन्देश भी लेटिन/रोमन लिपि में लिखकर एसएमएस आदि करते हैं। क्योंकि हिन्दी में एण्ट्री कठिन होती है... और फिर हिन्दी में एक वर्ण/स्ट्रोक तीन बाईट का स्थान घेरता है। यदि किसी एक प्लान में अंग्रेजी में 150 अक्षरों के एक सन्देश के 50 पैसे लगते हैं, तो हिन्दी में 150 अक्षरों का एक सन्देश भेजने पर वह 450 बाईट्स का स्थान घेरने के कारण तीन सन्देशों में बँटकर पहुँचता है और तीन गुने पैसे लगते हैं... क्योंकि हिन्दी (अन्य भारतीय भाषा) के सन्देश UTF8 encoding में ही वेब में भण्डारित/प्रसारित होते हैं।

हिन्दी सन्देशों को सस्ता बनाने के लिए क्या उपाय किए जा रहे हैं?

(5)
-- -- अंग्रेजी शब्दकोश में अकारादि क्रम में शब्द ढूँढना आम जनता के लिेए सरल है, हम सभी भी अंग्रेजी-हिन्दी शब्दकोश में जल्दी से इच्छित शब्द खोज लेते हैं,
-- -- लेकिन हमें यदि हिन्दी-अंग्रेजी शब्दकोश में कोई शब्द खोजना हो तो दिमाग को काफी परिश्रम करना पड़ता है और समय ज्यादा लगता है, आम जनता/हिन्दीतर भाषी लोगों को तो काफी तकलीफ होती है। हिन्दी संयुक्ताक्षर/पूर्णाक्षर को पहले मन ही मन वर्णों में विभाजित करना पड़ता है, फिर अकारादि क्रम में सजाकर तलाशना पड़ता है...
विभिन्न डैटाबेस देवनागरी के विभिन्न sorting order का उपयोग करते हैं।

हिन्दी (देवनागरी) को अकारादि क्रम युनिकोड में मानकीकृत करने तथा सभी के उपयोग के लिए उपलब्ध कराने के लिए क्या कदम उठाए जा रहे हैं?

(6)
-- -- चाहे ऑन लाइन आयकर रिटर्न फार्म भरना हो, चाहे किसी भी वेबसाइट में कोई फार्म ऑनलाइन भरना हो, अधिकांशतः अंग्रेजी में ही भरना पड़ता है...
-- -- Sybase, powerbuilder आदि डैटाबेस अभी तक हिन्दी युनिकोड का समर्थन नहीं दे पाते। MS SQL Server में भी हिन्दी में ऑनलाइन डैटाबेस में काफी समस्याएँ आती हैं... अतः मजबूरन् सभी बड़े संस्थान अपने वित्तीय संसाधन, Accounting, production, marketing, tendering, purchasing आदि के सारे डैटाबेस अंग्रेजी में ही कम्प्यूटरीकृत कर पाते हैं। जो संस्थान पहले हाथ से लिखे हुए हिसाब के खातों में हिन्दी में लिखते थे। किन्तु कम्प्यूटरीकरण होने के बाद से वे अंग्रेजी में ही करने लगे हैं।

हिन्दी (देवनागरी) में भी ऑनलाइन फार्म आदि पेश करने के लिए उपयुक्त डैटाबेस उपलब्ध कराने के लिए क्या कदम उठाए जा रहे हैं?

(7)
सन् 2000 से कम्प्यूटर आपरेटिंग सीस्टम्स स्तर पर हिन्दी का समर्थन इन-बिल्ट उपलब्ध हो जाने के बाद आज 12 वर्ष बीत जाने के बाद भी अभी तक अधिकांश जनता/उपयोक्ता इससे अनभिज्ञ है। आम जनता को जानकारी देने के लिए क्या कदम उठाए जा रहे हैं?

(8)
भारत IT से लगभग 20% आय करता है, देश में हजारों/लाखों IITs या प्राईवेट तकनीकी संस्थान हैं, अनेक कम्प्यूटर शिक्षण संस्थान हैं, अनेक कम्प्टूर संबंधित पाठ्यक्रम प्रचलित हैं, लेकिन किसी भी पाठ्यक्रम में हिन्दी (या अन्य भारतीय भाषा) में कैसे पाठ/डैटा संसाधित किया जाए? ISCII codes, Unicode Indic क्या हैं? हिन्दी का रेण्डरिंग इंजन कैसे कार्य करता है? 16 bit Open Type font और 8 bit TTF font क्या हैं, इनमें हिन्दी व अन्य भारतीय भाषाएँ कैसे संसाधित होती हैं? ऐसी जानकारी देनेवाला कोई एक भी पाठ किसी भी कम्प्यूटर पाठ्यक्रम के विषय में शामिल नहीं है। ऐसे पाठ्यक्रम के विषय अनिवार्य रूप से हरेक computer courses में शामिल किए जाने चाहिए। हालांकि केन्द्रीय विद्यालयों के लिए CBSE के पाठ्यक्रम में हिन्दी कम्प्यूटर के कुछ पाठ बनाए गए हैं, पर यह सभी स्कूलों/कालेजों/शिक्षण संस्थानों अनिवार्य रूप से लागू होना चाहिए।

इस्की और युनिकोड(इण्डिक) पाठ्यक्रम अनिवार्य करने के लिए क्या कदम उठाए जा रहे हैं?

(9)
हिन्दी की परिशोधित मानक वर्तनी के आधार पर समग्र भारतवर्ष में पहली कक्षा की हिन्दी "वर्णमाला" की पुस्तक का संशोधन होना चाहिए। कम्प्यूटरीकरण व डैटाबेस की "वर्णात्मक" अकारादि क्रम विन्यास की जरूरत के अनुसार पहली कक्षा की "वर्णमाला" पुस्तिका में संशोधन किया जाना चाहिए। सभी हिन्दी शिक्षकों के लिए अनिवार्य रूप से तत्संबंधी प्रशिक्षण प्रदान किए जाने चाहिए।

इसके लिए क्या कदम उठाए जा रहे हैं?

(10)

अभी तक हिन्दी की मानक वर्तनी के अनुसार युनिकोड आधारित कोई भी वर्तनी संशोधक प्रोग्राम/सुविधा वाला साफ्टवेयर आम जनता के उपयोग के लिए निःशुल्क डाउनलोड व उपयोग हेतु उपलब्ध नहीं कराया जा सका है। जिसके कारण हिन्दी में अनेक अशुद्धियाँ के प्रयोग पाए जाते हैं।

इसके लिए क्या व्यवस्थाएँ की जा रही हैं?

15 May 2012

एडोबे ईनडिजाइन सीएस-6 में भारतीय लिपियों का समर्थन

Indic Support in InDesign CS6
एडोबे ईनडिजाइन सीएस-6 में भारतीय लिपियों का समर्थन

भारतीय प्रकाशन उद्योग के लिए खुशी की खबर है कि उनकी बहु-प्रतीक्षित आवश्यकता पूरी हो रही है। विश्व में सबसे लोकप्रिय प्री-प्रेस डिजाइन-पैकेज Adobe InDesign CS6 में भारतीय लिपियों के समर्थन की घोषणा की गई है।

इसके वर्ल्ड रेडी कम्पोजर (WRC) के द्वारा 10 भारतीय भाषाओं (हिन्दी, मराठी, गुजराती, तमिल, पंजाबी, बंगला, तेलगु, ओड़िआ, मलयालम एवं कन्नड़) में पाठ के सही रूप में शब्द-संयोजन को प्रकट करने का सामर्थ्य हासिल हो गया है।

देवनागरी फोंट समुदाय में Hunspell के माध्यम से वर्तनीशोधक (spell cheking) और शब्द-जोड़ी-विभाजक (Hyphenation) की सुविधा भी प्रदान कर दी गई है।

भारतीय लिपियों में काम करने की सुविधाओं को सुस्थापित या डिफॉल्ट रूप में सेट करने के लिए एक प्रोग्राम भी प्राथमिकताओं (Preferences) में दे दिया गया है। साथ ही इसमें अन्य सॉफ्टवेयरों में सम्पादित पाठ को आयात (Import) करने की सुविधा भी प्रदान की गई है।

यदि किसी फोंट में कोई विशेष संयुक्ताक्षर का ग्लीफ उपलब्ध न हो तो इसकी चेतावनी भी स्वचालित रूप से प्रकट हो जाती है।

हालांकि अभी फोटोशॉप और इल्यूस्ट्रेटर सीएस-6 (Photoshop & Illustrator CS6) आदि में युनिकोडित भारतीय लिपियों के समर्थन की कोई घोषणा नहीं हुई है।

एडोबे क्रीएटिव श्यूट मुख्यतः मीडिया, प्रकाशन और मनोरंजन उद्योग के पेशेवर महारथियों को ध्यान में रखकर बनाया गया है, जो मुख्यतः चार पैकेजों में उपलब्ध है- मास्टर कलेक्शन (रु. 1.56 लाख), डिजाइन एवं वेब प्रीमियम और प्रोडक्शन प्रीमियम (रु. 1.14 लाख) और डिजाइन स्टैण्डर्ड (रु. 78,288). ये उत्पाद इनके इन्स्टालेशन के बाद ऑनलाइन रजिस्ट्रेशन करने के बाद ही कार्यक्षम होने के शर्ताधीन होंगे।

ये मूल्य भारतीय छोटे प्रेस तथा अखबारों के लिए अत्यन्त भारी लग रहे हैं। फिर भी यह एक अच्छी खबर है भारतीय प्रकाशन उद्योग के लिए। युनिकोड में कार्य करना अधिकांश लोगों के लिए सरल हो जाएगा। विशेषकर अखबारों को दोहरा कार्य नहीं करना पड़ेगा- ऑनलाइन वेब संस्करण के लिए युनिकोड में और मुद्रित अखबार के लिए पुराने 8-बिट ASCII आधारित ttf फोंट में।

फोंट कनवर्टरों का बारम्बार उपयोग तथा तत्संबंधी समस्याओं का निराकरण काफी हद तक हो जाएगा।

एडोबे सीस्टम्स के दक्षिण एशिया के प्रबन्ध-निदेशक श्री उमंग बेदी ने पत्रकारों को बताया कि फिक्की-केपीएमजी की एक रिपोर्ट के अनुसार सन् 2016 तक भारतीय मीडिया तथा मनोरंजन उद्योग का कारोबार 1457 अरब रुपये तक पहुँचने की आशा है। अतः उन्हें अपने ऐसे उत्पादों की भारतीय बाजार में बिक्री से हजारों करोड़ रुपये का लाभ होने की उम्मीद है।

सन्दर्भ : http://www.thehindu.com/sci-tech/article3349487.ece

19 Jan 2012

Speech to text SMS

Speech to text SMS
सिर्फ बोल कर भेज सकेंगे लिखित एसएमएस

भारत के आंध्र प्रदेश में हैदराबाद स्थित अंतरराष्ट्रीय सूचना प्रौद्योगिकी संस्थान [आईआईआईटी] (http://iiit.net) एक ऐसी मोबाइल प्रौद्योगिकी विकसित करने पर काम कर रहा है जो बोले गए शब्दों को 'इनपुट' के तौर पर ग्रहण करेगी और इसे भारतीय भाषाओं के लिखित पाठ में तब्दील कर देगी जिसे एसएमएस के तौर पर भेजा जा सकेगा।

आईआईआईटी के निदेशक श्री राजीव संगल ने बताया कि परियोजना अगले दो साल में तैयार हो जाएगी और इसके लिए सूचना एवं प्रौद्योगिकी मंत्रालय वित्तीय सहायता मुहैया करा रहा है।

श्री संगल ने कहा कि अगर कोई पढ़ना या लिखना नहीं जानता है तो जो संदेश वह किसी अन्य व्यक्ति के पास भेजना चाहता है उसे वह नई प्रौद्योगिकी की मदद से फोन पर या एसएमएस पर बोल कर लिखवा सकेगा। इसके लिए पहले उसे अपनी बात बोलनी होगी और मोबाइल फोन उसे लिखित पाठ में तब्दील कर संदेश के तौर पर भेज देगा।

उन्होंने बताया कि इस परियोजना पर सात अन्य संस्थान काम कर रहे हैं। संगल ने कहा कि यह प्रौद्योगिकी मोबाइल फोन में उपयोगी रहेगी जिनमें छोटे स्क्रीन और छोटे कीबोर्ड होते हैं जिसकी वजह से अक्षर टाइप करने में दिक्कत होती है।

संकाय के एक वरिष्ठ सदस्य ने कहा कि आईआईआईटी की स्पीच लैब का उद्देश्य ऐसी प्रणालियों का विकास करना है जो बोले गए शब्दों का लिप्यंतरण कर सकें, भारतीय भाषाओं के लिए सही ध्वनि एवं उच्चारण उत्पन्न कर सकें, शरीर के चिह्नों जैसे उंगली के निशानों अथवा आखों की पुतलियों द्वारा व्यक्ति विशेष की पहचान कर सकें और वाक शैली में संवाद स्पष्ट कर सकें।

श्री संगल ने संस्थान की एक और परियोजना के बारे में बताया। उन्होंने कहा कि अनुसंधान दल मोबाइल फोनों के लिए लिखित शब्दों को पढ़ने वाली एक प्रणाली 'ऑप्टिकल कैरेक्टर रीडर' भी विकसित करने के लिए प्रयासरत है।

उन्होंने बताया कि ऑप्टिकल कैरेक्टर रीडर स्क्रीन पर लिखे शब्दों को हस्तलिपि पहचानने वाले एक उपकरण की मदद से पढ़ेगा। हम शलाका की मदद से मोबाइल फोन पर किसी भी भाषा में लिख सकते हैं। सेल फोन इसे पहचानेगा और उसके अनुसार ऑप्टिकल कैरेक्टर रीडर आगे का कदम उठाएगा।

संगल ने बताया कि संस्थान ने एक अंतर्राष्ट्रीय मोबाइल निर्माता के लिए एक ऐसा सॉफ्टवेयर विकसित किया है जो हिंदी में लिखे एसएमएस पढ़ सकेगा। बहरहाल, उन्होंने मोबाइल फोन निर्माता का नाम नहीं बताया। विश्लेषकों का कहना है कि यह प्रौद्योगिकी ग्रामीण भारतीय बाजारों के विस्तार के लिए उपयोगी साबित होगी जहा मोबाइल फोन निरक्षरता की वजह से अभी भी अपनी गहरी पैठ नहीं बना पाए हैं।

सौजन्य : दैनिक जागरण, 19 जनवरी, 2012 http://www.jagran.com/news/national-technology-for-converting-speech-into-text-msg-8782895.html>

तथा

सन्मार्ग, 19 जनवरी, 2012, पृ.11

सन्दर्भ हेतु देखें क्या कम्प्यूटर क्रान्ति लायेगी हिन्दी क्रान्ति?

उल्लेखनीय है कि हिन्दी तथा ब्राह्मी लिपि आधारित अन्य भारतीय भाषाओँ की लिपियाँ ध्वनिविज्ञान की कसौटी पर खरी उतरती हैं। इनमें जैसे बोला जाता है वैसे ही लिखा जाता है। इसके विपरीत अंग्रेजी में एक शब्द का उच्चारण कुछ और होता है तो जिन अक्षरों को मिलकर वह शब्द बना है उन अक्षरों के एक एक कर उच्चारण किया जाए तो कुछ और ही होता है।

अतः बोलकर लिखित पाठ में बदलने के श्रुतलेखन सॉफ्टवेयर अंग्रेजी भाषा (लेटिन लिपि) में सही काम नहीं करते, 50 से 70 प्रतिशत तक ही सही शब्द प्रकट कर पाते हैं। बाकी को फिर से मैनुअल सम्पादन/सुधार करना पड़ता है। जबकि हिन्दी व भारतीय भाषाओं में श्रुतलेखन सॉफ्टवेयर 90 से 98 प्रतिशत तक शुद्ध पाठ प्रदान कर पाते हैं।

साथ ही अंग्रेजी में बोलकर पाठ प्रविष्टि करके लिखित पाठ में बदलनेवाले श्रुतलेखन सॉफ्टवेयर की निर्माण विधि शब्दकोश में शब्दों की उच्चारण की गई ध्वनि-क्लिप के डैटाबेस फील्ड को वर्तनी (स्पेलिंग) के लिखित पाठ में बदलने की पद्धति पर आधारित होती है, इसलिए ऐसे सॉफ्टवेयर भारी-भारीकम तथा अधिक हार्डडिस्क स्पेस और अधिक मेमोरी घेरते हैं।

इसके विपरीत भारतीय भाषाओं के श्रुतलेखन सॉफ्टवेयर केवल मूल वर्णों के ध्वनि-अणुओं को लिपि के मूल वर्णों में बदलने की सूक्ष्म तकनीक पर आधारित होते हैं, इसलिए अत्यन्त कम भंडारण स्पेस एवं अति कम मेमोरी घेरते हैं और मोबाईल फोन पर भी चल पाने में सफल होते हैं।

आशा है कि इन सॉफ्टवेयरों के बाजार में आने पर भारतीय भाषाओं के प्रयोग में क्रान्ति दिखाई देगी।