15-Feb-2007

क्या कम्प्यूटर क्रान्ति लायेगी हिन्दी क्रान्ति?

विश्व में विकसित राष्ट्रों में इक्कीसवीं शताब्दी की ओर दौड़ की स्पर्धा में दिन दूनी रात चौगुनी हो रही कम्प्यूटर क्रान्ति और हिन्दी भाषा की वैज्ञानिक विशेषताओं को देखते हुए यह आशा करना केवल 'हवाई किले' बनाना न होगा कि निकट भविष्य में विश्व के बुद्धिजीवियों में हिन्दी सीखने की होड़ लग जायेगी। और फिर भाषा विज्ञान के विद्वानों का यह कथन सार्थक हो सकेगा कि "अपने गुणों के कारण ही हिन्दी विश्वभाषा बनने की क्षमता रखती है।"

कम्प्यूटरों का प्रयोग अब जन-जीवन के हर क्षेत्र में हो रहा है -- बालकों की शिक्षा से लेकर औद्योगिक/व्यावसायिक संस्थानों का संपूर्ण लेखा-जोखा रखने, प्रकाशन उद्योग को बिजली की गति देने, बड़े-बड़े विशाल कल-कारखानों का सञ्चालन करने, विश्वस्तरीय सञ्चार एवं सूचना प्रणाली, मौसम सम्बन्धी भविष्यवाणी करने, ज्योतिष सम्बन्धी भूत-भविष्य के हर प्रश्‍न का उत्तर देने से लेकर अन्तरिक्ष यानों व उपग्रहों के सुदूर सञ्चालन तक।

अब बाजार में नई पीढ़ी के बहु-माध्यमी (Multi-media) कम्प्यूटर भी आ गए हैं, जिनमें आँकड़ों के संसाधन के साथ-साथ ध्वनि, चलचित्र-ग्राफिक और सञ्चार सुविधाएँ भी शामिल हैं। कम्प्यूटर की सी॰डी॰रोम में आँकड़ों के अलावा संगीत एवं चित्र-प्रतिबिम्ब भी आँकिक (Digital) रूप में भण्डारित किए जा सकते हैं और आवश्यकतानुसार सुधार एवं बारम्बार प्रयोग किया जा सकता है। कम्प्यूटर ग्राफिक सिर्फ हालीवुड की फिल्मों तक ही सीमित नहीं हैं, भारतीय फिल्म 'मि॰ इण्डिया' और अनेक टी॰वी॰ विज्ञापनों में भी इसका कमाल देखा जा चुका है। अब शैक्षणिक एवं चिकित्सा क्षेत्र में भी कम्प्यूटर ग्राफिक का इस्तेमाल किया जाने लगा है। कम्प्यूटर सहयोजित डिजाइन एवं निर्माण सॉफ्टवेयर प्रोग्रामों (CAD-CAM) के द्वारा विभिन्न नक्शे, इञ्जीनियरिंग व टेक्सटाइल डिजाइन, आदि बनाने एवं उनमें रङ्ग भरने के काम भी आसानी से सम्पन्न होते हैं। अब तो आभासी वास्तविकता (वर्चुअल रीयलिटी Virtual Reality) के कमाल भी विभिन्न प्रयोगों में किए जा रहे हैं।

वर्तमान प्रचालित कम्प्यूटर सामान्यतः कुञ्जीपटल (Key-Board) की कुञ्जियों एवं 'माउस' (Mouse) या 'ज्वाय-स्टिक' (Joy stick) द्वारा सञ्चालित होते हैं। विभिन्न आँकड़ों को की-बोर्ड पर टङ्कित करके कम्प्यूटर को "फीड" करना पड़ता है। कम्प्यूटर की स्क्रीन पर प्रदर्शित सामग्री को पढ़कर आवश्यक सुधार करके अन्त में प्रिण्ट निकालकर दस्तावेज प्रस्तुत किए जाते हैं। मेग्नेटिक डिस्क में साफ्टवेयर प्रोग्राम सुरक्षित रखे जाते हैं। कम्प्यूटर की भाषा सांकेतिक इलेक्ट्रॉनिक विद्युत-तरंग पर आधारित होती है, इसका समस्त आधार सिर्फ दो संकेत -- 'हाँ' और 'नहीं' या ऋणात्मक और धनात्मक आवेश या 0 और 1 -- होते हैं। इन संकेतों की मशीनी भाषा को नियंत्रित करने के लिए बेसिक, कोबोल, सी, पास्कल आदि इण्टरप्रेटर या कम्प्यूटर लैंगवेज प्रोग्राम विकसित किए गए हैं। कम्प्यूटर के सुचारू एवं तीव्र प्रचालन हेतु इन कम्प्यूटर भाषाओं का ज्ञान तथा टाइपिंग सीखना आवश्यक है।

लेकिन मानव को और अधिक आराम व सुविधाएँ प्रदान करने की विज्ञान की होड़ में आज इलेक्ट्रॉनिक वैज्ञानिक नई पीढ़ी के ऐसे ध्वन्यात्मक (PHONETIC) कम्प्यूटरों के अनुसन्धान में लगे हैं जिनमें "की-बोर्ड" पर टाइप करने की आवश्यकता ही न रहे। कम्प्यूटर भाषा प्रोग्रामिंग एवं टाइपिंग सीखने या टाइपिस्ट या आपरेटर रखने के झमेले से मुक्ति मिल जाए। सिर्फ बोलकर कम्प्यूटर को आदेश दिया जा सके या सामग्री फीड की जा सके और वह कम्प्यूटर अपनी स्क्रीन पर सभी सङ्गणित आँकड़े, लेख, चित्र आदि में उत्तर प्रदर्शित करने के साथ-साथ बोलकर उत्तर भी दे सके और मुद्रित दस्तावेज भी प्रस्तुत कर दे।

कल्पना की जा सकती है कि तब अधिकारियों को अपने स्टेनो या निजी सहायक रखने की जरूरत न होगी। यह सभी कार्य कम्प्यूटर कर देगा। अधिकारी कम्प्यूटर को डिक्टेशन देंगे और कम्प्यूटर दस्तावेज मुद्रित कर प्रस्तुत करेगा। अपनी मेमोरी में फाइलिंग कर सुरक्षित भी रखेगा, आँकड़ों का सङ्गणन व विश्लेषण करके आवाज में बोलकर तथा स्क्रीन पर प्रदर्शित करके भी उत्तर देगा।

परन्तु वैज्ञानिकों के समक्ष ऐसे चमत्कारी कम्प्यूटर के निर्माण में मुख्यतः भाषाओं के ध्वनिचिह्नों (लिपि के अक्षरों) और शब्दों में उच्चारणगत अन्तर बाधा बनकर आता है। ध्वनिविज्ञान की कसौटी पर परिशुद्ध एक ऐसी भाषा को अपनाने से ही उनका लक्ष्य सिद्ध हो सकता है जिसके ध्वनिचिह्नों और शब्द-विन्यास में पूर्णरूपेण एकरूपता हो या कोई अन्तर न हो।

संसार भर की अन्यान्य भाषाओं में दुर्लभ यह वैज्ञानिक विशेषता हिन्दी और संस्कृत भाषा का मौलिक गुण है। 14 सितम्बर, 1989 के दैनिक जनसत्ता में प्रकाशित लेख की कुछ पंक्तियाँ इस सन्दर्भ में उल्लेखयाग्य है -- "पाणिनी के सूत्रों को पढ़कर आधुनिक वैज्ञानिक संस्कृत की गणितीय विशेषता को पहचानते हुए चकित रह गए हैं। आज के औद्योगिक युग में व्यवहार के लिए दुनिया के कई हिस्सों में संस्कृत के आधार पर एक कम्प्यूटर भाषा विकसित करने के लिए काफी खोजबीन चल रही है और उसमें पर्याप्त सफलता भी मिली है।" अमेरिका के "नासा" सैन्य अनुसन्धान केन्द्र और कम्प्यूटर तकनीकी के विशेषज्ञों ने कम्प्यूटर पर मानवीय भाषा के बीस वर्षों के लम्बे अनुसन्धान के बाद दावा किया है कि कम्प्यूटर की यान्त्रिक जरूरतों को पूरा करने के लिए विश्व की किसी भी अन्य भाषा की तुलना में संस्कृत सबसे उपयुक्त है। 'स्कूल आफ कम्प्यूटर एण्ड सिस्टम साइन्स' के एसोसियेट प्रोफेसर (जवाहर लाल नेहरू विश्वविद्यलय) डॉ॰ गुरुबचन सिंह, जो कम्प्यूटर पर संस्कृत सम्बन्धी परियोजना पर कार्यरत है, के अनुसार "संस्कृत के वाक्यों की संरचना आधुनिक ज्ञान के निरूपण और निष्कर्ष निकालने के विधि, जैसे सिमेण्टिक नेट्स, फ्रेम्स, कन्सेप्चुअल डिपेण्डेन्सी सिद्धान्त, कन्सेप्चुअल ग्राफ आदि से बहुत मिलती है, जो मशीन की डिजाइनिंग में प्रयुक्त की जा सके।"

लेकिन कठिन व्याकरणयुक्त संस्कृत सामान्य-जन को काफी कठिन लगती है। हिन्दी भाषा सरल होने के साथ-साथ वैज्ञानिकता पूर्ण भी है। शायद इसीलिए भूतपूर्व केन्द्रीय सूचना व प्रसारण मंत्री श्री हरिकिशन लाल भगत ने एक सम्मेलन में कहा था -- "भविष्य के कम्प्यूटरों के लिए हिन्दी ही सर्वाधिक उपयुक्त भाषा होगी।"

विश्व की अन्यान्य भाषाओं में ऐसी ध्वन्यात्मक समन्वयता का अभाव पाया जाता है। अन्तर्राष्ट्रीय मञ्च पर शिष्ट वर्ग की भाषा अंग्रेजी में अक्षरों का अपना स्वतन्त्र उच्चारण कुछ और है तो अक्षरों से मिलकर बने शब्दों का बिल्कुल भिन्न है। जैसे--


"GO'' का आक्षरिक उच्चारण "जी ओ" है तो इससे मिलकर बने शब्द का उच्चारण "गो" होता है।
"SO'' का आक्षरिक उच्चारण "एस ओ" है तो शाब्दिक "सो" होता है।
और फिर उच्चारण का कोई एक समान नियम भी लागू नहीं है।
"TO'' का आक्षरिक उच्चारण "टी ओ" है तो शाब्दिक " टु",
"DO'' का आक्षरिक उच्चारण "डी ओ" है तो शाब्दिक "डु" होता है।
यदि कोई एक समान नियम मानकर पहले दो शब्दों का अनुकरण करे तो "TO'' एवं "DO'' का शाब्दिक उच्चारण भी क्रमश: "टो" एवं "डो" होना चाहिए न।
अक्षरों का अलग-अलग शब्दों में उच्चारण अलग-अलग होता जाता है, जैसे - 'G' (जी) का 'page' (पेज) में "ज" और "pag'' (पैग) में "ग" होता है।
इसी कारण अंग्रजी के अधिकांश शब्दों का उच्चारण (prounciation of same spelling) अलग-अलग व्यक्ति अलग-अलग प्रकार से करते पाये जाते हैं तो एक ही शब्द की वर्तनी (spelling) भिन्न-भिन्न प्रकार से लिखी जाती है। इसके लिए हिन्दी के एक ही शब्द 'चौधरी' को उदाहरणार्थ देखें :---

1.चौधरी
1.Chaudhary 2.Chaudhari 3.Chaudharie
4.Chawdhry 5.Chaudhri 6.Chaudhry
7.Chaudhri 8.Chawdhary 9.Chawdhury
10.Chodhri 11.Choadhri 12.Chaodhry
13.Choudhhari 14.Choudhary 15.Choudhri
16.Choudhry 17.Choudhri 18.Choudhree
19.Chowdary 20.Choudhury 21.Chowdhary
22.Choudharii 23.Chawdharii 24.Chaudharii


संसार की अन्यान्य भाषाओं - फ्रेञ्च, जर्मन, लेटिन, हिब्रू, चीनी, अरबी, फारसी आदि में भी ऐसी ही कुछ न कुछ अस्पष्टता देखी जाती है। कुछ भारतीय भाषाओं में भी उच्चारणगत स्वर-भेद दिखाई देते है। उदाहरणार्थ ओड़िआ व बंगला भाषा में लिखा गया शब्द "कटक" बोलते वक्त "अ"- कार में कुछ "ओ"-कार का लहजा मिल जाने से "कोटोको" जैसा उच्चारित होता है। बंगला में 'व' अक्षर का अभाव होने से 'व' के संयुक्ताक्षरों में से 'व' ध्वनि गायब हो जाती है तथा 'व' वर्ण के पूर्ण प्रयोग के स्थान पर 'ब' का प्रयोग करना पड़ता है। कुछ दक्षिण भारतीय भाषाओं में भी ऐसी समस्याएँ दृष्टगोचर होती है। निस्सन्देह कम्प्यूटर की ध्वनि- तकनीक पर ऐसी जटिल और बेसिरपैर की समस्या का स्वत: समाधान हो जाना कितना कठिन है।
इसके विपरीत हिन्दी भाषा में जो बोला जाता है, वही लिखा जाता है। ध्वनि-सङ्केतों के वैज्ञानिक क्रम, उच्चारणानुकूल लिखावट, सुपाठ्य लिपि, ह्रस्व व दीर्घ स्वरों, सघोष व अघोष, अल्पप्राण व महाप्राण व्यञ्जन ध्वनियों के लिए अलग-अलग चिह्नों की मौलिक विशेषता के साथ इसमें दक्षिण भारतीय अतरिक्त स्वरों, अर्द्ध-संवृत्त, विवृत आदि विदेशी स्वरों व अरबी-फारसी की ध्वनियों को शामिल किए जाने के कारण संसार की किसी भी भाषा यो बोली के शब्दों को हिन्दी में हूबहू उच्चारित और लिपिबद्ध किया जा सकता है। जबकि हिन्दी एवं संस्कृत भाषा के शब्दों को अंग्रेजी में बोलना व रोमन लिपि में हूबहू लिखना लगभग असम्भव है।

विश्व-भाषाओं में हिन्दी को सर्वोत्तम वैज्ञानिक ध्वनिपरक भाषा स्वीकार किए जाने के पीछे सबसे बड़ा कारण यह है कि हिन्दी एक लचीली भाषा है। इसे किसी भी भाषायी संरचना में ढालकर उसी के अनुरूप बनाया जा सकता है। सर विलियम जोन्स का यह कथन इसके कितना अनुकूल है -- "नागरी लिपि की वैज्ञानिकता पर संसार के विद्वान मुग्ध रहे हैं।"
ध्वन्यात्मक कम्प्यूटरों की श्रृंखला में प्रोसेस कण्ट्रोल या एनालोग कम्प्यूटर तो बन चुके हैं जो यन्त्रमानव "रोबोट" की तरह अनेक कार्य करते हैं। उनकी स्मृति में रिकार्ड की गई शब्दावली के आधार पर प्रश्‍नों के निर्धारित उत्तर बोलकर भी देते हैं। ध्वनि-नियम पर आधारित "खुल जा सम सम" के अंदाज में "कोड-वर्ड" प्रचालित अनेक यन्त्र बन चुके हैं। इनकी परिकल्पना दूरदर्शन विज्ञान धारावाहिक "स्पेस सिटी सिग्मा" में स्वचालित दरवाजों, कम्प्यूटर कलाई घड़ी और "ब्रेन बैंक" के रूप में देखी जा चुकी है।

वैसे तो वर्ड-प्रोसेसर पर लिप्यन्तरण (TRANSLITERATION), ओडियोग्राफिक प्रिण्टिङ्ग तथा कम्प्यूटर अनुवादक यन्त्र भी व्यवहार में आ चुके हैं, परन्तु उनकी क्षमता उनके स्मृतिकोश में भण्डारित शब्दकोशों तक ही सीमित है। किन्तु स्टेनों की तरह डिक्टेशन लेकर या किसी भी आवाज को ग्रहण कर, हरेक ध्वनि को स्वचालित रूप से विश्लेषित करके सम्पूर्ण सङ्गणना कार्य करके, बोलकर उत्तर देने, स्क्रीन पर प्रदर्शित करने और प्रिण्टर पर मुद्रित दस्तावेज प्रस्तुत कर सकने वाले कम्प्यूटरों के कार्य सम्पादन हेतु ध्वनिविज्ञान के सिद्धान्तों की कसौटी पर सुगठित हिन्दी व संस्कृत भाषाएँ ही सर्वाधिक उपयुक्त होगी।

तकनीकी संरचना : ऐसे ध्वन्यात्मक (PHONETIC) कम्प्यूटरों की तकनीकी संरचना में इनपुट की-बोर्ड के अलावा एक ध्वनि बोर्ड (add on speech Board) होगा जिसमें उत्कृष्टतम एकमुखी (एक ही दिशा से आई ध्वनि को ग्रहण करनेवाला) माइक्रोफोन रिसीवर लगा होगा जो ध्वनि-सङ्केतों को मुख्यतः चार अङ्गों में विश्लेषित करेगा--
(1) ध्वनि-तरंगों की आवृत्ति (FREQUENCY),
(2) प्रबलता (VOLUME),
(3) स्वरमान तारत्व (PITCH), और
(4) व्यक्तिगत लहजे या स्वराघात (TONE) --
और वर्गीकरण करके इलेक्ट्रॉनिक सूक्ष्म-ध्वनि-सङ्केतों में बदलकर हार्ड डिस्क या रैम या रोम में भण्डारण करेगा। बाइनेरी मशीनी सङ्केत-लिपि में केन्द्रीय सूक्ष्म-संसाधक में सभी गाणितीय, आभियान्त्रिक या वैज्ञानिक सङ्गणनाओं के बाद समस्त जानकारियाँ अपने स्मृतिकोश में भण्डारित करेगा। आऊटपुट उत्तर इसमें लगे विशेष "स्पीकर" द्वारा आवाज में बोलकर सुनाने के साथ-साथ स्क्रीन पर प्रदर्शित करेगा और आवश्यकता के अनुरूप प्रिण्टर पर मुद्रित दस्तावेज भी प्रस्तुत करेगा।

आजकल कम्प्यूटर बाजार में हो रहे "कम्प्यूटर-वायरस" के प्रकोपों, साफ्टवेयर प्रोग्रामों की नकल की भयानक समस्याओं से ऐसे ध्वन्यात्मक कम्प्यूटर अधिक सुरक्षित रह सकेंगे क्योंकि विश्व में किन्हीं दो व्यक्तियों की आवाज बिल्कुल एक जैसी नहीं होती। सही मालिक की आवाज के अनुसार प्रोग्रामिंग किए जाने पर यह कम्प्यूटर अन्य किसी का आदेश नहीं मानेगा।

लेकिन इस लक्ष्य तक पहुँचने में अभी अनेक तकनीकी, ध्वनिवैज्ञानिक व भाषागत बाधायें पार करनी होगी। हिन्दी भाषा को सर्वोपयोगी बनाने हेतु लिङ्ग-वचन सम्बन्धी क्रिया-पदों के सरलीकरण आदि विषयों पर शोध किया जाना है।

ऐसे कम्प्यूटर के प्रचलन से हिन्दी को विश्व में उल्लेखनीय महत्ता मिलेगी और हिन्दी भाषा की सरलता के कारण संसार के लोग इसे आसानी से सीख सकेंगे। आचार्य क्षितिमोहन सेन का कथन है कि "हिन्दी विश्व की सरलतम भाषाओं में से है।" आचार्य बिनोवा भावे का कथन भी कितना सार्थक है कि "केवल अंग्रेजी सीखने में जितना श्रम करना पड़ता है, उतने में हिन्दुस्तान की सभी भाषायें सीखी जा सकती है।"

अब हमें अपनी हीनभावना को त्यागकर, हिन्दी की महानता को पहचानकर स्वयं को गौरवान्वित अनुभव करना चाहिए। सभी हिन्दी को "विश्वभाषा" पद एवं भारत को फिर से विश्वगुरू का मान दिलाने हेतु एकजुट हो जायें तो हमारे मनीषियों का स्वप्न साकार करना और सरल हो जाये।

आधुनिक युग का समस्त तकनीकी और वैज्ञानिक ज्ञान कम्प्यूटर पर निर्भर हो गया है, अतः ऐसे कम्प्यूटर के आविर्भाव से समस्त तकनीकी और वैज्ञानिक कार्यों में हिन्दी का प्रयोग स्वतः ही होने लगेगा।

गर्व की बात है कि हिन्दी विरोधी के रूप में प्रसिद्ध मद्रास के आई॰आई॰टी॰ में सर्वप्रथम "बोलकर कम्प्यूटरों में संदेशों के आदन-प्रदान की प्रणाली तथा भारतीय भाषाओं में सीस्टम हार्डवेयर के विकास" का कार्य चल रहा है। 'सी-डैक', पूना द्वारा भी शोध-कार्य जारी है। मुक्त स्रोत प्रचालन प्रणाली Linux के अन्तर्गत हाल ही में यूनीकोड हिन्दी पाठ को बोलकर सुनाने (text to speech) सॉफ्टवेयर का भी सफलता के साथ जारी किया गया है। (देखें : http://espeak.sourceforge.net)। भारत के राष्ट्रपति जी के प्रोत्साहन के अनुसार हमारे वैज्ञानिक एवं हिन्दी के विद्वान मिलकर लगनपूर्वक जुट जायें तो मञ्जिल कोई अधिक दूर नहीं लगती।
(मूल लेख 'अक्षर-1993' में प्रकाशित)

1 comment:

ePandit said...

आपकी बात सही है। अभी तक जो Speech to Text प्रणालियाँ हैं वो आंशिक रुप से ही काम करती हैं। ऑफिस xp में जो टैक्स्ट टू स्पीच प्रणाली है उसका उपयोग किया तो एक लाइन में मुश्किल से दो शब्द सही लिखता है। इससे जल्दी आदमी कीबोर्ड से टाइप कर सकता है।

इसके अतिरिक्त विंडोज xp की जो दूसरी सीडी है Plus उसमें मीडिया प्लेयर के लिए वायस कमाण्ड का विकल्प है, वो कुछ बेहतर है।

अभी इस मामले में विंडोज प्रोग्रामों में Dragon Naturally Speaking ही सबसे अधिक कारगर है।

इसका कारण यही है कि वो आवाज को ठीक से एनालाइज नहीं कर पा रहा। अब चूंकि हिन्दी फोनेटिक तौर पर विश्व की सर्वाधिक वैज्ञानिक भाषा है अतः उम्मीद की जा सकती है कि इस मामले में वो बेहतर साबित होगी।

लेकिन दिक्कत यही है कि हिन्दी पर इस बारे में कहीं अनुसंधान चल ही नही रहा, सिवाय सीडैक को छोड़कर। यद्यपि सीडैक इस दिशा में अच्छा कार्य कर रहा है। कुछ समय पहले सीडैक द्वारा विकसित InScript Keyboard का ट्यूटर देखा तो हैरान रह गया उसकी वैज्ञानिकता पर।

परंतु हिन्दी संबंधी सभी प्रयास अभी अपर्याप्त हैं। सबसे पहले आवश्यकता है कि सभी कम्प्यूटरों पर हिन्दी का पूरा सपोर्ट टाइपिंग की सुविधा सहित बाई डिफॉल्ट मौजूद हो।