15 Feb 2007

क्या कम्प्यूटर क्रान्ति लायेगी हिन्दी क्रान्ति?

विश्व में विकसित राष्ट्रों में इक्कीसवीं शताब्दी की ओर दौड़ की स्पर्धा में दिन दूनी रात चौगुनी हो रही कम्प्यूटर क्रान्ति और हिन्दी भाषा की वैज्ञानिक विशेषताओं को देखते हुए यह आशा करना केवल 'हवाई किले' बनाना न होगा कि निकट भविष्य में विश्व के बुद्धिजीवियों में हिन्दी सीखने की होड़ लग जायेगी। और फिर भाषा विज्ञान के विद्वानों का यह कथन सार्थक हो सकेगा कि "अपने गुणों के कारण ही हिन्दी विश्वभाषा बनने की क्षमता रखती है।"

कम्प्यूटरों का प्रयोग अब जन-जीवन के हर क्षेत्र में हो रहा है -- बालकों की शिक्षा से लेकर औद्योगिक/व्यावसायिक संस्थानों का संपूर्ण लेखा-जोखा रखने, प्रकाशन उद्योग को बिजली की गति देने, बड़े-बड़े विशाल कल-कारखानों का सञ्चालन करने, विश्वस्तरीय सञ्चार एवं सूचना प्रणाली, मौसम सम्बन्धी भविष्यवाणी करने, ज्योतिष सम्बन्धी भूत-भविष्य के हर प्रश्‍न का उत्तर देने से लेकर अन्तरिक्ष यानों व उपग्रहों के सुदूर सञ्चालन तक।

अब बाजार में नई पीढ़ी के बहु-माध्यमी (Multi-media) कम्प्यूटर भी आ गए हैं, जिनमें आँकड़ों के संसाधन के साथ-साथ ध्वनि, चलचित्र-ग्राफिक और सञ्चार सुविधाएँ भी शामिल हैं। कम्प्यूटर की सी॰डी॰रोम में आँकड़ों के अलावा संगीत एवं चित्र-प्रतिबिम्ब भी आँकिक (Digital) रूप में भण्डारित किए जा सकते हैं और आवश्यकतानुसार सुधार एवं बारम्बार प्रयोग किया जा सकता है। कम्प्यूटर ग्राफिक सिर्फ हालीवुड की फिल्मों तक ही सीमित नहीं हैं, भारतीय फिल्म 'मि॰ इण्डिया' और अनेक टी॰वी॰ विज्ञापनों में भी इसका कमाल देखा जा चुका है। अब शैक्षणिक एवं चिकित्सा क्षेत्र में भी कम्प्यूटर ग्राफिक का इस्तेमाल किया जाने लगा है। कम्प्यूटर सहयोजित डिजाइन एवं निर्माण सॉफ्टवेयर प्रोग्रामों (CAD-CAM) के द्वारा विभिन्न नक्शे, इञ्जीनियरिंग व टेक्सटाइल डिजाइन, आदि बनाने एवं उनमें रङ्ग भरने के काम भी आसानी से सम्पन्न होते हैं। अब तो आभासी वास्तविकता (वर्चुअल रीयलिटी Virtual Reality) के कमाल भी विभिन्न प्रयोगों में किए जा रहे हैं।

वर्तमान प्रचालित कम्प्यूटर सामान्यतः कुञ्जीपटल (Key-Board) की कुञ्जियों एवं 'माउस' (Mouse) या 'ज्वाय-स्टिक' (Joy stick) द्वारा सञ्चालित होते हैं। विभिन्न आँकड़ों को की-बोर्ड पर टङ्कित करके कम्प्यूटर को "फीड" करना पड़ता है। कम्प्यूटर की स्क्रीन पर प्रदर्शित सामग्री को पढ़कर आवश्यक सुधार करके अन्त में प्रिण्ट निकालकर दस्तावेज प्रस्तुत किए जाते हैं। मेग्नेटिक डिस्क में साफ्टवेयर प्रोग्राम सुरक्षित रखे जाते हैं। कम्प्यूटर की भाषा सांकेतिक इलेक्ट्रॉनिक विद्युत-तरंग पर आधारित होती है, इसका समस्त आधार सिर्फ दो संकेत -- 'हाँ' और 'नहीं' या ऋणात्मक और धनात्मक आवेश या 0 और 1 -- होते हैं। इन संकेतों की मशीनी भाषा को नियंत्रित करने के लिए बेसिक, कोबोल, सी, पास्कल आदि इण्टरप्रेटर या कम्प्यूटर लैंगवेज प्रोग्राम विकसित किए गए हैं। कम्प्यूटर के सुचारू एवं तीव्र प्रचालन हेतु इन कम्प्यूटर भाषाओं का ज्ञान तथा टाइपिंग सीखना आवश्यक है।

लेकिन मानव को और अधिक आराम व सुविधाएँ प्रदान करने की विज्ञान की होड़ में आज इलेक्ट्रॉनिक वैज्ञानिक नई पीढ़ी के ऐसे ध्वन्यात्मक (PHONETIC) कम्प्यूटरों के अनुसन्धान में लगे हैं जिनमें "की-बोर्ड" पर टाइप करने की आवश्यकता ही न रहे। कम्प्यूटर भाषा प्रोग्रामिंग एवं टाइपिंग सीखने या टाइपिस्ट या आपरेटर रखने के झमेले से मुक्ति मिल जाए। सिर्फ बोलकर कम्प्यूटर को आदेश दिया जा सके या सामग्री फीड की जा सके और वह कम्प्यूटर अपनी स्क्रीन पर सभी सङ्गणित आँकड़े, लेख, चित्र आदि में उत्तर प्रदर्शित करने के साथ-साथ बोलकर उत्तर भी दे सके और मुद्रित दस्तावेज भी प्रस्तुत कर दे।

कल्पना की जा सकती है कि तब अधिकारियों को अपने स्टेनो या निजी सहायक रखने की जरूरत न होगी। यह सभी कार्य कम्प्यूटर कर देगा। अधिकारी कम्प्यूटर को डिक्टेशन देंगे और कम्प्यूटर दस्तावेज मुद्रित कर प्रस्तुत करेगा। अपनी मेमोरी में फाइलिंग कर सुरक्षित भी रखेगा, आँकड़ों का सङ्गणन व विश्लेषण करके आवाज में बोलकर तथा स्क्रीन पर प्रदर्शित करके भी उत्तर देगा।

परन्तु वैज्ञानिकों के समक्ष ऐसे चमत्कारी कम्प्यूटर के निर्माण में मुख्यतः भाषाओं के ध्वनिचिह्नों (लिपि के अक्षरों) और शब्दों में उच्चारणगत अन्तर बाधा बनकर आता है। ध्वनिविज्ञान की कसौटी पर परिशुद्ध एक ऐसी भाषा को अपनाने से ही उनका लक्ष्य सिद्ध हो सकता है जिसके ध्वनिचिह्नों और शब्द-विन्यास में पूर्णरूपेण एकरूपता हो या कोई अन्तर न हो।

संसार भर की अन्यान्य भाषाओं में दुर्लभ यह वैज्ञानिक विशेषता हिन्दी और संस्कृत भाषा का मौलिक गुण है। 14 सितम्बर, 1989 के दैनिक जनसत्ता में प्रकाशित लेख की कुछ पंक्तियाँ इस सन्दर्भ में उल्लेखयाग्य है -- "पाणिनी के सूत्रों को पढ़कर आधुनिक वैज्ञानिक संस्कृत की गणितीय विशेषता को पहचानते हुए चकित रह गए हैं। आज के औद्योगिक युग में व्यवहार के लिए दुनिया के कई हिस्सों में संस्कृत के आधार पर एक कम्प्यूटर भाषा विकसित करने के लिए काफी खोजबीन चल रही है और उसमें पर्याप्त सफलता भी मिली है।" अमेरिका के "नासा" सैन्य अनुसन्धान केन्द्र और कम्प्यूटर तकनीकी के विशेषज्ञों ने कम्प्यूटर पर मानवीय भाषा के बीस वर्षों के लम्बे अनुसन्धान के बाद दावा किया है कि कम्प्यूटर की यान्त्रिक जरूरतों को पूरा करने के लिए विश्व की किसी भी अन्य भाषा की तुलना में संस्कृत सबसे उपयुक्त है। 'स्कूल आफ कम्प्यूटर एण्ड सिस्टम साइन्स' के एसोसियेट प्रोफेसर (जवाहर लाल नेहरू विश्वविद्यलय) डॉ॰ गुरुबचन सिंह, जो कम्प्यूटर पर संस्कृत सम्बन्धी परियोजना पर कार्यरत है, के अनुसार "संस्कृत के वाक्यों की संरचना आधुनिक ज्ञान के निरूपण और निष्कर्ष निकालने के विधि, जैसे सिमेण्टिक नेट्स, फ्रेम्स, कन्सेप्चुअल डिपेण्डेन्सी सिद्धान्त, कन्सेप्चुअल ग्राफ आदि से बहुत मिलती है, जो मशीन की डिजाइनिंग में प्रयुक्त की जा सके।"

लेकिन कठिन व्याकरणयुक्त संस्कृत सामान्य-जन को काफी कठिन लगती है। हिन्दी भाषा सरल होने के साथ-साथ वैज्ञानिकता पूर्ण भी है। शायद इसीलिए भूतपूर्व केन्द्रीय सूचना व प्रसारण मंत्री श्री हरिकिशन लाल भगत ने एक सम्मेलन में कहा था -- "भविष्य के कम्प्यूटरों के लिए हिन्दी ही सर्वाधिक उपयुक्त भाषा होगी।"

विश्व की अन्यान्य भाषाओं में ऐसी ध्वन्यात्मक समन्वयता का अभाव पाया जाता है। अन्तर्राष्ट्रीय मञ्च पर शिष्ट वर्ग की भाषा अंग्रेजी में अक्षरों का अपना स्वतन्त्र उच्चारण कुछ और है तो अक्षरों से मिलकर बने शब्दों का बिल्कुल भिन्न है। जैसे--


"GO'' का आक्षरिक उच्चारण "जी ओ" है तो इससे मिलकर बने शब्द का उच्चारण "गो" होता है।
"SO'' का आक्षरिक उच्चारण "एस ओ" है तो शाब्दिक "सो" होता है।
और फिर उच्चारण का कोई एक समान नियम भी लागू नहीं है।
"TO'' का आक्षरिक उच्चारण "टी ओ" है तो शाब्दिक " टु",
"DO'' का आक्षरिक उच्चारण "डी ओ" है तो शाब्दिक "डु" होता है।
यदि कोई एक समान नियम मानकर पहले दो शब्दों का अनुकरण करे तो "TO'' एवं "DO'' का शाब्दिक उच्चारण भी क्रमश: "टो" एवं "डो" होना चाहिए न।
अक्षरों का अलग-अलग शब्दों में उच्चारण अलग-अलग होता जाता है, जैसे - 'G' (जी) का 'page' (पेज) में "ज" और "pag'' (पैग) में "ग" होता है।
इसी कारण अंग्रजी के अधिकांश शब्दों का उच्चारण (prounciation of same spelling) अलग-अलग व्यक्ति अलग-अलग प्रकार से करते पाये जाते हैं तो एक ही शब्द की वर्तनी (spelling) भिन्न-भिन्न प्रकार से लिखी जाती है। इसके लिए हिन्दी के एक ही शब्द 'चौधरी' को उदाहरणार्थ देखें :---

1.चौधरी
1.Chaudhary 2.Chaudhari 3.Chaudharie
4.Chawdhry 5.Chaudhri 6.Chaudhry
7.Chaudhri 8.Chawdhary 9.Chawdhury
10.Chodhri 11.Choadhri 12.Chaodhry
13.Choudhhari 14.Choudhary 15.Choudhri
16.Choudhry 17.Choudhri 18.Choudhree
19.Chowdary 20.Choudhury 21.Chowdhary
22.Choudharii 23.Chawdharii 24.Chaudharii


संसार की अन्यान्य भाषाओं - फ्रेञ्च, जर्मन, लेटिन, हिब्रू, चीनी, अरबी, फारसी आदि में भी ऐसी ही कुछ न कुछ अस्पष्टता देखी जाती है। कुछ भारतीय भाषाओं में भी उच्चारणगत स्वर-भेद दिखाई देते है। उदाहरणार्थ ओड़िआ व बंगला भाषा में लिखा गया शब्द "कटक" बोलते वक्त "अ"- कार में कुछ "ओ"-कार का लहजा मिल जाने से "कोटोको" जैसा उच्चारित होता है। बंगला में 'व' अक्षर का अभाव होने से 'व' के संयुक्ताक्षरों में से 'व' ध्वनि गायब हो जाती है तथा 'व' वर्ण के पूर्ण प्रयोग के स्थान पर 'ब' का प्रयोग करना पड़ता है। कुछ दक्षिण भारतीय भाषाओं में भी ऐसी समस्याएँ दृष्टगोचर होती है। निस्सन्देह कम्प्यूटर की ध्वनि- तकनीक पर ऐसी जटिल और बेसिरपैर की समस्या का स्वत: समाधान हो जाना कितना कठिन है।
इसके विपरीत हिन्दी भाषा में जो बोला जाता है, वही लिखा जाता है। ध्वनि-सङ्केतों के वैज्ञानिक क्रम, उच्चारणानुकूल लिखावट, सुपाठ्य लिपि, ह्रस्व व दीर्घ स्वरों, सघोष व अघोष, अल्पप्राण व महाप्राण व्यञ्जन ध्वनियों के लिए अलग-अलग चिह्नों की मौलिक विशेषता के साथ इसमें दक्षिण भारतीय अतरिक्त स्वरों, अर्द्ध-संवृत्त, विवृत आदि विदेशी स्वरों व अरबी-फारसी की ध्वनियों को शामिल किए जाने के कारण संसार की किसी भी भाषा यो बोली के शब्दों को हिन्दी में हूबहू उच्चारित और लिपिबद्ध किया जा सकता है। जबकि हिन्दी एवं संस्कृत भाषा के शब्दों को अंग्रेजी में बोलना व रोमन लिपि में हूबहू लिखना लगभग असम्भव है।

विश्व-भाषाओं में हिन्दी को सर्वोत्तम वैज्ञानिक ध्वनिपरक भाषा स्वीकार किए जाने के पीछे सबसे बड़ा कारण यह है कि हिन्दी एक लचीली भाषा है। इसे किसी भी भाषायी संरचना में ढालकर उसी के अनुरूप बनाया जा सकता है। सर विलियम जोन्स का यह कथन इसके कितना अनुकूल है -- "नागरी लिपि की वैज्ञानिकता पर संसार के विद्वान मुग्ध रहे हैं।"
ध्वन्यात्मक कम्प्यूटरों की श्रृंखला में प्रोसेस कण्ट्रोल या एनालोग कम्प्यूटर तो बन चुके हैं जो यन्त्रमानव "रोबोट" की तरह अनेक कार्य करते हैं। उनकी स्मृति में रिकार्ड की गई शब्दावली के आधार पर प्रश्‍नों के निर्धारित उत्तर बोलकर भी देते हैं। ध्वनि-नियम पर आधारित "खुल जा सम सम" के अंदाज में "कोड-वर्ड" प्रचालित अनेक यन्त्र बन चुके हैं। इनकी परिकल्पना दूरदर्शन विज्ञान धारावाहिक "स्पेस सिटी सिग्मा" में स्वचालित दरवाजों, कम्प्यूटर कलाई घड़ी और "ब्रेन बैंक" के रूप में देखी जा चुकी है।

वैसे तो वर्ड-प्रोसेसर पर लिप्यन्तरण (TRANSLITERATION), ओडियोग्राफिक प्रिण्टिङ्ग तथा कम्प्यूटर अनुवादक यन्त्र भी व्यवहार में आ चुके हैं, परन्तु उनकी क्षमता उनके स्मृतिकोश में भण्डारित शब्दकोशों तक ही सीमित है। किन्तु स्टेनों की तरह डिक्टेशन लेकर या किसी भी आवाज को ग्रहण कर, हरेक ध्वनि को स्वचालित रूप से विश्लेषित करके सम्पूर्ण सङ्गणना कार्य करके, बोलकर उत्तर देने, स्क्रीन पर प्रदर्शित करने और प्रिण्टर पर मुद्रित दस्तावेज प्रस्तुत कर सकने वाले कम्प्यूटरों के कार्य सम्पादन हेतु ध्वनिविज्ञान के सिद्धान्तों की कसौटी पर सुगठित हिन्दी व संस्कृत भाषाएँ ही सर्वाधिक उपयुक्त होगी।

तकनीकी संरचना : ऐसे ध्वन्यात्मक (PHONETIC) कम्प्यूटरों की तकनीकी संरचना में इनपुट की-बोर्ड के अलावा एक ध्वनि बोर्ड (add on speech Board) होगा जिसमें उत्कृष्टतम एकमुखी (एक ही दिशा से आई ध्वनि को ग्रहण करनेवाला) माइक्रोफोन रिसीवर लगा होगा जो ध्वनि-सङ्केतों को मुख्यतः चार अङ्गों में विश्लेषित करेगा--
(1) ध्वनि-तरंगों की आवृत्ति (FREQUENCY),
(2) प्रबलता (VOLUME),
(3) स्वरमान तारत्व (PITCH), और
(4) व्यक्तिगत लहजे या स्वराघात (TONE) --
और वर्गीकरण करके इलेक्ट्रॉनिक सूक्ष्म-ध्वनि-सङ्केतों में बदलकर हार्ड डिस्क या रैम या रोम में भण्डारण करेगा। बाइनेरी मशीनी सङ्केत-लिपि में केन्द्रीय सूक्ष्म-संसाधक में सभी गाणितीय, आभियान्त्रिक या वैज्ञानिक सङ्गणनाओं के बाद समस्त जानकारियाँ अपने स्मृतिकोश में भण्डारित करेगा। आऊटपुट उत्तर इसमें लगे विशेष "स्पीकर" द्वारा आवाज में बोलकर सुनाने के साथ-साथ स्क्रीन पर प्रदर्शित करेगा और आवश्यकता के अनुरूप प्रिण्टर पर मुद्रित दस्तावेज भी प्रस्तुत करेगा।

आजकल कम्प्यूटर बाजार में हो रहे "कम्प्यूटर-वायरस" के प्रकोपों, साफ्टवेयर प्रोग्रामों की नकल की भयानक समस्याओं से ऐसे ध्वन्यात्मक कम्प्यूटर अधिक सुरक्षित रह सकेंगे क्योंकि विश्व में किन्हीं दो व्यक्तियों की आवाज बिल्कुल एक जैसी नहीं होती। सही मालिक की आवाज के अनुसार प्रोग्रामिंग किए जाने पर यह कम्प्यूटर अन्य किसी का आदेश नहीं मानेगा।

लेकिन इस लक्ष्य तक पहुँचने में अभी अनेक तकनीकी, ध्वनिवैज्ञानिक व भाषागत बाधायें पार करनी होगी। हिन्दी भाषा को सर्वोपयोगी बनाने हेतु लिङ्ग-वचन सम्बन्धी क्रिया-पदों के सरलीकरण आदि विषयों पर शोध किया जाना है।

ऐसे कम्प्यूटर के प्रचलन से हिन्दी को विश्व में उल्लेखनीय महत्ता मिलेगी और हिन्दी भाषा की सरलता के कारण संसार के लोग इसे आसानी से सीख सकेंगे। आचार्य क्षितिमोहन सेन का कथन है कि "हिन्दी विश्व की सरलतम भाषाओं में से है।" आचार्य बिनोवा भावे का कथन भी कितना सार्थक है कि "केवल अंग्रेजी सीखने में जितना श्रम करना पड़ता है, उतने में हिन्दुस्तान की सभी भाषायें सीखी जा सकती है।"

अब हमें अपनी हीनभावना को त्यागकर, हिन्दी की महानता को पहचानकर स्वयं को गौरवान्वित अनुभव करना चाहिए। सभी हिन्दी को "विश्वभाषा" पद एवं भारत को फिर से विश्वगुरू का मान दिलाने हेतु एकजुट हो जायें तो हमारे मनीषियों का स्वप्न साकार करना और सरल हो जाये।

आधुनिक युग का समस्त तकनीकी और वैज्ञानिक ज्ञान कम्प्यूटर पर निर्भर हो गया है, अतः ऐसे कम्प्यूटर के आविर्भाव से समस्त तकनीकी और वैज्ञानिक कार्यों में हिन्दी का प्रयोग स्वतः ही होने लगेगा।

गर्व की बात है कि हिन्दी विरोधी के रूप में प्रसिद्ध मद्रास के आई॰आई॰टी॰ में सर्वप्रथम "बोलकर कम्प्यूटरों में संदेशों के आदन-प्रदान की प्रणाली तथा भारतीय भाषाओं में सीस्टम हार्डवेयर के विकास" का कार्य चल रहा है। 'सी-डैक', पूना द्वारा भी शोध-कार्य जारी है। मुक्त स्रोत प्रचालन प्रणाली Linux के अन्तर्गत हाल ही में यूनीकोड हिन्दी पाठ को बोलकर सुनाने (text to speech) सॉफ्टवेयर का भी सफलता के साथ जारी किया गया है। (देखें : http://espeak.sourceforge.net)। भारत के राष्ट्रपति जी के प्रोत्साहन के अनुसार हमारे वैज्ञानिक एवं हिन्दी के विद्वान मिलकर लगनपूर्वक जुट जायें तो मञ्जिल कोई अधिक दूर नहीं लगती।
(मूल लेख 'अक्षर-1993' में प्रकाशित)

1 comment:

ePandit said...

आपकी बात सही है। अभी तक जो Speech to Text प्रणालियाँ हैं वो आंशिक रुप से ही काम करती हैं। ऑफिस xp में जो टैक्स्ट टू स्पीच प्रणाली है उसका उपयोग किया तो एक लाइन में मुश्किल से दो शब्द सही लिखता है। इससे जल्दी आदमी कीबोर्ड से टाइप कर सकता है।

इसके अतिरिक्त विंडोज xp की जो दूसरी सीडी है Plus उसमें मीडिया प्लेयर के लिए वायस कमाण्ड का विकल्प है, वो कुछ बेहतर है।

अभी इस मामले में विंडोज प्रोग्रामों में Dragon Naturally Speaking ही सबसे अधिक कारगर है।

इसका कारण यही है कि वो आवाज को ठीक से एनालाइज नहीं कर पा रहा। अब चूंकि हिन्दी फोनेटिक तौर पर विश्व की सर्वाधिक वैज्ञानिक भाषा है अतः उम्मीद की जा सकती है कि इस मामले में वो बेहतर साबित होगी।

लेकिन दिक्कत यही है कि हिन्दी पर इस बारे में कहीं अनुसंधान चल ही नही रहा, सिवाय सीडैक को छोड़कर। यद्यपि सीडैक इस दिशा में अच्छा कार्य कर रहा है। कुछ समय पहले सीडैक द्वारा विकसित InScript Keyboard का ट्यूटर देखा तो हैरान रह गया उसकी वैज्ञानिकता पर।

परंतु हिन्दी संबंधी सभी प्रयास अभी अपर्याप्त हैं। सबसे पहले आवश्यकता है कि सभी कम्प्यूटरों पर हिन्दी का पूरा सपोर्ट टाइपिंग की सुविधा सहित बाई डिफॉल्ट मौजूद हो।