17 Aug 2007

हिन्दी श्रुतलेखन सॉफ्टवेयर उन्मोचित

हिन्दी श्रुतलेखन सॉफ्टवेयर उन्मोचित
Hindi Speech Recognition Software

सभी हिन्दी भाषियों, हिन्दी प्रेमियों, हिन्दी चिट्ठाकारों के लिए यह एक बड़ी खुशखबरी है कि हिन्दी में भी अब श्रुतलेखन सॉफ्टवेयर आ गया है। सन् 1993 से सँजोया गया हमारा सपना अब साकार हो गया लगता है जिसकी परिकल्पना क्या कम्प्यूटर क्रान्ति लाएगी हिन्दी क्रान्ति नामक आलेख में इस चिट्ठे पर की गई थी। चलो देर आए, दुरस्त आए!

इसके लिए धन्यवाद हैं सी-डैक, आईबीएम और भारत सरकार के राजभाषा विभाग को, जिन्होंने मिलकर संयुक्त प्रयास से इस सॉफ्टवेयर का विकास किया है।

अब कम्प्यूटर पर हिन्दी में टाइप करने के लिए विभिन्न प्रकार के की-बोर्ड लेआऊट इन्स्टॉल करने, किस बटन में कौन सा अक्षर हैं, उसे खोजने, याद करने और टंकण करने के परिश्रम से मुक्ति मिल सकेगी। सिर्फ कम्प्यूटर के माईक्रोफोन में बोलकर ही हिन्दी पाठ/आँकड़े ही नहीं प्रविष्टि कर सकेंगे, बल्कि कम्प्यूटर को आदेश (Command) भी दे सकेंगे।

एक रोबोट की तरह आपके कम्प्यूटर आपका हुक्म मानेगा। क्या "खुल जा सिम-सिम" वाली कहानी सच हो जाएगी?


इस सम्बन्ध में सबसे पहली सूचना भारत सरकार के राजभाषा विभाग के वेबसाइट पर जुलाई-2007 के मध्यकाल में न्यूयार्क में विश्व हिन्दी सम्मेलन के आयोजन के समय से ही यह सूचना निम्नवत् परिचक्रित (MARQUEE) हो रही है:--


श्रुतलेखन-राजभाषा सॉफ्टवेयर की सी.डी. सी-डैक, पूणे (डॉ. हेमन्त दरबारी, प्रोग्राम कोर्डिनेटर) से प्राप्त की जा सकती है और इसकी एक प्रति का मूल्य 5623/- रू. (कर सहित) है ।


इस सूचना के आधार पर कई लोगों ने डॉ. हेमन्त दरबारी जी से सम्पर्क साधने का प्रयास किया, परन्तु उन्हें अब तक कोई जबाब नहीं मिला।
इसके बाद कल (16.08.2007 को) आईटीन्यूज-ऑनलाइन तथा अन्य समाचारों में भी यह समाचार प्रकाशित हुआ है कि भारत की 60वें स्वतन्त्रता दिवस पर यह सॉफ्टवेयर देसवासियों को एक विशेष उपहार है।

प्रकाशित समाचार के अनुसार यह श्रुतलेखन सॉफ्टवेयर राजभाषा विभाग तथा सीडैक, पुणे द्वारा पहले विकसित "मन्त्र" (MANTRA= Machine-Assisted Translation System) नामक अनुवादक सॉफ्टवेयर द्वारा अंग्रेजी से हिन्दी अनुवाद की गई सामग्री को सम्पादित करने, प्रूफ रीडिंग करने के काम में सहायता करेगा। इसके साथ ही की-बोर्ड की कुञ्जियों का भी सहयोग लेना पड़ेगा। भविष्य में इस तकनीक का उपयोग इण्टरएक्टिव एटीएम-किओस्क पर सूचनाओँ के आदान-प्रदान तथा टेलीफोन माध्यम से जुड़े कम्प्यूटर द्वारा जनता को सूचना प्रदान करने के काम में किया जा सकेगा। चूँकि हरेक व्यक्ति की आवाज का लहजा अलग अलग होता है। अतः इसमें कुछ ऐसी व्यवस्था की गई है कि वह आवश्यक सुधार के साथ शब्दों को ग्रहण करे। इसके साथ हिन्दी वर्तनी शोधक तथा युनिकोड से इस्फोक (ISFOC 8बिट- ट्र-टाइप फोंट कोड) में पाठ को परिवर्तित करने की भी सुविधाएँ दी गई है।

अब देखना यह है कि सी-डैक के कृत्रिम बुद्धि (Artificial Intelligence) विभाग के कार्यक्रम संयोजक, डॉ. हेमन्त दरबारी जी इस सॉफ्टवेयर को आम जनता को तब तक उपलब्ध कराएँगे और यह कितना सही परिणाम (output) प्रदान कर पाएगा। सी-डैक तथा आईबीएम आम उपयोगकर्ताओं को कितना सन्तोषजनक तकनीकी समर्थन एवं सहयोग प्रदान कर पाएँगे और भविष्य इसमें भूल-सुधार (Bugfixes) तथा विकास किस तेजी से हो पाएगा।

उल्लेखनीय है कि पिछले 8-9 वर्षों से अंग्रेजी में श्रुतलेखन के कई सॉफ्टवेयर बाजार में उपलब्ध हैं जिनमें सबसे अच्छा माना जाता है ड्रेगन नेचुरली स्पीकिंग (Dragon Naturally Speeking) तथा इसके बाद दूसरे नम्बर पर था आईबीएम वॉयस टाइप (IBM Voice Type) और तीसरे नम्बर पर था फिलिप्स फ्री स्पीच (Philips Free Speech) जो अंग्रेजी में बोलकर कम्प्यूटर में पाठ प्रविष्टि करने पर 60 से 70 प्रतिशत तक सही प्रतिफल दे पाते थे। फिर पाठ को यथाविधि कीबोर्ड द्वारा टंकण करके या अंग्रेजी वर्तनी शोधक (Spell checker) सॉफ्टवेयरों के माध्यम से भूलसुधार (Proof correction) करना पड़ता था। क्योंकि अंग्रेजी में वर्णों का उच्चारण कुछ और होता है तो इनसे मिलकर बने शब्दों का कुछ और।

लेकिन हिन्दी भाषा(देवनागरी लिपि) में बोलने और लिखने के क्रम में एकरूपता होने तथा लिखित पाठ का हू-बू-बू उच्चारण हो पाने की विशेषता के चलते आशा है कि यह सॉफ्टवेयर 90 से 95 प्रतिशत तक सही परिणाम (output) देगा। आशा है विश्व में हिन्दी की स्थिति अब और दृढ़ होगी। (जारी...)

15 comments:

mamta said...

ये तो वाकई मे बहुत बड़ी खुशखबरी है। जानकारी बांटने का शुक्रिया।

Anonymous said...

अच्छी जानकारी दी आपने। क्या कोई ऐसा साफ़्ट्वेयर है जो हिन्दी मे लिखे को Scan कर दे। मेरा मतलब है Optical Charecter Recongnition Software

हरिराम said...

बेनामी जी, हिन्दी में "चित्रांकन" नामक OCR सॉफ्टवेयर उपलब्ध है और वह भी निःशुल्क डाउनलोड हेतु, यहाँ से ले लें। किन्तु यह कितना सही परिणाम दे पाता है, इसके बारे में फीडबैक से मुझे भी सूचित करने की कृपा करें।

रवि रतलामी said...

चित्रांकन ओसीआर पर मेरा रीव्यू यहाँ पर है-

http://hindini.com/ravi/?m=20050818

श्रुतलेखन को सीडॅक को आम जनता के लिए मुक्त और मुफ़्त स्रोत में उपलब्ध करवाना चाहिए तभी इसका सही इस्तेमाल हो सकेगा.

अनुनाद सिंह said...

यदि हिन्दी का स्पीच-रिकाग्निशन उपकरण बढ़िया काम करने लगे तो हिन्दी को कम्पयूटर पर धाक बनाने का एक बहुत बड़ा मौका मिल जायेगा। यह अवसर यूनिकोड के कारण आये अवसर से भी बड़ा होगा। रोमन पर आधारित भाषाओं की तुलना में देवनागरी पर आधारित भाषाओं के लिये 'स्पीच रिकाग्निशन' टूल बनाने में अधिक सरलता विशेष रूप से उल्लेखनीय है। हिन्दी को देवनागरी लिपि में लिखे जाने का असली फायदा 'स्पीच से तेक्स्ट' और टेक्स्ट से स्पीच' के साधनों के निर्माण में ही है।

श्रुतलेखन से हिन्दी को बहुत आशायें हैं।

Udan Tashtari said...

बहुत बढ़िया खुशखबरी लाये हैं, आभार.

Sagar Chand Nahar said...

हरिरामजी
चित्रांकन सोफ्टवेर मैने एक बार डाउनलोड कर उसे चलाने की कोशिश की तो परिणाम बहुत बुरा मिला। पूरा एक दिन बर्बाद किया चित्रांकन के पीछे और परिणाम शून्य!!
खैर सुना है मुफ्त की बछिया के दाँत नहीं गिने जाते पर ऐसी बिना दाँत वाली बछिया दान में दी क्यों जाये?
www.nahar.wordpress.com

Sagar Chand Nahar said...

श्रुत लेखन सोफ्टवेर की कीमत 5000.00 फिलहाल अपने बजट के अनुसार बहुत ज्यादा है। देखते हैं कुछ कीमतें कम हो या कोई नया सोफ्ट्वेर आये ।

विनोद पाराशर said...

बहुत ही अच्छी जानकारी दी आपने, धन्यवाद.

विनोद पाराशर said...

बहुत अच्छी जानकारी दी,आपने.धन्यवाद.

ePandit said...

बधाई हरिराम जी आपका एक स्वप्न पूर्ण हुआ। अगर यह सॉ्फ्टवेयर कारगर है तो 5000 रुपए में भी महँगा नहीं अन्यथा षायद इसकी बजाय कीबोर्ड से टाइप करना अधिक तेज हो।

अगर कारगर है तो भी इसे प्रचलित होने में काफी समय लगेगा, खासकर मुफ्त न होने के कारण।

@रविरतलामी,

रवि जी आपकी बात तो सही है परंतु कीमत इसलिए रखी गई होगी कि इसके विकास पर बहुत पैसा खर्च हुआ। वैसे पिछले रिकॉर्ड को देखते हुए उम्मीद नहीं कि यह मुफ्त में उपलब्ध होगा।

अविनाश वाचस्पति said...

या तो सेल लगा दें
अथवा 1 के साथ
4 फ्री दिलवा दें

पर हम बोलने से
छापने में अधिक
विश्वास करते है

नही तो लेखक
नहीं, नेता होते
मीटिगों मे सोते
जो हमें चुनते
वो सदा रोते

अगर हम नेता होते.

peekay said...

indians learn in childhood that proper pronouncing of prayers is compulsory .. with sanskrit existing all around us .. for indians it will be 'natural' to use voice based interface with pc's

the product has arrived sooo slowly

i pray that people can co-operate
and do great things that have happened on indian language websites .. pk sharma

girish.nagda said...

17/8/2007/ ke bad srutlekhn per koi post kyo nhi

Anonymous said...

17/8/2007se 2010 ke bich surt lekhn per koi post koi khbar kyo nhi hai