हिन्दी श्रुतलेखन सॉफ्टवेयर उन्मोचित
Hindi Speech Recognition Software
सभी हिन्दी भाषियों, हिन्दी प्रेमियों, हिन्दी चिट्ठाकारों के लिए यह एक बड़ी खुशखबरी है कि हिन्दी में भी अब श्रुतलेखन सॉफ्टवेयर आ गया है। सन् 1993 से सँजोया गया हमारा सपना अब साकार हो गया लगता है जिसकी परिकल्पना क्या कम्प्यूटर क्रान्ति लाएगी हिन्दी क्रान्ति नामक आलेख में इस चिट्ठे पर की गई थी। चलो देर आए, दुरस्त आए!
इसके लिए धन्यवाद हैं सी-डैक, आईबीएम और भारत सरकार के राजभाषा विभाग को, जिन्होंने मिलकर संयुक्त प्रयास से इस सॉफ्टवेयर का विकास किया है।
अब कम्प्यूटर पर हिन्दी में टाइप करने के लिए विभिन्न प्रकार के की-बोर्ड लेआऊट इन्स्टॉल करने, किस बटन में कौन सा अक्षर हैं, उसे खोजने, याद करने और टंकण करने के परिश्रम से मुक्ति मिल सकेगी। सिर्फ कम्प्यूटर के माईक्रोफोन में बोलकर ही हिन्दी पाठ/आँकड़े ही नहीं प्रविष्टि कर सकेंगे, बल्कि कम्प्यूटर को आदेश (Command) भी दे सकेंगे।
एक रोबोट की तरह आपके कम्प्यूटर आपका हुक्म मानेगा। क्या "खुल जा सिम-सिम" वाली कहानी सच हो जाएगी?
इस सम्बन्ध में सबसे पहली सूचना भारत सरकार के राजभाषा विभाग के वेबसाइट पर जुलाई-2007 के मध्यकाल में न्यूयार्क में विश्व हिन्दी सम्मेलन के आयोजन के समय से ही यह सूचना निम्नवत् परिचक्रित (MARQUEE) हो रही है:--
श्रुतलेखन-राजभाषा सॉफ्टवेयर की सी.डी. सी-डैक, पूणे (डॉ. हेमन्त दरबारी, प्रोग्राम कोर्डिनेटर) से प्राप्त की जा सकती है और इसकी एक प्रति का मूल्य 5623/- रू. (कर सहित) है ।
प्रकाशित समाचार के अनुसार यह श्रुतलेखन सॉफ्टवेयर राजभाषा विभाग तथा सीडैक, पुणे द्वारा पहले विकसित "मन्त्र" (MANTRA= Machine-Assisted Translation System) नामक अनुवादक सॉफ्टवेयर द्वारा अंग्रेजी से हिन्दी अनुवाद की गई सामग्री को सम्पादित करने, प्रूफ रीडिंग करने के काम में सहायता करेगा। इसके साथ ही की-बोर्ड की कुञ्जियों का भी सहयोग लेना पड़ेगा। भविष्य में इस तकनीक का उपयोग इण्टरएक्टिव एटीएम-किओस्क पर सूचनाओँ के आदान-प्रदान तथा टेलीफोन माध्यम से जुड़े कम्प्यूटर द्वारा जनता को सूचना प्रदान करने के काम में किया जा सकेगा। चूँकि हरेक व्यक्ति की आवाज का लहजा अलग अलग होता है। अतः इसमें कुछ ऐसी व्यवस्था की गई है कि वह आवश्यक सुधार के साथ शब्दों को ग्रहण करे। इसके साथ हिन्दी वर्तनी शोधक तथा युनिकोड से इस्फोक (ISFOC 8बिट- ट्र-टाइप फोंट कोड) में पाठ को परिवर्तित करने की भी सुविधाएँ दी गई है।
अब देखना यह है कि सी-डैक के कृत्रिम बुद्धि (Artificial Intelligence) विभाग के कार्यक्रम संयोजक, डॉ. हेमन्त दरबारी जी इस सॉफ्टवेयर को आम जनता को तब तक उपलब्ध कराएँगे और यह कितना सही परिणाम (output) प्रदान कर पाएगा। सी-डैक तथा आईबीएम आम उपयोगकर्ताओं को कितना सन्तोषजनक तकनीकी समर्थन एवं सहयोग प्रदान कर पाएँगे और भविष्य इसमें भूल-सुधार (Bugfixes) तथा विकास किस तेजी से हो पाएगा।
उल्लेखनीय है कि पिछले 8-9 वर्षों से अंग्रेजी में श्रुतलेखन के कई सॉफ्टवेयर बाजार में उपलब्ध हैं जिनमें सबसे अच्छा माना जाता है ड्रेगन नेचुरली स्पीकिंग (Dragon Naturally Speeking) तथा इसके बाद दूसरे नम्बर पर था आईबीएम वॉयस टाइप (IBM Voice Type) और तीसरे नम्बर पर था फिलिप्स फ्री स्पीच (Philips Free Speech) जो अंग्रेजी में बोलकर कम्प्यूटर में पाठ प्रविष्टि करने पर 60 से 70 प्रतिशत तक सही प्रतिफल दे पाते थे। फिर पाठ को यथाविधि कीबोर्ड द्वारा टंकण करके या अंग्रेजी वर्तनी शोधक (Spell checker) सॉफ्टवेयरों के माध्यम से भूलसुधार (Proof correction) करना पड़ता था। क्योंकि अंग्रेजी में वर्णों का उच्चारण कुछ और होता है तो इनसे मिलकर बने शब्दों का कुछ और।
लेकिन हिन्दी भाषा(देवनागरी लिपि) में बोलने और लिखने के क्रम में एकरूपता होने तथा लिखित पाठ का हू-बू-बू उच्चारण हो पाने की विशेषता के चलते आशा है कि यह सॉफ्टवेयर 90 से 95 प्रतिशत तक सही परिणाम (output) देगा। आशा है विश्व में हिन्दी की स्थिति अब और दृढ़ होगी। (जारी...)
15 comments:
ये तो वाकई मे बहुत बड़ी खुशखबरी है। जानकारी बांटने का शुक्रिया।
अच्छी जानकारी दी आपने। क्या कोई ऐसा साफ़्ट्वेयर है जो हिन्दी मे लिखे को Scan कर दे। मेरा मतलब है Optical Charecter Recongnition Software
बेनामी जी, हिन्दी में "चित्रांकन" नामक OCR सॉफ्टवेयर उपलब्ध है और वह भी निःशुल्क डाउनलोड हेतु, यहाँ से ले लें। किन्तु यह कितना सही परिणाम दे पाता है, इसके बारे में फीडबैक से मुझे भी सूचित करने की कृपा करें।
चित्रांकन ओसीआर पर मेरा रीव्यू यहाँ पर है-
http://hindini.com/ravi/?m=20050818
श्रुतलेखन को सीडॅक को आम जनता के लिए मुक्त और मुफ़्त स्रोत में उपलब्ध करवाना चाहिए तभी इसका सही इस्तेमाल हो सकेगा.
यदि हिन्दी का स्पीच-रिकाग्निशन उपकरण बढ़िया काम करने लगे तो हिन्दी को कम्पयूटर पर धाक बनाने का एक बहुत बड़ा मौका मिल जायेगा। यह अवसर यूनिकोड के कारण आये अवसर से भी बड़ा होगा। रोमन पर आधारित भाषाओं की तुलना में देवनागरी पर आधारित भाषाओं के लिये 'स्पीच रिकाग्निशन' टूल बनाने में अधिक सरलता विशेष रूप से उल्लेखनीय है। हिन्दी को देवनागरी लिपि में लिखे जाने का असली फायदा 'स्पीच से तेक्स्ट' और टेक्स्ट से स्पीच' के साधनों के निर्माण में ही है।
श्रुतलेखन से हिन्दी को बहुत आशायें हैं।
बहुत बढ़िया खुशखबरी लाये हैं, आभार.
हरिरामजी
चित्रांकन सोफ्टवेर मैने एक बार डाउनलोड कर उसे चलाने की कोशिश की तो परिणाम बहुत बुरा मिला। पूरा एक दिन बर्बाद किया चित्रांकन के पीछे और परिणाम शून्य!!
खैर सुना है मुफ्त की बछिया के दाँत नहीं गिने जाते पर ऐसी बिना दाँत वाली बछिया दान में दी क्यों जाये?
www.nahar.wordpress.com
श्रुत लेखन सोफ्टवेर की कीमत 5000.00 फिलहाल अपने बजट के अनुसार बहुत ज्यादा है। देखते हैं कुछ कीमतें कम हो या कोई नया सोफ्ट्वेर आये ।
बहुत ही अच्छी जानकारी दी आपने, धन्यवाद.
बहुत अच्छी जानकारी दी,आपने.धन्यवाद.
बधाई हरिराम जी आपका एक स्वप्न पूर्ण हुआ। अगर यह सॉ्फ्टवेयर कारगर है तो 5000 रुपए में भी महँगा नहीं अन्यथा षायद इसकी बजाय कीबोर्ड से टाइप करना अधिक तेज हो।
अगर कारगर है तो भी इसे प्रचलित होने में काफी समय लगेगा, खासकर मुफ्त न होने के कारण।
@रविरतलामी,
रवि जी आपकी बात तो सही है परंतु कीमत इसलिए रखी गई होगी कि इसके विकास पर बहुत पैसा खर्च हुआ। वैसे पिछले रिकॉर्ड को देखते हुए उम्मीद नहीं कि यह मुफ्त में उपलब्ध होगा।
या तो सेल लगा दें
अथवा 1 के साथ
4 फ्री दिलवा दें
पर हम बोलने से
छापने में अधिक
विश्वास करते है
नही तो लेखक
नहीं, नेता होते
मीटिगों मे सोते
जो हमें चुनते
वो सदा रोते
अगर हम नेता होते.
indians learn in childhood that proper pronouncing of prayers is compulsory .. with sanskrit existing all around us .. for indians it will be 'natural' to use voice based interface with pc's
the product has arrived sooo slowly
i pray that people can co-operate
and do great things that have happened on indian language websites .. pk sharma
17/8/2007/ ke bad srutlekhn per koi post kyo nhi
17/8/2007se 2010 ke bich surt lekhn per koi post koi khbar kyo nhi hai
Post a Comment