17 Aug 2007

हिन्दी श्रुतलेखन सॉफ्टवेयर उन्मोचित

हिन्दी श्रुतलेखन सॉफ्टवेयर उन्मोचित
Hindi Speech Recognition Software

सभी हिन्दी भाषियों, हिन्दी प्रेमियों, हिन्दी चिट्ठाकारों के लिए यह एक बड़ी खुशखबरी है कि हिन्दी में भी अब श्रुतलेखन सॉफ्टवेयर आ गया है। सन् 1993 से सँजोया गया हमारा सपना अब साकार हो गया लगता है जिसकी परिकल्पना क्या कम्प्यूटर क्रान्ति लाएगी हिन्दी क्रान्ति नामक आलेख में इस चिट्ठे पर की गई थी। चलो देर आए, दुरस्त आए!

इसके लिए धन्यवाद हैं सी-डैक, आईबीएम और भारत सरकार के राजभाषा विभाग को, जिन्होंने मिलकर संयुक्त प्रयास से इस सॉफ्टवेयर का विकास किया है।

अब कम्प्यूटर पर हिन्दी में टाइप करने के लिए विभिन्न प्रकार के की-बोर्ड लेआऊट इन्स्टॉल करने, किस बटन में कौन सा अक्षर हैं, उसे खोजने, याद करने और टंकण करने के परिश्रम से मुक्ति मिल सकेगी। सिर्फ कम्प्यूटर के माईक्रोफोन में बोलकर ही हिन्दी पाठ/आँकड़े ही नहीं प्रविष्टि कर सकेंगे, बल्कि कम्प्यूटर को आदेश (Command) भी दे सकेंगे।

एक रोबोट की तरह आपके कम्प्यूटर आपका हुक्म मानेगा। क्या "खुल जा सिम-सिम" वाली कहानी सच हो जाएगी?

इस सम्बन्ध में सबसे पहली सूचना भारत सरकार के राजभाषा विभाग के वेबसाइट पर जुलाई-2007 के मध्यकाल में न्यूयार्क में विश्व हिन्दी सम्मेलन के आयोजन के समय से ही यह सूचना निम्नवत् परिचक्रित (MARQUEE) हो रही है:--


श्रुतलेखन-राजभाषा सॉफ्टवेयर की सी.डी. सी-डैक, पूणे (डॉ. हेमन्त दरबारी, प्रोग्राम कोर्डिनेटर) से प्राप्त की जा सकती है और इसकी एक प्रति का मूल्य 5623/- रू. (कर सहित) है ।


इस सूचना के आधार पर कई लोगों ने डॉ. हेमन्त दरबारी जी से सम्पर्क साधने का प्रयास किया, परन्तु उन्हें अब तक कोई जबाब नहीं मिला।
इसके बाद कल (16.08.2007 को) आईटीन्यूज-ऑनलाइन तथा अन्य समाचारों में भी यह समाचार प्रकाशित हुआ है कि भारत की 60वें स्वतन्त्रता दिवस पर यह सॉफ्टवेयर देसवासियों को एक विशेष उपहार है।

प्रकाशित समाचार के अनुसार यह श्रुतलेखन सॉफ्टवेयर राजभाषा विभाग तथा सीडैक, पुणे द्वारा पहले विकसित "मन्त्र" (MANTRA= Machine-Assisted Translation System) नामक अनुवादक सॉफ्टवेयर द्वारा अंग्रेजी से हिन्दी अनुवाद की गई सामग्री को सम्पादित करने, प्रूफ रीडिंग करने के काम में सहायता करेगा। इसके साथ ही की-बोर्ड की कुञ्जियों का भी सहयोग लेना पड़ेगा। भविष्य में इस तकनीक का उपयोग इण्टरएक्टिव एटीएम-किओस्क पर सूचनाओँ के आदान-प्रदान तथा टेलीफोन माध्यम से जुड़े कम्प्यूटर द्वारा जनता को सूचना प्रदान करने के काम में किया जा सकेगा। चूँकि हरेक व्यक्ति की आवाज का लहजा अलग अलग होता है। अतः इसमें कुछ ऐसी व्यवस्था की गई है कि वह आवश्यक सुधार के साथ शब्दों को ग्रहण करे। इसके साथ हिन्दी वर्तनी शोधक तथा युनिकोड से इस्फोक (ISFOC 8बिट- ट्र-टाइप फोंट कोड) में पाठ को परिवर्तित करने की भी सुविधाएँ दी गई है।

अब देखना यह है कि सी-डैक के कृत्रिम बुद्धि (Artificial Intelligence) विभाग के कार्यक्रम संयोजक, डॉ. हेमन्त दरबारी जी इस सॉफ्टवेयर को आम जनता को तब तक उपलब्ध कराएँगे और यह कितना सही परिणाम (output) प्रदान कर पाएगा। सी-डैक तथा आईबीएम आम उपयोगकर्ताओं को कितना सन्तोषजनक तकनीकी समर्थन एवं सहयोग प्रदान कर पाएँगे और भविष्य इसमें भूल-सुधार (Bugfixes) तथा विकास किस तेजी से हो पाएगा।

उल्लेखनीय है कि पिछले 8-9 वर्षों से अंग्रेजी में श्रुतलेखन के कई सॉफ्टवेयर बाजार में उपलब्ध हैं जिनमें सबसे अच्छा माना जाता है ड्रेगन नेचुरली स्पीकिंग (Dragon Naturally Speeking) तथा इसके बाद दूसरे नम्बर पर था आईबीएम वॉयस टाइप (IBM Voice Type) और तीसरे नम्बर पर था फिलिप्स फ्री स्पीच (Philips Free Speech) जो अंग्रेजी में बोलकर कम्प्यूटर में पाठ प्रविष्टि करने पर 60 से 70 प्रतिशत तक सही प्रतिफल दे पाते थे। फिर पाठ को यथाविधि कीबोर्ड द्वारा टंकण करके या अंग्रेजी वर्तनी शोधक (Spell checker) सॉफ्टवेयरों के माध्यम से भूलसुधार (Proof correction) करना पड़ता था। क्योंकि अंग्रेजी में वर्णों का उच्चारण कुछ और होता है तो इनसे मिलकर बने शब्दों का कुछ और।

लेकिन हिन्दी भाषा(देवनागरी लिपि) में बोलने और लिखने के क्रम में एकरूपता होने तथा लिखित पाठ का हू-बू-बू उच्चारण हो पाने की विशेषता के चलते आशा है कि यह सॉफ्टवेयर 90 से 95 प्रतिशत तक सही परिणाम (output) देगा। आशा है विश्व में हिन्दी की स्थिति अब और दृढ़ होगी। (जारी...)

15 comments:

  1. ये तो वाकई मे बहुत बड़ी खुशखबरी है। जानकारी बांटने का शुक्रिया।

    ReplyDelete
  2. Anonymous17.8.07

    अच्छी जानकारी दी आपने। क्या कोई ऐसा साफ़्ट्वेयर है जो हिन्दी मे लिखे को Scan कर दे। मेरा मतलब है Optical Charecter Recongnition Software

    ReplyDelete
  3. बेनामी जी, हिन्दी में "चित्रांकन" नामक OCR सॉफ्टवेयर उपलब्ध है और वह भी निःशुल्क डाउनलोड हेतु, यहाँ से ले लें। किन्तु यह कितना सही परिणाम दे पाता है, इसके बारे में फीडबैक से मुझे भी सूचित करने की कृपा करें।

    ReplyDelete
  4. चित्रांकन ओसीआर पर मेरा रीव्यू यहाँ पर है-

    http://hindini.com/ravi/?m=20050818

    श्रुतलेखन को सीडॅक को आम जनता के लिए मुक्त और मुफ़्त स्रोत में उपलब्ध करवाना चाहिए तभी इसका सही इस्तेमाल हो सकेगा.

    ReplyDelete
  5. यदि हिन्दी का स्पीच-रिकाग्निशन उपकरण बढ़िया काम करने लगे तो हिन्दी को कम्पयूटर पर धाक बनाने का एक बहुत बड़ा मौका मिल जायेगा। यह अवसर यूनिकोड के कारण आये अवसर से भी बड़ा होगा। रोमन पर आधारित भाषाओं की तुलना में देवनागरी पर आधारित भाषाओं के लिये 'स्पीच रिकाग्निशन' टूल बनाने में अधिक सरलता विशेष रूप से उल्लेखनीय है। हिन्दी को देवनागरी लिपि में लिखे जाने का असली फायदा 'स्पीच से तेक्स्ट' और टेक्स्ट से स्पीच' के साधनों के निर्माण में ही है।

    श्रुतलेखन से हिन्दी को बहुत आशायें हैं।

    ReplyDelete
  6. बहुत बढ़िया खुशखबरी लाये हैं, आभार.

    ReplyDelete
  7. हरिरामजी
    चित्रांकन सोफ्टवेर मैने एक बार डाउनलोड कर उसे चलाने की कोशिश की तो परिणाम बहुत बुरा मिला। पूरा एक दिन बर्बाद किया चित्रांकन के पीछे और परिणाम शून्य!!
    खैर सुना है मुफ्त की बछिया के दाँत नहीं गिने जाते पर ऐसी बिना दाँत वाली बछिया दान में दी क्यों जाये?
    www.nahar.wordpress.com

    ReplyDelete
  8. श्रुत लेखन सोफ्टवेर की कीमत 5000.00 फिलहाल अपने बजट के अनुसार बहुत ज्यादा है। देखते हैं कुछ कीमतें कम हो या कोई नया सोफ्ट्वेर आये ।

    ReplyDelete
  9. बहुत ही अच्छी जानकारी दी आपने, धन्यवाद.

    ReplyDelete
  10. बहुत अच्छी जानकारी दी,आपने.धन्यवाद.

    ReplyDelete
  11. बधाई हरिराम जी आपका एक स्वप्न पूर्ण हुआ। अगर यह सॉ्फ्टवेयर कारगर है तो 5000 रुपए में भी महँगा नहीं अन्यथा षायद इसकी बजाय कीबोर्ड से टाइप करना अधिक तेज हो।

    अगर कारगर है तो भी इसे प्रचलित होने में काफी समय लगेगा, खासकर मुफ्त न होने के कारण।

    @रविरतलामी,

    रवि जी आपकी बात तो सही है परंतु कीमत इसलिए रखी गई होगी कि इसके विकास पर बहुत पैसा खर्च हुआ। वैसे पिछले रिकॉर्ड को देखते हुए उम्मीद नहीं कि यह मुफ्त में उपलब्ध होगा।

    ReplyDelete
  12. या तो सेल लगा दें
    अथवा 1 के साथ
    4 फ्री दिलवा दें

    पर हम बोलने से
    छापने में अधिक
    विश्वास करते है

    नही तो लेखक
    नहीं, नेता होते
    मीटिगों मे सोते
    जो हमें चुनते
    वो सदा रोते

    अगर हम नेता होते.

    ReplyDelete
  13. indians learn in childhood that proper pronouncing of prayers is compulsory .. with sanskrit existing all around us .. for indians it will be 'natural' to use voice based interface with pc's

    the product has arrived sooo slowly

    i pray that people can co-operate
    and do great things that have happened on indian language websites .. pk sharma

    ReplyDelete
  14. 17/8/2007/ ke bad srutlekhn per koi post kyo nhi

    ReplyDelete
  15. Anonymous11.6.10

    17/8/2007se 2010 ke bich surt lekhn per koi post koi khbar kyo nhi hai

    ReplyDelete