14 Aug 2007

वैदिक संस्कृत स्वर चिह्नों का यूनिकोड मानकीकरण

वैदिक संस्कृत स्वर चिह्नों का यूनिकोड मानकीकरण
Vedic Sanskrit Unicode Encodings

प्रतीक जी ने अपने चिट्ठे पर यूनिकोड और वैदिक संस्कृत में प्रश्न किया है कि वैदिक संस्कृत में प्रयुक्त विशेष स्वराघात चिह्नों या वर्णों को यूनिकोड में कम्प्यूटर पर कैसे टंकित किया जाए। अतः यहाँ इस सम्बन्ध में अभी तक हुई प्रगति तथा कुछ तकनीकी जानकारी देने का प्रयास किया जा रहा है।

वेदों को "श्रुति" कहा गया है। आरम्भ में वेदों का ज्ञान केवल गुरु-शिष्य परम्परा से प्राप्त होता था। शिष्य गुरु-मुख से सुनकर ही ऋचाओं को याद करता था। लोगों को स्मरण शक्ति प्रबल थी इसलिए लिखने की जरूरत नहीं होती थी। मन्त्र सिद्ध होने पर कई कार्य सिर्फ मन्त्र पढ़ने से ही सम्पन्न हो जाते थे। मंत्रों के बल पर ही वर्षा की जा सकती थी, मंत्रोच्चार से ही अच्छी फसल हो पाती थी। मन्त्र पाठ मात्र से ही विभिन्न रोगों को ईलाज सम्भव हो पाता था। ऋषि-मुनियों के "वरदान" या "शाप" देने के दौरान जो उनके मुख से निकल जाता था, वह तुरन्त कार्यान्वित हो जाता था।

बाद में लिपि का प्रचलन होने के बाद सर्वप्रथम ब्राह्मी लिपि का आविष्कार हुआ तथा धीरे धीरे इसका क्रमविकास होते होते देवनागरी लिपि परिष्कृत रूप में विकसित हुई और भाषा का संस्कार होते होते "संस्कृत" नाम से प्रचलित हुई।

चारों वेद (सामवेद, यजुर्वेद, अथर्ववेद और ऋग्वेद) देवनागरी लिपि में वैदिक संस्कृत भाषा में लिखे गए। वैदिक ऋचाओं के सही उच्चारण को विशेष महत्त्व दिया जाता है। यदि उच्चारण जरा-सा भी गलत हो जाए तो ऋचाएँ या मन्त्र उलटा प्रभाव डाल सकते हैं। लाभ के वजाए भयंकर हानि हो सकती है। इसलिए वैदिक ऋचाओं में स्वरों का सही उच्चारण प्रकट करने के लिए विशेष चिह्नों का प्रयोग होता था। जिनमें स्वरित, उदात्त, अनुदात्त, प्लुत, गुंकार, जिह्वामूलीय तथा विभिन्न प्रकार के अनुस्वार तथा अनुनासिक एवं विसर्ग आदि स्वर चिह्न प्रमुख हैं।

वेदों में एक ही ध्वनि/स्वर के उच्चारण के लिए सामवेद में अलग चिह्न मिलता है तो अथर्ववेद या यजुर्वेद में अलग प्रकार के चिह्न का प्रयोग मिलता है। कुछ दशक पहले पुस्तकों की छपाई छापाखाने (Letter press) में शीशे से बने टाइपफेस से कम्पोज करके ट्रेडल मशीन पर होती थी, जिसके लिए वैदिक स्वर चिह्नों के भी टाईपफेस बनाए गए थे।

किन्तु कम्प्यूटर के प्रचलन के बाद छपाई-पूर्व समग्र प्रोसेसिंग डेस्क-टॉप-पब्लिशिंग (DTP) द्वारा होने लगी, तो वैदिक स्वर चिह्नों/वर्णों के कुछ कम्प्यूटर-फोंट्स बनाए गए, जो ASCII के सुपरसेट के रूप में ही कार्य कर पाते थे। ये वाराणसी, दिल्ली आदि के कुछ प्रेस में अभी प्रयोग किए जा रहे हैं। कुछ संस्कृत संस्थानों के संस्कृत पाठ (Text) जो इण्टरनेट पर उपलब्ध हैं, वे XDEVNAG.TTF में सम्पादित किए गए हैं।

किन्तु इण्टरनेट के विकास/प्रचलन के बाद संसार की समस्त भाषाओं/लिपियों के सभी अक्षरों को स्वतन्त्र सत्ता प्रदान करने की आवश्यकता हुई तो युनिकोड (Unique Code = Unicode) कोन्सोर्टियम द्वारा यह बीड़ा उठाया गया और संसार की हरेक लिपि के हरेक अक्षर के लिए एक अनुपम कोड नम्बर निर्धारण किया गया, जो 16-बिट अर्थात् 2 बाईट का होता है। ताकि इण्टरनेट/ई-मेल आदि द्वारा संजाल(Web) पर सूचना-विनिमय के दौरान किसी भाषा/लिपि में प्रकट/प्रकाशित/प्रेषित की गई किसी सूचना में कोई अवांछित परिवर्तन/गड़बड़ी न हो और वह हू-ब-हू उसी रूप में प्रकट हो।

देवनागरी लिपि संस्कृत, हिन्दी, मराठी, नेपाली, सहित 8 भाषाओं और अनेक बोलियों की लिपि है। युनिकोड कोन्सोर्टियम द्वारा अब तक निर्धारित देवनागरी युनिकोड 5.0 में कुल 109 वर्णों/चिह्नों का मानकीकरण किया गया है।


इनमें वैदिक संस्कृत में प्रयोग होनेवाले 4 स्वराघात चिह्नों को निम्नवत् शामिल किया गया है।









Windows XP के हिन्दी (देवनागरी) के default कीबोर्ड Hindi Traditional के माध्यम से इनको टंकित करने के लिए विशेष कुञ्जियों की जोड़ी का निर्धारण किया गया है। जिन्हें Control+Alt+Shift+key समुच्चय दबाकर टंकित किया जा सकता है।


वेदिक स्वरों/चिह्नों के मानकीकरण का इतिहास

इसके पूर्व 1991 में भारत सरकार के भारतीय मानक ब्यूरो (Bureau of Indian Standards) द्वारा ISCII-1991 मानक IS 13194:1991 के ANNEX-G के अन्तर्गत वेदिक के 31 चिह्नों/स्वरों (उदात्त, अनुदात्त्, स्वरित, कम्प, जिह्वामूलीय, पुष्पिका, गुंकार, कालबोधक आदि) का निर्धारण एवं मानकीकरण किया गया था, जिन्हें GIST CARD युक्त कम्प्युटरों में टाइप तथा संसाधित करने की भी सुविधा प्रदान की गई थी। कुछ वैदिक साहित्य का इसकी मदद लेकर कम्प्यूटरीकरण भी किया गया था। इनकी एक झलक निम्नवत् है:
इसके बाद भारत सरकार के सूचना प्रौद्योगिकी मन्त्रालय के अन्तर्गत "भारतीय भाषाओं के लिए प्रौद्योगिकी विकास" विभाग (TDIL) के तत्वावधान में क्रमशः अगस्त-2000, जून-2001, जुलाई-2002 में वेदिक संस्कृत वर्णों के युनिकोड में मानकीकरण के लिए तीन रिपोर्टें पेश की गई।

तत्पश्चात् अप्रेल-2002, जून-2002, सितम्बर-2002 में तीन बैठकें आयोजित हुई जिनमें युनिकोड में मानकीकरण हेतु वैदिक संस्कृत के विशेष स्वरों/चिह्नों/वर्णों के संग्रह तथा निर्धारण के बारे में तकनीकी चर्चाएँ हुईं। इन बैठकों में देश-विदेश के विभिन्न संस्कृत अध्ययन/अध्यापन संस्थानों, अनुसन्धान केन्द्रों, विश्वविद्यालयों, भाषाविदों तथा कम्प्यूटर तकनीकी विशेषज्ञों ने भाग लिया।

वैदिक संस्कृत के वर्णों/चिह्नों के मानकीकरण का कार्य भारत सरकार के संस्थान, सी-डैक, मुम्बई (पूर्व एन.सी.एस.टी.) को सौंपा गया जो 1985 से भारतीय भाषाओं के कम्प्यूटरीकरण हेतु विभिन्न अनुसन्धान कार्यों से जुड़ा हुआ है। वैदिक संस्कृत के युनिकोड मानकीकरण सम्बन्धी दायित्व "प्रो. आर॰के॰जोशी" के नेतृत्व में एक दल सम्भाल रहा है।

इसके बाद भारत सरकार के प्रतिनिधियों के अवलोकन के बाद वैदिक संस्कृत के युनिकोड मानक निर्धारण हेतु मसौदे (Draft) TDIL की तकनीकी-पत्रिका "विश्वभारत" के अक्टूबर-2002 अंक में विद्वानों की समीक्षा तथा फीडबैक के लिए प्रकाशित किए गए, जिनकी पीडीएफ फाइल यहाँ उपलब्ध है। यह मसौदा युनिकोड कोन्सोर्टियम को मानकीकरण हेतु प्रस्ताव के साथ भेजा गया। इसमें दो खण्ड थे चार्ट-1 और चार्ट-2. चार्ट-1 सदियों से चली आई वैदिक संस्कृत की सर्वोत्तम ध्वनि-विज्ञान सम्मत मूल-"व्यञ्जन+स्वर" के संयोग से विभिन्न अक्षरों के संयोजन की सरल तथा सुबोध अवधारणा पर आधारित था, जो कि डैटाबेस प्रबन्धन(Database Managemenet), ध्वनि से पाठ (Speech to Text), तथा पाठ से ध्वनि(Text to Speech), शब्दबोध, शुद्ध वर्णक्रमानुसार छँटाई (Alphabetical Sorting Order), सूचकांकन (Indexing) शब्दकोश-निर्माण-विज्ञान (Lexicology), व्याकरण-संरचनाओं, अनुवाद आदि विभिन्न कम्प्यूटर में संस्कृत (हिन्दी-देवनागरी सहित) के सम्पूर्ण उन्नत संसाधन (Advanced Processing) कर पाने की सक्षमता प्रदान करती थी।
चार्ट-2 में स्वर/ध्वनि की तीव्रता (Pitch), काल(Duration), बल (Stress), कम्प (Vibration) प्रदिपादक स्वर-चिह्नों, वैदिक अनुस्वारों, विसर्गों, अन्य स्वरित चिह्नों और आदेशों को शामिल किया गया था। दिसम्बर-2005 तक परिशोधित चार्ट-2 की झलक निम्नवत् है:
इसके बाद युनिकोड कोन्सोर्टियम की कुछ अन्तर्राष्ट्रीय बैठकों में इन के कोड निर्धारण पर तकनीकी चर्चा हुई। दुर्भाग्यवश कुछ तथाकथित विद्वानों द्वारा "अनावश्यक दोहराने" का तर्क लगाते हुए प्रस्तावित चार्ट-1 को अनावश्यक बताते हुए स्थगित कर दिया गया। सिर्फ चार्ट-2 के वर्णों/चिह्नों के मानकीकरण हेतु आगे और विशेष चर्चा हेतु कुछ व्याख्याएँ व विवरण, उदाहरण आदि प्रस्तुत करने तथा और जाँच-पड़ताल करने हेतु निर्देश दिया गया।

तदनुसार चार्ट-1 को स्थगित करते हुए मई-2006 में सिर्फ चार्ट-2 को कुछ और परिशोधत कर जारी किया गया, जिसकी झलक निम्नवत् है:

इसके बाद सी-डैक, मुम्बई में 10-11 मार्च,2007 को विभिन्न वैदिक संस्कृत विद्वानों, तकनीकी विशेषज्ञों तथा भारत सरकार के प्रतिनिधियों की एक बैठक आयोजित हुई जिसमें वैदिक संस्कृत वर्णों के विभिन्न पहलुओं पर व्यापक चर्चाएँ हुईं और अनेक शोध-पत्र प्रस्तुत किए गए। विद्वानों के फीडबैक तथा सुझावों के अनुसार प्रस्तावित चार्ट-2 में कुछ और संशोधन किए गए।


वर्तमान स्थिति

इसके बाद प्रो॰आर॰के॰जोशी जी त्रिवेन्द्रम, तिरुपति, पुरी, भुवनेश्वर, दिल्ली, वाराणसी, कोलकाता आदि विभिन्न स्थानों पर वैदिक संस्कृत के विद्वानों/विशेषज्ञों की बैठकें कर चुके हैं तथा और फीडबैक तथा सुझाव इकट्ठे कर रहे हैं तथा आवश्यक संशोधन तथा परिशोधन कर रहे हैं ताकि वैदिक स्वरों/चिह्नों का मानकीकरण त्रुटिरहित और यथासम्भव सम्पूर्ण रूप से हो सके।

क्योंकि युनिकोड कोन्सोर्टियम की "Stability Policy" के अनुसार एक बार एनकोड किए गए अक्षर को फिर से सुधारना, डिलिट करना या पुनर्परिभाषित करना लगभग असम्भव होता है। क्योंकि युनिकोड द्वारा एक बार CLDR जारी किए जाने के बाद यह संसार भर के समस्त कम्प्यूटरों में स्वतःनिर्मित रूप से उपलब्ध हो जाता है।

इस सम्बन्ध में वैदिक संस्कृत के विद्वानों/विशेषज्ञों को कोई विशेष जानकारी चाहिए या कोई सुझाव या

फीडबैक देना हो तो निम्न पते पर उनसे सम्पर्क करें:-
Prof. R.K.Joshi,
CDAC Mumbai (Formerly NCST)
Gulmohar Cross Rd No.9
Juhu, Mumbai-4000049, India
Email : mailto:rkjoshi@cdacmumbari.in
या उनकी सहयोगी डॉ. अलका जी से उपरोक्त पते पर सम्पर्क कर सकते हैं:-
Dr. Alaka Irani
Email: alka@cdacmumbai.in



भावी परिकल्पना (Vision)

वेदिक संस्कृत वर्णों के विशेषकर चार्ट-1 का निर्धारण एवं मानकीकरण यदि हो जाए तो भारतीय भाषाओं की कम्प्यूटिंग के क्षेत्र में रोजाना उपजने वाली अनेकानेक समस्याओं का समाधान हो सकता है तथा हिन्दी-देवनागरी (तथा अन्य भारतीय भाषा/लिपियाँ) वर्तमान क्लिष्ट लिपियों (Complex Scripts) की बुरी छाप से छूट कर सरल तथा सपाट और अंग्रेजी(रोमन) से भी अधिक सरल बन सकती है। इस बारे में अलग लेख में विस्तार से प्रकाश डाला जाएगा।


6 comments:

सुनीता शानू said...

हे शास्त्र के ज्ञाता-ध्याता,
इतना लम्बा क्यों लिख डाला,
अगर पोस्ट हो हास्य की तो...
जितनी लम्बी पढ़ ली जायेगी,
जो करना है अध्ययन तो समझो,
टुकड़ो में ही समझ आयेगी...

आधा हिस्सा ही आज पढा़ है,
आधा कल पढ़ पायेंगे...
सोच लेना श्रीमान जरा ये,
बार-बार न टिप्पणी देने आयेंगे...

सुनीता(शानू)

Shastri JC Philip said...

जानकारी से भरपूर इस लेख के लिये आभार. कई बातों में संशयसमाधान हो गया है.

भविष्य में चित्र कुछ और बडे दिये जायें तो अच्छा होगा -- शास्त्री जे सी फिलिप

हिन्दी ही हिन्दुस्तान को एक सूत्र में पिरो सकती है
http://www.Sarathi.info

हरिराम said...
This comment has been removed by the author.
हरिराम said...
This comment has been removed by the author.
हरिराम said...

सुनीता जी, आपकी असीम काव्य-प्रतिभा यह प्रमाणित करती है "सुनीता(शानू)" और "सुनीता विलियम्स" में कोई किसी से कम नहीं है।

आपके सुझाव अनुसार भविष्य में तकनीकी आलेखों के आरम्भ में उसका सारांश (abstract) भी दूँगा, ताकि अति व्यस्त पाठक भी तत्काल समझ सकें। जो विशेष जरूरी समझें, वे ही विस्तार में जाएँ।

ePandit said...

आम हिन्दी प्रयोगकर्ता वैदिक वर्णों के मानकीकरण का महत्व नहीं समझता लेकिन हमारे वैदिक ज्ञान के डिजिटलीकरण तथा उसे इण्टरनैट पर सुलभ कराने के लिए यह कार्य अत्यंत आवश्यक है।

दिक्कत यह है कि जो वैदिक संस्कृत के विद्वान हैं उनका आम तौर पर कम्प्यूटर से वास्ता नहीं होता और आम कम्प्यूटर प्रयोक्ता इस बारे में वांछित जानकारी नहीं रखता।

खैर हमें प्रयास करते रहना चाहिए कि अपनी पहचान के किसी भी संस्कृत के विद्वान को इस कार्य से जोड़ सकें।