सूचना
प्रौद्योगिकी और भारतीय भाषाएँ
--विजय कुमार मल्होत्रा
१. सभी भारतीय भाषाओं के लिए समान कुंजीपटल
विविधता में एकता अर्थात Unity in Diversity भारतीय संस्कृति को मूलभूत विशेषता रही है। यही
अंतर्निहित समानता ब्राह्मी लिपि से उद्भूत और विकसित सभी भारतीय लिपियों में भी
कमोबेश रही हैं। ब्राह्मी लिपि संस्कृत और भारतीय भाषाओं के लिए लगभग ३५० ई.पू. से
लेकर ३५० ई. तक केवल भारत में ही नहीं, अन्य अनेक पड़ोसी
देशों में भी प्रयुक्त होती थी। यह लिपि अपने युग की सर्वाधिक वैज्ञानिक और आदर्श
लिपि थी। यही कारण था कि खरोष्ठी आदि लिपियों के रहते हुए भी बौद्ध तथा जैन धर्म के
प्रचारकों ने भी ब्राह्मी लिपि को ही अपने धर्म के प्रचार और ग्रंथों के निर्माण के
लिए इस्तेमाल किया। चौथी शताब्दी के उत्तरार्ध में ब्राह्मी लिपि दो शैलियों में भी
विभक्त हो गई, उत्तरी और दक्षिणी शैली। उत्तर भारत की सभी लिपियाँ ब्राह्मी की
उत्तरी शैली से और दक्षिण भारत की लिपियाँ दक्षिणी शैली से विकसित हुई हैं। कालांतर
में इनमें काफ़ी अंतर आ गया। इस अंतर का एक प्रमुख कारण कदाचित लेखन सामग्री की
भिन्नता भी रहा है। दक्षिण भारत में ताड़ वृक्षों की बहुलता के कारण लेखन सामग्री
के रूप में ताड़पत्रों का प्रयोग किया जाता था। और उस कलम पर सीधे लेखन से
ताड़पत्रों के फटने की आशंका रहती थी। इसलिए नोकदार सूखी कलम से वृत्ताकार रूप में
लिखने की परंपरा विकसित हुई। इसके विपरीत, उत्तर भारत में चपटी और खोखली कलम से
वृत्त के बजाय ऊपर नीचे की मात्राओं के साथ लिखने की परंपरा विकसित हुई।
इतनी विविधताओं और विभिन्नताओं के
बावजूद ध्वन्यात्मक स्वरूप होने के कारण इन सभी लिपियों की वर्णमाला के क्रम में
विलक्षण समानता है। इसी अंतर्निहित समानता को आधार बनाकर कुछ लिपियों में प्रचलित
विशिष्ट ध्वनियों को 'परिवर्धित देवनागरी' के अंतर्गत समाहित कर लिया गया है। इसी
मूलभूत समानता को आधार बनाकर वर्ष १९८३ में आई.आई.टी., कानपुर के वैज्ञानिकों ने
सभी भारतीय भाषाओं के लिए एक समन्वित देवनागरी टर्मिनल का विकास किया, जिसे वर्ष
१९८६ में दिल्ली में आयोजित विश्व हिंदी सम्मेलन में प्रदर्शित किया गया। दो वर्ष
के बाद भारत में सुपर कंप्यूटर के लिए इलैक्ट्रॉनिकी विभाग के अंतर्गत पुणे में
स्थापित सी-डैक ने इसे 'जिस्ट' (Graphics and
Intelligence Script Technology) के रूप में
पुष्पित और पल्लवित किया। सभी भारतीय लिपियों में अंतर्निहित समानता के आधार पर
'इस्की' (ISCII Aqaa-t\
Indian Standard code for Information Interchange)
कोडिंग प्रणाली का विकास किया गया। कंप्यूटर जगत में अंग्रेज़ी के वर्चस्व को देखते
हुए इस प्रणाली में भारतीय लिपियों के साथ-साथ रोमन लिपि को भी समाहित किया गया और
इसके लिए 'इन्स्क्रिप्ट' (Indian
Script का
संक्षिप्त रूप) कुंजीपटल का विकास किया गया। अभी तक सभी भारतीय भाषाओं और लिपियों
के लिए यांत्रिक टाइपराइटर के लिए अलग-अलग कुंजीपटल इस्तेमाल किए जाते थे। इतना ही
नहीं, सिर्फ़ देवनागरी लिपि के लिए दो-तीन कुंजीपटल आज भी प्रचलन में हैं। ऐसी
स्थिति में रोमन, और सभी भारतीय लिपियों (उर्दू को छोड़कर) के लिए एक समन्वित
कुंजीपटल (integrated keyboard)
के विकास की परिकल्पना भी भारतीय संस्कृति की मूल भावना 'विविधता में एकता' अर्थात 'Unity in
Diversity' के ही अनुरूप थी। इसके लिए सभी भारतीय भाषाओं की ५५
मूल ध्वनियों को समान वर्ण या character
के रूप में ही 'इस्को' में समाहित किया गया था। 'इस्को' कोडिंग प्रणाली
८ बिट पर
आधारित है, जबकि अधिकांश योरोपीय भाषाओं के लिए प्रयुक्त रोमन लिपि के लिए विकसित
'आस्की' (ASCII
Aqaa-t\ American Standard Code for Information Interchange)
कोडिंग प्रणाली ७ बिट पर आधारित है किंतु 'इस्की' के अंतर्गत इसे भी समाहित किया
गया है। सह अस्तित्व (co-existence)
की इसी भावना के कारण 'इन्स्क्रिप्ट' कुंजीपटल से भारतीय भाषाओं के साथ-साथ रोमन
लिपि में लिखी जाने वाली योरोप की अधिकांश भाषाओं में भी कंप्यूटर पर काम किया जा
सकता है। सभी भारतीय लिपियों के लिए समान कोडिंग प्रणाली के कारण उनमें परस्पर
लिप्यंतरण (transliteration)
की सुविधा भी अनायास ही उपलब्ध हो गई है। साथ ही यह सुविधा रोमन में भी उपलब्ध है,
अर्थात भारतीय लिपियों से रोमन में भी लिप्यंतरण किया जा सकता है।
वस्तुत: यह एक ऐतिहासिक संयोग ही है
कि कंप्यूटर के लिए आरंभ में रोमन लिपि का उपयोग किया गया, किंतु इसका कोई तकनीकी
कारण नहीं हैं। यह तथ्य तो सर्वविदित ही है कि कंप्यूटर का विकास सर्वप्रथम उन
देशों में हुआ जिनकी भाषा मुख्यत: रोमन लिपि पर आधारित थी, किंतु आज रोमनेतर
लिपियों में भी कंप्यूटर का व्यापक उपयोग किया जाने लगा है। कुछ हद तक यह सही है कि
रोमन लिपि रेखिक(linear)
होने के कारण यंत्र के लिए अपेक्षाकृत अधिक सुगम है, किंतु "नासा" (NASA)
के प्रसिद्ध अमरीकी वैज्ञानिक रिक ब्रिग्ज़ की यह धारणा है कि देवनागरी लिपि में
लिखी जाने वाली संस्कृत भाषा कंप्यूटर प्रोग्राम की दृष्टि से आदर्श भाषा है। इसका
कारण कदाचित यही है कि यह अत्यंत सूत्रबद्ध (codified)
भाषा है।
वस्तुत: आज आवश्यकता इस बात की है कि
'वसुधैव कुटुंबकम्' की भावना से विश्व की सभी भाषाओं और लिपियों को एक ही कोड़िंग
प्रणाली के अंतर्गत समाहित किया जाए। रोमन लिपि की सुगमता के कारण आरंभ में विश्व
की सभी भाषाओं में कुंजीयन (keying)
का कार्य रोमन लिपि के माध्यम से करने के प्रयास किए गए। इस दिशा में अमरीका की
ज़ीरोक्स कॉर्पोरेशन द्वारा विकसित 'स्टार' सॉफ्टवेयर अत्यंत लोकप्रिय सिद्ध हुआ।
वस्तुत: रोमनेतर लिपियों में इतनी अधिक भिन्नता है कि उन्हें एक कुंजीपटल पर लाना
कोई सहज कार्य नहीं है। अरबी और हिब्रू दाएँ से बाएँ लिखी जाती हैं। चीनी लिपि
अधिकांशत: ऊपर से नीचे लिखी जाती है। चीनी एक रूपमिक (morphemic) लिपि है। इसमें
६५,५३६ भावचित्र (ideographs)
हैं और प्रत्येक भावचित्र का अलग-अलग अर्थ है। ऐसी वैविध्यपूर्ण और विशिष्ट लिपि को
'स्टार' के अंतर्गत १२८४ रोमन अक्षरों में लिप्यंतरित किया गया है। कोरियन लिपि में
अनेक अक्षरों का गुच्छा (cluster)
बन जाता है। इसे १४४३ रोमन अक्षरों में समाहित किया गया है। जापानी लिपि में भी
लगभग ५०,००० भावचित्र हैं। इन्हें जापानी भाषा में 'कंजी' कहा जाता है। इन तमाम
भावचित्रों को रोमन के २००० से ३००० अक्षरों में समाहित किया गया है। जहां तक
भारतीय भाषाओं का संबंध हैं, भारत में अठारह संविधान सम्मत भाषाएँ हैं और ये भाषाएँ
१० अलग-अलग लिपियों में लिखी जाती हैं, किंतु सभी भाषाएँ ध्वन्यात्मक हैं और उर्दू
को छोड़कर शेष भाषाओं की वर्णमाला भी एक है।
किंतु वर्ष १९९१ में विश्व की सभी
भाषाओं के लिए युनिकोड १.० से संबंधित एक प्रलेख प्रकाशित किया गया, जिसमें
इस्की-८८ कोड को भी समाहित किया गया था। बाद में उसी वर्ष के दौरान भारतीय मानक
ब्यूरो ने IS १३१९४ : १९९१
के रूप में इस्की-९१ कोडिंग प्रणाली को मानक के रूप में स्वीकार कर लिया। आज
विंड़ोज़ २००० के रिलीज़ के बाद युनिकोड प्रणाली विश्वभर में लोकप्रिय हो गई है।
वस्तुत: युनिकोड ही एकमात्र ऐसी मानक प्रणाली है, जिसमें विश्व की अधिकांश भाषाओं
के शब्दों और अक्षरों को समाहित किया गया है। एक समय था, जब कंप्यूटर ८ बिट प्रणाली
पर आधारित होते थे तो एक बाइट (byte)
में २५६ तरीकों से ही अक्षरों को व्यक्त किया जा सकता था। अंग्रेज़ी भाषा के २६
अक्षरों के लिए तो यह उपयुक्त थी और भारतीय भाषाओं की ५५ मूल ध्वनियों को भी इसके
अंतर्गत समाहित किया जा सकता था, किंतु चीनी, कोरियाई और जापानी जैसी भाषाओं की
जटिल लिपियों के लिए यह पर्याप्त नहीं थी। इसलिए १६ बिट प्रणाली के अंतर्गत युनिकोड
की परिकल्पना की गई, जिसके अंतर्गत ६५,५३६ अक्षरों को समाहित किया जा सकता था। इसके
फलस्वरूप सभी भाषाओं के लिए अलग-अलग परिचालन प्रणाली की आवश्यकता भी नहीं रह गई।
इसका दूसरा लाभ यह होगा कि इंटरनेट पर केवल अंग्रेज़ी का वर्चस्व नहीं रहेगा।
सहअस्तित्व की भावना के साथ विश्व की सभी भाषाएँ इसमें समाहित हो जाएँगी। चूँकि
युनिकोड में रोमन पर आधारित मानक कोडिंग प्रणाली आस्की-७ के २५६ अक्षर भी शामिल
हैं, इसलिए ८ बिट पर आधारित कंप्यूटर भी युनिकोड़ के अनुरूप हैं। भारतीय भाषाओं के
लिए विकसित 'इस्की-८' को भी युनिकोड में स्थान दिया गया है।
२. विभिन्न परिचलन प्रणालियों
में भारतीय भाषाओं की स्थिति
आज 'डॉस', 'विंडोज़' और 'युनिक्स', 'मैक'
आदि सभी परिचलन प्रणालियों (Operating
Systems) भारतीय भाषाओं में संसाधन की सुविधा
मौजूद हैं। इस कार्य में अनेक सरकारी और गै़र-सरकारी संस्थाओं का योगदान रहा है।
सरकारी संस्थाओं में भारत के लिए सुपर कंप्यूटर के निर्माता पुणे (महाराष्ट्र)
स्थित 'सी-डैक' का योगदान अप्रतिम है। इस संस्था ने भारतीय भाषाओं के लिए
सॉफ्टवेयरों की एक पूरी श्रृंखला विकसित की है। 'डॉस' परिवेश के अंतर्गत भारत की
अनेक प्रमुख संस्थाओं ने शब्द संसाधन (Word
Processing) के अनेक पैकेज विकसित किए। इनमें
प्रमुख है - 'एएलपी', 'मल्टीवर्ड', 'शब्दरत्न', 'शब्दमाला', 'अक्षर', 'बाइस्क्रिप्ट',
'सुवर्ड' आदि। किंतु शब्द संसाधन के साथ-साथ डैटा संसाधन (Data
Processing) का कार्य हिंदी में करने के लिए
सी-डैक ने 'जिस्ट कार्ड', आर.के. कंप्यूटर्स ने 'सुलिपि' और 'सॉफ्टेक' कंपनी ने 'देवबेस'
विकास किया। किंतु जहाँ 'सुलिपि' और 'देवबेस' में भारतीय भाषाओं में केवल हिंदी को
ही समाहित किया गया है, वहाँ सी-डैक, पुणे द्वारा विकसित 'जिस्ट' कार्ड में भारतीय
भाषाओं की सभी लिपियों के साथ-साथ दक्षिण-पूर्वेशिया और योरोप की कुछ लिपियों को भी
समाहित किया गया है। फारसी-अरबी पर आधारित उर्दू लिपि भी 'जिस्ट कार्ड' की अन्यतम
विशेषता है, किंतु ये सभी सॉफ्टवेयर आईबीएम पीसी के लिए है, मैक (MAC)
प्लेटफॉर्म के लिए सी-डैक ने 'एएलपी' शब्द-संसाधन का विशेष वर्शन (version)
विकसित किया है।
इसमें संदेह नहीं कि इन सॉफ्टवेयरों के माध्यम से डॉस परिवेश के अंतर्गत सरलता से
हिंदी में काम किया जा सकता है, किंतु अभी भी इनके कमांड (command)
और मेन्यू (menu)
आदि अंग्रेज़ी में ही है। इस कठिनाई को देखते हुए आईबीएम टाटा कंपनी ने
आर.के.कंप्यूटर्स की मदद से 'हिंदी डॉस' नाम से एक ऐसी परिचलन प्रणाली (operating system)
का विकास किया है, जिसके अंतर्गत 'कमांड' और 'मेन्यू' भी हिंदी में दिए गए हैं और
फ़ाइल का नाम भी हिंदी में दिया जा सकता है। यूनिक्स परिवेश के अंतर्गत सी-डैक ने 'जिस्ट
टर्मिनल' और आर.के. कंप्यूटर्स ने 'सूयूनिक्स' का विकास किया है। सी-डैक ने यूनिक्स
परिवेश के अंतर्गत शब्द संसाधन के लिए एएलपी का यूनिक्स वर्शन (version)
भी विकसित किया है, जिसमें स्पैल-चैकर आदि की अधुनातन सुविधाएँ भी मौजूद हैं। किंतु
आज आम आदमी के लिए सर्वाधिक मैत्रीपूर्ण प्लेटफॉर्म है 'विंडोज़'। इस प्लेटफार्म पर
भारतीय भाषाओं में विभिन्न प्रकार के 'इंटरफेस' विकसित किए गए हैं। इनमें प्रमुख
हैं : सी-डैक द्वारा विकसित 'लीप ऑफ़िस' और 'इज़्म ऑफ़िस', आर.के.कंप्यूटर्स द्वारा
विकसित 'सुविंडोज़', एसीईएस कंसल्टैंट्स द्वारा विकसित 'आकृति ऑफ़िस' और 'सॉफ्टैक'
कंपनी द्वारा विकसित 'अक्षर फॉर विंडोज़' आदि। मैक प्लेटफॉर्म के लिए सी-डैक ने 'मैक
इज़्म' का विकास किया है, जिसके माध्यम से 'पेजमेकर'और 'क्वार्क एक्सप्रेस' आदि में
भी हिंदी में कार्य किया जा सकता है। इनमें एम.एस.ऑफ़िस के अंतर्गत समाविष्ट सभी
सॉफ्टवेयरों में विभिन्न भारतीय लिपियों में काम करने की सुविधा मौजूद हैं। वस्तुत:
विंडोज़ और एम.एस. ऑफ़िस की लोकप्रियता के कारण आज सभी कंपनियाँ भारत की विभिन्न
लिपियों में फांट (font)
एम.एस.ऑफ़िस (MS Office)
के साथ ही देने लगी हैं, किन्तु 'स्पैल चैकर' और 'ऑन-लाइन' शब्दकोश की सुविधा कुछेक
सॉफ्टवेयरों में ही उपलब्ध हैं।
विंडोज़ २००० के रिलीज़ के बाद
यह महसूस किया जाने लगा था कि भारतीय भाषाओं को यदि परिचालन प्रणाली में अंतर्निहित
नहीं किया गया तो उनमें अनेक कमियाँ रह जाएँगी। उदाहरण के लिए कोश निर्माण के लिए
भारतीय भाषाओं की वर्णमाला के अनुरूप 'सॉर्टिंग' की सुविधा अत्यंत आवश्यक है और यह
सुविधा आज मूल प्रणाली में हिंदी को अंतर्निहित करने के कारण अनायास ही सुलभ हो गई
है। इसलिए यह कदम भारतीय भाषाओं में कंप्यूटिंग के क्षेत्र में अत्यंत महत्वपूर्ण
सिद्ध होगा। विंड़ोज़ ऑपरेटिंग सिस्टम के बाद अब 'लोटस', 'लाइनेक्स' और 'ऑरेकल'
कंपनियों ने भी घोषणा कर दी है कि वे भी यथाशीघ्र अपनी परिचालन प्रणालियों में
हिंदी और अन्य भारतीय भाषाओं को समाहित कर लेंगी।
३. हिंदी में डीटीपी अर्थात
डैस्क प्रकाशन
यह तो स्पष्ट ही है कि हिंदी और अन्य
भारतीय भाषाओं में प्रकाशन कार्य में गुणात्मक सुधार लाने में 'इस्फॉक' (ISFOC)
मानक फौंट की विशेष भूमिका है। इस कार्य के लिए भी सरकारी और ग़ैर-सरकारी दोनों ही
स्तरों पर कई सॉफ्टवेयर विकसित किए गए हैं। इनमें प्रमुख हैं : समिट द्वारा विकसित
'इंडिका', एसआरजी द्वारा विकसित 'प्रकाशक' और सी-डैक द्वारा विकसित 'इज़्म पब्लिशर'
या 'इज़्म सॉफ्ट' आदि। वस्तुत: हिंदी या अन्य भारतीय भाषाओं में प्रकाशन कार्य में
क्रांति तब आएगी, तब लेखक स्वयं अपने कंप्यूटर पर अपनी पांडुलिपि को टंकित करेगा।
उपयोक्ता की सुविधा के लिए सभी प्रमुख सॉफ्टवेयरों में हिंदी में तीन प्रकार के
कुंजीपटलों की व्यवस्था है। लीप ऑफ़िस में ''Tool''
के अंतर्गत 'Option'
से आप तीनों में किसी एक कुंजीपटल का चुनाव कर सकते हैं। यांत्रिक टाइपराइटर पर काम
करने के अभ्यस्त टाइपिस्ट 'Typist'
विकल्प का चुनाव कर सकते हैं ओर 'क्वेर्टी(querty)'
कुंजीपटल पर रोमन लिपि में काम करने के अभ्यस्त प्रयोक्ता 'Phonetic English'
का चुनाव कर सकते हैं, किंतु मूलत: कंप्यूटर पर ही टंकण सीखने वाले लेखकों और अन्य
प्रयोक्ताओं के लिए 'इन्स्क्रिप्ट' (Inscript)
कुंजीपटल का विकास किया गया है। इस कुंजीपटल में वर्णमाला का स्वाभाविक क्रम होने
के कारण इसे सीखना बहुत सरल है। सी-डैक ने व्यक्तिगत स्तर पर लेखकों के लिए
कुंजीपटल को सरल बनाने के लिए 'आई-लीप' (iLeap)
नामक अत्यंत मैत्रीपूर्ण और कलात्मक इंटरफेस का विकास किया है। इसके माध्यम से लेखक
न केवल अपनी पांडुलिपि स्वयं टंकित कर सकते हैं, बल्कि 'बहुभाषी स्पैल चैकर' की
सहायता से उसमें प्रूफ संशोधन भी कर सकते हैं। प्रूफ संशोधन के बाद 'पेज-लेआउट'
तैयार करके व्यक्तिगत स्तर पर प्रकाशन कार्य भी कर सकते हैं। 'वेब प्रकाशन' की
अतिरिक्त सुविधा के कारण इसके ज़रिए लेखक या उपयोक्ता इंटरनेट पर अपना 'होमपेज' या
'वेबपेज' बना सकते हैं। इस सॉफ्टवेयर में सभी भारतीय भाषाओं में उक्त सभी सुविधाएँ
मौजूद हैं। हाल ही में सी-डैक ने भारतीय कला-चित्रों (Cliparts)
के संकलन 'शैली' और 'प्रतिबिंब' नाम से रिलीज़ किए हैं। इसमें रंगोली के चित्रों से
लेकर अनेक भारतीय भाषाओं के प्रतीक 'क्लिपार्ट' के रूप में दिए गए हैं। इन्हें
'कोरल ड्रॉ', '३-डी स्टुडिओ' और वेब प्रकाशन के सॉफ्टवेयर के साथ भारतीय भाषाओं का
संयोजन करते हुए इस्तेमाल किया जा सकता है।
४. इंटरनेट, ई-मेल और वेब
पब्लिशिंग
आज विंडोज़ का अधुनातन 'वर्शन' (version)
है विंड़ोज़ २०००। इसे 'विंडोज़ एनटी ५.०' कहा जाता है। इसी के अनुरूप
माइक्रोसॉफ्ट कंपनी ने एम.एस. ऑफ़िस के अंतर्गत 'ऑफ़िस २०००' भी रिलीज़ किया है। इसमें विश्व की
सभी जटिलतम लिपियों को समाहित किया गया है। इनमें प्रमुख हैं - अरबी, हिब्रू, थाई,
देवनागरी और तमिल। वस्तुत: अभी तक 'विंडोज़' के अंतर्गत विभिन्न भाषाओं में मात्र
कुंजीयन (keying) की सुविधा वैकल्पिक रूप में मौजूद थी, किंतु 'विंड़ोज़ २०००' के आगमन के कारण
स्थानीय भाषाओं में 'इंटरफेस' की सुविधा भी उपलब्ध हो गई है अर्थात अब हम देवनागरी
में न केवल संदेशों का आदान-प्रदान कर सकते हैं, बल्कि पाठों के कुंजीयन के साथ-साथ
'मेन्यु' (menu)
भी देवनागरी में देख सकते हैं। 'युनिकोड' पर आधारित होने के कारण इसमें 'इस्की'
कोडिंग प्रणाली का समावेश भी अनायास ही हो गया है। यद्यपि ई-मेल और वेब प्रकाशन की
सुविधा 'विंड़ोज़-९५' और 'विंड़ोज़-९८' में भी उपलब्ध थी, लेकिन अब ये कार्य बहुत
सरलता से भारतीय लिपियों में भी किए जा सकेंगे।
सी-डैक द्वारा विकसित 'आई-लीप', 'लीप-ऑफ़िस
२.०' तथा आर.के.कंप्यूटर्स द्वारा विकसित 'सुविंड़ोज़' २.०' के माध्यम से न केवल
ई-मेल के संदेशों का आदान-प्रदान देवनागरी में किया जा सकता है, बल्कि वैब-पेज भी
हिंदी में लिखा जा सकता है, किंतु जहाँ आई-लीप और 'लीप-ऑफ़िस २.०' में यह सुविधा
सभी भारतीय भाषाओं में सुलभ हैं, वहाँ 'सुविंड़ोज़ २.०' में यह सुविधा केवल
देवनागरी में हैं, किंतु सी-डैक द्वारा 'हॉटमेल' के समकक्ष हिंदी और मराठी में 'मल्टीमेल'
की सुविधा भी प्रदान की गई है। यह निश्चय ही क्रांतिकारी कदम है। इसके माध्यम से न
केवल संदेशों का आदान-प्रदान हिंदी में किया जा सकता है, बल्कि 'कमांड' और 'मेन्यु'
भी हिंदी में ही दिए गए हैं। उपयोक्ता अपना 'पासवर्ड' भी हिंदी में दे सकता है।
इंटरनेट पर इसका पता इस प्रकार है : http:\\www.gist.cdac.org
रोमन लिपि के बढ़ते प्रभाव के कारण
विश्व की अनेक लिपियाँ समाप्तप्राय हो गई हैं, किंतु भारतीय भाषाओं के संदर्भ में
स्थितियाँ इतनी निराशाजनक नहीं हैं। सी-डैक ने इस क्षेत्र में भी चुनौती को स्वीकार
किया है और मल्टी-मीडिया वीडियो कार्यों की एक पूरी श्रृंखला विकसित कर दी है। इसके
अंतर्गत 'लिप्स' (Language
Independent Program Sub–titles) नाम से एक
सॉफ्टवेयर विकसित किया गया है, जिसके माध्यम से सभी भारतीय भाषाओं में फ़िल्मों के
उप-शीर्षक (Sub–titles)
हिंदी और अन्य भारतीय भाषाओं में तैयार किए जा सकते हैं। इसके फलस्वरूप अपने
ड्राइंग-रूम में बैठकर अपनी पसंद की किसी भी भारतीय भाषा में विदेशी फ़िल्में भी
देखी जा सकती हैं। टीवी पर भारतीय भाषाओं में समाचार-वाचन के लिए 'मल्टी प्रॉम्प्टर
(Multi-Prompter)
का विकास किया गया है जिसके ज़रिए समाचार-वाचक बिना काग़ज़ देखे समाचार पढ़ सकता है
और स्क्रालिंग की गति को आवश्यकतानुसार नियंत्रित भी कर सकता है। 'मूव(Move)' (Multiscript
Oneline Video Editor) एक ऐसा बहुभाषी अक्षर
जनरेटर है, जिसके ज़रिए दूरदर्शन और फ़िल्मों में पात्रों के नाम भारतीय भाषाओं में
अंकित किए जा सकते हैं। हिंदी और अन्य भारतीय भाषाओं में 'बटरफ्लाई (Butterfly)
नाम से डबिंग स्टेशन भी विकसित किया गया है और हिंदी और अन्य भारतीय भाषाओं में
सीडी बनाने के लिए 'केमेलियन (chameleon)'
नामक साफ्टवेयर का विकास किया गया है। इसकी सहायता से किसी भी वीडियो को 'सीडी' में
रूपांतरित किया जा सकता है।
इसके अलावा, 'मोटरोला' कंपनी ने
सन १९९७ में देवनागरी और गुजराती में पेजर का निर्माण भी किया है और भारतीय भाषाओं में
पेजर टैक्नोलॉजी के विकास के लिए ('ISCLAP(
Indian Standard Code for Language Paging) के
मानक का विकास किया था और यह मानक ISCII
के ही अनुरूप है। इसके ज़रिए संदेशों का आदान-प्रदान पेजर पर भी हिंदी, मराठी और
गुजराती में करना संभव हो गया है।
५. कृत्रिम बुद्धि (Artificial
Intelligence) पर आधारित विशेषज्ञ
प्रणालियों (Expert Systems)
का विकास
कंप्यूटर टैक्नोलॉजी के अंतर्गत
प्राकृतिक भाषा संसाधन (Natural
Language Processing) के क्षेत्र में विश्वभर
में अनेक विशेषज्ञ प्रणालियों (³expert
systems) का विकास किया गया है, जिनके माध्यम
से कंप्यूटर साधित भाषा शिक्षण, मशीनी अनुवाद और वाक्-संसाधन (Speech
Processing) से संबंधित विभिन्न अनुप्रयोग
विकसित किए गए हैं। इस संबंध में आई.आई.टी, कानपुर के सहयोग से हैदराबाद
विश्वविद्यालय में 'अनुसारक' नाम से एक ऐसी स्वचलित मशीनी अनुवाद प्रणाली का विकास
किया गया है जिसके माध्यम से विभिन्न भारतीय भाषाओं में परस्पर 'शाब्दिक अनुवाद' की
व्यवस्था है। यह तो स्पष्ट ही है कि सभी भारतीय भाषाओं में वाक्य विन्यास एक जैसा
है। यदि कहीं कुछ अंतर हैं भी तो वह अंतर इतना बड़ा नहीं हैं कि उससे 'अर्थ' का
'अनर्थ' हो जाए। यही कारण है कि अंग्रेज़ी से हिंदी में अनुवाद के लिए 'अनुसारक'
प्रणाली सफल सिद्ध नहीं हो पाई है, किंतु भारतीय भाषाओं के संदर्भ में यह प्रणाली
अपनी सीमाओं के बावजूद काफ़ी हद तक सफल मानी जा सकती है। आजकल यह कार्य आई.आई.टी
हैद्राबाद में प्रो. राजीव संगल के निर्देशन में किया जा रहा है। अब तक 'अनुसारक'
प्रणाली तेलुगु-हिंदी, कन्नड़-हिंदी, बंगला-हिंदी, मराठी-हिंदी और कुछ हद तक
पंजाबी-हिंदी में भी विकसित की गई है।
इसके अलावा, राजभाषा विभाग, गृह
मंत्रालय, भारत सरकार के सहयोग से सी-डैक के 'ए ए आई' ग्रुप ने भी 'मंत्र' (Machine
assisted Translation Tool) नाम से एक ऐसी
स्वचालित मशीनी अनुवाद प्रणाली विकसित की है जिसके माध्यम से नियुक्ति और पदोन्नति
से संबंधित भारत के राजपत्र की अधिसूचनाओं को अंग्रेज़ी से हिंदी में अनूदित किया
जा सकता है। यद्यपि इसका प्रयोग-क्षेत्र अत्यंत सीमित है, किंतु अधिसूचनाओं की जटिल
वाक्य रचनाओं को देखते हुए यह प्रयास निश्चय ही सराहनीय है। इंटेल कंपनी की अनुशंसा
पर 'स्मिथसोनियन' संस्था ने इसे सूचना प्रौद्योगिकी के क्षेत्र में अत्यंत साहसिक
और सराहनीय कदम के रूप में स्वीकार किया है। इसके अलावा, इसी ग्रुप ने राजभाषा
विभाग, गृह मंत्रालय, भारत सरकार के सहयोग से 'लीला प्रबोध' और 'लील प्रवीण' नामक
स्वयं शिक्षक पैकेज भी विकसित किए हैं। ये पैकेज पूर्णत: मल्टीमीड़िया कंप्यूटर
प्रणाली पर आधारित हैं और इनमें ध्वनि (speech),
चित्रों (graphics)
और एनिमेशन का भरपूर उपयोग किया गया है। इनमें अनेक प्रकार के वीडियो क्लिपिंग्स भी
रखे गए हैं ताकि शिक्षार्थी बड़े जीवंत रूप में और सहजता से इसके ज़रिए हिंदी सीख
सकें। 'हिंदी प्रवीण' का निर्माण भी अंतिम चरण में हैं।
६. हिंदी और अन्य भारतीय
भाषाओं में कंप्यूटर संबंधी विभिन्न अनुप्रयोग
भारतीय भाषाओं में कंप्यूटर
टैक्नोलॉजी के विकास के कारण आज जटिल से जटिल कंप्यूटर संबंधी अनुप्रयोगों में
हिंदी और अन्य भारतीय भाषाओं का व्यापक रूप से प्रयोग किया जा रहा है। भारतीय रेल
द्वारा आरक्षण व्यवस्था के कंप्यूटरीकरण के कारण आम आदमी को बहुत सुविधा हो गई है
और अब यह सुविधा एक विशेष टैक्नोलॉजी के माध्यम से हिंदी में भी सुलभ करा दी गई है।
इस कार्य में 'सी एम सी' और 'क्रिस' जैसी वैज्ञानिक संस्थाओं का प्रमुख योगदान है।
भारत में होने वाले आम चुनावों के लिए करोड़ों मतदाताओं की सूचियाँ कंप्यूटर के
माध्यम से हिंदी और अन्य भारतीय भाषाओं में तैयार की गई हैं। भारतीय चुनाव आयोग
द्वारा वितरित अधिकांश परिचय-पत्र भी भारतीय भाषाओं में तैयार किए गए हैं।
महाराष्ट्र बिजली बोर्ड की रसीदें कंप्यूटर के माध्यम से मराठी में छापी जा रही
हैं। उड़ीसा के पटवारी अपनी ज़मीन से संबंधित रिकार्ड कंप्यूटर पर उड़िया में तैयार
कर रहे हैं। आंध्र प्रदेश और तमिलनाडु में अनेक सरकारी कार्य क्रमश: तेलुगु और तमिल
में संपन्न किए जा रहे हैं।
आज अनेक गौरव-ग्रंथ और
महत्वपूर्ण सूचनाएँ भी सीडी के रूप में भारतीय भाषाओं में उपलब्ध होने लगी हैं।
इनमें प्रमुख हैं : सी-डैक द्वारा विकसित 'ज्ञानेश्वरी' भारतीय चुनाव आयोग द्वारा
तैयार की गई मतदाता सूचियाँ, कुछ निजी संस्थाओं द्वारा विकसित 'पंचतंत्र की कथाएँ'
और गेटवे मल्टीमीडिया इंडिया लिमिटेड, अहमदाबाद द्वारा विकसित विशाल
अंग्रेज़ी-हिंदी शब्दकोश।
७. निष्कर्ष:
आज हम अगली सदी और सहस्त्राब्दि (millennium)
की दहलीज़ पर खड़े हैं। इसलिए आवश्यकता इस बात की है कि हम हिंदी और अन्य भारतीय
भाषाओं के सामने आने वाली चुनौतियों को रेखांकित करें और उनका सामना करने के लिए
आवश्यक उपाय करें। इस संदर्भ में मैं कुछ सुझाव उपस्थित विद्वज्जनों के सामने रखना
चाहूँगा। मुझे विश्वास है कि यदि हमने इन सुझावों और प्रस्तावों के अनुरूप अपनी
कार्य योजना बनाई तो नई सदी और सहस्त्राब्दि में हिंदी और अन्य भारतीय भाषाओं का
भविष्य निश्चय ही उज्ज्वल होगा:
१. हिंदी के प्रमुख गौरव-ग्रंथों (classics)
को चिह्नित करना और उन्हें सीडी के रूप में उपलब्ध कराना।
२. हिंदी में ओ.सी.आर.(Optical
Character Recognition) का निर्माण।
३. अधिक से अधिक वैब ठिकानों में यथासंभव अधिकारिक सामग्री हिंदी और अन्य भारतीय
भाषाओं में उपलब्ध कराना।
४. हिंदी में स्पीच इनपुट-आउटपुट सिस्टम विकसित करना।
५. पूर्णत: स्वचालित कंप्यूटर साधित मशीनी अनुवाद प्रणाली का विकास।
|