(ஆங்கில எழுத்துருவில் தமிழை எழுதினால் என்ன? – ஜெயமோகன், எழுத்தாளர் அவர்களின் இந்து செய்திஏட்டுக் கட்டுரைக்கு பதிலாக)
ஒரு மொழியின் எழுத்துகள் – வரிவடிவம் – என்பது அம்மொழியில் பயன்படும் அனைத்து பேச்சு ஒலிகளுக்குமான (phones) குறியீடுகள் இல்லை.
Posted on by இரா.சுகுமாரன்
(ஆங்கில எழுத்துருவில் தமிழை எழுதினால் என்ன? – ஜெயமோகன், எழுத்தாளர் அவர்களின் இந்து செய்திஏட்டுக் கட்டுரைக்கு பதிலாக)
ஒரு மொழியின் எழுத்துகள் – வரிவடிவம் – என்பது அம்மொழியில் பயன்படும் அனைத்து பேச்சு ஒலிகளுக்குமான (phones) குறியீடுகள் இல்லை.
தலைப்பில் “இரண்டாம்” என்ற சொல் வரும்போதே இதைப்போன்ற முதலாம் நிகழ்வு இருந்திருக்க வேண்டும் என்று யாவரும் எண்ணுவது சரியே. அது ஏறத்தாழ இரண்டாண்டுகள் பழைமையானது. முதலாம் நிகழ்வைப் பற்றி விரிவாகப் பின்னர் காண்போம். தற்போதைய நிகழ்வைப் பதிவு செய்வதே நோக்கம்.
முதலாம் தமிழ்-ஒருங்குறி அழிப்பு முயற்சியில் 5 தமிழ் எழுத்துகளைக் கொண்டுபோய் கிரந்த-ஒருங்குறியிலும், முன்பின் பார்த்திராத 26 கிரந்த எழுத்துகளை தமிழ்-ஒருங்குறியிலும் கலந்து தமிழின் முகவரியை, அடையாளத்தைக் கணிப்பரப்பில் நீக்குவதற்காக தமிழ் அழிப்பாளர்கள் பெரும் போராட்டத்தை நடத்தினார்கள். அப்போது தமிழ்நாடு, தமிழ் கூறு நல்லுலகம் இவற்றொடு தமிழக அரசாங்கமும் திரண்டெழுந்து எதிர்த்ததால் தமிழ் அழிப்பாளர்கள் பின்வாங்கினார்கள்.
ஆயினும், விடாமுயற்சியாக, தற்போது, “ன, ழ” என்ற இரண்டு எழுத்துகளையாவது கிரந்த-ஒருங்குறியில் கொண்டுபோய்ச் சேர்த்து விட வேண்டும் என்று மீண்டும் போராட்டத்தில் இறங்கியிருக்கிறார்கள் தமிழ்-அழிப்பாளர்கள். முதலில் இவ் இரண்டைச் சேர்த்து விட்டால் பின்னர் ஒவ்வொன்றாக மீதி மூன்றையும் சேர்த்து விடலாம் என்பது அவர்களின் திட்டமாக இருக்கக் கூடும்.
முதலாம் தமிழ்-ஒருங்குறி அழிப்பில் (த.ஒ.அ) முன்களத்தில் இருந்து செயற்பட்ட அதே திரு.நா.கணேசன் அவர்களே இம்முறையும் முன்களத்தில் இருக்கிறார். ஆனால், ஒருங்குறிச் சேர்த்தியத்திற்கு அனுப்பியிருக்கும் முன்னீடு (proposal) ஒரு மேனாட்டவரிடம் இருந்து போகுமாறு ஏற்பாடாகியிருக்கிறது இம்முறை.
திரு.மைக்கேல் எவர்சன் என்ற மேனாட்டவர் இவ் இரு தமிழ்
எழுத்துகளையும் கிரந்த-ஒருங்குறியில் கலக்க வேண்டும் என்ற வேண்டுகோளை
ஒருங்குறிச் சேர்த்தியத்திற்குக் கடந்த வருட இறுதியில் அனுப்பினார்.
அம் முன்னீட்டைப் பாராட்டி, ஆதரித்து, அக்கலப்பிற்குப் பரிந்துரையாக திரு.நா.கணேசன் ஒரு மடலையும் சேர்த்தியத்திற்கு அனுப்பினார்.
முதலாம் த.ஒ.அ இற்கு ஆதரவு காட்டிய அறிஞர் பெருமக்கள் வரிசையில் இம்முறை
திரு.மறவன்புலவு சச்சிதானந்தன் அவர்களும் சேர்ந்தது மிகப்பெரும்
அதிர்ச்சியாகவே தமிழுலகிற்கும் தமிழ்க் கணியிலகிற்கும்\
ஆகிப் போனது. மறவன்புலவாரும் இந்த “ன,ழ” எழுத்துகளை கிரந்த-ஒருங்குறியில்
சேர்க்க வேண்டும் என்று பரிந்துரைத்து ஒரு கடிதத்தை எழுதியிருக்கிறார்
சேர்த்தியத்திற்கு. மிக வருந்தத் தக்க ஒன்றாகும்.
அதில் என்னதான் தேவை சொல்லப் பட்டிருக்கிறது என்று பார்க்கையில், நமக்கு வியப்பே மிகுகிறது. “தாய்லாந்து நாட்டில் உள்ள அரச வம்சத்தார் சிலருக்குத் தேவார திருவாசகத்தைக் கிரந்தத்தில் படிக்க ஆசையிருப்பதால்” தயவு செய்து கிரந்தத்தில் இவ் இரு எழுத்துகளையும் கலந்து விடுங்கள் என்று கேட்டுக் கொள்ளப் பட்டிருக்கிறது.
“எனது ஆங்கிலத்தில் “ழ” இல்லை. ஆனால் “ழ” வை வைத்துள்ள தமிழர்கள் தமிழைவிட ஆங்கிலத்தையே அதிகம் படிக்கிறார்கள். அதனால், ஆங்கில-ஒருங்குறியில் தமிழ்-ழ வைச் சேர்த்து விடுங்கள் என்று எந்த ஆங்கிலேயராவது சொல்வாரா?”
ஆனால் தமிழர் “அவர்களின் கிரந்தத்தில் இவ் எழுத்துகள் இல்லை – அதனால் எமது எழுத்துகளைக் கொண்டு போய் அங்கு சேருங்கள் – அங்கே இருக்கின்ற எழுத்துகளையெல்லாம் கொண்டு வந்து இங்கே வந்து சேருங்கள்” என்று சொல்கிறார்கள். தமது மொழியைச் சிதைக்கும் நுண்ணிய கூறுகளை தலைமேற் சுமந்து செய்கிறார்கள்.
முதலாம் த.ஒ.அவின் போது, திரு.நாகசாமி, திரு.செ.இராசு, திரு.இ.அண்ணாமலை
ஆகிய அறிஞர்கள் திரு.கணேசனின் முன்னீட்டிற்குப் பின் ஆதரவு அளித்துச்
சேர்த்தியத்திற்கு அனுப்பியிருந்தார்கள். திரு.கணேசன்
இம்முறை சேர்த்தியத்திற்கு எழுதிய கடிதத்தில் அவர்களை மறக்காமல் நினைவு
கூர்ந்ததொடு திரு.சச்சிதானந்தன் அவர்களையும் பின் ஆதரவில்
சேர்த்திருக்கிறார்.
இவர்களின் முன்னீடுகள், பரிந்துரைகளைப் பார்த்த தமிழுலகம் வருந்தத்தான்
செய்தது. தமிழ் இணையக் கல்விக் கழகத்தின் இயக்குநர் முனைவர் நக்கீரன்
அவர்கள் இம்முயற்சியை எதிர்த்து சேர்த்தியத்திற்குக் கடிதம் எழுதினார்.
அமெரிக்கத் தமிழறிஞர் சு.பழனியப்பன் மிக வலுவான ஆய்வுக் கட்டுரை எழுதி, இவ்
எழுத்துகளைக் கலப்பதற்கு எதிர்ப்பு கூறி சேர்த்தியத்திற்கு அனுப்பினார்.
கோவை தொல்லியல் துறையைச் சேர்ந்த முனைவர் சாந்தலிங்கம் மறுப்பினையம்
பொருத்தமற்ற முன்னீடு என்பதையும் கூறி கடிதம் எழுதினார். இது எவ்வளவு
தேவையற்ற விதயம் என்றும், இதனால் நலமில்லை என்றும் கூறி திரு.இரமணசர்மா
சேர்த்தியத்திற்கு விளக்கி எழுதினார். திரு.நூ.த.உலோகசுந்தரம் அவர்களும்
தனது மறுப்பினை மிக வலுவாக சேர்த்தியத்தில் பதிவு செய்தார். இவர்களின்
எதிர்ப்பினால், சனவரி-பிப்ரவரியில் கூடிய சேர்த்தியம் இது குறித்து எந்த
முடிவும் எடுக்காமல் தள்ளி வைத்திருக்கிறது. மீண்டும் சேர்த்தியம்
கூடும்போது (ஓரிரு மாதங்களில்) இது குறித்து முடிவெடுக்கக் கூடும்.
இது இரண்டாம் தமிழ்-ஒருங்குறி அழிப்பின் தற்போதைய நிலை.
முதலாம் நிகழ்வின் போது எழுந்த அதே கேள்விகள் இன்றும் அப்படியே இருக்கின்றன.
1) பன்னாட்டு நிறுவனங்களால் நடத்தப்படும் ஒருங்குறிச்
சேர்த்தியத்திற்கு, உலகில் யார் வேண்டுமானாலும் தமிழ் எழுத்துகளை என்ன
செய்ய வேண்டும் என்று எழுதி தமிழைக் குலைத்துவிட முடியும் என்ற நிலை
இருக்கிறது.
அது தமிழர் என்ற பெயரில் இருக்கும் தனி மனிதரோ அல்லது ஓர் அமைப்போ
எதை வேண்டுமானாலும் மாற்றச் சொல்லி, திணிக்கச் சொல்லிக் கேட்கலாம்.
யாரும் மறுக்க வில்லை என்றால் சேர்த்தியமும் அதற்கு உடன்பட்டுப்
போய்விடும். ஆர்வலர்கள் கொஞ்சம் தவறவிட்டாலும் தமிழ் தொடர்பான தவறான
முன்னீடுகள் கணிமை, இணைய வரலாற்றில் நிரந்தரமாகச் சேர்ந்துவிடும். இந்த
நிலையில், தமிழக அரசாங்கத்திற்குத் தெரியாமல் எந்த ஒரு தமிழ் சார்ந்த
ஒருங்குறி முன்னீட்டையும் சேர்த்தியம் ஏற்கக் கூடாது என்று ஏன் நாம்
இன்னும் நிலைப்பாடு எடுக்கவில்லை?
2) தமிழ் மக்களால் பயன்படுத்தப்படும் கணியில் யாரோ எங்கோ அமர்ந்து கொண்டு இதைத் தூக்கி அங்கே போடு, அதைத் தூக்கி இங்கே போடு என்று சொல்வதும் உடனே தமிழறிஞர்கள் அவர்களுக்கு மறுப்பு சொல்லியே காலம் கழிப்பதும் எத்தனை நாளைக்கு ஆகக்கூடும்?
தவறான முன்னீடுகளைச் செய்து தமது சொந்த நலத்திற்காக மட்டும் ஒரு தமிழர் தமிழ் மொழியின் நெடுங்கணக்கில் விளையாட முடியும் என்றால் இது எங்கே போய் முடியும்? இதற்கு முற்றுப் புள்ளியை யார் வைப்பது? எங்கு வைப்பது?
தமிழ் மொழியைச் சீரழிக்கும் போக்குக்கு உடன்போகிறவர்களை எப்படித் தமிழுலகம் தொடர்ந்து ஏற்றுக் கொள்கிறது?
தமிழக அரசாங்கத்தை விட, தமிழறிஞர்களை விட, பழுத்த தமிழ் மன்றங்களை விட, பல்வேறு தமிழக அரசின் தமிழ்த் துறைகளை விட சில தனியர்கள் எல்லாவற்றையும் அறிந்தவர்களா? அவர்களால் பல கோடி மக்களின் எழுத்துகளின் தலைஎழுத்து தீர்மானிக்கப் படுமா?
தொடர்ந்து வரும் இச்சரவலுக்குத் தீர்வென்ன? எத்தனை நாள் மாரடிக்கப் போகிறோம் இவற்றோடு?
நண்பர்களே, இது இன்றைய, இந்நேரத் தமிழழிப்பாகும். விழித்துக் கொள்ளுங்கள் – அறிவுக் கூர்மையுடன் செயல்படுங்கள் – இல்லாவிட்டால் அழிந்தே போங்கள்! என்று மட்டுமே விவரம் அறிந்தவர்கள் சொல்கிறார்கள்.
அன்புடன்
நாக.இளங்கோவன்
எழுத்து மாற்றம் தமிழுக்கும், தமிழர்களுக்கும் கேடு விளைவிக்கும் என்பதை எடுத்துக்கூற உலகம் தழுவிய தமிழர்களின் ஒருங்கிணைந்த முயற்சியால் கடந்த 2010 ஆம் ஆண்டு கோவை செம்மொழி மாநாட்டு அரங்கில் தமிழ் எழுத்துப் பாதுகாப்பியக்கம் என்ற அமைப்பு கீழ்க்கண்டவர்களால் தொடங்கப்பட்டது.
ஆதரவான அமைப்பு
எங்களைத் தொடர்பு கொள்ள
மின்னஞ்சல் முகவரி: epithamizh@gmail.com
எழுத்தாக்கம்: நாக.இளங்கோவன்
இன்றைக்கு இருக்கின்ற 247 தமிழ் எழுத்துக்களில் 239 எழுத்துக்களை மாற்றுவதற்கு நடக்கும்பல்வேறு முயற்சிகளின் தொகுப்பு இக்கட்டுரை(தொடர்).
தமிழ் எழுத்து வடிவங்களை எப்படியாவது மாற்றி உருக்குலைத்து விடவேண்டும்
என்ற உறுதி தமிழர்களிடையே தென்படுகிறது. தமிழுக்குப் பகைதமிழரே என்ற
உண்மையை வெளிச்சமிட்டுக் காட்டுகிறது இந்தச் சீர்திருத்த முயற்சிகள்.
தமிழ்நாட்டில் எத்தனையோ குடிசைத் தொழில்கள்உண்டு. தீப்பெட்டிக்கு பெயர்
ஒட்டும் தொழில், தீக்குச்சிக்கு எரிமருந்து வைக்கும் தொழில்,பீடி சுற்றும்
தொழில், பேரீச்சம்பழத்தை எடை போட்டுபொட்டலம் போடும் தொழில் என்று பலவுண்டு.
தமிழ் எழுத்துச் சீர்திருத்தமும் இத்தொழில் போன்றுஉயிரெழுத்து மாற்றத்
தொழில், உயிர்மெய்கள் மாற்றத் தொழில், தமிழெழுத்து எண்ணிக்கை குறைப்புத்
தொழில் போன்று பல்வேறு கோணங்களில்தமிழ் கூறும் மக்களிடையே புற்றீசல் போலத்
தோன்றியிருக்கிறது.
இன்றைய காலக் கட்டத்தில், தமிழ் எழுத பேசத்தெரிந்தாலே எளிதில் தமிழ்
அறிஞராகி விடமுடிகின்ற சூழலும், எம்மெசு வேர்டு நிரலியில்தமிழை எழுதவும்
அட்டவணைகள் இடவும் தெரிந்துவிட்டால் அவர் கணிப்பேரறிஞராக ஆகிவிட முடிகின்ற
சூழலும் நிலவுவது இந்தஎழுத்துச் சீர்திருத்தத் தொழிலுக்கு மிகவும்உதவியாக
இருக்கிறது என்று சொன்னால்மிகையல்ல.
என்ன இவன்? – எவ்வளவு பாடுபட்டுத் தமிழை வளர்க்க முனைபவர்களின் செயலை
குடிசைத் தொழிலுக்கு ஒப்பிடுகிறானே என்றுஎண்ணத் தோன்றும். 247
எழுத்துக்களில் 239எழுத்துக்களை மாற்றத் துடிக்கின்ற பலரின்கோணங்களையும்
அவர்களின் ஆய்வுகளின்அளவுகளையும் படிக்கும்போது குடிசைத் தொழில்களுக்குத்
தேவையான அடிப்படைச்சிந்தனைகளைக் கூட எந்த ஒரு சீர்திருத்தத்தாளும்
கொண்டிருக்கவில்லை என்பதுவும்வெற்று அட்டவணைகளால் நிரப்பப்பட்டஇந்தத்
தாள்களைச் செய்வதற்கும்பீடி சுற்றுவதற்கும் பேரீச்சம்பழம்
பொட்டலம்கட்டுவதற்கும் செய்யும் வேலைக்கும்எந்த வேறுபாடும் கிடையாது
என்பதைபுரிந்து கொள்ள முடியும்.
(அதே வேளையில் எந்த ஒரு குடிசைத் தொழிலையும் நான் இளக்காரம் செய்யவில்லைஎன்பதனை வாசகர்களுக்குத் தெரிவித்துக்கொள்கிறேன்.)
இதில் கொடுமை என்னெவென்றால் இவர்களின் ஆராய்ச்சியற்ற எழுத்து வடிவ
மாற்றங்களுக்குத் தந்தை பெரியார் பெயரை, விளம்பரத்திற்குப் பயன்படுத்துமாப்
போல, பயன்படுத்துவதாகும்.
பெரியார் நேயர்களையும் சிந்தனையாளர்களையும் பெரியார் பெயரைச் சொல்லி
திசைதிருப்புவதே இவர்களின் நோக்கமாக இருக்கின்றது. இதுபற்றி விரிவாகப்
பின்னர் காண்போம்.
தமிழ் எழுத்து வடிவத்தை ஏன் மாற்ற வேண்டும், அதற்கென்ன தேவை என்பதை வடிவமாற்றவிரும்பிகள் ஒருவர் கூட நிறைவான ஆராய்ச்சி செய்ததில்லை.
கற்பனைகளையும் கதைகளையும் சொல்கிறார்களே தவிர இன்னது தேவை இன்னது சரவல்
இன்னது விளைவு இன்னது பயன் என்று அறிவுசார் ஆராய்ச்சிகள் கொண்டாரில்லை.
இன்றைய நிலையில் தமிழ் உலகில் உலவுகின்ற பல்வேறு வடிவ மாற்ற முனைவுகளின் தொகுப்பினைஇக்கட்டுரை (தொடர்) கொண்டுள்ளது.
இகர வரிசையில் செய்ய வேண்டிய வடிவ மாற்றத்தை எடுத்துரைக்கிறார்
வா.செ.குழந்தைசாமி. மேலே படத்தில் இருப்பது போல வடிவ மாற்றம் செய்தால்
குழந்தைகள் எளிதாகக் கல்வி கற்பர் என்கிறார். ஈகார வரிசைக்கும் இதே
முறையில் வேறு ஒரு குறியை போட்டுவிடுகிறார் வா.செ.கு. கீழே காண்க.
என்ன இது? கி, கீ, நி, நீ எழுத்துக்களில் இருக்கும் துணைக் குறிகளை
அப்படியே நகர்த்தி ஒரு மில்லி மீட்டர் தள்ளிப்போட்டுவிடுவது
சீர்திருத்தமாகுமா? இதுதான் சீர்திருத்தம் என்றால் எவ்வளவோ
செய்யலாமே,செய்து பெரியார் ஆகிவிடலாமே என்ற அவாவில் இன்றைக்குப் பலரும்
இதனைத் தொழிலாகக் கொண்டிருக்கிறார்கள் என்று சொன்னால் வியப்பு ஏற்படுவது
தவிர்க்க ஏலாதது.
உகர
வரிசையில் உள்ள எழுத்துக்களை இப்படி உடைத்து இரண்டு குறிகளாக்கிப்
போட்டால் ஆசிரியர்களுக்குப் பாடம் கற்பிக்க ஏதுவாக இருக்கும் என்று
சொல்கிறார் வா.செ.கு.ஊகார வரிசையில் உள்ள எழுத்துக்களுக்கும் அதே போல
வேறு ஒரு துணைக்குறியீட்டைப் போட்டு எழுதினால் காலத்திற்குத் தக்க மாற்றம்
செய்த பெருமை நம்மிடம் இருக்கும். இல்லாவிடில் தமிழே இல்லாமல் போய்விடும்
என்று சொல்கிறார் வா.செ.கு.
(வா.செ.கு போன்று பலர் செய்ய முனையும் மாற்றங்கள், சிதைவுகளை வரும் கட்டுரைகளில் தொடரும்)
அன்புடன்
நாக.இளங்கோவன்
தமிழ் உலகில் குறிப்பாகக் கடந்த 3 மாதங்களாக நிலவுகின்ற, “தமிழ்-ஒருங்குறியில் கிரந்தக் கலப்பு” பற்றிய விதயங்களை, பல் துறை சார்ந்தோர்க்கும் அறியத்தரும் வண்ணம் இந்த ஆவணத்தை அமைக்க முயன்றிருக்கிறேன். இது அடிக்கடி ஊடாடும் வினாக்கள் (FAQ) முறையையும் கட்டுரை விளக்க முறையையும் உள்ளடக்கியதாக அமைகிறது. ஒருங்குறி அடிப்படைகள், அதன் கட்டமைப்பு, கிரந்த நுழைப்பு முன்மொழிவுகள், கடந்த 3 மாதங்களில் நிகழ்ந்தவை பற்றிய குறிப்புகள், தற்போது நிலவுகின்ற குழப்பங்கள் ஆகியவற்றை விளக்குவதாகவும், தமிழ்ப் பற்றாளரும் தமிழக அரசும் மேற்கொள்ள வேண்டிய பணிகளைப் பற்றிய பார்வை காட்டுவதாகவும் இது அமைகிறது.
*தொகுதி-1: ஒருங்குறி – அறிமுகம்*
*1) யுனிக்கோடு என்றால் என்ன?*
கணியிற் பல்வேறு மொழி எழுத்துக்களை இப்பொழுது எழுதவும், படிக்கவும் முடிகிறது. ஆனால் ஒருகாலத்தில்
உலகம் முழுவதிலும், ஆங்கிலத்தைத் தவிர, பலமொழிகளின் எழுத்துக்களை
எழுதுவதிலும், படிப்பதிலும் சிக்கல்கள் இருந்தன. தவிர ஒவ்வொரு
மொழியெழுத்துக்குள்ளும் பல்வேறு எழுத்துத் தரப்பாடுகள் இருந்தன. தமிழிலும்
ஒருகாலத்தில் கணியில் எழுதப் படிக்கப் பல்வேறு எழுத்துத் தரப்பாடுகள்
புழங்கிக் கொண்டிருந்தன.
ஒவ்வொருவரும் தங்களுக்குப் பிடித்த எழுத்துத் தரப்பாட்டில் தமது இணையத் தளங்களையும், செய்தி ஏடுகள், மாத வார இதழ்களையும் வெளியிட்டனர்.
ஒவ்வொரு இதழையும் இனையத்தளத்தையும் படிக்க வேண்டுமானால் ஒவ்வொன்றுக்கும் உரிய எழுத்துத் தரப்பாட்டையும் எழுத்துருவையும் கணியில் இருத்த வேண்டிய கட்டாயம் இருந்தது.
இல்லாவிட்டால் அவற்றைப் படிக்கவோ, அச்சிடவோ, பறிமாறிக்கொள்ளவோ
முடியாதிருந்தது.அதனால் தமிழ்ப் படைப்புகள் கணியிலும் இணையத்திலும்
பல்லாயிரக் கணக்கில் இருந்தாலும் அவை தனித் தனித்
திடல்களாகக் கிடந்ததால் அவற்றைப் புழங்கும் பயனர்களுக்குப் பல்வேறு சிக்கல்கள் இருந்தன. அவை மொழி வளர்ச்சிக்குத் தடையாகவும் இருந்தன.
இதே நிலைதான் உலகில் இருக்கும் பல்வேறு மொழிபேசும் மக்களுக்கும் இருந்தன.
ஆகவே, உலகில் உள்ள எல்லா மக்களும் கணியில் எளிதில் புழங்க, உலகின் எல்லா
எழுத்து முறைகளையும் (Writing Systems) உள்ளடக்கி ஒரு எழுத்துத் தரப்பாடு
(Character Encoding Standard) உருவாக்கப் பட்டது.
அதற்குப் பெயர் தான் ஒருங்குறி என்கின்ற யுனிக்கோடு (Unicode) எழுத்துமுறையாகும்.
தமிழி எழுத்துமுறையை உள்ளடக்கிய ஒருங்குறியின் உலகப் பயனை உணர்ந்த தமிழ்க் கணிஞர்களும் பயனர்களும் அந்தத் தரப்பாட்டுக்கு சிறிது சிறிதாக மாறினர். தமிழ்நாட்டரசும் 2010 சூன் மாதத்தில் நடந்த செம்மொழி மாநாட்டில் ஒருங்குறிக்கு ஏற்பளித்து அரசின் தரப்பாடாக அறிவித்தது.
யுனிக்கோடு அல்லது ஒருங்குறியில் எத்தனை எழுத்து முறைகள் உள்ளன?
இதுவரை, தமிழ் உள்ளிட்ட ஏறத்தாழ 93 எழுத்து முறைகள் ஒருங்குறித் தரப்பாட்டுக்குள் கொண்டு வரப்பட்டிருக்கின்றன.
அரபி எழுத்துமுறை, சீன முறை, ஈபுரு, இலத்தீனம், சிரில்லிக்கு, தமிழ்,
தேவநாகரி, மங்கோலியம், தெலுங்கு, வங்கம் போன்றவை இவற்றுள் சில
எடுத்துக்காட்டுகளாகும்.
*2) எழுத்துரு (Font) என்றால் என்ன?*
***
*கணித்திரையிலும் அச்சிலும் நாம் காணுகின்ற எழுத்துக்களுக்கு வடிவ
ஒழுங்கைத் தருவது எழுத்துருக் கோப்பு (Font Files) ஆகும். இதனைச்
சுருக்கமாக எழுத்துரு என்கிறோம். வடிவம், அடர்த்தி, பயன்பாடு ஆகியவற்றின்
அடிப்படையில் பல நிறுவனங்களும், தனியாரும் அவரவர் தேவைக்கேற்ப எழுத்துருக்
கோப்பை உருவாக்கிக் கொள்ளலாம். பரணர், இலதா, கண்ணகி போன்று பல நூறு
எழுத்துருக் கோப்புகளைத் தமிழில் உருவாக்கியிருக்கிறார்கள்.
*3) எழுத்துத் தரப்பாடும்(Encoding) எழுத்துருவும்(Font) வெவ்வேறா?*
ஆமாம்; இரண்டும் வெவ்வேறானவை. எழுத்துத் தரப்பாடு என்பது ஒவ்வொரு எழுத்துக் குறிக்கும் ஒரு குறியெண்ணைக் (Code Point) கொடுத்து அதனைக் கணியின் செயற்பாட்டிற்குள் பொருத்திய செந்தர வரைவாகும்(Standard Definition). இந்தக் குறி எண்கள் பதினறும எண்கள் ஆகும்.
எடுத்துக்காட்டு:
U+0B85 என்ற குறியெண் தமிழ்க்குறியான “அ” வைக் குறிக்கும்.
U+0BBE என்ற குறியெண் தமிழ்க்குறியான கால் “ா” ஐக் குறிக்கும்.
U+0BB5 என்ற குறியெண் தமிழ்க்குறியான “வ” வைக்குறிக்கும்.
U+0041 என்ற குறியெண் ஆங்கிலக்குறியான “A” யைக் குறிக்கும்.
“வா” என்ற எழுத்தைத் திரையில் காட்ட வேண்டுமானால் U+0BB5 என்ற குறியெண்ணுடைய “வ” குறியையும், U+0BBE என்ற குறியெண்ணுடைய “ா” என்ற காற் குறியையும் இணைத்துக் காட்டுவார்கள். கணிக்குள் இந்தப் பதினறும எண்கள் இரும எண்களாக மாற்றப்பட்டுச் செயல்படும்.
ஆகவே தமிழில் உள்ள பல அடிப்படைக் குறிகள், உயிர்மெய்க் குறிகள், தமிழ்
எண்கள் போன்றவற்றின் வடிவங்களை எண்ணுமைப் படுத்தும் தரமே
எழுத்துத்தரப்பாடாகும். தமிழ் அகரமெய்களும், உயிர்களும் அங்கு அ டிப்படைக்
குறிகளாக உள்ளன. அவை அப்படியே கணித்திரையிலோ, கணியச்சியிலோ, எழுத்தாக
வெளிவரும். பிற உயிர்மெய் எழுத்துக்கள் வெளிவர வேண்டுமானால் அடிப்படைக்
குறிகளையும் தக்க உயிர்மெய்க் குறிகளையும் அடுத்தடுத்து
ஒட்டுப்போட்டுத்தான் பெறமுடியும்.
இந்தச் செந்தரக் குறியீடுகளைப் பயன்படுத்தி நாம் விரும்பிய வடிவழகில்
எண்ணற்ற எழுத்துருக் கோப்புகளை ஏற்படுத்திக் கொள்ளலாம். ஒருங்குறித்
தரப்பாட்டை எல்லாக்கணிகளின் கட்டமைப்பும் சொவ்வறைகளும் (Softwares),
நிரலிகளும் (Programs), செயலிகளும்(Applications) உள்ளடக்கியிருக்கின்றன.
அத் தரப்படிச் செய்யப்படும் எழுத்துருக்கள் செந்தரத்தின் பயனை அளிக்கின்றன.
Posted on by இரா.சுகுமாரன்
“எழுத்துச் சீர்குலைப்பாளர்கள் தமிழக அரசியலாரிடம் தங்களுக்கு இருக்கும் அணுக்கத்தைப் பயன்படுத்தி உலகத் தமிழ்ச் செம்மொழி மாநாட்டின் முடிவில் எழுத்துச் சீர்குலைப்பிற்கு ஆதரவாக ஓர் அரசாணை கொண்டுவர முயல்கிறார்கள்” என்று 10, 11 மாதங்களுக்கு முன் அரசல் புரசலாகச் செய்தி வெளிப்பட்டது. இது தெரிந்தவுடனேயே ”இதை நடக்க விட்டுவிடக் கூடாது, பலரையும் ஒருங்கு சேர்த்து நம்மால் முடிந்தவரை, பரவலாய் எதிர் வாதங்களைத் தொடுக்க வேண்டும், அதே பொழுது எழுத்துக்காப்பு வாதங்கள் ‘அவர் சொன்னார், இவர் சொன்னார்’ என்று வெறும் மேற்கோள் காட்டுவதாய் மட்டுமே அமையக்கூடாது. மாறாக, யாராலும் அளக்கக் கூடிய எண்ணக (measurable and quantitative) முறையில், அடிப்படை ஏரணங்களோடு (with basic logic), அமையவேண்டும்” என்று எங்களிற் சிலர் எண்ணினோம். எண்ணக முறை வாதங்களை எழுப்பும் பொறுப்பைச் சொவ்வறையாளர் (software specialist) திரு. நாக. இளங்கோவன் ஏற்றுக் கொண்டார். ”இகர, ஈகார, உகர, ஊகார உயிர்மெய்களான 72 எழுத்துக்களை மாற்றுவதால் எத்தனை விழுக்காட்டுத் தமிழ்ச் சொற்கள் தம் உருவை மாற்றிக் கொள்ளும்?” என்று அளவிடும் வகையில் நிரல் எழுத முன்வந்து, அந்தப் பணியைச் சிறப்பாகவே செய்தார். அதன் விளைவாக எழுத்துக் குலைப்புச் செய்கையின் முழுப் பரிமானம் பலருக்கும் புரிந்தது. [நாக.இளங்கோவனின் அலசல் அண்மையில் நடந்த செம்மொழி மாநாட்டில் மொழியியற் புலத்தில் கட்டுரையாகப் படிக்கப் பட்டது.] அதை விளக்குமுன் இவ்விடத்தில் ஒன்றைச் சொல்லவேண்டும்.
நாம் பேசும் மொழியிற் பொருள் பொதிந்த அடிக்கூறு சொல்லெனும் அளவை தான். சொற்களைப் புரிவதிற் தடுமாறினால் ஒரு புலனம் பற்றிய பொருட்புரிதல் இல்லாது போகும். சொற்கள் புரிவதற்கு எழுத்துக்கள் வசப் படவேண்டும். வீச்செழுத்துக்களில் இருந்து அச்செழுத்துக்களுக்கு வந்து சேர்ந்த 400 ஆண்டுகளிற் தான் நம்முடைய எழுத்துக்கள் பெரிதும் நிலை பெற்றிருக்கின்றன. There is no more change of shapes. இந்த எழுத்துக்களை இப்போது வலிந்து திருத்துவது என்பது ”பரமபத” விளையாட்டில் பெரிய பாம்பு கடித்து இரண்டாம் கட்டத்திற்குத் திரும்பப் போவது போன்றதாகும். இப்படி எத்தனை முறை இரண்டாம் கட்டத்திற்குப் போவது? மீண்டும் தொடக்கக் கட்டத்தில் இருந்து பொத்தகங்களைத் திரும்ப அச்சடித்து எல்லா வேலைகளையும் திரும்பச் செய்து நம்மைப் பின் தள்ளுவதற்கே இது போன்ற சீர்குலைப்பு வேலைகள் பயன்படும். தமிழிற் செய்வதற்கு எத்தனையோ வேலைகள் உள்ளன. அவற்றைச் செய்யாமல், எழுத்துத் திருத்தம் செய்ய முற்படுவது, வெட்டிவேலையேயாகும். எது உடையவில்லையோ, அதை உடைத்து ஒட்டாதீர்கள் என்று ஆங்கிலத்தில் ஒரு சொலவடை உண்டு. குழப்பமில்லாத எழுத்தை உடைத்து ஒட்டவைக்க முயல்வதும் அப்படி ஒரு நிலை தான். நம் உடம்பிற்குக் காய்ச்சல் இல்லாத போது காய்ச்சல் மருந்து சாப்பிடுவோமோ?
”எழுத்துக்களைத் திருத்துவதால் ஓர் ஆவணத்தில் எத்தனை சொற்களின் தோற்றம் மாறும்?” என்று கணக்கிடுவது ”எத்தனை இடங்களில் பொருளைப் புரிந்து கொள்ளத் தடுமாறுகிறோம், சோர்வடைகிறோம்” என்று கணித்துரைப்பதாகும். சொற்பொருள் புரிவதிற் தடுமாறவைக்கும் ஆவணங்களால் நாம் சலிப்படைந்து அவற்றைப் படிக்காமலே போய்விடுவோம். ஒரு பழைய ஆவணத்தைச் சீர்குலைப்பு எழுத்தில் வெளியிட்டுப் படிக்கவைத்தால் எத்தனை இடங்களில் நாம் படிக்க இடர்ப்படுகிறோமோ, அத்தனை முறை “இந்த ஆவணத்தை ஏன் படித்துத் தொலைக்கவேண்டும்?” என்ற எரிச்சல் நம்முள் மேலெழுந்து, அதன் விளைவாய் ஆவணத்தைக் கீழே போட்டு வேறு வேலை பார்க்கப் போய்விடுவோம். இது மாந்த இயல்பு. எல்லாம் நமக்குள் இருக்கும் பழக்கத் தோய்வே காரணம்.
இகர, ஈகார, உகர, ஊகார உயிர்மெய்களைத் திருத்துவதால் கிட்டத்தட்ட 80% தமிழ்ச்சொற்கள் தம் தோற்றத்தில் மாறுகின்றன என்று திரு. நாக. இளங்கோவன் தம் ஆய்வின் முடிவிற் கண்டறிந்தார். [அதாவது தமிழ்ச்சொற்களில் 80% சொற்கள் இகர, ஈகார, உகர, ஊகார உயிர்மெய்கள் பயிலாது எழுவதில்லை.] அதைப் பற்றிய விளக்கத்தை அவர் கட்டுரையிற் காணலாம். அதற்கு முன்னால் இயல்பான தமிழெழுத்துப் பரம்பல் (natural distribution of Tamil letters) பற்றிய செய்திகளை இங்கு பார்ப்போம். மேலே சொல்வது போல் சொல்லைக் கணக்கிற் கொள்ளாமல் வெறுமே எழுத்துப் பரம்பலை மட்டும் பார்ப்பது இன்னொருவகை அலசலாகும் அதை எனக்குத் தெரிந்து கி.பி.2000-த்தில் கல்பாக்கம் சு. சீனிவாசனும், அவருக்கு முன் 1990 களின் பிற்பாதியில் தகுதரக் (TSCII) குறியீட்டினரும் பார்த்திருந்தார்கள். எழுத்துக்கள் அடங்கிய சொற்களாகப் பார்ப்பது (நாக. இளங்கோவன் கொடுத்த புள்ளிவிவரம்) இதனின்று வேறுபட்டது. இரண்டு வகை அலசல்களுக்கும் தமிழிற் தேவைகள் உண்டு. ஒன்று இன்னொன்றிற்கு ஒளிகூட்டும். இந்தக் கட்டுரையில் எழுத்துப் பரம்பலின் வெவ்வேறு பரிமானங்கள் குறித்துப் பார்க்கப் போகிறோம்.
கல்பாக்கம் சு.சீனிவாசன் தமிழிணையம் 2000-த்தில், வேறொரு புலனத்தில், “அஸ்கி மற்றும் யுனிக்கோடு தமிழ்க் குறிமுறைகளின் சார்பு செயல்திறன் மதிப்பீடு” என்ற கட்டுரையில் தமிழ் உரையில் புழங்கும் எழுத்துக்களின் பரம்பலைக் குறித்திருந்தார். அதன்படி
நேர்ச்சிப் பெருவெண் %
(frequency of occurance)
அனைத்து உயிரெழுத்துக்கள் 7.35
அனைத்து மெய்யெழுத்துக்கள் 29.45
அகர உயிர்மெய் எழுத்துக்கள் 21.13
இகர, ஈகார உயிர்மெய் எழுத்துக்கள் 11.47
உகர, ஊகார உயிர்மெய் எழுத்துக்கள் 12.93
ஆகார, எகர, ஏகார, ஐகார உயிர்மெய் எழுத்துக்கள் 14.97
ஒகர, ஓகார, ஔகார உயிர்மெய் எழுத்துக்கள் 2.69
என்று எழுத்துப் பரம்பல் அமையும். இந்தப் புள்ளிவிவரம் சொற்களைக் கருதாமல் வெறுமே எழுத்துக்களை மட்டுமே பார்ப்பதாகும். இந்த விவரத்தில் ஆகாரம் பற்றிய புள்ளிவிவரத்தை அகரத்தோடும், ஐகார, ஔகார பற்றிய புள்ளிவிவரங்களைத் தனித்தும் கொடுத்திருந்தால் அவதானிப்பதற்கு நன்றாக இருந்திருக்கும். ஆனால் திரு. சீனிவாசன் அப்படித் தரவில்லை. இணையத்தில் இருந்து கிட்டத்தட்ட 4 இலக்கம் எழுத்துக்கள் அடங்கிய பல்வேறு ஆவணங்களை தம் ஆய்விற்கெனக் கீழிறக்கி அவற்றை வகைபிரித்து எண்ணிப் பார்த்துக் கணக்குப் போட்டு இந்தப் புள்ளிவிவரத்தை உருவாக்கியிருந்தார். இந்த விவரத்தின் சிறப்பு இற்றைத் தமிழின் எந்த ஆவணத்திலும் நிரவலாய்க் (average) கிடைக்கக் கூடிய தமிழெழுத்துப் பரம்பலைத் தெரிவிப்பதாகும்.
இதே போன்றதொரு புள்ளி விவரத்தை தகுதரக் குறியீட்டை (TSCII) உருவாக்கும் போது முனைவர் கல்யாண சுந்தரமும் ஓர் ஆவணத்தின் வழி வெளியிட்டிருந்தார். (முத்து நெடுமாறனும், மணிவண்ணனும் அந்த ஆவணத்திற் பங்களித்தார்கள் என்றே எண்ணுகிறேன். சரியாக நினைவில்லை.) பத்துப் பதினைந்து ஆண்டுகளிற் பழகிய என் பல்வேறு கணிகளில் ஏதோவொன்றில் அந்த ஆவணத்தின் படி (copy) சிக்கி, என்னால் மேலும் படியெடுத்துத்தர இயலாதிருக்கிறது. அந்த ஆவணம் வரலாற்றுக் காரணமாய்க் காக்கப் படவேண்டிய ஒன்று. உத்தமம் ஆவணக் காப்பகத்தில் திரு. கல்யாணசுந்தரம் அதைச் சேமித்து வைக்கலாம். அவர் அதை மீண்டும் வெளியிட்டால் நல்லது. நானறிந்து தமிழெழுத்துப் பரம்பலை அறிவியல் வழியில் முதன்முதலாய் அளந்து சொல்லிய ஆவணம் அதுவேயாகும். திரு. கல்யாணசுந்தரம் அளித்த புள்ளிவிவரத்திற்கும் சீனிவாசன் அளித்த புள்ளிவிவரத்திற்கும் பெரிதாய் வேறுபாடு கிடையாது. வேண்டுமானால், ஒருசில பதின்மப் புள்ளிகள் வேறுபட்டிருக்கலாம்.
இந்தப் பரம்பலில் இருந்து பெறப்படும் ஒரு சில முடிவுகள் நமக்குச் சற்று அதிர்ச்சியையும், வியப்பையும் கொடுக்கக் கூடியவை.
தமிழெழுத்து என்பது அரிச்சுவடி என்னும் எழுத்தசை வகையைச் சேர்ந்தது (alpha-syllabary, அதாவது எழுத்துக்களும் அசைகளும் சேர்ந்தது தமிழெழுத்தாகும்) என்று நாமெல்லோரும் அறிவோம். அரிச்சுவடியை அபுகிடா (abugida) வகை என்று ஒரு சில மேல்நாட்டார் அரைகுறைப் புரிதலிற் சொல்லுவார்கள். அது தவறு. ”அரிச்சுவடியும் அபுகிடாவும் முற்றிலும் வெவ்வேறானவை, அதே போல அரிச்சுவடியும் அல்வபெட் (alphabet) என்னும் அகரவரிசையும் வெவ்வேறானவை, இன்னுஞ் சொன்னால் அரிச்சுவடியும் மெய்யெழுத்து, அதைஉயிர்மெய்யாக்கத் துணைக்குறியீடு என்றியங்கும் அபுசட் (abujad) என்பதும் கூட வெவ்வேறானவை” என்ற கருத்தை அண்மையிற் செம்மொழி மாநாட்டில் பேரா. செல்வக் குமார் மிகத் தெளிவாகத் தெரிவித்திருந்தார்.
அரிச்சுவடி என்ற கலைச்சொல்லை அகரம் என்ற தமிழ்ச்சொல்லின் திரிவான அக்கரம்>அக்ஷரம் என்ற வடநாட்டுக் கலைச்சொல்லால் திரு. மணிவண்ணன் TACE 16 RFC document இல் கையாளுவார். அரிச்சுவடி என்ற தமிழ்க் கலைச்சொல்லும் அக்க்ஷரம் என்ற வடநாட்டுக் கலைச்சொல்லும் ஒன்றிற்கொன்று அப்படியே இணையானவை. மேல்நாட்டுக்காரர் புரிந்து கொள்ளுதற்காக அக்க்ஷரம் என்ற வடநாட்டுக் கலைச்சொல்லைப் பயன்படுத்துவதில் எனக்கொன்றும் மாறுபாடு இல்லை. தமிழில் அரிச்சுவடி என்ற கலைச்சொல்லையே நாம் பயன்படுத்துவோம் [அந்தக் காலத்தில் 50, 60 ஆண்டுகளுக்கு முன்னாற் கூட, நாட்டுப் புறங்களில் திண்ணப் பள்ளிக் கூடத்தில் அரிசிப் பரப்பில் எழுதித்தான் தமிழ்ப்பிள்ளைகளின் எழுத்துப் பயிற்சி (அக்க்ஷர அப்பியாசம்) தொடங்கும். அரி(சி)யில் எழுதத் தொடங்கும் எழுத்துவகை என்பதால் அரிச்சுவடி என்ற பெயர் ஏற்பட்டது.]
அரிச்சுவடி என்பது அடிப்படை எழுத்துக்களையும், அவற்றின் பெருக்கெழுத்துக்களையும் (product characters) உறுப்பாய்க் கொண்டது. அதாவது எழுத்தசை என்பதை ஒரு கொத்து (set) என்றால் உயிரெழுத்து என்பது அதனுள் ஓர் உட்கொத்து (subset). (அதன் எண்ணிக்கை 12) மெய்யெழுத்து என்பது இன்னோர் உட்கொத்து.(அதன் எண்ணிக்கை 18. இதனுள் ஜ்,ஷ்,ஸ்,ஹ் என்ற நாலு கிரந்த எழுத்துச் சேர்த்தால் எண்ணிக்கை 22 ஆகும். அண்மையில் 3,4 ஆண்டுகளுக்குள் முன் ஒருங்குறிக்குள் சேர்த்த இன்னொரு z ஒலிச் சகரம் ஒரு முட்டாட்தனமான கூத்து. தமிழ்ப் பள்ளிக்கூடங்களில் யாருக்குஞ் சொல்லிக் கொடுக்காத, ஒரு சில விதப்பான, விரல்விட்டு எண்ணக் கூடிய, பயனாளர் மட்டுமே பயனாக்கும் எழுத்து அதுவாகும். இதுபோல அதிநுணுக்கச் சிறுபான்மையாளர் பயன்படுத்தும் எழுத்துக்களை எல்லாம் தமிழ் அரிச்சுவடியில் சேர்க்கத் தொடங்கினால், அப்புறம் தமிழெழுத்து என்பது எல்லையில்லாது போய்விடும். One has to put a full stop to these kinds of unwanted additions. க்ஷ் என்பது மெய்க்கூட்டு. மெய்க்கூட்டைத் தவிர்க்கும் தமிழில் அதைக் கணக்கில் சேர்த்ததும் தவறுதான். ஸ்ரீ என்பது ஒற்றைக் கூட்டெழுத்து.)
உயிர், மெய் ஆகிய இரண்டின் பெருக்கமாய் 12*18 = 216 எழுத்துக்களாய் (அல்லது கிரந்தம் சேர்த்தால் 12*22 = 264 எழுத்துக்களாய்) அமையும் உயிர்மெய்கள் இன்னோர் உட்கொத்து. இவை போக நாலாவது உட்கொத்து தொல்காப்பியரின் படி குற்றியலுகரம், குற்றியலிகரம், ஆய்தம் ஆகிய மூன்று உறுப்பினர் அடங்கியதாகும். ஆனால் இற்றைத் தமிழில் இது ஒரே உறுப்பினர் அடங்கிய உட்கொத்தாய் ஆகிவிட்டது. எல்லா உட்கொத்து உறுப்புகளையும் கூட்டிப் பார்த்தால், தமிழெழுத்து வரிசை மொத்தம் 247 எழுத்துக்கள் (கிரந்தம் சேர்த்தால் 12+22+12*22+1 = 300 எழுத்துக்கள்) கொண்டதாகும். இவற்றின் அடிப்படையில் எந்த ஆவணத்திலும், இயல்பாக ஏதேனும் ஓர்
உயிர்எழுத்துத் தோன்றுதற்கான பெருதகை (probability) = 12/247 = 0.048583 (கிரந்தம் சேர்த்தால் 0.04.)
இதே போல பெய்யெழுத்துப் பெருதகை = 18/247 = 0.0728745 (0.06)
அகர, ஆகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
இகர, ஈகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
உகர, ஊகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
எகர, ஏகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
ஐகார உயிர்மெய்ப் பெர்தகை = 18/247 = 0.0728745 (0.06)
ஒகர, ஓகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
ஔகார உயிர்மெய்ப் பெருதகை = 18/247 = 0.0728745 (0.06)
இந்தப் பெருதகைகளைக் கணக்கிடும் போது ஓரெழுத்தின் நேர்ச்சி (occurrence) இன்னோர் எழுத்தின் நேர்ச்சியைப் பாதிக்காது என்றும் இரண்டும் ஒன்றிற்கொன்று பந்துறாதவை (independant; பந்தம் = dependency) என்றும் நாம் கருதிக் கொள்ளுகிறோம் (hypothesize). ஆழ்ந்து ஓர்ந்து பார்த்தால் அத்தகைய கருத்து தமிழைப் பொறுத்தவரை உண்மையில்லை தான். எழுத்துக்களின் நேர்ச்சி பல சொற்களில் ஒன்றையொன்று சார்ந்திருப்பதைப் பலவிடத்தும் உணரமுடியும். காட்டாக, பங்து என்ற சொல் தமிழில் அமையவே அமையாது. அது பந்து என்று இருக்கலாம், அல்லது பங்கு என்று இருக்கலாம். ’ங்’ஙும், ’து’வும் எங்கும் சேரமுடியாத எழுத்துக்கள். இது போன்ற கட்டியப் பெருதகைகளைக் (conditional probablities) கணக்கிடுவது இன்றைய நிலையிற் கடினம் என்பதால், முடிவு சாய்வாக இருக்கலாம் எனினும் எழுத்துக்களின் நேர்ச்சி ஒன்றிற்கொன்று பந்துறாதவை என்றே இவ்வாய்வில் கருதிக் கொள்கிறோம்.
இனி தேற்றப் பெருதகையையும் (theoretical probability) மேலே சீனிவாசன் 4 இலக்கம் தமிழெழுத்துக்கள் கொண்ட ஆவணங்களை இறக்கிக் கணக்கெடுத்த இயல் நேர்ச்சியையும் ஒப்பிட்டுப் பார்த்தால், ஒரு புதிய செய்தி விளங்கும். இற்றைத் தமிழில் உயிரெழுத்துக்களும், மெய்யெழுத்துக்களும், அகர, ஆகார உயிர்மெய்களும் (ஆகார உயிர்மெய் நேர்ச்சியைச் சீனிவாசன் எகர, ஏகாரத்தோடு சேர்த்து விட்டார், எனவே குத்து மதிப்பாக 7 அல்லது 8 விழுக்காட்டை நாம் அகர உயிர்மெய் நேர்ச்சியோடு சேர்க்கலாம். அதற்குக் காரணம் இருக்கிறது கீழே பார்ப்போம்.) எதிர்பார்க்கப்படும் பெருதகையைக் (expected probability) காட்டிலும் இருமடங்கு அதிகமாக நேர்ச்சியுறுகின்றன. அதே பொழுது இகர, ஈகாரங்களும் உகர, ஊகாரங்களும் கிட்டத்தட்ட நிரவலாக எதிர்பார்த்த பெருதகையையொட்டியே நேர்ச்சி கொள்ளுகின்றன. எகர, ஏகார, ஐகார, ஒகர, ஓகார, ஔகாரங்களும் எதிர்பார்க்கப் பட்ட பெருதகைக்கும் மிகக் குறைவாகவே நேர்ச்சி கொள்ளுகின்றன. [உயிரெழுத்து அதிகம் நேர்ச்சி கொள்ளுவது இந்தக் காலப் பழக்கமாய் இருக்கலாம். பெரும்பாலும் புணர்ச்சி பிரித்து எழுதும் காரணத்தால் உயிரெழுத்துக்கள் இயல் பெருதகையைக் காட்டிலும் அதிகமாகத் தோற்றங் கொள்ளலாம்.]
விவரித்துச் சொன்னால், தமிழ் அரிச்சுவடியில் 247 அசையெழுத்துக்கள் இருந்தாலும் நாம் 12+18+36 = 66 எழுத்துக்களையே அதிகமாகப் பயன்படுத்துகிறோம். இது ஒரு வியப்பான அவதானிப்பு. கிட்டத்தட்ட மூன்றில் இரண்டு பங்கு எந்தத் தமிழாவணத்திலும் இந்த 66 எழுத்துக்களே பயன்கொள்ளுகின்றன. Even though Tamil Script is alphasyllabary, it uses its alphabets and the akara, aakaara syllables more for articulation compared to other syllables. This is remarkable and perhaps characterizes Tamil language. தமிழின் இயல்பு இதுதான் போலும். இந்த இயல்பை காலந்தோறும் எழுந்த ஆவணங்களின் வழி ஆய்வு செய்வது பல்வேறு ஆய்வு முடிவுகளை நமக்கு உணர்த்தலாம். அதற்காக மற்ற அசைகளைத் தூக்கியெறிந்து விடலாமா என்றால் இல்லையென்றே சொல்லவேண்டும். ஓர் தமிழிசை விருந்தில் ”ஆ, அ …….என்று ஆலத்தி (ஆலாபனை) மட்டும் சொல்லிப் போக முடியாதே? நம்மையறியாமல் மூச்சை நிறுத்தி (மூச்சு நிறுத்தும் இடங்கள் எல்லாம் மெய் வந்தே தீரும்) பின் மாற்றும் போது மற்ற அசைகளைச் சொல்லும் கட்டாயத்திற்கு ஆளாகிறோம் அல்லவா?
மற்ற அசையெழுத்துக்கள் என்னவகையில் தமிழ் மொழியாளுகையில் பயன்படுகின்றன என்று ஆய்ந்து சொல்லவேண்டும். அதற்குப் பல்வேறு காலகட்டங்களில் உருவாகிய இலக்கியங்களின், ஆவணங்களின் பல்வேறு கைச்சாத்துக்களை (signatures) அடையாளங் காணுவது நலம் பயக்கும்.
அன்புடன்,
இராம.கி.