வெள்ளி, 15 நவம்பர், 2013

ஆங்கில எழுத்துருவில் தமிழை எழுதினால் என்ன? : பேரா. தெய்வசுந்தரம் பதில்

Posted on

(ஆங்கில எழுத்துருவில் தமிழை எழுதினால் என்ன? – ஜெயமோகன், எழுத்தாளர் அவர்களின் இந்து செய்திஏட்டுக்  கட்டுரைக்கு பதிலாக)

ஒரு மொழியின் எழுத்துகள் – வரிவடிவம் – என்பது  அம்மொழியில் பயன்படும் அனைத்து பேச்சு ஒலிகளுக்குமான (phones)  குறியீடுகள் இல்லை.

பொருள் வேறுபாட்டை ( meaning differentiation)  உணர்த்தவே பேச்சொலிகள் பயன்படுத்தப்படுகின்றன. பேச்சொலிகள் தாமாகவே பொருளை வெளிப்படுத்துவதில்லை. வேறுபடுத்துவதில்லை.  அவை ஒரு குறிப்பிட்ட கட்டமைப்பில் (structured) அமைந்து – ஒலியன்களாக ( Phoneme) , அசைகளாக (Syllable)  – அமைந்துதான் பொருளை வெளிப்படுத்துகிறது. வெளிப்படுத்தமுடியும்.
அக்குறிப்பிட்ட கட்டமைப்பை வெளிப்படுத்துவதுதான் எழுத்துகள் ( Grapheme) . அக்கட்டமைப்புக்குத்தான் எழுத்துகள்  அமைகின்றன. எடுத்துக்காட்டாகத் தமிழில் கடல், தங்கம், பகல் என்ற மூன்று சொற்களை எடுத்துக்கொள்ளுங்கள். இதில் முதல் சொல்லில் உள்ள க் , இரண்டாவது சொல்லில் உள்ள க், மூன்றாவது சொல்லில் உள்ள க் ஆகிய மூன்றும் வெவ்வேறு பேச்சொலிகள். இவை மூன்றும் ஒரே இடத்தில் வராது ( Complimentary distribution) . ஆனால் இம்மூன்றுக்கும் ஒரே எழுத்துதான். ஆனால் இந்தியில் இவற்றிற்கு வெவ்வேறு எழுத்துகள். இதற்குக்க காரணம் தமிழில் இந்த மூன்று பேச்சொலிகளும் ஒரே குடும்பத்தைச் சேர்ந்த  உறுப்பினர்கள் –  மாற்றொலிகள் ( Allophones) . ஒன்று வருமிடத்தில் மற்றொன்று வராது. வந்து பொருள் வேறுபாட்டைத் தராது. ஆனால் இந்தியில் இந்த மூன்றும் வெவ்வேறு குடும்பத்தைச் சேர்ந்தவர்கள். ஒரே இடத்தில் வந்து, பொருள் வேறுபாட்டைத் தரும். அதாவது தனித்தனி ஒலியன்கள் ( Phonemes) . எனவேதான் இந்தியில் அவற்றிற்குத் தனித்தனி எழுத்துகள். தமிழில் அவற்றிற்கு ஒரே எழுத்து.
தமிழில் ஒவ்வொரு ஒலியனுக்கும் – 12 உயிர், 18 மெய் – எழுத்துகள் அமைந்துள்ளன. அதற்கு அடுத்த கட்டமாக,  ஒலியன்கள் அசைகளாக அமைகின்றன. ஒரு சொல்லை உச்சரிக்கும்போது எத்தனை தடவை வாய் திறக்கப்பட்டு, காற்றுக்கொத்து ( air puff)  வெளிவருகிறதோ, அத்தனை அசைகள் அச்சொல்லில் உண்டு. காற்றுக்கொத்து வெளிவரும்போது உயிர் ஒலி  பிறக்கும். அதற்குத் துணையாக முன்னும் பின்னும் மெய் ஒலிகள் அமையலாம். மெய் ஒலியைத் தனியாகப் பிறப்பிக்கமுடியாது. ஆனால் உயிர் ஒலியைத் தனியாகப் பிறப்பிக்கமுடியும்.  அக்கா என்ற சொல்லில் வாய் இரண்டு தடவை ( அக்-கா) திறக்கிறது. எனவே இரண்டு அசைகள். முதல் அசையில்  அ ( உச்சி – peak)  – க் (ஒடுக்கம் – coda)   என்ற இரண்டும் அசையின் உறுப்புகள்.  இரண்டாவது அசையில் க் ( தொடக்கம் – onset) – ஆ (உச்சி)  என்ற இரண்டும் அசையின் உறுப்புகள். 
 
தமிழில்  அசையின் உச்சிகளுக்குத் ( உயிர்களுக்கு)தனி எழுத்துகள் . அசையின் ஒடுக்கத்திற்கு (மெய்களுக்கு) தனி எழுத்துகள். இதுபோக,  தொடக்கம் , உச்சி ஆகிய இரண்டையும் உள்ளடக்கிய தொகுதிகளுக்கும் ( உயிர்மெய்கள்) எழுத்துகள். உயிர்மெய் எழுத்துகளை அசை எழுத்துகள் ( syllabic scripts) என்று அழைக்கலாம். தனித்தோ அல்லது மெய்யோடு இணைந்தோ காற்றுக்கொத்து வெளியிடப்படும்போது , அதற்கென்று எழுத்துவடிவம் அமைந்துள்ளது மிகச் சிறப்பான ஒன்றாகும். அசையின் தொடக்கம், உச்சி, ஒடுக்கம் ஆகியவை தனித்தனி ஒலியன்களாகும். தொடக்கமும் உச்சியும் இணைந்தது அசையாகும். 
 
அசையானது ஒடுக்கம் இல்லாமலும் ( மெய் )  முடியலாம்.  ஒடுக்கத்தோடும் ( மெய்)  முடியலாம். 
எனவே தமிழின் எழுத்துவடிவங்கள் ஒலியன், அசை என்ற அமைப்புகளை – கட்டுக்கோப்புகளை-  வெளிப்படுத்தும் ஒரு குறியீடு. பொருளற்ற குறியீடு அல்ல.
 
மேலும் தமிழில் எழுத்துவடிவத்திற்கும் உச்சரிப்புக்கும்  மிக நெருங்கிய தொடர்பு உண்டு. எழுதுவதை மாற்றொலி விதிகளோடு அப்படியே வாசிக்கமுடியும். ஆங்கில எழுத்துமுறை வேறு.  எழுத்துகளுக்கும் உச்சரிப்புக்கும் நெருங்கிய தொடர்பு கிடையாது. சில வேளைகளில் தொடர்பே இருக்காது. அங்கு எழுதுவதை அப்படியே உச்சரிக்கமுடியாது. உச்சரிப்பைத் தனியே கற்றுக்கொள்ளவேண்டும். எனவேதான் டானியல் ஜோன்ஸ், கிம்சன் போன்றோர் ஆங்கிலத்திற்குத் தனியே உச்சரிப்பு அகராதி வெளியிட்டுள்ளார்கள். தமிழுக்கு மாற்றொலி விதிகளைக் கற்றுக்கொடுத்தால் போதும்.
இவ்வாறு தெளிவான அமைப்பு அடிப்படை தமிழுக்கு இருக்கும்போது, ரோமன் எழுத்தில் தமிழை எழுதவேண்டும் என்று சொல்வது   உடல் உறுப்புகளை வெறும் படமாகப் பார்ப்பது போலாகும்.  அவற்றை இயக்கும் உயிரை கவனத்தில் கொள்ளாத போக்காகும். இதயமோ, நுரையீரலோ , சிறுநீரகமோ வெறும் உறுப்புகள் அல்ல. உயிரை இயக்குவதற்காக – அதற்கேற்றவாறு – அமைந்துள்ள உறுப்புகளாகும்.
அதுபோன்றே  ஒரு மொழியின் எழுத்துகள். இந்த அடிப்படையை மனதில் கொள்ளாமல், ரோமன் எழுத்தில் தமிழை எழுதச் சொல்வதோ அல்லது தன் விருப்பத்திற்கு எழுத்துச்சீர்திருத்தம் என்ற பெயரில் கருத்துகளை முன்வைப்பதோ தவறு. கண்ணை வெட்டிக் காலில் வைக்கமுடியாது. காலை வெட்டித் தலையில் வைக்கமுடியாது. 
பேசுவதை அப்படியே எழுதுவது என்பது மொழியியல் ஆய்வுக்குத் தேவைப்படும். அதற்குப் பன்னாட்டு ஒலியியல் கழகம் ( International Phonetic Association)  உருவாக்கியுள்ள பேச்சொலி எழுத்துகள் ( IPA scripts)உள்ளன.  அதைப் பயன்படுத்தலாம்.
அன்புடன்
ந. தெய்வ சுந்தரம்

 

செவ்வாய், 11 ஜூன், 2013

இரண்டாம் தமிழ்-ஒருங்குறி அழிப்பு!

ஆக்கம்: நாக. இளங்கோவன்

தலைப்பில் “இரண்டாம்” என்ற சொல் வரும்போதே இதைப்போன்ற முதலாம் நிகழ்வு இருந்திருக்க வேண்டும் என்று யாவரும் எண்ணுவது சரியே. அது ஏறத்தாழ இரண்டாண்டுகள் பழைமையானது. முதலாம்  நிகழ்வைப் பற்றி விரிவாகப் பின்னர் காண்போம். தற்போதைய நிகழ்வைப் பதிவு செய்வதே நோக்கம்.

முதலாம் தமிழ்-ஒருங்குறி அழிப்பு முயற்சியில் 5 தமிழ் எழுத்துகளைக் கொண்டுபோய் கிரந்த-ஒருங்குறியிலும், முன்பின் பார்த்திராத 26 கிரந்த எழுத்துகளை தமிழ்-ஒருங்குறியிலும் கலந்து தமிழின் முகவரியை, அடையாளத்தைக் கணிப்பரப்பில் நீக்குவதற்காக தமிழ் அழிப்பாளர்கள் பெரும் போராட்டத்தை நடத்தினார்கள். அப்போது தமிழ்நாடு, தமிழ் கூறு நல்லுலகம் இவற்றொடு தமிழக அரசாங்கமும் திரண்டெழுந்து எதிர்த்ததால் தமிழ் அழிப்பாளர்கள் பின்வாங்கினார்கள்.

ஆயினும், விடாமுயற்சியாக, தற்போது, “ன, ழ” என்ற இரண்டு எழுத்துகளையாவது கிரந்த-ஒருங்குறியில் கொண்டுபோய்ச் சேர்த்து விட வேண்டும் என்று மீண்டும் போராட்டத்தில் இறங்கியிருக்கிறார்கள் தமிழ்-அழிப்பாளர்கள். முதலில் இவ் இரண்டைச் சேர்த்து விட்டால் பின்னர் ஒவ்வொன்றாக மீதி மூன்றையும் சேர்த்து விடலாம் என்பது அவர்களின் திட்டமாக இருக்கக் கூடும்.

முதலாம் தமிழ்-ஒருங்குறி அழிப்பில் (த.ஒ.அ) முன்களத்தில் இருந்து செயற்பட்ட அதே திரு.நா.கணேசன் அவர்களே இம்முறையும் முன்களத்தில் இருக்கிறார். ஆனால், ஒருங்குறிச் சேர்த்தியத்திற்கு அனுப்பியிருக்கும் முன்னீடு (proposal) ஒரு மேனாட்டவரிடம் இருந்து போகுமாறு ஏற்பாடாகியிருக்கிறது இம்முறை.

திரு.மைக்கேல் எவர்சன் என்ற மேனாட்டவர் இவ் இரு தமிழ்
எழுத்துகளையும் கிரந்த-ஒருங்குறியில் கலக்க வேண்டும் என்ற வேண்டுகோளை ஒருங்குறிச் சேர்த்தியத்திற்குக் கடந்த வருட இறுதியில் அனுப்பினார்.

அம் முன்னீட்டைப் பாராட்டி, ஆதரித்து, அக்கலப்பிற்குப் பரிந்துரையாக  திரு.நா.கணேசன் ஒரு மடலையும் சேர்த்தியத்திற்கு அனுப்பினார்.

முதலாம் த.ஒ.அ இற்கு ஆதரவு காட்டிய அறிஞர் பெருமக்கள் வரிசையில் இம்முறை திரு.மறவன்புலவு சச்சிதானந்தன் அவர்களும் சேர்ந்தது மிகப்பெரும் அதிர்ச்சியாகவே தமிழுலகிற்கும் தமிழ்க் கணியிலகிற்கும்\
ஆகிப் போனது. மறவன்புலவாரும் இந்த “ன,ழ” எழுத்துகளை கிரந்த-ஒருங்குறியில் சேர்க்க வேண்டும் என்று பரிந்துரைத்து ஒரு கடிதத்தை எழுதியிருக்கிறார் சேர்த்தியத்திற்கு. மிக வருந்தத் தக்க ஒன்றாகும்.

அதில் என்னதான் தேவை சொல்லப் பட்டிருக்கிறது என்று பார்க்கையில், நமக்கு வியப்பே மிகுகிறது. “தாய்லாந்து நாட்டில் உள்ள அரச வம்சத்தார் சிலருக்குத் தேவார திருவாசகத்தைக் கிரந்தத்தில் படிக்க ஆசையிருப்பதால்” தயவு செய்து கிரந்தத்தில் இவ் இரு எழுத்துகளையும் கலந்து விடுங்கள் என்று கேட்டுக் கொள்ளப் பட்டிருக்கிறது.

“எனது ஆங்கிலத்தில் “ழ” இல்லை. ஆனால் “ழ” வை வைத்துள்ள தமிழர்கள் தமிழைவிட ஆங்கிலத்தையே அதிகம் படிக்கிறார்கள். அதனால், ஆங்கில-ஒருங்குறியில் தமிழ்-ழ வைச் சேர்த்து விடுங்கள் என்று எந்த ஆங்கிலேயராவது சொல்வாரா?”

ஆனால் தமிழர் “அவர்களின் கிரந்தத்தில் இவ் எழுத்துகள் இல்லை – அதனால் எமது எழுத்துகளைக் கொண்டு போய் அங்கு சேருங்கள் – அங்கே இருக்கின்ற எழுத்துகளையெல்லாம் கொண்டு வந்து இங்கே வந்து சேருங்கள்” என்று சொல்கிறார்கள். தமது மொழியைச் சிதைக்கும் நுண்ணிய கூறுகளை தலைமேற் சுமந்து செய்கிறார்கள்.

முதலாம் த.ஒ.அவின் போது, திரு.நாகசாமி, திரு.செ.இராசு, திரு.இ.அண்ணாமலை ஆகிய அறிஞர்கள் திரு.கணேசனின் முன்னீட்டிற்குப் பின் ஆதரவு அளித்துச் சேர்த்தியத்திற்கு அனுப்பியிருந்தார்கள். திரு.கணேசன்
இம்முறை சேர்த்தியத்திற்கு எழுதிய கடிதத்தில் அவர்களை மறக்காமல் நினைவு கூர்ந்ததொடு திரு.சச்சிதானந்தன் அவர்களையும் பின் ஆதரவில் சேர்த்திருக்கிறார்.

இவர்களின் முன்னீடுகள், பரிந்துரைகளைப் பார்த்த தமிழுலகம் வருந்தத்தான் செய்தது. தமிழ் இணையக் கல்விக் கழகத்தின் இயக்குநர் முனைவர் நக்கீரன் அவர்கள் இம்முயற்சியை எதிர்த்து சேர்த்தியத்திற்குக் கடிதம் எழுதினார்.
அமெரிக்கத் தமிழறிஞர் சு.பழனியப்பன் மிக வலுவான ஆய்வுக் கட்டுரை எழுதி, இவ் எழுத்துகளைக் கலப்பதற்கு எதிர்ப்பு கூறி சேர்த்தியத்திற்கு அனுப்பினார். கோவை தொல்லியல் துறையைச் சேர்ந்த முனைவர் சாந்தலிங்கம் மறுப்பினையம் பொருத்தமற்ற முன்னீடு என்பதையும் கூறி கடிதம் எழுதினார். இது எவ்வளவு தேவையற்ற விதயம் என்றும், இதனால் நலமில்லை என்றும் கூறி திரு.இரமணசர்மா சேர்த்தியத்திற்கு விளக்கி எழுதினார். திரு.நூ.த.உலோகசுந்தரம் அவர்களும் தனது மறுப்பினை மிக வலுவாக சேர்த்தியத்தில் பதிவு செய்தார். இவர்களின் எதிர்ப்பினால், சனவரி-பிப்ரவரியில் கூடிய சேர்த்தியம் இது குறித்து எந்த முடிவும் எடுக்காமல் தள்ளி வைத்திருக்கிறது. மீண்டும் சேர்த்தியம் கூடும்போது (ஓரிரு மாதங்களில்) இது குறித்து முடிவெடுக்கக் கூடும்.

இது இரண்டாம் தமிழ்-ஒருங்குறி அழிப்பின் தற்போதைய நிலை.

முதலாம் நிகழ்வின் போது எழுந்த அதே கேள்விகள் இன்றும் அப்படியே இருக்கின்றன.

1) பன்னாட்டு நிறுவனங்களால் நடத்தப்படும் ஒருங்குறிச் சேர்த்தியத்திற்கு, உலகில் யார் வேண்டுமானாலும் தமிழ் எழுத்துகளை என்ன செய்ய வேண்டும் என்று எழுதி தமிழைக் குலைத்துவிட முடியும் என்ற நிலை இருக்கிறது.
அது தமிழர் என்ற பெயரில் இருக்கும் தனி மனிதரோ அல்லது ஓர் அமைப்போ
எதை வேண்டுமானாலும் மாற்றச் சொல்லி, திணிக்கச் சொல்லிக் கேட்கலாம்.
யாரும் மறுக்க வில்லை என்றால் சேர்த்தியமும் அதற்கு உடன்பட்டுப் போய்விடும். ஆர்வலர்கள் கொஞ்சம் தவறவிட்டாலும் தமிழ் தொடர்பான தவறான முன்னீடுகள் கணிமை, இணைய வரலாற்றில் நிரந்தரமாகச் சேர்ந்துவிடும். இந்த நிலையில், தமிழக அரசாங்கத்திற்குத் தெரியாமல் எந்த ஒரு தமிழ் சார்ந்த ஒருங்குறி முன்னீட்டையும் சேர்த்தியம் ஏற்கக் கூடாது என்று ஏன் நாம் இன்னும் நிலைப்பாடு எடுக்கவில்லை?

2) தமிழ் மக்களால் பயன்படுத்தப்படும் கணியில் யாரோ எங்கோ அமர்ந்து கொண்டு இதைத் தூக்கி அங்கே போடு, அதைத் தூக்கி இங்கே போடு என்று சொல்வதும் உடனே தமிழறிஞர்கள் அவர்களுக்கு மறுப்பு சொல்லியே காலம் கழிப்பதும் எத்தனை நாளைக்கு ஆகக்கூடும்?

தவறான முன்னீடுகளைச் செய்து தமது சொந்த நலத்திற்காக மட்டும் ஒரு தமிழர் தமிழ் மொழியின் நெடுங்கணக்கில் விளையாட முடியும் என்றால் இது எங்கே போய் முடியும்? இதற்கு முற்றுப் புள்ளியை யார் வைப்பது? எங்கு வைப்பது?

தமிழ் மொழியைச் சீரழிக்கும் போக்குக்கு உடன்போகிறவர்களை எப்படித் தமிழுலகம் தொடர்ந்து ஏற்றுக் கொள்கிறது?

தமிழக அரசாங்கத்தை விட, தமிழறிஞர்களை விட, பழுத்த தமிழ் மன்றங்களை விட, பல்வேறு தமிழக அரசின் தமிழ்த் துறைகளை விட சில தனியர்கள் எல்லாவற்றையும் அறிந்தவர்களா? அவர்களால் பல கோடி மக்களின் எழுத்துகளின் தலைஎழுத்து தீர்மானிக்கப் படுமா?

தொடர்ந்து வரும் இச்சரவலுக்குத் தீர்வென்ன? எத்தனை நாள் மாரடிக்கப் போகிறோம் இவற்றோடு?

நண்பர்களே, இது இன்றைய, இந்நேரத் தமிழழிப்பாகும். விழித்துக் கொள்ளுங்கள் – அறிவுக் கூர்மையுடன் செயல்படுங்கள் – இல்லாவிட்டால் அழிந்தே போங்கள்! என்று மட்டுமே விவரம் அறிந்தவர்கள் சொல்கிறார்கள்.

அன்புடன்
நாக.இளங்கோவன்

ஞாயிறு, 7 அக்டோபர், 2012

எங்களைப் பற்றி…

எழுத்து மாற்றம் தமிழுக்கும், தமிழர்களுக்கும் கேடு விளைவிக்கும்  என்பதை எடுத்துக்கூற  உலகம் தழுவிய தமிழர்களின் ஒருங்கிணைந்த முயற்சியால்  கடந்த 2010  ஆம் ஆண்டு கோவை செம்மொழி மாநாட்டு அரங்கில் தமிழ் எழுத்துப் பாதுகாப்பியக்கம் என்ற அமைப்பு கீழ்க்கண்டவர்களால் தொடங்கப்பட்டது.

 2013 சூன் மாதம்  முதல் தமிழ் எழுத்துப் பாதுகாப்பியக்கத்தின்  நிலைக்குழு  உறுப்பினர்கள்:
  1. முனைவர்.இராம.கி                                             (தமிழ்நாடு)
  2. பேராசிரியர். செ.இரா.செல்வக்குமார்                 (கனடா)
  3. திரு. மணி.மு.மணிவண்ணன்                            (தமிழ்நாடு)
  4. திரு.நாக. இளங்கோவன்                                      (சவுதி அரேபியா)
  5. திரு.இரா.சுகுமாரன்                                             (புதுச்சேரி)
  6. திரு. மணியம்                                                      (சிங்கப்பூர்)
  7. பேரா.பெஞ்சமின் லெபோ                                   (பிரான்சு)
  8. திரு.சுப.நற்குணன்                                              (மலேசியா)
  9. திரு.திருநாவுக்கரசு                                               (தமிழ்நாடு)
  10. திரு. ஆல்பர்ட்

ஆதரவான அமைப்பு

  1. புதுச்சேரி வலைப்பதிவர் சிறகம் (புதுச்சேரி)

எங்களைத் தொடர்பு கொள்ள

மின்னஞ்சல் முகவரி: epithamizh@gmail.com

வியாழன், 1 டிசம்பர், 2011

குடிசைத் தொழிலாகிப் போன தமிழ் எழுத்துச் சீர்திருத்தம்! – பகுதி-1

 எழுத்தாக்கம்:  நாக.இளங்கோவன்

இன்றைக்கு இருக்கின்ற 247 தமிழ் எழுத்துக்களில் 239 எழுத்துக்களை மாற்றுவதற்கு நடக்கும்பல்வேறு முயற்சிகளின் தொகுப்பு இக்கட்டுரை(தொடர்).

தமிழ் எழுத்து வடிவங்களை எப்படியாவது மாற்றி உருக்குலைத்து விடவேண்டும் என்ற உறுதி தமிழர்களிடையே தென்படுகிறது. தமிழுக்குப் பகைதமிழரே என்ற உண்மையை வெளிச்சமிட்டுக் காட்டுகிறது இந்தச் சீர்திருத்த முயற்சிகள்.
தமிழ்நாட்டில் எத்தனையோ குடிசைத் தொழில்கள்உண்டு. தீப்பெட்டிக்கு பெயர் ஒட்டும் தொழில், தீக்குச்சிக்கு எரிமருந்து வைக்கும் தொழில்,பீடி சுற்றும் தொழில், பேரீச்சம்பழத்தை எடை போட்டுபொட்டலம் போடும் தொழில் என்று பலவுண்டு.
தமிழ் எழுத்துச் சீர்திருத்தமும் இத்தொழில் போன்றுஉயிரெழுத்து மாற்றத் தொழில், உயிர்மெய்கள் மாற்றத் தொழில், தமிழெழுத்து எண்ணிக்கை குறைப்புத் தொழில் போன்று பல்வேறு கோணங்களில்தமிழ் கூறும் மக்களிடையே புற்றீசல் போலத் தோன்றியிருக்கிறது.
இன்றைய காலக் கட்டத்தில், தமிழ் எழுத பேசத்தெரிந்தாலே எளிதில் தமிழ் அறிஞராகி விடமுடிகின்ற சூழலும், எம்மெசு வேர்டு நிரலியில்தமிழை எழுதவும் அட்டவணைகள் இடவும் தெரிந்துவிட்டால் அவர் கணிப்பேரறிஞராக ஆகிவிட முடிகின்ற சூழலும் நிலவுவது இந்தஎழுத்துச் சீர்திருத்தத் தொழிலுக்கு மிகவும்உதவியாக இருக்கிறது என்று சொன்னால்மிகையல்ல.

என்ன இவன்? – எவ்வளவு பாடுபட்டுத் தமிழை வளர்க்க முனைபவர்களின் செயலை குடிசைத் தொழிலுக்கு ஒப்பிடுகிறானே என்றுஎண்ணத் தோன்றும். 247 எழுத்துக்களில் 239எழுத்துக்களை மாற்றத் துடிக்கின்ற பலரின்கோணங்களையும் அவர்களின் ஆய்வுகளின்அளவுகளையும் படிக்கும்போது குடிசைத் தொழில்களுக்குத் தேவையான அடிப்படைச்சிந்தனைகளைக் கூட எந்த ஒரு சீர்திருத்தத்தாளும் கொண்டிருக்கவில்லை என்பதுவும்வெற்று அட்டவணைகளால் நிரப்பப்பட்டஇந்தத் தாள்களைச் செய்வதற்கும்பீடி சுற்றுவதற்கும் பேரீச்சம்பழம் பொட்டலம்கட்டுவதற்கும் செய்யும் வேலைக்கும்எந்த வேறுபாடும் கிடையாது என்பதைபுரிந்து கொள்ள முடியும்.
(அதே வேளையில் எந்த ஒரு குடிசைத் தொழிலையும் நான் இளக்காரம் செய்யவில்லைஎன்பதனை வாசகர்களுக்குத் தெரிவித்துக்கொள்கிறேன்.)
இதில் கொடுமை என்னெவென்றால் இவர்களின் ஆராய்ச்சியற்ற எழுத்து வடிவ மாற்றங்களுக்குத் தந்தை பெரியார் பெயரை, விளம்பரத்திற்குப் பயன்படுத்துமாப் போல, பயன்படுத்துவதாகும்.
பெரியார் நேயர்களையும் சிந்தனையாளர்களையும் பெரியார் பெயரைச் சொல்லி திசைதிருப்புவதே இவர்களின் நோக்கமாக இருக்கின்றது. இதுபற்றி விரிவாகப் பின்னர் காண்போம்.

தமிழ் எழுத்து வடிவத்தை ஏன் மாற்ற வேண்டும், அதற்கென்ன தேவை என்பதை வடிவமாற்றவிரும்பிகள் ஒருவர் கூட நிறைவான ஆராய்ச்சி செய்ததில்லை.
கற்பனைகளையும் கதைகளையும் சொல்கிறார்களே தவிர இன்னது தேவை இன்னது சரவல் இன்னது விளைவு இன்னது பயன் என்று அறிவுசார் ஆராய்ச்சிகள் கொண்டாரில்லை.

இன்றைய நிலையில் தமிழ் உலகில் உலவுகின்ற பல்வேறு வடிவ மாற்ற முனைவுகளின் தொகுப்பினைஇக்கட்டுரை (தொடர்) கொண்டுள்ளது.

இகர வரிசையில் செய்ய வேண்டிய வடிவ மாற்றத்தை எடுத்துரைக்கிறார் வா.செ.குழந்தைசாமி. மேலே படத்தில் இருப்பது போல வடிவ மாற்றம் செய்தால் குழந்தைகள் எளிதாகக் கல்வி கற்பர் என்கிறார். ஈகார வரிசைக்கும் இதே முறையில் வேறு ஒரு குறியை போட்டுவிடுகிறார் வா.செ.கு. கீழே காண்க.
என்ன இது? கி, கீ, நி, நீ எழுத்துக்களில் இருக்கும் துணைக் குறிகளை அப்படியே நகர்த்தி ஒரு மில்லி மீட்டர் தள்ளிப்போட்டுவிடுவது சீர்திருத்தமாகுமா? இதுதான் சீர்திருத்தம் என்றால் எவ்வளவோ செய்யலாமே,செய்து பெரியார் ஆகிவிடலாமே என்ற அவாவில் இன்றைக்குப் பலரும் இதனைத் தொழிலாகக் கொண்டிருக்கிறார்கள் என்று சொன்னால் வியப்பு ஏற்படுவது தவிர்க்க ஏலாதது.
உகர வரிசையில் உள்ள எழுத்துக்களை இப்படி உடைத்து இரண்டு குறிகளாக்கிப் போட்டால் ஆசிரியர்களுக்குப் பாடம் கற்பிக்க ஏதுவாக இருக்கும் என்று சொல்கிறார் வா.செ.கு.ஊகார வரிசையில் உள்ள எழுத்துக்களுக்கும் அதே போல வேறு ஒரு துணைக்குறியீட்டைப் போட்டு எழுதினால் காலத்திற்குத் தக்க மாற்றம் செய்த பெருமை நம்மிடம் இருக்கும். இல்லாவிடில் தமிழே இல்லாமல் போய்விடும் என்று சொல்கிறார் வா.செ.கு.

(வா.செ.கு போன்று பலர் செய்ய முனையும் மாற்றங்கள், சிதைவுகளை வரும் கட்டுரைகளில் தொடரும்)

அன்புடன்
நாக.இளங்கோவன்

 

ஞாயிறு, 9 ஜனவரி, 2011

யுனிக்கோடு: கிரந்தக் கலப்பின் பல்வேறு பக்கங்கள் – வினா-விடை – பகுதி-1

 தமிழ் உலகில் குறிப்பாகக் கடந்த 3 மாதங்களாக  நிலவுகின்ற, “தமிழ்-ஒருங்குறியில் கிரந்தக் கலப்பு” பற்றிய விதயங்களை, பல் துறை சார்ந்தோர்க்கும் அறியத்தரும் வண்ணம் இந்த ஆவணத்தை அமைக்க முயன்றிருக்கிறேன். இது அடிக்கடி ஊடாடும் வினாக்கள் (FAQ) முறையையும் கட்டுரை விளக்க முறையையும் உள்ளடக்கியதாக அமைகிறது. ஒருங்குறி அடிப்படைகள், அதன் கட்டமைப்பு, கிரந்த நுழைப்பு முன்மொழிவுகள், கடந்த 3 மாதங்களில் நிகழ்ந்தவை பற்றிய குறிப்புகள், தற்போது நிலவுகின்ற குழப்பங்கள் ஆகியவற்றை விளக்குவதாகவும், தமிழ்ப் பற்றாளரும் தமிழக அரசும் மேற்கொள்ள வேண்டிய பணிகளைப் பற்றிய பார்வை காட்டுவதாகவும் இது அமைகிறது.

*தொகுதி-1: ஒருங்குறி – அறிமுகம்*

*1) யுனிக்கோடு என்றால் என்ன?*

கணியிற் பல்வேறு மொழி எழுத்துக்களை இப்பொழுது எழுதவும், படிக்கவும் முடிகிறது. ஆனால் ஒருகாலத்தில்
உலகம் முழுவதிலும், ஆங்கிலத்தைத் தவிர, பலமொழிகளின் எழுத்துக்களை எழுதுவதிலும், படிப்பதிலும் சிக்கல்கள் இருந்தன. தவிர ஒவ்வொரு மொழியெழுத்துக்குள்ளும் பல்வேறு எழுத்துத் தரப்பாடுகள் இருந்தன. தமிழிலும் ஒருகாலத்தில் கணியில் எழுதப் படிக்கப் பல்வேறு எழுத்துத் தரப்பாடுகள் புழங்கிக் கொண்டிருந்தன.

ஒவ்வொருவரும் தங்களுக்குப் பிடித்த எழுத்துத் தரப்பாட்டில் தமது இணையத் தளங்களையும், செய்தி ஏடுகள், மாத வார இதழ்களையும் வெளியிட்டனர்.

ஒவ்வொரு இதழையும் இனையத்தளத்தையும் படிக்க வேண்டுமானால் ஒவ்வொன்றுக்கும் உரிய எழுத்துத் தரப்பாட்டையும் எழுத்துருவையும் கணியில் இருத்த வேண்டிய கட்டாயம் இருந்தது.

இல்லாவிட்டால் அவற்றைப் படிக்கவோ, அச்சிடவோ, பறிமாறிக்கொள்ளவோ முடியாதிருந்தது.அதனால் தமிழ்ப் படைப்புகள் கணியிலும் இணையத்திலும் பல்லாயிரக் கணக்கில் இருந்தாலும் அவை தனித் தனித்
திடல்களாகக் கிடந்ததால் அவற்றைப் புழங்கும் பயனர்களுக்குப் பல்வேறு சிக்கல்கள் இருந்தன. அவை மொழி வளர்ச்சிக்குத் தடையாகவும் இருந்தன.

இதே நிலைதான் உலகில் இருக்கும் பல்வேறு மொழிபேசும் மக்களுக்கும் இருந்தன.

ஆகவே, உலகில் உள்ள எல்லா மக்களும் கணியில் எளிதில் புழங்க, உலகின் எல்லா எழுத்து முறைகளையும் (Writing Systems) உள்ளடக்கி ஒரு எழுத்துத் தரப்பாடு (Character Encoding Standard) உருவாக்கப் பட்டது.
அதற்குப் பெயர் தான் ஒருங்குறி என்கின்ற யுனிக்கோடு (Unicode) எழுத்துமுறையாகும்.

தமிழி எழுத்துமுறையை உள்ளடக்கிய ஒருங்குறியின் உலகப் பயனை உணர்ந்த தமிழ்க் கணிஞர்களும் பயனர்களும் அந்தத் தரப்பாட்டுக்கு சிறிது சிறிதாக மாறினர். தமிழ்நாட்டரசும் 2010 சூன் மாதத்தில் நடந்த செம்மொழி மாநாட்டில் ஒருங்குறிக்கு ஏற்பளித்து அரசின் தரப்பாடாக அறிவித்தது.

யுனிக்கோடு அல்லது ஒருங்குறியில் எத்தனை எழுத்து முறைகள் உள்ளன?
இதுவரை, தமிழ் உள்ளிட்ட ஏறத்தாழ 93 எழுத்து முறைகள் ஒருங்குறித் தரப்பாட்டுக்குள் கொண்டு வரப்பட்டிருக்கின்றன.
அரபி எழுத்துமுறை, சீன முறை, ஈபுரு, இலத்தீனம், சிரில்லிக்கு, தமிழ், தேவநாகரி, மங்கோலியம், தெலுங்கு, வங்கம் போன்றவை இவற்றுள் சில எடுத்துக்காட்டுகளாகும்.

*2) எழுத்துரு (Font) என்றால் என்ன?*
***
*கணித்திரையிலும் அச்சிலும் நாம் காணுகின்ற எழுத்துக்களுக்கு வடிவ ஒழுங்கைத் தருவது எழுத்துருக் கோப்பு (Font Files) ஆகும். இதனைச் சுருக்கமாக எழுத்துரு என்கிறோம். வடிவம், அடர்த்தி, பயன்பாடு ஆகியவற்றின்
அடிப்படையில் பல நிறுவனங்களும், தனியாரும் அவரவர் தேவைக்கேற்ப எழுத்துருக் கோப்பை உருவாக்கிக் கொள்ளலாம். பரணர், இலதா, கண்ணகி போன்று பல நூறு எழுத்துருக் கோப்புகளைத் தமிழில்  உருவாக்கியிருக்கிறார்கள்.

*3) எழுத்துத் தரப்பாடும்(Encoding) எழுத்துருவும்(Font) வெவ்வேறா?*

ஆமாம்; இரண்டும் வெவ்வேறானவை. எழுத்துத் தரப்பாடு என்பது ஒவ்வொரு எழுத்துக் குறிக்கும் ஒரு குறியெண்ணைக் (Code Point) கொடுத்து அதனைக் கணியின் செயற்பாட்டிற்குள் பொருத்திய செந்தர வரைவாகும்(Standard Definition). இந்தக் குறி எண்கள் பதினறும எண்கள் ஆகும்.

எடுத்துக்காட்டு:

U+0B85 என்ற குறியெண் தமிழ்க்குறியான “அ” வைக் குறிக்கும்.
U+0BBE என்ற குறியெண் தமிழ்க்குறியான கால் “ா” ஐக் குறிக்கும்.
U+0BB5 என்ற குறியெண் தமிழ்க்குறியான “வ” வைக்குறிக்கும்.
U+0041 என்ற குறியெண் ஆங்கிலக்குறியான “A” யைக் குறிக்கும்.

“வா” என்ற எழுத்தைத் திரையில் காட்ட வேண்டுமானால் U+0BB5 என்ற குறியெண்ணுடைய “வ” குறியையும், U+0BBE என்ற குறியெண்ணுடைய “ா” என்ற காற் குறியையும் இணைத்துக் காட்டுவார்கள். கணிக்குள் இந்தப் பதினறும எண்கள் இரும எண்களாக மாற்றப்பட்டுச் செயல்படும்.

ஆகவே தமிழில் உள்ள பல அடிப்படைக் குறிகள், உயிர்மெய்க் குறிகள், தமிழ் எண்கள் போன்றவற்றின் வடிவங்களை எண்ணுமைப் படுத்தும் தரமே எழுத்துத்தரப்பாடாகும். தமிழ் அகரமெய்களும், உயிர்களும் அங்கு அ டிப்படைக் குறிகளாக உள்ளன. அவை அப்படியே கணித்திரையிலோ, கணியச்சியிலோ, எழுத்தாக வெளிவரும். பிற உயிர்மெய் எழுத்துக்கள் வெளிவர வேண்டுமானால் அடிப்படைக் குறிகளையும் தக்க உயிர்மெய்க் குறிகளையும் அடுத்தடுத்து
ஒட்டுப்போட்டுத்தான் பெறமுடியும்.

இந்தச் செந்தரக் குறியீடுகளைப் பயன்படுத்தி நாம் விரும்பிய வடிவழகில் எண்ணற்ற எழுத்துருக் கோப்புகளை ஏற்படுத்திக் கொள்ளலாம். ஒருங்குறித் தரப்பாட்டை எல்லாக்கணிகளின் கட்டமைப்பும் சொவ்வறைகளும் (Softwares),
நிரலிகளும் (Programs), செயலிகளும்(Applications) உள்ளடக்கியிருக்கின்றன. அத் தரப்படிச் செய்யப்படும் எழுத்துருக்கள் செந்தரத்தின் பயனை அளிக்கின்றன.

வெள்ளி, 9 ஜூலை, 2010

தமிழெழுத்துப் பரம்பல் – 1

 Posted on

“எழுத்துச் சீர்குலைப்பாளர்கள் தமிழக அரசியலாரிடம் தங்களுக்கு இருக்கும் அணுக்கத்தைப் பயன்படுத்தி உலகத் தமிழ்ச் செம்மொழி மாநாட்டின் முடிவில் எழுத்துச் சீர்குலைப்பிற்கு ஆதரவாக ஓர் அரசாணை கொண்டுவர முயல்கிறார்கள்” என்று 10, 11 மாதங்களுக்கு முன் அரசல் புரசலாகச் செய்தி வெளிப்பட்டது. இது தெரிந்தவுடனேயே ”இதை நடக்க விட்டுவிடக் கூடாது, பலரையும் ஒருங்கு சேர்த்து நம்மால் முடிந்தவரை, பரவலாய் எதிர் வாதங்களைத் தொடுக்க வேண்டும், அதே பொழுது எழுத்துக்காப்பு வாதங்கள் ‘அவர் சொன்னார், இவர் சொன்னார்’ என்று வெறும் மேற்கோள் காட்டுவதாய் மட்டுமே அமையக்கூடாது. மாறாக, யாராலும் அளக்கக் கூடிய எண்ணக (measurable and quantitative) முறையில், அடிப்படை ஏரணங்களோடு (with basic logic), அமையவேண்டும்” என்று எங்களிற் சிலர் எண்ணினோம். எண்ணக முறை வாதங்களை எழுப்பும் பொறுப்பைச் சொவ்வறையாளர் (software specialist) திரு. நாக. இளங்கோவன் ஏற்றுக் கொண்டார். ”இகர, ஈகார, உகர, ஊகார உயிர்மெய்களான 72 எழுத்துக்களை மாற்றுவதால் எத்தனை விழுக்காட்டுத் தமிழ்ச் சொற்கள் தம் உருவை மாற்றிக் கொள்ளும்?” என்று அளவிடும் வகையில் நிரல் எழுத முன்வந்து, அந்தப் பணியைச் சிறப்பாகவே செய்தார். அதன் விளைவாக எழுத்துக் குலைப்புச் செய்கையின் முழுப் பரிமானம் பலருக்கும் புரிந்தது. [நாக.இளங்கோவனின் அலசல் அண்மையில் நடந்த செம்மொழி மாநாட்டில் மொழியியற் புலத்தில் கட்டுரையாகப் படிக்கப் பட்டது.] அதை விளக்குமுன் இவ்விடத்தில் ஒன்றைச் சொல்லவேண்டும்.

நாம் பேசும் மொழியிற் பொருள் பொதிந்த அடிக்கூறு சொல்லெனும் அளவை தான். சொற்களைப் புரிவதிற் தடுமாறினால் ஒரு புலனம் பற்றிய பொருட்புரிதல் இல்லாது போகும். சொற்கள் புரிவதற்கு எழுத்துக்கள் வசப் படவேண்டும். வீச்செழுத்துக்களில் இருந்து அச்செழுத்துக்களுக்கு வந்து சேர்ந்த 400 ஆண்டுகளிற் தான் நம்முடைய எழுத்துக்கள் பெரிதும் நிலை பெற்றிருக்கின்றன. There is no more change of shapes. இந்த எழுத்துக்களை இப்போது வலிந்து திருத்துவது என்பது ”பரமபத” விளையாட்டில் பெரிய பாம்பு கடித்து இரண்டாம் கட்டத்திற்குத் திரும்பப் போவது போன்றதாகும். இப்படி எத்தனை முறை இரண்டாம் கட்டத்திற்குப் போவது? மீண்டும் தொடக்கக் கட்டத்தில் இருந்து பொத்தகங்களைத் திரும்ப அச்சடித்து எல்லா வேலைகளையும் திரும்பச் செய்து நம்மைப் பின் தள்ளுவதற்கே இது போன்ற சீர்குலைப்பு வேலைகள் பயன்படும். தமிழிற் செய்வதற்கு எத்தனையோ வேலைகள் உள்ளன. அவற்றைச் செய்யாமல், எழுத்துத் திருத்தம் செய்ய முற்படுவது, வெட்டிவேலையேயாகும். எது உடையவில்லையோ, அதை உடைத்து ஒட்டாதீர்கள் என்று ஆங்கிலத்தில் ஒரு சொலவடை உண்டு. குழப்பமில்லாத எழுத்தை உடைத்து ஒட்டவைக்க முயல்வதும் அப்படி ஒரு நிலை தான். நம் உடம்பிற்குக் காய்ச்சல் இல்லாத போது காய்ச்சல் மருந்து சாப்பிடுவோமோ?

”எழுத்துக்களைத் திருத்துவதால் ஓர் ஆவணத்தில் எத்தனை சொற்களின் தோற்றம் மாறும்?” என்று கணக்கிடுவது ”எத்தனை இடங்களில் பொருளைப் புரிந்து கொள்ளத் தடுமாறுகிறோம், சோர்வடைகிறோம்” என்று கணித்துரைப்பதாகும். சொற்பொருள் புரிவதிற் தடுமாறவைக்கும் ஆவணங்களால் நாம் சலிப்படைந்து அவற்றைப் படிக்காமலே போய்விடுவோம். ஒரு பழைய ஆவணத்தைச் சீர்குலைப்பு எழுத்தில் வெளியிட்டுப் படிக்கவைத்தால் எத்தனை இடங்களில் நாம் படிக்க இடர்ப்படுகிறோமோ, அத்தனை முறை “இந்த ஆவணத்தை ஏன் படித்துத் தொலைக்கவேண்டும்?” என்ற எரிச்சல் நம்முள் மேலெழுந்து, அதன் விளைவாய் ஆவணத்தைக் கீழே போட்டு வேறு வேலை பார்க்கப் போய்விடுவோம். இது மாந்த இயல்பு. எல்லாம் நமக்குள் இருக்கும் பழக்கத் தோய்வே காரணம்.

இகர, ஈகார, உகர, ஊகார உயிர்மெய்களைத் திருத்துவதால் கிட்டத்தட்ட 80% தமிழ்ச்சொற்கள் தம் தோற்றத்தில் மாறுகின்றன என்று திரு. நாக. இளங்கோவன் தம் ஆய்வின் முடிவிற் கண்டறிந்தார். [அதாவது தமிழ்ச்சொற்களில் 80% சொற்கள் இகர, ஈகார, உகர, ஊகார உயிர்மெய்கள் பயிலாது எழுவதில்லை.] அதைப் பற்றிய விளக்கத்தை அவர் கட்டுரையிற் காணலாம். அதற்கு முன்னால் இயல்பான தமிழெழுத்துப் பரம்பல் (natural distribution of Tamil letters) பற்றிய செய்திகளை இங்கு பார்ப்போம். மேலே சொல்வது போல் சொல்லைக் கணக்கிற் கொள்ளாமல் வெறுமே எழுத்துப் பரம்பலை மட்டும் பார்ப்பது இன்னொருவகை அலசலாகும் அதை எனக்குத் தெரிந்து கி.பி.2000-த்தில் கல்பாக்கம் சு. சீனிவாசனும், அவருக்கு முன் 1990 களின் பிற்பாதியில் தகுதரக் (TSCII) குறியீட்டினரும் பார்த்திருந்தார்கள். எழுத்துக்கள் அடங்கிய சொற்களாகப் பார்ப்பது (நாக. இளங்கோவன் கொடுத்த புள்ளிவிவரம்) இதனின்று வேறுபட்டது. இரண்டு வகை அலசல்களுக்கும் தமிழிற் தேவைகள் உண்டு. ஒன்று இன்னொன்றிற்கு ஒளிகூட்டும். இந்தக் கட்டுரையில் எழுத்துப் பரம்பலின் வெவ்வேறு பரிமானங்கள் குறித்துப் பார்க்கப் போகிறோம்.

கல்பாக்கம் சு.சீனிவாசன் தமிழிணையம் 2000-த்தில், வேறொரு புலனத்தில், “அஸ்கி மற்றும் யுனிக்கோடு தமிழ்க் குறிமுறைகளின் சார்பு செயல்திறன் மதிப்பீடு” என்ற கட்டுரையில் தமிழ் உரையில் புழங்கும் எழுத்துக்களின் பரம்பலைக் குறித்திருந்தார். அதன்படி

நேர்ச்சிப் பெருவெண் %
(frequency of occurance)
அனைத்து உயிரெழுத்துக்கள்                                 7.35
அனைத்து மெய்யெழுத்துக்கள்                              29.45
அகர உயிர்மெய் எழுத்துக்கள்                                21.13
இகர, ஈகார உயிர்மெய் எழுத்துக்கள்                      11.47
உகர, ஊகார உயிர்மெய் எழுத்துக்கள்                    12.93
ஆகார, எகர, ஏகார, ஐகார உயிர்மெய் எழுத்துக்கள் 14.97
ஒகர, ஓகார, ஔகார உயிர்மெய் எழுத்துக்கள்           2.69

என்று எழுத்துப் பரம்பல் அமையும். இந்தப் புள்ளிவிவரம் சொற்களைக் கருதாமல் வெறுமே எழுத்துக்களை மட்டுமே பார்ப்பதாகும். இந்த விவரத்தில் ஆகாரம் பற்றிய புள்ளிவிவரத்தை அகரத்தோடும், ஐகார, ஔகார பற்றிய புள்ளிவிவரங்களைத் தனித்தும் கொடுத்திருந்தால் அவதானிப்பதற்கு நன்றாக இருந்திருக்கும். ஆனால் திரு. சீனிவாசன் அப்படித் தரவில்லை. இணையத்தில் இருந்து கிட்டத்தட்ட 4 இலக்கம் எழுத்துக்கள் அடங்கிய பல்வேறு ஆவணங்களை தம் ஆய்விற்கெனக் கீழிறக்கி அவற்றை வகைபிரித்து எண்ணிப் பார்த்துக் கணக்குப் போட்டு இந்தப் புள்ளிவிவரத்தை உருவாக்கியிருந்தார். இந்த விவரத்தின் சிறப்பு இற்றைத் தமிழின் எந்த ஆவணத்திலும் நிரவலாய்க் (average) கிடைக்கக் கூடிய தமிழெழுத்துப் பரம்பலைத் தெரிவிப்பதாகும்.

இதே போன்றதொரு புள்ளி விவரத்தை தகுதரக் குறியீட்டை (TSCII) உருவாக்கும் போது முனைவர் கல்யாண சுந்தரமும் ஓர் ஆவணத்தின் வழி வெளியிட்டிருந்தார். (முத்து நெடுமாறனும், மணிவண்ணனும் அந்த ஆவணத்திற் பங்களித்தார்கள் என்றே எண்ணுகிறேன். சரியாக நினைவில்லை.) பத்துப் பதினைந்து ஆண்டுகளிற் பழகிய என் பல்வேறு கணிகளில் ஏதோவொன்றில் அந்த ஆவணத்தின் படி (copy) சிக்கி, என்னால் மேலும் படியெடுத்துத்தர இயலாதிருக்கிறது. அந்த ஆவணம் வரலாற்றுக் காரணமாய்க் காக்கப் படவேண்டிய ஒன்று. உத்தமம் ஆவணக் காப்பகத்தில் திரு. கல்யாணசுந்தரம் அதைச் சேமித்து வைக்கலாம். அவர் அதை மீண்டும் வெளியிட்டால் நல்லது. நானறிந்து தமிழெழுத்துப் பரம்பலை அறிவியல் வழியில் முதன்முதலாய் அளந்து சொல்லிய ஆவணம் அதுவேயாகும். திரு. கல்யாணசுந்தரம் அளித்த புள்ளிவிவரத்திற்கும் சீனிவாசன் அளித்த புள்ளிவிவரத்திற்கும் பெரிதாய் வேறுபாடு கிடையாது. வேண்டுமானால், ஒருசில பதின்மப் புள்ளிகள் வேறுபட்டிருக்கலாம்.

இந்தப் பரம்பலில் இருந்து பெறப்படும் ஒரு சில முடிவுகள் நமக்குச் சற்று அதிர்ச்சியையும், வியப்பையும் கொடுக்கக் கூடியவை.

தமிழெழுத்து என்பது அரிச்சுவடி என்னும் எழுத்தசை வகையைச் சேர்ந்தது (alpha-syllabary, அதாவது எழுத்துக்களும் அசைகளும் சேர்ந்தது தமிழெழுத்தாகும்) என்று நாமெல்லோரும் அறிவோம். அரிச்சுவடியை அபுகிடா (abugida) வகை என்று ஒரு சில மேல்நாட்டார் அரைகுறைப் புரிதலிற் சொல்லுவார்கள். அது தவறு. ”அரிச்சுவடியும் அபுகிடாவும் முற்றிலும் வெவ்வேறானவை, அதே போல அரிச்சுவடியும் அல்வபெட் (alphabet) என்னும் அகரவரிசையும் வெவ்வேறானவை, இன்னுஞ் சொன்னால் அரிச்சுவடியும் மெய்யெழுத்து, அதைஉயிர்மெய்யாக்கத் துணைக்குறியீடு என்றியங்கும் அபுசட் (abujad) என்பதும் கூட வெவ்வேறானவை” என்ற கருத்தை அண்மையிற் செம்மொழி மாநாட்டில் பேரா. செல்வக் குமார் மிகத் தெளிவாகத் தெரிவித்திருந்தார்.

அரிச்சுவடி என்ற கலைச்சொல்லை அகரம் என்ற தமிழ்ச்சொல்லின் திரிவான அக்கரம்>அக்‌ஷரம் என்ற வடநாட்டுக் கலைச்சொல்லால் திரு. மணிவண்ணன் TACE 16 RFC document இல் கையாளுவார். அரிச்சுவடி என்ற தமிழ்க் கலைச்சொல்லும் அக்க்ஷரம் என்ற வடநாட்டுக் கலைச்சொல்லும் ஒன்றிற்கொன்று அப்படியே இணையானவை. மேல்நாட்டுக்காரர் புரிந்து கொள்ளுதற்காக அக்க்ஷரம் என்ற வடநாட்டுக் கலைச்சொல்லைப் பயன்படுத்துவதில் எனக்கொன்றும் மாறுபாடு இல்லை. தமிழில் அரிச்சுவடி என்ற கலைச்சொல்லையே நாம் பயன்படுத்துவோம் [அந்தக் காலத்தில் 50, 60 ஆண்டுகளுக்கு முன்னாற் கூட, நாட்டுப் புறங்களில் திண்ணப் பள்ளிக் கூடத்தில் அரிசிப் பரப்பில் எழுதித்தான் தமிழ்ப்பிள்ளைகளின் எழுத்துப் பயிற்சி (அக்க்ஷர அப்பியாசம்) தொடங்கும். அரி(சி)யில் எழுதத் தொடங்கும் எழுத்துவகை என்பதால் அரிச்சுவடி என்ற பெயர் ஏற்பட்டது.]

அரிச்சுவடி என்பது அடிப்படை எழுத்துக்களையும், அவற்றின் பெருக்கெழுத்துக்களையும் (product characters) உறுப்பாய்க் கொண்டது. அதாவது எழுத்தசை என்பதை ஒரு கொத்து (set) என்றால் உயிரெழுத்து  என்பது அதனுள் ஓர் உட்கொத்து (subset). (அதன் எண்ணிக்கை 12) மெய்யெழுத்து என்பது இன்னோர் உட்கொத்து.(அதன் எண்ணிக்கை 18. இதனுள் ஜ்,ஷ்,ஸ்,ஹ் என்ற நாலு கிரந்த எழுத்துச் சேர்த்தால் எண்ணிக்கை 22 ஆகும். அண்மையில் 3,4 ஆண்டுகளுக்குள் முன் ஒருங்குறிக்குள் சேர்த்த இன்னொரு z ஒலிச் சகரம் ஒரு முட்டாட்தனமான கூத்து. தமிழ்ப் பள்ளிக்கூடங்களில் யாருக்குஞ் சொல்லிக் கொடுக்காத, ஒரு சில விதப்பான, விரல்விட்டு எண்ணக் கூடிய, பயனாளர் மட்டுமே பயனாக்கும் எழுத்து அதுவாகும். இதுபோல அதிநுணுக்கச் சிறுபான்மையாளர் பயன்படுத்தும் எழுத்துக்களை எல்லாம் தமிழ் அரிச்சுவடியில் சேர்க்கத் தொடங்கினால், அப்புறம் தமிழெழுத்து என்பது எல்லையில்லாது போய்விடும். One has to put a full stop to these kinds of unwanted additions. க்ஷ் என்பது மெய்க்கூட்டு. மெய்க்கூட்டைத் தவிர்க்கும் தமிழில் அதைக் கணக்கில் சேர்த்ததும் தவறுதான். ஸ்ரீ என்பது ஒற்றைக் கூட்டெழுத்து.)

உயிர், மெய் ஆகிய இரண்டின் பெருக்கமாய் 12*18 = 216 எழுத்துக்களாய் (அல்லது கிரந்தம் சேர்த்தால் 12*22 = 264 எழுத்துக்களாய்) அமையும் உயிர்மெய்கள் இன்னோர் உட்கொத்து. இவை போக நாலாவது உட்கொத்து தொல்காப்பியரின் படி குற்றியலுகரம், குற்றியலிகரம், ஆய்தம் ஆகிய மூன்று உறுப்பினர் அடங்கியதாகும். ஆனால் இற்றைத் தமிழில் இது ஒரே உறுப்பினர் அடங்கிய உட்கொத்தாய் ஆகிவிட்டது. எல்லா உட்கொத்து உறுப்புகளையும் கூட்டிப் பார்த்தால், தமிழெழுத்து வரிசை மொத்தம் 247 எழுத்துக்கள் (கிரந்தம் சேர்த்தால் 12+22+12*22+1 = 300 எழுத்துக்கள்) கொண்டதாகும். இவற்றின் அடிப்படையில் எந்த ஆவணத்திலும், இயல்பாக ஏதேனும் ஓர்

உயிர்எழுத்துத் தோன்றுதற்கான பெருதகை (probability) = 12/247 = 0.048583 (கிரந்தம் சேர்த்தால் 0.04.)
இதே போல பெய்யெழுத்துப் பெருதகை = 18/247 = 0.0728745 (0.06)
அகர, ஆகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
இகர, ஈகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
உகர, ஊகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
எகர, ஏகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
ஐகார உயிர்மெய்ப் பெர்தகை = 18/247 = 0.0728745 (0.06)
ஒகர, ஓகார உயிர்மெய்ப் பெருதகை = 36/247 = 0.145749 (0.12)
ஔகார உயிர்மெய்ப் பெருதகை = 18/247 = 0.0728745 (0.06)

இந்தப் பெருதகைகளைக் கணக்கிடும் போது ஓரெழுத்தின் நேர்ச்சி (occurrence) இன்னோர் எழுத்தின் நேர்ச்சியைப் பாதிக்காது என்றும் இரண்டும் ஒன்றிற்கொன்று பந்துறாதவை (independant; பந்தம் = dependency) என்றும் நாம் கருதிக் கொள்ளுகிறோம் (hypothesize). ஆழ்ந்து ஓர்ந்து பார்த்தால் அத்தகைய கருத்து தமிழைப் பொறுத்தவரை உண்மையில்லை தான். எழுத்துக்களின் நேர்ச்சி பல சொற்களில் ஒன்றையொன்று சார்ந்திருப்பதைப் பலவிடத்தும் உணரமுடியும். காட்டாக, பங்து என்ற சொல் தமிழில் அமையவே அமையாது. அது பந்து என்று இருக்கலாம், அல்லது பங்கு என்று இருக்கலாம். ’ங்’ஙும், ’து’வும் எங்கும் சேரமுடியாத எழுத்துக்கள். இது போன்ற கட்டியப் பெருதகைகளைக் (conditional probablities) கணக்கிடுவது இன்றைய நிலையிற் கடினம் என்பதால், முடிவு சாய்வாக இருக்கலாம் எனினும் எழுத்துக்களின் நேர்ச்சி ஒன்றிற்கொன்று பந்துறாதவை என்றே இவ்வாய்வில் கருதிக் கொள்கிறோம்.

இனி தேற்றப் பெருதகையையும் (theoretical probability) மேலே சீனிவாசன் 4 இலக்கம் தமிழெழுத்துக்கள் கொண்ட ஆவணங்களை இறக்கிக் கணக்கெடுத்த இயல் நேர்ச்சியையும் ஒப்பிட்டுப் பார்த்தால், ஒரு புதிய செய்தி விளங்கும். இற்றைத் தமிழில் உயிரெழுத்துக்களும், மெய்யெழுத்துக்களும், அகர, ஆகார உயிர்மெய்களும் (ஆகார உயிர்மெய் நேர்ச்சியைச் சீனிவாசன் எகர, ஏகாரத்தோடு சேர்த்து விட்டார், எனவே குத்து மதிப்பாக 7 அல்லது 8 விழுக்காட்டை நாம் அகர உயிர்மெய் நேர்ச்சியோடு சேர்க்கலாம். அதற்குக் காரணம் இருக்கிறது  கீழே பார்ப்போம்.) எதிர்பார்க்கப்படும் பெருதகையைக் (expected probability) காட்டிலும் இருமடங்கு அதிகமாக நேர்ச்சியுறுகின்றன. அதே பொழுது இகர, ஈகாரங்களும் உகர, ஊகாரங்களும் கிட்டத்தட்ட நிரவலாக எதிர்பார்த்த பெருதகையையொட்டியே நேர்ச்சி கொள்ளுகின்றன. எகர, ஏகார, ஐகார, ஒகர, ஓகார, ஔகாரங்களும் எதிர்பார்க்கப் பட்ட பெருதகைக்கும் மிகக் குறைவாகவே நேர்ச்சி கொள்ளுகின்றன. [உயிரெழுத்து அதிகம் நேர்ச்சி கொள்ளுவது இந்தக் காலப் பழக்கமாய் இருக்கலாம். பெரும்பாலும் புணர்ச்சி பிரித்து எழுதும் காரணத்தால் உயிரெழுத்துக்கள் இயல் பெருதகையைக் காட்டிலும் அதிகமாகத் தோற்றங் கொள்ளலாம்.]

விவரித்துச் சொன்னால், தமிழ் அரிச்சுவடியில் 247 அசையெழுத்துக்கள் இருந்தாலும் நாம் 12+18+36 = 66 எழுத்துக்களையே அதிகமாகப் பயன்படுத்துகிறோம். இது ஒரு வியப்பான அவதானிப்பு. கிட்டத்தட்ட மூன்றில் இரண்டு பங்கு எந்தத் தமிழாவணத்திலும் இந்த 66 எழுத்துக்களே பயன்கொள்ளுகின்றன. Even though Tamil Script is alphasyllabary, it uses its alphabets and the akara, aakaara syllables more for articulation compared to other syllables. This is remarkable and perhaps characterizes Tamil language. தமிழின் இயல்பு இதுதான் போலும். இந்த இயல்பை காலந்தோறும் எழுந்த ஆவணங்களின் வழி ஆய்வு செய்வது பல்வேறு ஆய்வு முடிவுகளை நமக்கு உணர்த்தலாம்.  அதற்காக மற்ற அசைகளைத் தூக்கியெறிந்து விடலாமா என்றால் இல்லையென்றே சொல்லவேண்டும். ஓர் தமிழிசை விருந்தில் ”ஆ, அ …….என்று ஆலத்தி (ஆலாபனை) மட்டும் சொல்லிப் போக முடியாதே? நம்மையறியாமல் மூச்சை நிறுத்தி (மூச்சு நிறுத்தும் இடங்கள் எல்லாம் மெய் வந்தே தீரும்) பின் மாற்றும் போது மற்ற அசைகளைச் சொல்லும் கட்டாயத்திற்கு ஆளாகிறோம் அல்லவா?

மற்ற அசையெழுத்துக்கள் என்னவகையில் தமிழ் மொழியாளுகையில் பயன்படுகின்றன என்று ஆய்ந்து சொல்லவேண்டும். அதற்குப் பல்வேறு காலகட்டங்களில் உருவாகிய  இலக்கியங்களின், ஆவணங்களின் பல்வேறு கைச்சாத்துக்களை (signatures) அடையாளங் காணுவது நலம் பயக்கும்.

அன்புடன்,
இராம.கி.