Figure 1: தமிழ் 99 விசைப்பலகை
கணினிக்கலையில் தமிழ் பயன்பாட்டை அதிகரிக்க நான் தமிழ்க் கணினிக் குழுவை நிறுவினேன். அதன் முதன்மையான பணி Translation Project என்னும் கட்டற்ற மென்பொருள் மொழிபெயர்ப்புத் தளத்தில் தமிழ்க் குழுவை நடத்துவதே. Translation Project யில் பல GNU கட்டளை நிரல்கள் மொழிபெயர்ப்பிற்காக வழங்கப்பட்டிருக்கின்றன. பெரும்பாலும் தமிழாக்க முயற்சிகள் வலை, கைபேசி மென்பொருள் என அதிகமாகப் பயன்படுத்தப்படும் மென்பொருட்களுக்குப் பெரியுதி அளிக்கின்றன. தமிழ் நிரலாக்கரும் கணினி வல்லுநரும் ஆங்கிலத்தையே பயன்படுத்துகின்றனர். இந்நிலையை மாற்ற நிரலாக்கர் அதிகம் பயன்படுத்தும் கட்டளை நிரல்களைத் தமிழாக்க வேண்டும். இதற்குத் தமிழ்க் கணினி சொல்வளத்தைத் தரப்படுத்த வேண்டும். இவ்விரண்டையும் நடைமுறைபடுத்துவதே தமிழ்க் கணினிக் குழுவின் நோக்கம்.
தமிழ்க் கணினிக்குள் புகுவதற்கு இடையூறாகயிருக்கும் சிலவற்றைப் பற்றியும் அவ்விடையூறுகளைக் கடக்கும் முயற்சிகள் பற்றியும் கீழ் காணலாம்.
கலைச்சொற்கள் நுண்பொருள் தர வேண்டும்
கலைச்சொற்கள் பொதுச் சொற்கள் போன்றில்லாமல் துல்லியமான நுண்பொருள் தருவனவாயிருக்க வேண்டும். ஆங்கில கலைச்சொற்கள் இத்தகையவை. தமிழில் கலைச்சொற்கள் பல உருவாக்கப்பட்டுள்ளனவாயினும் அவைப் போதிய அளவு புழக்கத்தில் இல்லாததால், நுண்பொருள் எய்தாமல் பேரளவு அங்கீகாரம் பெறாமல் இருக்கின்றன. எடுத்துக்காட்டிற்கு ஆங்கிலத்தில் library, module, package என்னும் சொற்களைக் கருதுக. இச்சொற்கள் ஏறக்குறைய ஒரே பொருள் தந்தாலும், அவை இடம்பெற்றுள்ள இடத்திற்கேற்ப அவற்றின் பொருள்களில் நுண்மையான வேறுபாடு உண்டு. இச்சொற்கள் பலக் காலம் புழக்கத்தில் இருந்துள்ளதால் அவற்றின் பொருளில் கருத்தொற்றுமை உள்ளது. இச்சொற்களை எவரும் தவறாகப் புரிந்துக் கொள்ளமாட்டார். இச்சொற்களை நிரலகம், நிரல்கூறு, நிரல்தொகுப்பு என்று நாம் தமிழாக்கலாம். ஆனால் இத்தமிழாக்கங்கள் புழக்கத்திற்குள் புகாததால் அவற்றின் பொருள் மனத்திற்கு உடனே வெளிப்படுவதில்லை; மேலும் இத்தமிழாக்கங்களைப் பார்க்கிற ஒவ்வொருவரும் ஒவ்வொரு பொருள் காணும் வாய்ப்புள்ளது — அவற்றின் பொருளில் போதிய கருத்தொற்றுமை இல்லை.
ஆங்கிலத்தில் ஒரேச் சொல் கலைப்பொருளிலும் பொதுப்பொருளிலும் இடம்பெற்று குழம்பாமலிருக்க பல முறை கிரேக்க மொழிச் சொற்களையும் இலத்தீன் மொழிச் சொற்களையும் கடன் வாங்குகிறார்கள். இவ்வேற்றுமொழிச் சொற்களுக்கு ஆங்கிலத்தில் பிறப் பொதுப் பொருள் இல்லாததால் அவைத் தனித்து நின்று நுண்பொருள் தர முடிகிறது. இவ்வாறு கடன்சொற்கள் தேவையா என்பது ஐயப்பாட்டுக்குரியதாயினும் அவ்வாறே சொற்கள் வேண்டுமாயின் நாம் கடன் வாங்குவதற்குப் பதிலாகப் புழக்கத்திலிருந்து விலகிய பழந்தமிழ்ச் சொற்களை மீட்டெடுத்துப் புதிய நுண்பொருளுடன் பயன்படுத்தலாம்1.
ஓரகல எழுத்துருக்கள்
ஒர் எழுத்துருவில் அனைத்து எழுத்துகளும் ஒரே அகலமுடையதாய் அமைந்தால் அவ்வெழுத்துரு ஓரகல எழுத்துரு (monospace font) எனப்படும். எடுத்துக்காட்டாக ஆங்கிலத்தில் i என்னும் எழுத்து மிக மெலிந்தது; m என்னும் எழுத்து மிக அகலமானது; ஆயினும் ஓரகல எழுத்துருக்களில் அவை ஒரே அகலத்துடன் இருக்குமாறு கொஞ்சம் திரித்து எழுதப்பட்டிருக்கும். அனைத்து எழுத்துக்களும் ஒரே அகலமுடையதாய் இருந்தால் தான் கட்டளை நிரல்களின் வெளியீடு வரிக்கு வரி ஒருசீராக ஒன்றின் கீழ் ஒன்றாக நேர்படுத்தப்பட்டுத் தோன்றும். எனவே இவ்வெழுத்துருகள் கணினி முனையங்களில் பரவலாகப் பயன்படுத்தப்படுகின்றன. எனக்குத் தெரிந்தவரை தமிழ் ஓரகல எழுத்துருக்கள் இல்லை. தமிழ் எழுத்துகள் மிகுந்த அகல வேறுபாடு உடையவை. எடுத்துக்காட்டிற்கு, “க” போன்ற அகர எழுத்துகள் மிக மெலிந்தவை; “கோ” போன்ற ஓகார எழுத்துகள் மிக அகலமானவை. இத்தகைய அகல வேறுபாடுகளுடைய தமிழ் எழுத்துகளுக்கு ஓரகல எழுத்துரு உருவாக்குவதெப்படி? இதைப் பற்றி உங்களுக்கு எண்ணம் இருந்தால் கூறுங்கள்.
Figure 2: Proportional எழுத்துருவும் Monospace எழுத்துருவும்
cal என்னும் நாட்காட்டி நிரலின் வெளியீட்டை ஆங்கிலத்திலும் தமிழிலும் கீழ் காண்க. ஆங்கில வெளியீடு ஓரகல எழுத்துருகளைப் பயன்படுத்துவதால் பத்திகள் நேர்படுத்தப்பட்டுத் தோன்றுகின்றன. தழிழிலோ ஓரகல எழுத்துருகள் இல்லாததால் கிழமைப் பெயர்கள் சற்று பெயர்ந்திருப்பதைக் காண்க.
February 2019 Su Mo Tu We Th Fr Sa 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
பிப்ரவரி 2019 ஞா தி செ பு வி வெ ச 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
மென்பொருள் கையேடுகள்
கணினி நிரல்களைத் தமிழாக்குவதோடு தமிழாக்கப் பணி முடிந்துவிடாது. அதை விடக் கடினமான, ஆனால் அவசியமான, வேலை அந்நிரல்களின் பயன்பாட்டு ஆவணங்களைத் தமிழாக்குவது. தற்போதைய நிலையில் அதற்குத் தேவையான ஆள்வலி இல்லாததால் முழு தொழில்நுட்பக் கையேடுகளைத் தமிழாக்குவது மிகக் கடினம். அக்கையேடுகளின் சுருக்கங்களான man பக்கங்களைத் தமிழாக்கலாம். ஆனால் man பக்கங்களை விடச் சுருக்கமாக tldr பக்கங்கள்2 என உள்ளன. அவை ஒவ்வொரு கட்டளை பற்றியும் 4-5 எடுத்துக்காட்டுகள் காட்டி அதன் அடிப்படை பயன்பாட்டை விளக்குவன. இவற்றைத் தமிழாக்கினால் குறைந்த உழைப்பில் நிறைய கட்டளைகளை ஓரளவாது ஆவணப்படுத்திவிடலாம். tldr-pages தற்போது ஆங்கிலப் பக்கங்களை மட்டுமே கொண்டுள்ளது. அதில் தமிழ் உட்பட பிற மொழி பக்கங்களை ஏற்றும் முயற்சி நடந்துக்கொண்டிருக்கிறது3.
முடிவுரை
தமிழ் பாமரனுக்கு மட்டும் தான் என்ற எண்ணம் மாற வேண்டும். ஆங்கிலம் அறிந்தவர்-அறியாதவர், நிரலாக்கர்-பயனர் என்ற பிரிவினைகள் மறைய வேண்டும். இக்குறியோடு நம்மால் இயன்ற அனைத்தையும் செய்து தமிழ்த்தொண்டு புரிவோம்.
Image Credits
Tamil 99 keyboard — by Thamizhpparithi Maari, released under the Creative Commons Attribution-ShareAlike 4.0 International license
A side by side comparison of proportional and monospace font — by Garethlwalt, released under the Creative Commons Attribution 3.0 Unported license
Footnotes:
புழக்கதில் இல்லாதச் சொற்களை மீட்டெடுப்பது பற்றி அறிய பழைய ஆங்கிலத்தை மீட்டெடுக்க முயலும் Anglish Moot திட்டத்தைக் காண்க.
GitHub tldr-pages களஞ்சியத்தில் உரையாடலைக் காண்க: Support for multiple human languages
உரிமை – Creative Commons Attribution-ShareAlike 4.0 International
எழுதியவர் – அருண் ஐசக். தற்போது இந்திய அறிவியல் நிறுவனம், பெங்களூரில் முனைவர் பட்டம் பெற கணிப்பிய அறிவியல் துறையில் ஆய்வு செய்துக்கொண்டிருக்கிறார். அவர் கட்டற்ற மென்பொருள், lisp/scheme நிரலாக்க மொழிகள், மின்னணுவியல், தொழில்சாரா வானொலி ஆகியவற்றில் ஆர்வம் கொண்டவர்.
மின்னஞ்சல்/XMPP – arunisaac@systemreboot.net