தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 12. ஏன் திறந்த மூலமும், திறந்த தரவுகளும், திறந்த ஆய்வும்?

இது நாள் வரை பொதுமக்களின் வரிப் பணத்தில் செய்யப்படும் ஆராய்ச்சிகளும், மென்பொருட்களும் பெரும்பாலும் சமூகம், பொதுமக்கள், அரசாங்கம் ஆகியவற்றுடன் தொடர்பில்லாமலே செய்யப்படுகின்றன. ஆராய்ச்சித் தரவும் மென்பொருட்களும் பெரும் செலவில் உருவாக்கப்படுகின்றன. ஆனால் அதைப் பகிர்ந்து கொள்வதேயில்லை. பெரும்பாலும் ஆராய்ச்சி முடிவுகள் வெளிவந்த பிறகு விரைவில் அந்தத் திட்டம் தரவுகளை இழந்து விடுகிறது. மென்பொருட்கள் மக்களுக்குப் பயன் தராமல் வீணாகின்றன. பண விரயம் மட்டுமல்லாமல், ஒத்துழைப்பையும் முன்னேற்றத்தையும் இந்த அணுகுமுறை தடுக்கிறது.

ஆய்வறிக்கைகள்படி இக்கருவிகள், வளங்கள் யாவும் உருவாக்கப்பட்டு விட்டனவே?

நீங்கள் கேட்கலாம், “ஆய்வறிக்கைகள்படி இக்கருவிகள் மற்றும் வளங்கள் யாவும் உருவாக்கப்பட்டு விட்டதாகத் தெரிகிறதே? முன்னர் கண்டுபிடித்த அதே சக்கரத்தை மீண்டும் கண்டுபிடிப்பதுபோல் அல்லவா இது இருக்கிறது? நாம் ஏன் மீண்டும் முயற்சி போடவேண்டும்?” என்று. ஆய்வறிக்கைகளைப் படித்தால் அப்படித்தான் தெரிகிறது. ஆனால் இவற்றை அணுகுவதோ வேறு சங்கதி. ஒன்றிரண்டு கருவிகள் பதிவிறக்கம் செய்யலாம். சில எழுதிக் கேட்டால் கிடைக்கக்கூடும். ஆனால் மொழிமாற்றிய (compiled) வடிவத்தில்தான் கிடைக்கும், மூல நிரல் (source code) கிடைக்காது. மூல நிரல் கிடைக்காவிட்டால் தேவைக்குத் தகுந்தாற்போல் மாற்றவோ மேம்படுத்தவோ முடியாது. தரவுகள் பெரும்பாலும் கிடைப்பதேயில்லை.

திறந்த ஆய்வும் திறந்த தரவுகளும்

ஆராய்ச்சி முடிவில் பொதுவாக ஒரு அறிக்கைதான் வெளியிடப்படுகிறது. அறிக்கையில் ஒருசில மாதிரி புள்ளிவிவரங்களும் இருக்கலாம். ஆனால் அந்த ஆராய்ச்சியின் முடிவுக்குக் கொண்டு செல்லும் மூலப் பொருள்களான தரவுகள் வெளியிடப்படுவதில்லை. இம்மாதிரி ஆராய்ச்சித் தரவுகள் பொதுவாகப் புள்ளிவிவரங்கள் மற்றும் எண்வகை போன்ற அளவீட்டுத் தரவுகளாக இருக்கலாம். அல்லது பேட்டி எழுத்துப்படிகள், எண்ணிம உள்ளடக்கமான படங்கள், ஒலிப்பதிவு மற்றும் நிழல் படம் போன்ற பண்பு சார்ந்த தரவு வடிவத்திலும் இருக்கலாம். இத்தரவுகள் ஒரு முக்கியமான ஆதாரம் மட்டுமல்ல, கல்வி சார்ந்த முன்னேற்றத்திற்கும் மிக அவசியமானதாகும்.

அறிவியல் வெளியீடுகள் மற்றும் ஆராய்ச்சித் தரவுகளுக்கான திறந்த அணுகல் பற்றிய ஐரோப்பிய ஒன்றிய வழிகாட்டுதல்கள் இவ்வாறு கூறுகிறது.  “பொது மக்களின் வரிப் பணத்தை ஏற்கெனவே ஒரு முறை செலவு செய்து சேகரித்த தகவலை ஒவ்வொரு முறையும் பொதுமக்களும் மற்ற ஆய்வாளர்களும் அணுகவும் அல்லது பயன்படுத்தவும் இயல வேண்டும். மேலும் அது ஐரோப்பிய நிறுவனங்களுக்கும், குடிமக்களுக்கும் முழுப் பயன் தர வேண்டும்.”

இந்தியாவிலும் மத்திய அரசின் அறிவியல் மற்றும் தொழில்நுட்பத் துறை, திறந்த அணுகல் என்ற இணைய தளத்தை உருவாக்கி ஆய்வுத் திட்டங்களின் தரவுகள் யாவற்றையும் திறந்த தரவுகளாக வெளியிட வேண்டுமென்று அறிவுறுத்தி வருகிறது.

திறமையாளர்களை ஈர்க்க திறந்த மூலம் வழி செய்கிறது

இன்னும் தீர்க்கப்படாத பிரச்சினைகளில் வேலை செய்யவே உருவாக்குநர்கள் விரும்புகிறார்கள். நீங்கள் எதிர்கொள்ளும் சுவாரசியமான சவால்களையும் மற்றும் அவற்றை தீர்வு செய்வது பற்றி நீங்கள் எப்படி சிந்தனை செய்கிறீர்கள் என்பதையும் நிரலாளர் சமூகத்துக்கு வெளிப்படுத்த திறந்த மூலம் உதவுகிறது. திறந்த மூல திட்டத்துக்கு திறமையுள்ள நிரலாளர்கள் எளிதில் பங்களிக்க இயலும்.  ஏற்கனவே தீர்க்கப்பட்ட பிரச்சினைகளை அடிப்படையாக வைத்து, புதிய கண்டுபிடிப்புகள் உருவாக்க வழி வகுக்கிறது. தங்கள் சொந்த கள அறிவுக்கு அப்பால் மற்ற நிபுணர்களின் திறனையும் வைத்து நிரலாளர்கள் புதிய கண்டுபிடிப்புகள் உருவாக்குவதும் சாத்தியமாகிறது.

இந்திய மொழிகளுக்கான உரை ஒலி மாற்றி

இந்திய மொழிகளுக்கான உரை ஒலி மாற்றி

நடைமுறை எடுத்துக்காட்டு: இந்திய தொழில்நுட்பக் கழகத்தின் உரை ஒலி மாற்றி

2010 இல் இந்திய தொழில்நுட்பக் கழகம் ஒரு அருமையான உரை ஒலி மாற்றியை உருவாக்கியது. இது பெங்காலி, இந்தி, தமிழ், தெலுங்கு, மலையாளம் மற்றும் மராத்தி ஆகிய இந்திய மொழிகளுக்கான உரை ஒலி மாற்றி. தொகுப்புகளை உருவாக்குதல், தரத்தை மேம்படுத்துதல் மற்றும் செயலியின் கால் தடத்தைச் சுருக்கி  ஊனமுற்றவர்களுக்கு உதவும் பிற செயலிகளுடன் ஒருங்கிணைத்தல் ஆகியவை இத்திட்டத்தின் குறிக்கோள். இது ஃபெஸ்டிவல் (Festival) என்ற திறந்த மூல மென்பொருளை அடிப்படையாகக் கொண்டது. 2012 ஆம் ஆண்டில் 13 இந்திய மொழிகளுக்கு HTS புள்ளியியல் உரை ஒலி மாற்றி அடிப்படையிலான திட்டத்தின் இரண்டாம் கட்டம் துவங்கியது. இந்தத் திட்டத்தில் சென்னை எஸ்.எஸ்.என். பொறியியல் கல்லூரியும் பங்களித்திருந்தது. இது நன்றாக வேலை செய்வதை நிரூபிக்க ஒரு இணைய தளம் இருக்கிறது. ஆனால் இதன் பயன் மக்களைச் சென்றடைந்ததா என்று தெரியவில்லை. கூகிள் உரை ஒலி மாற்றியில் இன்னும் தமிழ் வரக்காணோம். ஆக இந்தவொரு தொழில்நுட்பத்தில் கூகிளைவிட நம் திறந்த மூலம் ஒரு படி மேலே இருக்கிறது.

2017 இல் திரு. சீனிவாசன் அவர்கள் தகவல் உரிமைச் சட்டத்தின் கீழ் இந்த மென்பொருளை திறந்த மூலமாக வெளியிடக் கோரி ஒரு விண்ணப்பம் அனுப்பினார். இந்திய தொழில்நுட்பக் கழகத்திலிருந்து உடன் பதில் கிடைத்தது, அது ஏற்கெனவே திறந்த மூலத்தில் பகிரப்பட்டிருப்பதாக! திரு. சீனிவாசன், திரு. மோகன் இருவரும் மிகவும் முயன்று இ.தொ.க. ஆய்வாளர்கள் உதவியுடன் திறந்த மூல ஃபெஸ்டிவல் உரை ஒலி மாற்றி கருவியில் இயங்கும் குரல் மாதிரிகளைத் தொகுக்க முடிந்தது.

ஆனால் இதில் இன்னும் சில முன்னேற்றங்கள் தேவைப்பட்டன. இந்த செயலியால் அடுத்த வெற்று வரி வரைதான் படிக்க முடிந்தது. ஒரு முழுப் பக்கத்தையோ அல்லது முழுப் புததகத்தையோ படிக்குமாறு செய்ய வேண்டும். அடுத்து திரு. மோகன் இந்தத் தமிழ் உரை ஒலி மாற்றியின் நிரலில் ஒரே நேரத்தில் பல உரைகளை மாற்றுவதை எளிதாக்கி உதவினார். இது உரையை ஒலியாக்கி .wav அலலது .mp3 வடிவத்தில் வெளியிடும். அடுத்து இதை இணைய செயலியாக மாற்ற வேண்டும். அப்பொழுதுதான் இதை எவரும் எளிதில் பயன்படுத்த முடியும்.

திரு. லெனின் குருசாமி தலைமையில் காரைக்குடி க்னூ லினக்ஸ் பயனர் குழு இந்த உரை ஒலி மாற்றியைப் பயன்படுத்தி சில தமிழ்ப் புத்தகங்களை ஒலி வடிவத்தில் வெளியிட்டுள்ளனர். இதற்கான இணையதளத்தை திரு. வேலுச்சாமி உருவாக்கியுள்ளார். இந்த ஒலிப் புத்தகங்கள் பார்வையற்றவர்கள் மற்றும் பார்வை குறைபாடுடையோருக்கு மிகப்பெரிய உதவியாக இருக்கும் என்பதில் ஐயமில்லை. இந்த ஒலிப் புத்தகங்களை காப்பகம் இணைய தளத்திலும் பதிவேற்றியுள்ளனர்.

இம்மாதிரி ஒரு தயாரிப்பையோ அல்லது செயலியையோ படிப்படியாக முன்னேற்றம் செய்வதும் மற்றும் தன்னார்வலர்கள் தம்மால் முடிந்ததை, முடிந்தபோது பங்களிப்பதும், பற்பல பயன்பாடுகளுக்குத் தகுந்தாற்போல் விருப்பமைவு செய்துகொள்வதும், இக்கூட்டு முயற்சிகளின் பலன் யாவருக்கும் எளிதில் அணுகக்கூடிய வகையில் கிடைப்பதும் திறந்த மூல திட்டங்களின் அடிப்படைப் பண்புகள்.

அடுத்த தலைமுறையை தயார் செய்தல்

மென்பொருள் தொழில்நுட்பத்தில் இன்று மிக முக்கிய பொறியாளர்களாக இருக்கும் பலரும் திறந்த மூலத்தில் வேலை செய்துதான் தங்கள் தொழில்நுட்ப அறிவைக் கூர்மைப்படுத்தினர். பார்வையிட வசதியாக மென்பொருளின் அடிப்படை நிரல் வெளியிடப்பட்டால், தொழிற்துறையின் அதிநவீன தொழில்நுட்பம் எப்படி கட்டப்பட்டுள்ளதென்று கணினி அறிவியல் கல்லூரிகளும் ஆய்வு செய்யலாம். அடுத்த தலைமுறை மென்பொருள் பொறியாளர்களை தயார் செய்வதில் இது பெரும் பங்காற்றும். திறந்த மூலம் இல்லாவிட்டால் மென்பொருள் உள்ளுக்குள் எப்படி வேலை செய்கிறதென்பதை வெறும் ஊகம்தான் செய்ய வேண்டியிருக்கும்.

மொழியியலாளர்களுக்கும் மென்பொருள் உருவாக்குநர்களுக்கும் இடையே நெருங்கிய ஒத்துழைப்பு தேவை

இத்துறையில் திறம்பட வேலைசெய்ய இரண்டு வேறுபட்ட துறைகளில் அறிவும் அனுபவமும் தேவை. ஒன்று மொழியியல், மற்றொன்று கணினி நிரலாக்கம். இவை இரண்டுமே ஒருங்கிணைந்த நிரலாக்க மொழியியல் பயிற்சிகள் உள்ளன. எனினும் திறந்த மூலமும், திறந்த தரவுகளும், திறந்த ஆய்வும்தான் துறைகள் அளவில் நெருங்கிய ஒத்துழைப்புக்கு வழிவகுக்கும்.

————————–

இத்தொடரில் அடுத்த கட்டுரை: நிரல் எழுதத் தெரியாதவர்கள் 21 ஆம் நூற்றாண்டின் தற்குறிகளா?

நிரலாக்கம்தான் புதிய எழுத்தறிவா? உயிரியலாளராக வேண்டுமா? நிரலாக்கம் நன்றாகக் கற்றுக்கொள்ள வேண்டும்! “நிரலாக்கச் சிந்தனை” என்றால் என்ன? கருத்துகளை மற்றவர்களுக்குப் புரியும் வழிகளில் வெளிப்படுத்துவதுதான் எழுத்தறிவு. எந்தவொரு தயாரிப்பு அல்லது சேவையை வழங்கினாலும் ஒவ்வொரு நிறுவனமும் மென்பொருள் நிறுவனமாக மாறி வருகின்றன.

%d bloggers like this: