தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 21. சொல்வலையும் சொல்லின் பொருளில் ஐயமகற்றலும்

அடுத்து வரும் நான்கு வாக்கியங்களைப் பாருங்கள். அவன் வீட்டிற்குச் சென்று இட்லி சாப்பிட்டான். பின்னர் அவன் சமையலறையைச் சுத்தம் செய்து விட்டு நாற்காலியில் அமர்ந்தான். சிறிது நேரம் கழித்து, அவன் இருக்கையில் இருந்து எழுந்தான். அவன் படுக்கைக்குச் சென்றான், சில நிமிடங்களில் அவன் சத்தமாகக் குறட்டை விட்டான். இயல்மொழி செயலாக்கத்தில், வாக்கியங்களின் பொருளை அறிய கணினி நிரல்களைப் பயன்படுத்துகிறோம். மேலே உள்ள நான்கு வாக்கியங்களில், சொல்வலை (wordnet) உதவியுடன், கணினி நிரலால் பின்வருவனவற்றை அடையாளம் காண முடியும்.… Read More »

அமேசான் இணையச்சேவைகள் – தனிப்பயன் விபிசி

இதுவரையில் நாம் விபிசியின் கூறுகளைப் பற்றியும், ஒவ்வொரு கணக்கிற்கும் அமேசான் உருவாக்கிக் கொடுக்கிற இயல்நிலை விபிசி பற்றியும் அறிந்தோம். அமேசான் இணையச்சேவைகளை முதன்முதலாகப் பயன்படுத்துவோருக்கு, விபிசி பற்றிய எந்தவொரு சிக்கலும் நேராதவண்ணம் இயல்நிலை விபிசிக்கள் பார்த்துக்கொள்கின்றன. முன்னதாக நாம் ஒரு மேகக்கணினியை உருவாக்கியபோதும், அதிலிருந்து ஒரு வலைத்தளத்தை இயக்கியபோதும், விபிசியின் இருப்பைக் கூட நாம் அறிந்திருக்கவில்லை. தொடக்கநிலையில் இருப்போருக்கு இது போதுமானது. ஆனால், பல்வேறு பயனர்களைக் கொண்டவொரு வலைத்தளத்தையோ, செயலியையோ கட்டமைக்கும்போது, இயல்நிலை விபிசிக்கள் மட்டுமே போதுமானதாக… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 20. தமிழின் தனித்தன்மைகளை வைத்துக் குறியிட்ட உரைகள் தேவையைக் குறைக்க முடியுமா?

சொல்வகைக் குறியீடு ஒரு சவால் மிகுந்த சிக்கலான பணியாகும். ஏனெனில் அகராதியில் இல்லாத தனிப்பெயர்ச்சொற்கள், மற்ற மொழிச் சொற்கள், மாற்று எழுத்துக்கோர்வை, எழுத்துப் பிழைகள், தெரியாத சொற்கள் போன்றவை வரலாம். இயந்திரக் கற்றல் நுட்பங்களைப் பயன்படுத்தி ஆங்கிலத்துக்குப் பல சொல்வகைக் குறியீடு செய்யும் கருவிகள் உருவாக்கப்பட்டுள்ளன. இயந்திரக் கற்றல் நுட்பங்களுடன், விதிகள் சார்ந்த அணுகுமுறைகளைக் கலந்தும் சில கருவிகள் உள்ளன. எனினும், பெரும்பாலானவை உருபனியல் அல்லது சொற்பகுப்பியல் உத்திகளில் கவனம் செலுத்துவதில்லை. அதற்குப் பதிலாக அவர்கள் மிகுதியான… Read More »

அமேசான் இணையச்சேவைகள் – அணுக்கக் கட்டுப்பாட்டுப் பட்டியல்கள்

பாதுகாப்புக்குழுக்கள் என்பவை மேகக்கணினிகளின் தீச்சுவர்களாகச் (Firewalls) செயல்படுகின்றன என முந்தைய பதிவில் அறிந்தோம். அதைப்போலவே, ஒரு துணைஇணையத்தின் தீச்சுவராக, அணுக்கக் கட்டுப்பாட்டுப் பட்டியல்கள் (Access Control Lists) செயல்படுகின்றன. மேகக்கணினிகளைப் பொருத்தவரையில், பாதுகாப்புக்குழுக்களும், அணுக்கக் கட்டுப்பாட்டுப் பட்டியல்களும் இணைந்து இரண்டடுக்கு பாதுகாப்பினை வழங்குகிறது. தனக்குக் கொடுக்கப்பட்டுள்ள விதிகளின் அடிப்படையில், அணுக்கக் கட்டுப்பாட்டுப் பட்டியல்கள், துணைஇணையத்தின் உள்வருகிற மற்றும் வெளிச்செல்கிற இணையப் போக்குவரத்தினைக் கட்டுப்படுத்துகிறது. இவ்விதிகளை அதிநுணுக்கமாகக் கட்டமைக்கமுடியும். அதாவது, குறிப்பிட்ட நெறிமுறையைப் (Protocol) பயன்படுத்தி, குறிப்பிட்டத் துறை… Read More »

Machine Learning – 3 – PAC Method

Probably Approximately Correct (PAC Method) ஒரு கணிப்பான் மூலம் நிகழ்த்தப்படும் கணிப்பு எவ்வளவு தூரம் சரியானதாக இருக்கும், அதனை எவ்வளவு தூரம் நம்பலாம் என்பது போன்ற விஷயங்கள் எல்லாம் இந்த method-ல் கணக்கிடப்படுகிறது. முதலில் ஒரு கணிப்பானின் கணிப்பு probably approximately correct -ஆக அமைவதற்கு அவற்றில் என்னென்ன பண்புகளெல்லாம் இருக்க வேண்டும் என்பதை ஒருசில வரையறைகள் கொண்டு சோதிக்கிறது. அதாவது over-fitting இல்லாமல் இருக்கிறதா, inductive bias பெற்று விளங்குகிறதா,i.i.d  முறையில் பயிற்சித் தரவுகள் அளிக்கப்பட்டுள்ளதா,அதன் sample… Read More »

Machine Learning – 2 – Statistical Learning

Statistical Learning புள்ளி விவரங்களைக் கொண்டு கற்பதே இயந்திர வழிக்கற்றலின் அடிப்படை. எந்த ஒரு கணிப்பும் தரவுகளாக அளிக்கப்படும் புள்ளி விவரங்களின் அடிப்படையிலேயே அமைகிறது. இத்தகைய புள்ளி விவரங்களைத் திறம்படக் கையாண்டு கணினிக்குக் கற்றுக் கொடுப்பது எப்படி என்று இப்பகுதியில் காணலாம். இதுவே Statistical learning model என்று அழைக்கப்படும். Domain set: உள்ளீடாகத் தருகின்ற புள்ளி விவரங்களே இவ்வாறு அழைக்கப்படும். x={…..} என்பது domain set / instance space எனப்படும். இதிலுள்ள ஒவ்வொரு தனித்தனி… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 19. வாக்கியக் கூறு பிரித்தலும், பெயரிட்ட உருபொருள் அடையாளம் காணுதலும்

நாம் எண்ணங்களை சொற்களாலும் வாக்கியங்களாலும் வெளிப்படுத்துகிறோம். எல்லா மொழிகளும் சொற்களையும் வாக்கியங்களையும் கொண்டிருக்கின்றன. ஆனால் அவை பல்வேறு வழிகளில் ஒழுங்கமைக்கப்படுகின்றன. தொடரியல் (syntax) தொடரியல் என்பது சொற்களை வைத்து எவ்வாறு வாக்கியங்களை அமைக்கிறோம் என்ற வாக்கியக் கட்டமைப்பு ஆய்வு. தமிழ் இலக்கணப்படி எழுவாய் என்பது ஒரு வாக்கியத்தில் செயலைக் காட்டும் சொல்மீது “யார், எது, எவை” என வினவும் போது கிடைக்கும் பதில் ஆகும். செயப்படுபொருள் என்பது “யாரை, எதை, எவற்றை” என்பதின் பதில் ஆகும். பொருள்… Read More »

இயந்திர வழிக் கற்றல் – ஒரு அறிமுகம் – காணொளி

  இயந்திர வழிக் கற்றல் – ஒரு அறிமுகம் என்ற தலைப்பில் கணியம் இதழில் எழுதும் கட்டுரைத்தொகுப்பின் அறிமுகக் காணொளி இது. இம்முறை வெளிப்புறப் படப்பிடிப்பை முயற்சி செய்துள்ளோம். ஒலி சில இடங்களில் குறையலாம். அடுத்த முறை இன்னும் சிறப்பாக பதிவு செய்ய முயல்வோம். இதற்கான ஒலி வாங்கி கருவிகள் பற்றிய பரிந்துரைகள் இருந்தால் இங்கே பதிலுரையில் எழுதுங்கள்.   மிக்க நன்றி.   து. நித்யா

அமேசான் இணையச்சேவைகள் – மெய்நிகர் தனிப்பயன் மேகக்குழுமம் – பகுதி 2

நுழைவாயில்கள் பெரும்பாலான சமயங்களில், நமது மேகக்கணினிகளுக்கு இணையத்தொடர்பு தேவைப்படுகிறது. இது உலகளாவிய இணைய இணைப்பாகவோ (Internet), பயனரின் மெய்நிகர் தனிப்பயன் இணைய இணைப்பாகவோ (Virtual Private Network – VPN) இருக்கலாம். இவற்றில் எந்தவகை இணையத்தொடர்பாக இருந்தாலும், அவை, நுழைவாயில்கள் வழியாகவே நடைபெற முடியும். தன்வழியே நிகழும் இணையப்பரிமாற்றங்களுக்கான, இணையமுகவரிகளைப் கண்டறிவது (Network Address Translation – NAT) இவற்றின் முக்கிய வேலையாகும். துணைஇணையத்திற்கும் நுழைவாயிலுக்குமான தொடர்பைப் பொருத்து, துணைஇணையங்களை இரு வகைகளாகப் பிரிக்கலாம். பொதுத் துணைஇணையம்… Read More »