Category Archives: கணியம்

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 20. தமிழின் தனித்தன்மைகளை வைத்துக் குறியிட்ட உரைகள் தேவையைக் குறைக்க முடியுமா?

சொல்வகைக் குறியீடு ஒரு சவால் மிகுந்த சிக்கலான பணியாகும். ஏனெனில் அகராதியில் இல்லாத தனிப்பெயர்ச்சொற்கள், மற்ற மொழிச் சொற்கள், மாற்று எழுத்துக்கோர்வை, எழுத்துப் பிழைகள், தெரியாத சொற்கள் போன்றவை வரலாம். இயந்திரக் கற்றல் நுட்பங்களைப் பயன்படுத்தி ஆங்கிலத்துக்குப் பல சொல்வகைக் குறியீடு செய்யும் கருவிகள் உருவாக்கப்பட்டுள்ளன. இயந்திரக் கற்றல் நுட்பங்களுடன், விதிகள் சார்ந்த அணுகுமுறைகளைக் கலந்தும் சில கருவிகள் உள்ளன. எனினும், பெரும்பாலானவை உருபனியல் அல்லது சொற்பகுப்பியல் உத்திகளில் கவனம் செலுத்துவதில்லை. அதற்குப் பதிலாக அவர்கள் மிகுதியான… Read More »

Machine Learning – 3 – PAC Method

Probably Approximately Correct (PAC Method) ஒரு கணிப்பான் மூலம் நிகழ்த்தப்படும் கணிப்பு எவ்வளவு தூரம் சரியானதாக இருக்கும், அதனை எவ்வளவு தூரம் நம்பலாம் என்பது போன்ற விஷயங்கள் எல்லாம் இந்த method-ல் கணக்கிடப்படுகிறது. முதலில் ஒரு கணிப்பானின் கணிப்பு probably approximately correct -ஆக அமைவதற்கு அவற்றில் என்னென்ன பண்புகளெல்லாம் இருக்க வேண்டும் என்பதை ஒருசில வரையறைகள் கொண்டு சோதிக்கிறது. அதாவது over-fitting இல்லாமல் இருக்கிறதா, inductive bias பெற்று விளங்குகிறதா,i.i.d  முறையில் பயிற்சித் தரவுகள் அளிக்கப்பட்டுள்ளதா,அதன் sample… Read More »

Machine Learning – 2 – Statistical Learning

Statistical Learning புள்ளி விவரங்களைக் கொண்டு கற்பதே இயந்திர வழிக்கற்றலின் அடிப்படை. எந்த ஒரு கணிப்பும் தரவுகளாக அளிக்கப்படும் புள்ளி விவரங்களின் அடிப்படையிலேயே அமைகிறது. இத்தகைய புள்ளி விவரங்களைத் திறம்படக் கையாண்டு கணினிக்குக் கற்றுக் கொடுப்பது எப்படி என்று இப்பகுதியில் காணலாம். இதுவே Statistical learning model என்று அழைக்கப்படும். Domain set: உள்ளீடாகத் தருகின்ற புள்ளி விவரங்களே இவ்வாறு அழைக்கப்படும். x={…..} என்பது domain set / instance space எனப்படும். இதிலுள்ள ஒவ்வொரு தனித்தனி… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 19. வாக்கியக் கூறு பிரித்தலும், பெயரிட்ட உருபொருள் அடையாளம் காணுதலும்

நாம் எண்ணங்களை சொற்களாலும் வாக்கியங்களாலும் வெளிப்படுத்துகிறோம். எல்லா மொழிகளும் சொற்களையும் வாக்கியங்களையும் கொண்டிருக்கின்றன. ஆனால் அவை பல்வேறு வழிகளில் ஒழுங்கமைக்கப்படுகின்றன. தொடரியல் (syntax) தொடரியல் என்பது சொற்களை வைத்து எவ்வாறு வாக்கியங்களை அமைக்கிறோம் என்ற வாக்கியக் கட்டமைப்பு ஆய்வு. தமிழ் இலக்கணப்படி எழுவாய் என்பது ஒரு வாக்கியத்தில் செயலைக் காட்டும் சொல்மீது “யார், எது, எவை” என வினவும் போது கிடைக்கும் பதில் ஆகும். செயப்படுபொருள் என்பது “யாரை, எதை, எவற்றை” என்பதின் பதில் ஆகும். பொருள்… Read More »

ஆன்டிராய்டு திறன்பேசியில் பாதுகாப்பும் அகவுரிமையும்

கூகிள் விளையாட்டு அங்காடி (Google Play Store) தீங்குநிரல்கள் நிறைந்து, பாதுகாப்பு மற்றும் அகவுரிமைக்கு மிகவும் பாதகமாகிவிட்டது ஆன்டிராய்டு இயங்கு தளத்துடன் சேர்ந்தே கூகிள் அங்காடி வருகிறது, ஆகவே தனியாகப் பதிவிறக்கம் செய்து நிறுவத் தேவை இல்லை. இதில் மூன்று மில்லியனுக்கு மேற்பட்ட செயலிகள் உள்ளன. உங்களால் கற்பனை செய்யக்கூடிய எல்லா வேலைகளுக்கும் இதில் செயலிகள் கிடைக்கும். பல இலவசமாகவே கிடைக்கும், சிலவற்றைதான் பணம் கட்டி வாங்க வேண்டும். இப்படி அற்புதமான வசதியிருக்க வேறு எதுவும் யாருக்குத்… Read More »

Machine Learning – 1 – அறிமுகம்

இயந்திரவழிக் கற்றல் என்பது தற்போது அதிகமாக வளர்ந்து வருகின்ற ஒரு துறை. ஒரு கணினிக்கு கற்பிப்பது, அதற்கு அறிவு புகட்டுவது, புகட்டப்பட்ட அறிவின் அடிப்படையில் கணினிகளையே முடிவினை மேற்கொள்ளுமாறு செய்வது போன்ற பல்வேறு விஷயங்களை இயந்திரவழிக் கற்றலில் காணலாம். மனிதன் செய்கின்ற வேலையை வெறும் நிரல்கள் எழுதி கணினியைச் செய்யவைப்பதன் பெயர் இயந்திரவழிக் கற்றல் ஆகாது. அதன் பெயர் தானியக்கம் (Automation). மனிதனைப் போன்று கணினிகளை யோசிக்க வைத்து, முடிவுகளையும் அதனை வைத்தே எடுக்க வைப்பது, அவ்வாறு… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 17. உரையும் பேச்சும் கொண்ட மொழித்தொகுப்பு

மொழியியல் பகுப்பாய்வுக்கு அடிப்படையாக இருக்கும், உரையும் பதிவு செய்த பேச்சும் கொண்ட தொகுப்புகளை, மொழித்தொகுப்பு (corpus) என்று சொல்கிறோம். ஆங்கில மொழித்தொகுப்புகளின் வரலாறு 100 மில்லியன் சொற்கள் கொண்ட பிரிட்டானிய நாட்டு மொழித்தொகுப்பு (BNC), பர்மிங்ஹாம் மொழித்தொகுப்பு, லன்காஸ்டர் ஆங்கில பேச்சுத் தொகுப்பு முதலிய தொகுப்புகள் ஆங்கில மொழிக்குப் பிரபலமானவை. இருமொழி மொழித்தொகுப்புகள் இரண்டு மொழிகளின் மொழிபெயர்ப்பைக் கொண்டிருக்கும். ஐரோப்பிய ஒன்றிய முன்முயற்சி (ECI) பலமொழித்தொகுப்பு ஆகும். இது துருக்கிய, ஜப்பானிய, ரஷ்ய, சீன மற்றும் பிற மொழிகளில்… Read More »

ராஸ்பெர்ரி பையில் இயங்குதளம் நிறுவி நிரல் எழுதுவது எப்படி

ராஸ்ப்பெரி-பை கணினி ஏன் உருவாக்கப்பட்டது, எந்த வகையில் வித்தியாசமானது, வகுப்பறையில் ராஸ்பெர்ரி பை பயன்படுத்த வழிகள் எவை ஆகியவற்றை எங்கள் முந்தைய கட்டுரையில் காணலாம். நினைவக அட்டை மற்றும் துணைக்கருவிகளும் தேவை ராஸ்பெர்ரி பை பல மாதிரிகளில் கிடைக்கிறது, பை 3 B மாதிரி அதிக அம்சங்கள் கொண்டது சுமார் ரூ 3200 க்கு கிடைக்கிறது. புதிதாக பை 3 B+ என்ற மாதிரி சுமார் ரூ 3700 விலையில் அண்மையில் வெளியிடப்பட்டுள்ளது. இதைத் தவிர திட்டத்துக்குத்… Read More »

அமேசான் இணையச்சேவைகள் – நிரல்வழிச் செயல்முறை

இதுவரையில் நாம் அடையாள அணுக்க மேலாண்மை பற்றியும், எளிய சேமிப்பகச்சேவை பற்றியும் அறிந்திருக்கிறோம். முந்தைய பதிவுகளில் உருவாக்கிய பயனர்களின் அணுக்கத்திறப்புகளைக் கொண்டு, S3இல் பின்வருவனவற்றைச் செய்துபார்க்கலாம். ஒரு கொள்கலனை உருவாக்குதல் அக்கொள்கலனில் ஒரு கோப்பினைப் பதிவேற்றுதல் நாம் பதிவேற்றிய கோப்பு, சரியான கொள்கலனில் உள்ளதா என சரிபார்த்தல் பதிவேற்றிய கோப்பினை அழித்தல் முதற்படியில் உருவாக்கிய கொள்கலனை அழித்தல் அடிப்படை கட்டமைப்பு இச்செயல்முறைக்காக, நாம் C# மொழியைப் பயன்படுத்தவிருக்கிறோம். இணையச்சேவைகளை நிரல்வழியே இயக்குவதற்கு ஏதுவாக, பலமொழிகளுக்கான மென்பொருளாக்கக் கொட்டான்களை… Read More »

தமிழின் எதிர்காலமும் தகவல் தொழில்நுட்பமும் 16. தகவல் தொழில்நுட்ப உதவியுடன் நீங்களும் ஒரு எழுத்தாளராகலாம்

வெளியீடு செய்த எழுத்தாளராக ஆவதற்கு இதுதான் வரலாற்றிலேயே சிறந்த காலம் என்று நீங்கள் கேள்விப்பட்டிருக்கலாம். அது உண்மைதான். நூலாசிரியர்கள் முன்னர் இருந்ததை விட வாசகர்களை அடைய அதிக வாய்ப்புகளை கொண்டுள்ளனர். மேலும் தங்கள் படைப்புகளை வெளியீடு செய்வதில் முன்னை விட அதிகமான கட்டுப்பாட்டை எடுத்துக் கொள்ள விரும்பினால், அதுவும் சாத்தியமே. மேலும் புத்தகங்களை விநியோகம் செய்வதில் வந்த மாற்றங்களால் ஒவ்வொரு வாசகருக்கும் எந்தப் புத்தகமும் எங்கு வேண்டுமானாலும் எப்போது வேண்டுமானாலும் கிடைக்கும். இணையப்  புத்தகக் கடை அலமாரிகள்… Read More »