Category Archives: machine-learning
ML 20 – தமிழில் இயந்திரவழிக் கற்றல் – காணொளி – Decision Tree & Random Forest algorithms – Video
Machine Learning – 31 – Artificial Neural Networks
ஒரு நியூரான் கற்றுக் கொள்வதை அடிப்படையாக வைத்து கற்றுக் கொள்வது perceptron என்றால், பல்வேறு நியூரான்களைக் கொண்ட மனித மூளை கற்றுக் கொள்வதை அடிப்படையாக வைத்து கற்றுக் கொள்வது Multi-layer perceptron ஆகும். அதாவது செயல்களை அடிப்படையாகக் கொண்டு நியூரான்கள் கற்கின்றன. நியூரான்கள் கற்றுக் கொண்டதை வைத்து மனித மூளை கற்கிறது. இதே முறையில் தரவுகளை அடிப்படையாகக் கொண்டு perceptron கற்கின்றன. Perceptron-களை வைத்து directed acyclic graph-ஐ உருவாக்கி MLP கற்கிறது. இதுவே Artificial neural… Read More »
Machine Learning – 30 – Perceptron
Perceptron என்பதே neural networks-க்கான அடிப்படை. இது ஒரு நேர்கோடு மூலம் பிரிக்க வல்ல தரவுகளுக்கான binary classification algorithm ஆகும். ஆனால் இது logistic regression போன்று தனது கற்றலை அமைக்காது. ஒரு நியூரான் எவ்வாறு கொஞ்சம் கொஞ்சமாக கற்றுக் கொள்கிறதோ அதனை அடிப்படையாக வைத்து, பயிற்சித் தரவுகளைப் பற்றிப் படிப்படியாகக் கற்றுக் கொள்கிறது. கீழ்க்கண்ட எடுத்துக்காட்டில் 4 பயிற்சித் தரவுகள் கொடுக்கப்பட்டுள்ளன. அதில் x1, x2 எனும் 2 features-ஐ வைத்து 0 அல்லது… Read More »
Machine Learning – 29 – PCA
Principle Component Analysis என்பது அதிக அளவு பரிமாணங்கள் கொண்ட தரவுகளை குறைந்த அளவு பரிமாணங்கள் கொண்டதாக மாற்றுவதற்குப் பயன்படுகிறது. எடுத்துக்காட்டாக 1000 அம்சங்களைக் கொண்டு ஒரு விஷயம் கணிக்கப்படுகிறது என வைத்துக் கொள்வோம். PCA-ஆனது இந்த 1000 X-ஐ 100 X-ஆகவோ அல்லது இன்னும் குறைந்த பரிமாணங்கள் கொண்டதாகவோ மாற்றிக் கொடுக்கும். அதாவது Y எண்ணிக்கையைப் பற்றிக் கவலைப்படாது. வெறும் X எண்ணிக்கையை மட்டும் குறைக்கும். எனவேதான் PCA என்பது dimensionality reduction-க்கு உதவுகின்ற ஒரு சிறப்புவகை… Read More »
Machine Learning – 28 – SVM
Support Vector Machine (SVM) என்பது தரவுகளை வகைப்படுத்திப் பிரிப்பதற்கான ஒரு வழிமுறை ஆகும். ஏற்கெனவே இதற்கென logistic regression என்பதைப் பற்றிப் பார்த்தோம். ஆனால் இந்த SVM என்பது வகைப்படுத்துதல் எனும் வேலையை logistic-ஐ விட இன்னும் சற்று துல்லியமாக அமைக்கிறது. நேர்கோடு மூலம் பிரிக்கப்படும் தரவுகளுக்கு large margin classifier எவ்வாறு உதவுகிறது என்பதையும், நேர்கோடு முறையில் பிரிக்கப்பட முடியாத தரவுகளுக்கு kernels எவ்வாறு உதவுகிறது என்பதையும் இப்பகுதியில் காணலாம். Large margin classifier… Read More »
Machine Learning – 27 – Clustering Algorithm
Clustering with K-Means: Unsupervised learning-ல் நாம் கற்க இருக்கும் முதல் algorithm இதுவே. இதுவரை நாம் கண்ட அனைத்தும் supervised-ன் கீழ் அமையும். logistic regression, multi-class classification போன்ற அனைத்திலும், உள்ளீடு(X) மற்றும் வெளியீடு(Y) இரண்டையும் கொடுத்து பயிற்சி அளிப்போம். பல்வேறு வெளியீட்டு வகைகளின் கீழ் தரவுகளைப் பிரிப்பதற்கு அத்தனை வகையான எல்லைகளையும் நாமே வரையறை செய்வோம். ஆனால் இந்த unsupervised-ல் வெறும் உள்ளீடுகள் மட்டுமே கொடுக்கப்படும். எத்தனை வகையில் பிரிக்க வேண்டும் என்பதோ,… Read More »
எளிய தமிழில் Machine Learning – மின்னூல் – து. நித்யா
எளிய தமிழில் Machine Learning து.நித்யா nithyadurai87@gmail.com மின்னூல் வெளியீடு : கணியம் அறக்கட்டளை, kaniyam.com அட்டைப்படம், மின்னூலாக்கம் : த. சீனிவாசன் tshrinivasan@gmail.com உரிமை : Creative Commons Attribution – ShareAlike 4.0 International License. முதல் பதிப்பு ஏப்ரல் 2019 பதிப்புரிமம் © 2019 கணியம் அறக்கட்டளை கற்கும் கருவி இயல் – Machine Learning – கணினி உலகில் அதி வேகமாக வளர்ந்து வரும் துறை ஆகும். இதை, இந்த… Read More »
Machine Learning – 26 – Decisiontrees&Randomforest
Regression மற்றும் Classification இரண்டிற்கும் உதவக்கூடிய நேர்கோடு முறையில் பிரிக்க இயலாத non-linear தரவுகளுக்கான model-ஆக decision trees மற்றும் random forest விளங்குகிறது. Decision trees என்பது பொதுவாக மாதிரித் தரவுகளில் உள்ள மதிப்புகளைக் கொண்டு அவற்றை சிறுசிறு பகுதிகளாகப் பிரித்துக் கற்கிறது. கீழ்க்கண்ட எடுத்துக்காட்டில் ஒரு மலர் மல்லியா, ரோஜாவா, தாமரையா என்று தீர்மானிக்க DecisionTreeClassifier() மற்றும் RandomForestClassifier() பயன்படுத்தப்பட்டுள்ளன. ஒவ்வொரு மலரின் இதழ்களுடைய(sepal) நீள அகலமும், அவற்றின் மேற்புற இதழ்களுடைய(petal) நீள அகலமுமான… Read More »
வருமானவரிதகராறுகளையும் பிரச்சினைகளையும் தீர்வுசெய்வதற்கானRiverus எனும் பகுப்பாய்வு கருவி ஒரு அறிமுகம்
இது ஒரு வருமான வரிச்சட்டஆய்வு, பகுப்பாய்வு கருவியாகும் .நம்முடைய வருமானவரி ஆய்வு அனுபவத்தை விரைவாகவும் செயல்திறன்மிக்கதாகவும் மாற்றுவதற்கு இயந்திர கற்றல் போன்ற நவீன தொழில்நுட்பங்கள் இதில் பயன்படுத்தி கொள்ளப்படுகின்றது மிகமுக்கியமாக வருமானவரி பிரச்சினையில் ஒரு வினைமுறைத்திறனை உருவாக்கிடவும் அபாயங்களைத் தணித்திடவும் தேவையான உத்திகளை இதனுடைய பகுப்பாய்வை பயன்படுத்தி கண்டுபிடித்திடமுடியும் இந்த கருவியின் வாயிலாக நான்கு இலட்சத்திற்கும் அதிகமான நீதிமன்றத்தினாலும் தீர்ப்பாயங்களாலும் வெளியிடப்பட்டதும் வெளியிடபடாததுமான தீர்ப்புகளிலிருந்தும் உத்திரவுகளிலிருந்தும் தேவையான தகவல்களையும் உத்திகளையும் வகுப்பதற்கான வழிமுறைகளை வருமானவரி தொழில்முறையாளர்களுக்கு காண… Read More »