Category Archives: machine-learning

Machine Learning – 31 – Artificial Neural Networks

ஒரு நியூரான் கற்றுக் கொள்வதை அடிப்படையாக வைத்து கற்றுக் கொள்வது perceptron என்றால், பல்வேறு நியூரான்களைக் கொண்ட மனித மூளை கற்றுக் கொள்வதை அடிப்படையாக வைத்து கற்றுக் கொள்வது Multi-layer perceptron ஆகும். அதாவது செயல்களை அடிப்படையாகக் கொண்டு நியூரான்கள் கற்கின்றன. நியூரான்கள் கற்றுக் கொண்டதை வைத்து மனித மூளை கற்கிறது. இதே முறையில் தரவுகளை அடிப்படையாகக் கொண்டு perceptron கற்கின்றன. Perceptron-களை வைத்து directed acyclic graph-ஐ உருவாக்கி MLP கற்கிறது. இதுவே Artificial neural… Read More »

Machine Learning – 30 – Perceptron

Perceptron என்பதே neural networks-க்கான அடிப்படை. இது ஒரு நேர்கோடு மூலம் பிரிக்க வல்ல தரவுகளுக்கான binary classification algorithm ஆகும். ஆனால் இது logistic regression போன்று தனது கற்றலை அமைக்காது. ஒரு நியூரான் எவ்வாறு கொஞ்சம் கொஞ்சமாக கற்றுக் கொள்கிறதோ அதனை அடிப்படையாக வைத்து, பயிற்சித் தரவுகளைப் பற்றிப் படிப்படியாகக் கற்றுக் கொள்கிறது. கீழ்க்கண்ட எடுத்துக்காட்டில் 4 பயிற்சித் தரவுகள் கொடுக்கப்பட்டுள்ளன. அதில் x1, x2 எனும் 2 features-ஐ வைத்து 0 அல்லது… Read More »

Machine Learning – 29 – PCA

Principle Component Analysis என்பது அதிக அளவு பரிமாணங்கள் கொண்ட தரவுகளை குறைந்த அளவு பரிமாணங்கள் கொண்டதாக மாற்றுவதற்குப் பயன்படுகிறது. எடுத்துக்காட்டாக 1000 அம்சங்களைக் கொண்டு ஒரு விஷயம் கணிக்கப்படுகிறது என வைத்துக் கொள்வோம். PCA-ஆனது இந்த 1000 X-ஐ 100 X-ஆகவோ அல்லது இன்னும் குறைந்த பரிமாணங்கள் கொண்டதாகவோ மாற்றிக் கொடுக்கும். அதாவது Y எண்ணிக்கையைப் பற்றிக் கவலைப்படாது. வெறும் X எண்ணிக்கையை மட்டும் குறைக்கும். எனவேதான் PCA என்பது dimensionality reduction-க்கு உதவுகின்ற ஒரு சிறப்புவகை… Read More »

Machine Learning – 28 – SVM

Support Vector Machine (SVM) என்பது தரவுகளை வகைப்படுத்திப் பிரிப்பதற்கான ஒரு வழிமுறை ஆகும். ஏற்கெனவே இதற்கென logistic regression என்பதைப் பற்றிப் பார்த்தோம். ஆனால் இந்த SVM என்பது வகைப்படுத்துதல் எனும் வேலையை logistic-ஐ விட இன்னும் சற்று துல்லியமாக அமைக்கிறது. நேர்கோடு மூலம் பிரிக்கப்படும் தரவுகளுக்கு large margin classifier எவ்வாறு உதவுகிறது என்பதையும், நேர்கோடு முறையில் பிரிக்கப்பட முடியாத தரவுகளுக்கு kernels எவ்வாறு உதவுகிறது என்பதையும் இப்பகுதியில் காணலாம். Large margin classifier… Read More »

Machine Learning – 27 – Clustering Algorithm

Clustering with K-Means: Unsupervised learning-ல் நாம் கற்க இருக்கும் முதல் algorithm இதுவே. இதுவரை நாம் கண்ட அனைத்தும் supervised-ன் கீழ் அமையும். logistic regression, multi-class classification போன்ற அனைத்திலும், உள்ளீடு(X) மற்றும் வெளியீடு(Y) இரண்டையும் கொடுத்து பயிற்சி அளிப்போம். பல்வேறு வெளியீட்டு வகைகளின் கீழ் தரவுகளைப் பிரிப்பதற்கு அத்தனை வகையான எல்லைகளையும் நாமே வரையறை செய்வோம். ஆனால் இந்த unsupervised-ல் வெறும் உள்ளீடுகள் மட்டுமே கொடுக்கப்படும். எத்தனை வகையில் பிரிக்க வேண்டும் என்பதோ,… Read More »

எளிய தமிழில் Machine Learning – மின்னூல் – து. நித்யா

எளிய தமிழில் Machine Learning து.நித்யா  nithyadurai87@gmail.com மின்னூல் வெளியீடு : கணியம் அறக்கட்டளை, kaniyam.com அட்டைப்படம், மின்னூலாக்கம் : த. சீனிவாசன் tshrinivasan@gmail.com உரிமை : Creative Commons Attribution – ShareAlike 4.0 International License. முதல் பதிப்பு  ஏப்ரல் 2019 பதிப்புரிமம் © 2019 கணியம் அறக்கட்டளை   கற்கும் கருவி இயல் – Machine Learning – கணினி உலகில் அதி வேகமாக வளர்ந்து வரும் துறை ஆகும். இதை, இந்த… Read More »

Machine Learning – 26 – Decisiontrees&Randomforest

Regression மற்றும் Classification இரண்டிற்கும் உதவக்கூடிய நேர்கோடு முறையில் பிரிக்க இயலாத non-linear தரவுகளுக்கான model-ஆக decision trees மற்றும் random forest விளங்குகிறது. Decision trees என்பது பொதுவாக மாதிரித் தரவுகளில் உள்ள மதிப்புகளைக் கொண்டு அவற்றை சிறுசிறு பகுதிகளாகப் பிரித்துக் கற்கிறது. கீழ்க்கண்ட எடுத்துக்காட்டில் ஒரு மலர் மல்லியா, ரோஜாவா, தாமரையா என்று தீர்மானிக்க DecisionTreeClassifier() மற்றும் RandomForestClassifier() பயன்படுத்தப்பட்டுள்ளன. ஒவ்வொரு மலரின் இதழ்களுடைய(sepal) நீள அகலமும், அவற்றின் மேற்புற இதழ்களுடைய(petal) நீள அகலமுமான… Read More »

வருமானவரிதகராறுகளையும் பிரச்சினைகளையும் தீர்வுசெய்வதற்கானRiverus எனும் பகுப்பாய்வு கருவி ஒரு அறிமுகம்

இது ஒரு வருமான வரிச்சட்டஆய்வு, பகுப்பாய்வு கருவியாகும் .நம்முடைய வருமானவரி ஆய்வு அனுபவத்தை விரைவாகவும் செயல்திறன்மிக்கதாகவும் மாற்றுவதற்கு இயந்திர கற்றல் போன்ற நவீன தொழில்நுட்பங்கள் இதில் பயன்படுத்தி கொள்ளப்படுகின்றது மிகமுக்கியமாக வருமானவரி பிரச்சினையில் ஒரு வினைமுறைத்திறனை உருவாக்கிடவும் அபாயங்களைத் தணித்திடவும் தேவையான உத்திகளை இதனுடைய பகுப்பாய்வை பயன்படுத்தி கண்டுபிடித்திடமுடியும் இந்த கருவியின் வாயிலாக நான்கு இலட்சத்திற்கும் அதிகமான நீதிமன்றத்தினாலும் தீர்ப்பாயங்களாலும் வெளியிடப்பட்டதும் வெளியிடபடாததுமான தீர்ப்புகளிலிருந்தும் உத்திரவுகளிலிருந்தும் தேவையான தகவல்களையும் உத்திகளையும் வகுப்பதற்கான வழிமுறைகளை வருமானவரி தொழில்முறையாளர்களுக்கு காண… Read More »