Tag Archives: deep-learning

LLM-களின் கட்டமைப்பு மற்றும் செயல்பாடு : பகுதி 2

Large Language Models (LLMs) என்பவை மனித மொழியைப் புரிந்துகொண்டு, அதைப் பகுப்பாய்வு செய்து, உகந்த பதில்களை உருவாக்கும் திறன் கொண்ட செயற்கை நுண்ணறிவு (AI) மாடல்கள் ஆகும். இவை மிகப்பெரிய அளவிலான நியூரல் நெட்வொர்க்குகள் (Neural Networks)-ஆக வடிவமைக்கப்பட்டுள்ளன. இவை எவ்வாறு செயல்படுகின்றன என்பதைப் புரிந்துகொள்ள, LLM-களின் கட்டமைப்பு, பயிற்சி முறைகள், மற்றும் செயல்பாடுகள் பற்றி விரிவாகப் பார்ப்போம். 1. LLM-கள் எப்படி வேலை செய்கின்றன? Large Language Models (LLM-கள்) என்பவை மனித மொழியைப்… Read More »

AI ஒரு அறிமுகம் – பகுதி 2

முந்தைய பதிவில், NPC (Non-Player Character) உதாரணம் கொண்டு AI என்றால் என்ன?, அதன் செயல்பாடு, மற்றும் அதன் பயன்பாடுகள் பற்றிய அடிப்படை விளக்கங்களை பகிர்ந்திருந்தோம். இப்பதிவில் AI எப்போது தோன்றியது? அதன் வளர்ச்சி எந்த முக்கியமான காலக்கட்டங்களை கடந்து வந்தது? சில நேரங்களில் அதன் முன்னேற்றம் ஏன் தடைப்பட்டது, மற்றும் AI இன்று எந்த நிலைக்கு வளர்ந்துள்ளது என்பதை ஆராயப்போகிறோம். மனிதர்கள் பல நூற்றாண்டுகளாக எவ்வாறு நுண்ணறிவை வடிவமைக்கலாம் என்பதை ஆய்வு செய்து வந்தாலும், AI-யின்… Read More »

Large Language Models – ஒரு அறிமுகம்

Large Language Models (LLMs) என்றால் என்ன? மனிதர்கள் ஒரு உரையாடலில் ஈடுபடும் போது, அவர்கள் முன்பு பேசிய விஷயங்களை நினைவில் வைத்துக்கொள்கிறார்கள். உதாரணமாக, நீங்கள் ஒரு உணவகத்தில் உணவு ஆர்டர் செய்யும் போது, முதலில் “இந்த உணவகத்தில் 100 ரூபாய்க்குள் என்ன உணவு கிடைக்கும்?” என்று கேட்டால், உணவக ஊழியர் அதற்கேற்ப ஒரு பதில் கூறுவார். பின்னர் நீங்கள் “அதில் எதாவது காரமான உணவுகள் உள்ளதா?” என்று கேட்டால், அவர் உங்கள் முதல் கேள்வியையும் கருத்தில்… Read More »

NumPy அறிமுகம் – ARRAY ATTRIBUTES & ARRAY CREATION ROUTINES

1. NUMPY − ARRAY ATTRIBUTES 1.1. ndarray.shape shape attribute என்பது NumPy array-இன் அமைப்பை (structure) குறிக்கிறது. இது array-இல் எத்தனை rows மற்றும் columns உள்ளன என்பதை சொல்கிறது. எந்த ஒரு array-யும் கையாளும்போது, அதன் shape attribute மூலம் array-இன் பரிமாணங்களை (dimensions) அறிந்து கொள்ளலாம். shape attribute-ல் உள்ள values array-இல் உள்ள rows மற்றும் columns எண்ணிக்கையை தருகின்றன. Input: import numpy as np ​ arr… Read More »

Deep Learning – 18 – Reinforcement Learning

கணினிக்கோ அல்லது கணினியால் உருவாக்கப்பட்ட கருவிக்கோ ஒரு விஷயத்தை திரும்பத் திரும்பச் சொல்லிக் கொடுப்பதன் மூலம் அதனைப் பயிற்றுவிக்க முயலும் முறைக்கு ‘Reinforcement Learning’ என்று பெயர். சுயமாக ஓடக்கூடிய மகிழ் ஊர்தி(self-driving cars), கணினியோடு மக்களை விளையாடச் செய்யும் gaming industry போன்றவற்றில் ஒரு கருவிக்குத் திறம்பட பயிற்சி அளிக்க இத்தகைய முறை பயன்படுத்தப்படுகிறது. சமீபத்தில் உருவாக்கப்பட்ட ‘Deepmind’ என்பது இதற்கு ஒரு சிறந்த உதாரணம் ஆகும். இத்தகைய Reinforcement Learning எவ்வாறு நடைபெறுகிறது என்பது… Read More »

Deep Learning – 17 – Autoencoders

Autoencoder என்றால் தரவுகளைத் தானாகவே ஏதோ ஒரு முறையில் குறியிட்டு சுருக்கி அமைக்கக் கற்றுக் கொள்ளுகின்ற ஒரு விஷயம் என்று பொருள். எனவேதான் dimensionality reduction, feature representation போன்ற இடங்களில் இது பெரும்பங்கு வகிக்கிறது. Machine learning-க்கான அறிமுகக் கற்றலில் PCA-ஐப் பற்றிப் பார்த்தோம் அல்லவா, அதே வேலையைச் செய்வதற்காக நியூரல் நெட்வொர்கில் பயன்படுத்தப்படும் ஒரு விஷயமே autoencoder ஆகும். PCA என்பது நேர்கோடு முறையில் அமையும் தரவுகளின் dimension-ஐக் குறைக்கப் பயன்படுகிறதெனில் , Autoencoder… Read More »

Deep Learning – 16 – BM, RBM, DBN Networks

Boltzmann Machinesஎன்பதிலிருந்து உருவானதே Restricted boltzmann machines ஆகும். முதலில் Boltzmann Network என்றால் என்ன என்று பார்ப்போம். மாதிரித் தரவுகளில் உள்ள அதிகப்படியான features-ல் இருந்து நமக்கு வேண்டிய முக்கிய அம்சங்களை மட்டும் உருவாக்கும் வேலையை Boltzmann Machinesசெய்கிறது. இது வெறும் input மற்றும் hidden லேயரை மட்டும் பெற்று விளங்கும் நெட்வொர்க் ஆகும். மற்ற deep learning மாடலில் உள்ளது போன்று output லேயர் என்ற ஒன்று தனியாகக் கிடையாது. இந்த இரண்டு லேயரில்… Read More »

Deep Learning – 15 – RNN

சாதாரண நியூரல் நெட்வொர்கில் அடுத்தடுத்து வரும் இரண்டு உள்ளீட்டுத் தரவுகள் ஒன்றோடொன்று தொடர்பில்லாமல் இருக்கும். எடுத்துக்காட்டாக ஒரு வீட்டினுடைய சதுர அடி விவரத்தைப் பெற்றுக்கொண்டு அதன் விலையைக் கணிக்கும் சோதனையை எடுத்துக்கொண்டால் 400 சதுர அடி வீட்டிற்கு ஒரு விலையையும், 600 சதுர அடி வீட்டிற்கு ஒரு விலையையும் கணிக்கும். இந்த இரண்டும் ஒன்றோடொன்று தொடர்பில்லாத விவரங்கள். 600 சதுர அடிக்கான விலையைக் கணிக்க ஒரு நெட்வொர்க் இதற்கு முந்தைய 400 சதுர அடி வீட்டிற்கு என்ன… Read More »

Deep Learning – 14 – CNN

ஒரு database-ல் சேமிப்பதற்கு ஏற்ற வகையில் தரவுகளைக் கொண்ட அமைப்பிற்கு ‘Structured data’ என்று பெயர். இதுவரை நாம் பார்த்த அனைத்தும் ஒரு முறையான வடிவமைப்பைக் கொண்ட தரவுகளை நெட்வொர்குக்கு கொடுத்து எவ்வாறு பயிற்சி அளிப்பது என்று பார்த்தோம். இனிவரும் பகுதிகளில் ஒழுங்கற்ற தரவுகளுக்கான மாடல்களை எவ்வாறு உருவாக்குவது என்று பார்க்கலாம். அட்டவணை வடிவத்தில் அமையும் தரவுகள் ‘structured data’ என்றால், இவ்வடிவில் சேமிக்க இயலாத படங்கள், காணொளிகள் , உரை தரவுகள், குரல் கோப்புகள் (images,… Read More »

Deep Learning – 13 – Regularization and Optimization

deep neural network-ல் நாம் பயன்படுத்தியுள்ள மார்பகப் புற்றுநோய்க்கான எடுத்துக்காட்டையே இங்கும் பயன்படுத்தியுள்ளோம். கீழ்க்கண்ட இடங்களில் மட்டும் நிரல் சற்று வித்தியாசப்படுகிறது. 1. மாதிரித் தரவுகள் train_test_split மூலம் பிரிக்கப்பட்ட உடன், X_train-ல் உள்ள முதல் 2 features மட்டும் கணக்கிற்கு எடுத்துக் கொள்ளப்படுகிறது. பின்னர் இவ்விரண்டு தரவுகளும் non-linear எவ்வாறு முறையில் அமைந்துள்ளன என்பது வரைபடம் மூலம் வரைந்து காட்டப்பட்டுள்ளது. 2. hidden லேயரில் உள்ள ஒவ்வொரு node-ம் முந்தைய லேயரிலுள்ள node-லிருந்து வரும் மதிப்புடன்… Read More »