நம்முடையசொந்த செய்யறிவை(AI) உருவாக்குதல் தொடர்- பகுதி 2- செய்யறிவின்(AI)/இயந்திர கற்றலின்(ML) மேம்பாட்டிற்கான சூழலை அமைத்தல்

செய்யறிவையும்(AI) , இயந்திர கற்றலையும்(ML) தொடங்குவதற்கு நன்கு தயாரிக்கப்பட்ட மேம்பாட்டு சூழல் தேவையாகும். செய்யறிவின்(AI)/இயந்திர கற்றலின்(ML) பயணத்திற்குத் தேவையான கருவிகளையும் நூலகங்களையும் அமைப்பற்கான வழிமுறையை இந்தக் கட்டுரை காண்பிக்கும், இது தொடக்கநிலையாளர்களுக்கு ஒரு சீரான தொடக்கத்தை உறுதி செய்யும். சிக்கலான வளாக அமைப்புகளைத் தவிர்க்க விரும்புவோருக்கு Google Colab போன்ற இணைய தளங்களைப் பற்றியும் விவாதிப்போம்.
செய்யறிவின்(AI)/இயந்திர கற்றலின்(ML) மேம்பாட்டிற்கான கணினித் தேவைகள்
செய்யறிவு(AI) , இயந்திர கற்றல்(ML) ஆகிய செயல்திட்டங்களில் மூழ்குவதற்கு முன், நம்முடைய கணினியானது எவ்வளவு கணக்கீட்டு கோரிக்கைகளைக் கையாள முடியும் என்பதை உறுதி செய்வது அவசியாகும். பெரும்பாலான அடிப்படை பணிகள் செந்திரமான இயந்திரங்களில் இயங்க முடியும் என்றாலும், மேம்பட்ட செயல்திட்டங்களுக்கு (ஆழ்கற்றல் போன்றவை) சிறந்த வன்பொருள் தேவைப்படலாம். செயல்திட்டத்தின் சிக்கலான தன்மையின் அடிப்படையில் கணினியின் தேவைகளின் விளக்கம் பின்வருமாறு:
1. தொடக்கநிலையாளர்களுக்கு: சிறிய செயல்திட்டங்கள், கற்றல்
இயக்க முறைமை: விண்டோஸ் 10/11, macOS அல்லது எந்த நவீன லினக்ஸ் விநியோகமும்.
செயலி: இரட்டை கோர் CPU (Intel i5 அல்லது AMD சமமானது).
RAM: 8 GB (குறைந்தபட்சம்); மென்மையான பல்பணிக்கு 16 GB பரிந்துரைக்கப்படுகிறது.
சேமிப்பகம்:பைதான், நூலகங்கள் , சிறிய தரவுத்தொகுப்புகளுக்கு 20 ஜிபி காலியான நினைகஇடம்.
வேகமான செயல்திறனுக்கு ஒரு SSDதேவையென மிகவும் பரிந்துரைக்கப்படுகிறது.
GPU (வரைகலைஅட்டை): தேவையில்லை; அடிப்படை இயந்திர கற்றல்(ML) பணிகளுக்கு CPU போதுமானது.
இணைய இணைப்பு: நூலகங்கள், தரவுத்தொகுப்புகளைப் பதிவிறக்குவதற்கும் மேககணினியின் தளங்களைப் பயன்படுத்துவதற்கும் தேவையாகும்.
2. இடைநிலை செயல்திட்டங்களுக்கு: பெரிய தரவுத்தொகுப்புகள்
செயலி: குவாட்-கோர் CPU (Intel i7 அல்லது AMD Ryzen 5 சமமானது).
RAM: குறைந்தபட்சம் 16 GB; பெரிய தரவுத்தொகுப்புகளுக்கு 32 GB பரிந்துரைக்கப்படுகிறது.
சேமிப்பகம்:தரவுத்தொகுப்புகளுக்கும் சோதனைகளுக்கும் 50–100 GB அளவிற்கான காலியான கட்டணமற்ற நினைவக இடம் தேவையாகும்.
விரைவான தரவினை பதிவேற்றுதலுக்கும் செயலிகளுக்கும் SSD.GPU:
குறைந்தது 4GB VRAM (எ.கா. NVIDIA GTX 1650 அல்லது AMD Radeon RX 550) கொண்ட தனிப்பட்ட GPU தேவையாகும்.பெரிய மாதிரிகளைப் பயிற்றுவிப்பதற்கு அல்லது நரம்பியல் போன்ற வலைபின்னல்களுடன் பரிசோதனை செய்வதற்கு பயனுள்ளதாக இருக்கும்.
காட்சி: மாதிரி பிழைத்திருத்தம், காட்சிப்படுத்தலின் போது இரட்டை கணினிதிரைகள் உற்பத்தித்திறனை மேம்படுத்தலாம்.
3. மேம்பட்ட செயல்திட்டங்களுக்கு: ஆழ்கற்றல் , பெரிய மாதிரிகள்
செயலி: உயர் செயல்திறன் கொண்ட CPU (Intel i9 அல்லது AMD Ryzen 7/9).
RAM: நினைவகம் சார்ந்த செயலிகளை , பெரிய தரவுத்தொகுப்புகளைக் கையாள 32–64 GB தேவையாகும்.
சேமிப்பகம்: 1 TB அல்லது அதற்கு மேற்பட்டவை (SSD கடுமையாக பரிந்துரைக்கப்படுகிறது). தரவுத்தொகுப்புகளுக்கு வெளிப்புற சேமிப்பகம் தேவைப்படலாம்.
GPU: CUDA ஆதரவு காரணமாக NVIDIA GPUகள் ஆழ்கற்றலுக்கு விரும்பப்படுகின்றன.
பரிந்துரைக்கப்படுபவை: NVIDIA RTX 3060 (12 GB VRAM) அல்லது அதற்கு மேற்பட்டவை (எ.கா., RTX 3090, RTX 4090).
பட்ஜெட் விருப்பங்களுக்கு: NVIDIA RTX 2060 அல்லது RTX 2070.
குளிர்வித்தலும் மின்சாரமும்: குறிப்பாக நீண்ட பயிற்சி அமர்வுகளின் போது, ​​GPUகளுக்கு சரியான குளிர்ச்சியை உறுதி செய்திடுக.வன்பொருளை ஆதரிக்க தொடர்ச்சியான மின்சாரம் தேவையாகும்.
4. மேககணினி தளங்கள்: நம்முடைய கணினியின் அமைவு குறைவாக இருந்தால்
நம்முடைய கணினியின் அமைவு மேலே உள்ள விவரக்குறிப்புகளை பூர்த்தி செய்யவில்லை எனில் அல்லது நமக்கு அதிக கணக்கீட்டு சக்தி தேவைப்பட்டால், மேககணினியின் தளங்களைப் பயன்படுத்துவதைக் கருத்தில் கொள்க:
Google Colab: GPUகளுக்கான அணுகலுடன் கட்டணமற்றது (நீண்ட இயக்க நேரம் , சிறந்த GPUகளுக்கு Colab Pro விற்கு மேம்படுத்தலாம்).
AWS EC2 அல்லது SageMaker: பெரிய அளவிலான இயந்திர கற்றல்(ML) செயல்திட்டங்களுக்கான உயர் செயல்திறன் நிகழ்வுகள்.
Azure MLதளம் அல்லது GCPAI தளம்: நிறுவன அளவிலான செயல்திட்டங்களுக்கு ஏற்றது.
Kaggle Kernels: சிறிய தரவுத்தொகுப்புகளுடன் சோதனைகளுக்கு கட்டணமற்றது.
பயன்பாட்டு சூழலின் அடிப்படையில் பரிந்துரைக்கப்பட்ட அமைப்பு.
பயன்படுத்திடுகின்ற தேவைக்கேற்ப பரிந்துரைக்கப்படும் அமைவுகள்

பயன்படுத்திடுகின்ற தேவை

CPU RAM GPU சேமிப்பகம்(Storage)
தொடக்கநிலையாளர்களுக்கு: சிறிய செயல் திட்டங்கள், கற்றல் Dual-Core i5 8–16 GB None/Integrated 20–50 GB
இடைநிலை செயல்திட்டங்களுக்கு: பெரிய தரவுத் தொகுப்புகள் Quad-Core i7 16–32 GB GTX 1650+ (4 GB) 50–100 GB
மேம்பட்ட செயல் திட்டங்களுக்கு: ஆழகற்றல் , பெரிய மாதிரிகள் High-End i9/Ryzen 9 32–64 GB RTX 3060+ (12 GB) 1 TB+ SSD
மேககணினி தளங்கள்: நம்முடைய கணினியின் அமைவு குறைவாக இருந்தால் வளாகத்தில் தேவையில்லை தேவையில்லை மேககணினியின் GPUs (e.g., T4, V100) தேவையில்லை

படிமுறை 1: பைத்தானை நிறுவுகைசெய்தல்
பைதான் ஆனது அதன் எளிமை , நூலகங்களின் பரந்தசூழல் அமைப்பு ஆகியவற்றின் காரணமாக செய்யறிவு(AI)/இயந்திர கற்றல்(ML) இற்கான செல்லுபடியாகின்ற கணினிமொழியாகும். இதை எவ்வாறு நிறுவுகை செய்வது என்பதற்கான விவரம் பின்வருமாறு:
பைத்தானைப் பதிவிறக்கம்செய்திடுக:
python.org எனும் இணையதளத்தினைப் பார்வையிட்டு சமீபத்திய செந்தரமான பதிப்பைப் பதிவிறக்கம் செய்திடுக (முன்னுரிமை பைதான் 3.9 அல்லது அதற்குப் பிறகான பதிப்பு).
பைத்தானை நிறுவுகைசெய்திடுக:
நம்முடைய இயக்க முறைமைக்கான (விண்டோ, மேக் அல்லது லினக்ஸ்) நிறுவுகை செய்வதற்கான படிமுறைகளைப் பின்பற்றிடுக.
நிறுவுகைசெய்தலின் போது PATH இல் பைத்தானைச் சேர்க்கின்ற வாய்ப்பினைச் சரிபார்த்திடுக.
நிறுவுகைசெயலையும் அதன் பதிப்பையும் சரிபார்த்திடுக:
ஒரு முனைமத்தைத் திறந்து பின்வருமாறு தட்டச்சு செய்திடுக:
python –version
இப்போது பைத்தானின் நிறுவுகைசெய்யப்பட்ட பதிப்பின் விவரங்களைக்காணலாம்.
படிமுறை 2: மெய்நிகர் சூழலை அமைத்தல்
நம்முடைய செயல்திட்டங்களை ஒழுங்கமைத்து வைத்திருக்கவும் சார்பு மோதல்களைத் தவிர்க்கவும், மெய்நிகர் சூழலைப் பயன்படுத்துவது நல்லது.
மெய்நிகர் சூழலை உருவாக்கிடுதலிற்கான கட்டளைவரி பின்வருமாறு:
python -m venv env
மெய்நிகர் சூழலை செயல்படுத்துதல்:
விண்டோவில்அதற்கான கட்டளைவரி பின்வருமாறு:
.\env\Scripts\activate
macOS/Linux இல்அதற்கான கட்டளைவரி பின்வருமாறு:
source env/bin/activate
இந்தச்சூழலுக்குள் செயல்படுமாறான நூலகங்களை நிறுவுகைசெய்தல்: ஏனேனில் இதனை செயல்படுத்திய பிறகு, நிறுவுகைசெய்யப்பட்ட எந்த நூலகமும் இந்த சூழலுக்கென தனிமைப்படுத்தப்படும்.
படிமுறை 3: அத்தியாவசிய நூலகங்களை நிறுவுகைசெய்தல்
பைதான் தயாரானதும், செய்யறிவிற்கு(AI)/இயந்திர கற்றலிற்கு(ML) அவசியமான பின்வரும் நூலகங்களை நிறுவுகைசெய்திடுக:
எண் கணக்கீடுகளுக்கான NumPyஎன்பதை பின்வருமாறான கட்டளைவரியுடன்: .
pip install numpy
தரவினை கையாளுதலிற்கும் பகுப்பாய்விற்குமான.pandasஎன்பதை பின்வருமாறான கட்டளைவரியுடன்:
pip install pandas
தரவு காட்சிப்படுத்தலுக்கான Matplotlib , Seaborn என்பவைகளை பின்வருமாறான கட்டளைவரியுடன்: .
pip install matplotlib seaborn
அடிப்படை இயந்திர கற்றல்(ML) வழிமுறைகளுக்கும் கருவிகளுக்குமான scikit-learnஎன்பதை பின்வருமாறான கட்டளைவரியுடன்:
pip install scikit-learn
ஆழ் கற்றலிற்கான TensorFlow/PyTorchஎன்பதை பின்வருமாறான கட்டளைவரியுடன்:
pip install tensorflow
அல்லது
pip install torch torchvision
குறிமுறைவரிகளுக்கும் காட்சிப்படுத்தலுக்குமான ஒரு ஊடாடும் சூழலிற்காக.Jupyter Notebookஎன்பதை பின்வருமாறான கட்டளைவரியுடன்:
pip install notebook
படிமுறை 4: Jupyter Notebooks ஐ ஆய்வுசெய்தல்
Jupyter Notebooks ஆனது குறிமுறைவரிகளை எழுதவும் பரிசோதிக்கவும் ஒரு ஊடாடும் வழியை வழங்குகின்றன, அவை செய்யறிவினை(AI)/இயந்திர கற்றலை(ML) கற்க சரியானதாக அமைகின்றன.
Jupyter Notebook ஐ செயல்படுத்திடத் தொடங்கிடுக:
jupyter notebook ஆனது நம்முடைய உலாவியில் ஒரு வலை இடைமுகத்தைத் திறக்கின்றது.
பின்வருமாறு வாய்ப்புகளைசெயற்படுத்தி ஒரு புதிய Notebookஐ உருவாக்கிடுக :
New > Python 3 Notebook என்றவாறு வாய்ப்புகளை தெரிவுசெய்து சொடுக்குதல் செய்துகுறிமுறைவரிகளைத் தொடங்கிடுக!
படிமுறை 5: Google Colab ஐ அமைத்தல் (விரும்பினால்)
கணினியின் வளாக சூழலை அமைக்க விரும்பாதவர்களுக்கு, Google Colab ஒரு சிறந்த மாற்றாகும். இது கட்டணமற்றதாகும் இதுசெய்யறிவு(AI) மாதிரிகளைப் பயிற்றுவிப்பதற்கான சக்திவாய்ந்த GPUகளை வழங்குகிறது.
Google Colab ஐப் பார்வையிடுக:
அதற்காக colab.research.google.com எனும் இணையதளமுகவரிக்குச் செல்க.
ஒரு New Notebook உருவாக்கிடுக:
இதனைதொடங்க New Notebook என்பதை தெரிவுசெய்து சொடுக்குக.
நூலகங்களை நிறுவுகைசெய்திடுக (தேவைப்பட்டால்):
NumPy,pandas போன்ற நூலகங்கள் முன்பே நிறுவப்பட்டவை, ஆனால் இவற்றைப் பயன்படுத்தி மற்றவற்றை பின்வருமாறான கட்டளைவரியுடன் நிறுவுகை செய்திடலாம்:
!pip install library-name
படிமுறை 6: அமைப்பை பரிசோதித்தல்
அனைத்தும் சரியாக செயல்படுகிறதா என்பதை உறுதிப்படுத்த, Jupyter Notebook அல்லது Colab இல் பின்வருமாறான எளிய பரிசோதனையை இயக்கிடுக:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

NumPyஐ பரிசோதித்தல்

array = np.array([1, 2, 3])
print(f”NumPy Array: {array}”)
#pandasஐ பரிசோதித்தல்
data = pd.DataFrame({‘A’: [1, 2], ‘B’: [3, 4]})
print(f”\nPandas DataFrame:\n{data}”)

Matplotlibஐ பரிசோதித்தல்

plt.plot([1, 2, 3], [4, 5, 6])
plt.title(“Matplotlib Test”)
plt.show()

பொதுவான பிழைகளும் தீர்வுகளும்
Library Not Found:
செயலில் உள்ள மெய்நிகர் சூழலில் நூலகத்தை நிறுவுகைசெயதுள்ளோம் என்பதை உறுதிப்படுத்திகொள்க.
Python Not Recognized:
கணினியில்அமைவின் PATHஇல் பைதான் சேர்க்கப்பட்டுள்ளதா என்பதைச் சரிபார்த்திடுக.
Jupyter Notebook சிக்கல்கள்: Jupyter ஐ சரியான சூழலில் நிறுவிகைசெய்துள்ளோம் என்பதை உறுதிப்படுத்திகொள்க. ——- —–தொடரும்