இன்றைய விரைவான எண்ம உலகில் புதிய தகவல் அமைப்புகளை விரைவாக உருவாக்க நிறுவனங்கள் குறைந்த குறிமுறைவரிகள்/குறிமுறைவரிகள் இல்லாத (LC/NC) பயன்பாடுகளைப் பயன்படுத்திகொள்கின்றன. அதற்காக நமக்கு கைகொடுக்க வருவதுதான் இந்த PyCaret ஆகும்
PyCaret என்பது R நிரலாக்க மொழியில் உருவாக்கப்பட்டCaretஇன் ( Classification And REgression Training என்பதன் சுருக்கமான பெயராகும்) பைதான் பதிப்பின் தொகுப்பாகும்
அதாவது PyCaret என்பது பைத்தானில் உள்ள திற மூல, குறைந்த-குறிமுறைவரிகளின் இயந்திர கற்றல் நூலகமாகும், இது இயந்திர கற்றல் பணிப்பாய்வுகளை தானியங்குபடுத்துகிறது. இது இரு முடிவுகளுக்குஇடைய (end-to-end )இயந்திர கற்றல் மாதிரி நிருவாக கருவியாக திகழ்கின்றது, இது சோதனை சுழற்சியை அதிவேகமாக விரைவுபடுத்துகிறது அதிக பணி செய்திடுமாறு தூண்டுகின்றது.மற்ற திறமூல இயந்திரகற்றல் நூலகங்களுடன் ஒப்பிடும்போது, இது ஒரு மாற்றான குறைந்த-குறிமுறைவரிகளின் நூலகமாக திகழ்கின்றது, நூற்றுக்கணக்கான குறிமுறை வரிகளுக்கு பதிலாக இதனுடைய சில வரிகளுடனான பயன்பாட்டினை குறிப்பி்ட்ட செயலை எளிதாக செயல்படுவதற்குப் பயன்படுத்தி கொள்ளலாம். இது சோதனைகளை அதிவிரைவாகவும் திறமையாகவும் ஆக்குகிறது. PyCaret என்பது cikit-learn, XGBoost, LightGBM, CatBoost, spaCy, Optuna, Hyperopt, Ray , இன்னும் இதுபோன்ற பல இயந்திர கற்றல் நூலகங்கள், கட்டமைப்புகளைச் சுற்றி ஒரு பைதான் உறையாக திகழ்கின்றது.
PyCaret இன் வடிவமைப்பும் எளிமையும் பொதுமக்கள் தரவு அறவியலார்கள் ஆகியோர்கள் தன்மீது கவணம் செலுத்திடுமாறு செய்கின்றது, மிகமுக்கியமாகஇது Gartner ஆல் முதலில் பயன்படுத்தப்பட்டது. தரவு அறிவியலார்களுக்கு, அதிக தொழில்நுட்ப நிபுணத்துவம் தேவைப்படும் முந்தைய நிலைககு பதிலாக தற்போது எளிய , அதிநவீன பகுப்பாய்வு பணிகளைச் செய்யக்கூடிய ஆற்றலை இது வழங்குகின்றது.
அதிகரித்த உற்பத்தித்திறன்: PyCaret, குறைந்த குறிமுறைவரிகளின் நூலகமாக இருப்பதால், அதிகஅளவு பயன்பாடுகளை உருவாக்கிடுமாறு செய்கிறது. இதன்உதவியுடன் நம்முடைய பயன்பாடுகளுக்கு தேவையான குறிமுறைவரிகளை எழுத மிகக்குறைவான நேரத்தை மட்டும் பயன்படுத்திடுவதால், நிரலாக்க குழுவும் இப்போது வணிகச் சிக்கல்களை தீர்வுசெய்வதற்காக அதிககவனம் செலுத்தலாம்.
பயன்படுத்த எளிதானது: இது எளிய ,பயன்படுத்த எளிதான இயந்திர கற்றல் நூலகமாக அமைந்துள்ளது, குறைவான குறிமுறை வரிகளுடன் இருமுடிவுகளுக்கு இடையில்(end-to-end)இயந்திரகற்றல் (ML) சோதனைகளைச் செய்ய நமக்கு உதவுகின்றது.
தாயர்நிலை வணிகம் : PyCaret என்பது வணிகநிறுவனங்களுக்கு உதவத் தயாராக இருக்கும் தீர்வாகும். notebook சூழலின் நம்முடைய விருப்பத்திலிருந்து முன்மாதிரிகளை விரைவாகவும் திறமையாகவும் செய்ய இது நம்மை அனுமதிக்கிறது. வணிக நிறுவனங்கள் இதன் துனையுடன் பைத்தானில் ஒரு மெய்நிகர் சூழலை உருவாக்கலாம் ,
மிக முக்கியமாக ஒரு இயந்திரக் கற்றல் பயிற்சியாளர் வகைப்பாடு, பின்னடைவு, கொத்து(clustering)ஒழுங்கின்மை கண்டறிதல், இயற்கை மொழி செயலாக்கம், ஒருங்கிணைப்பு விதிகள் நேரத் தொடர் பகுப்பாய்வு ஆகியவற்றைஇந்த PyCaret மூலம் செயற்படுத்தலாம்.
PyCaret முழுமையான பதிப்பை நிறுவுகைசெய்திட பின்வரும் கட்டளைவரியை இயக்கிடுக:
pip install pycaret [full
PyCaret உடன் வகைப்பாடு மாதிரி கட்டமைப்பு
PyCaret இன் தரவுக் களஞ்சியத்திலிருந்து Iris தரவுத் தொகுப்பை எடுத்து, PyCaret உடன் வகைப்படுத்தல் மாதிரியை உருவாக்குவதை பற்றி இப்போது அறிந்து கொள்வோம்.
Google Colab சூழலைப் பயன்படுத்தி செயல்களை எளிமையாக்குவதற்காக பின்வரும் படிமுறைகளைப் பின்பற்றிடுக.
படிமுறை 1: முதலில்,பின்வரும் கட்டளைவரியுடன் PyCaret ஐ நிறுவுகைசெய்திடுக:
pipinstallpycaret
படிமுறை2:அடுத்து,படம் 1இல் குறிப்பிட்டுள்ளபடி தரவு தொகுப்பை பதிவேற்றிடுக:
படம் 1.தரவுதொகுப்பைபதிவேற்றுதல்
From pycaret.datasetsimportget_data
dataset=get_data(‘iris’)
(or)
import pandas as pd
dataset = pd.read_csv(/path_to_data/file.csv’)
படிமுறை3:இப்போது படம்2 இல்காண்பித்துள்ளவாறு,PyCaret சூழலை அமைத்திடுக:
படம் 2 .PyCaret சூழல் அமைவு
frompycaret.classificationimport*
clf1=setup (data=dataset,target=‘species’)
படம் 3: PyCaret சூழல் அமைவின்முடிவு
PyCaret உடன் எந்த வகையான மாதிரி கட்டமைவிற்கும், சுற்றுச்சூழல் அமைப்பு மிக முக்கியமான படிமுறையாகும். முன்னிருப்பாக, setup () எனும் செயலி தரவை எடுக்கின்றது: Pandas DataFrame , இலக்கு, இது தரவுத் தொகுப்பில் உள்ள label இன் மாறியை சுட்டிக்காட்டுகிறது. அமைவு செயலியின் முடிவு படம் 3 இல் காண்பிக்கப்பட்டுள்ளது. அமைவு செயலியானது, இயல்பாக, 70 சதவீத தரவை தொடர்நிலை தொகுப்பாகவும், 30 சதவீததரவை சோதனைத் தொகுப்பாகவும் பிரித்து, படம் 3 இல் காட்டப்பட்டுள்ளபடி தரவு முன் செயலாக்கத்தை செய்கிறது.
படிமுறை4: அடுத்து, படம் 4 இல் காண்பித்துள்ளவாறு சிறந்த மாதிரியைக் கண்டறிந்திடுக:
படம் 4.சிறந்த மாதிரியை தேடிகண்டுபிடித்தல்
அதற்கான கட்டளைவரி பின்வருமாறு
best=compare_models()
compare_models(), முன்னிருப்பாக, பத்து மடங்கு குறுக்கு சரிபார்ப்பைப் பயன்படுத்துகிறது , படம் 4 இல் காண்பித்துள்ளவாறு, குறைவான பயிற்சி நேரங்களைக் கொண்ட வெவ்வேறு வகைப்படுத்திகளுக்கானதுல்லியம், AUC, திரும்ப அழைத்தலிற்கான துல்லியம், F1 மதிப்பெண், Kappa, MCC போன்ற வெவ்வேறு செயல்திறன் அளவீடுகளைக் கணக்கிடுகிறது.
tubro=True to compare_models()
எனும் செயலியானது அனைத்து வகைப்படுத்திகளையும் முயற்சித்திட அனுமதிக்கின்றது.
படிமுறை 5: இப்போது படம் 5 இல் காண்பித்துள்ள மாதிரியை உருவாக்கிடுக:
படம் 5 .மாதிரியை உருவாக்குதல்
அதற்கான கட்டளைவரி பின்வருமாறு
lda_model=create_model (‘lda’)
படம் 4 இல் காண்பித்துள்ளவாறு, நேரியல் பாரபட்சமற்ற பகுப்பாய்வு வகைபடுத்தியானது( Linear Discriminant Analysis classifier) நன்றாகச் செயல்படுகிறது. எனவே create_model() செயல்பாட்டிற்கு ‘lda’ ஐ அனுப்புவதன் மூலம், நாம் முன்மாதிரியைப் பொருத்தலாம்.
படிமுறை 6: படம் 6 இல் காண்பித்துள்ளவாறு முன்மாதிரியை நன்றாக மாற்றுவது அடுத்த படிமுறையாகும்.
படம் 6.மாதிரியை ஒத்திசைத்தல்
அதற்கான கட்டளைவரி பின்வருமாறு
tuned_lda=tune_model(lda_model)
மீப்பெரும் அளவுருக்களின் ஒத்திசைவு மாதிரி துல்லியத்தை மேம்படுத்தலாம். படம் 7 இல் காண்பித்துள்ளவாறு, tune_model() செயலியானது நேரியல் பாரபட்சமற்ற பகுப்பாய்வு மாதிரி துல்லியத்தை 0.9818 முதல் 0.9909 வரை மேம்படுத்திடுகின்றது.
படம் 7.ஒத்திசைவு செய்யப்பட்ட மாதிரி விவரங்கள்
படிமுறை7: படம் 8 இல் காண்பித்துள்ளவாறு, அடுத்த கட்டமாக கணிப்புகளைச் செய்திடுக:
படம் 8.ஒத்திசைவு மாதிரைய பயன்படுத்தி கணிப்பது
அதற்கான கட்டளைவரி பின்வருமாறு
predictions=predict_model(tuned_lda)
சோதனைத் தரவில் இருக்கும் மாதிரிகளின் கணிப்புகளைச் செய்வதற்கு, predict_model() எனும் செயலி பயன்படுத்திகொள்ளப்படுகிறது.
படிமுறை 8: இப்போது படம் 9 இல் காண்பித்துள்ளவாறு மாதிரி செயல்திறனைத் திட்டமிடுக:
படம் 9.மாதிரி செயல்திறனை மதிப்பீடு செய்தலும் திட்டமிடுதலும்
அதற்கான கட்டளைவரி பின்வருமாறு
evaluate_model(tuned_lda)
இதில் evaluate_model () எனும் செயலியானது குறைந்தபட்ச முயற்சியுடன் வெவ்வேறு செயல்திறன் அளவீடுகளை உருவாக்க பயன்படுகிறது. வெளியீட்டைக் காண அவற்றை முயற்சித்திடுக.
இந்த கருவி குறித்து மேலும் விவரம் அறிந்து கொள்ளவும் பதிவிறக்கம் செய்து பயன்படுத்தி கொள்ளவும் pycaret.org/ எனும் இதனுடைய இணையதளமுகவரிக்கு செல்க