இயந்திர கற்றல்( ML ) என்பது ஒரு பரந்த மிக விரைவாக வளர்ந்து வருகின்ற துறையாகும், மேலும் இந்த கட்டுரை புதியதாக இந்த துறையில் நுழை பவர்கள் பாரம்பரிய நிரலாக்கத்திற்கும் ML க்கும் இடையிலான வேறுபாடுகளைப் புரிந்துகொள்வது முதல் பல்வேறு வகையான இயந்திர கற்றல் வழிமுறைகளை ஆராய்வது வரை இயந்திரக் கற்றலின் அடிப்படைக் கருத்தமைவுகளை இந்த கட்டுரையில் தெரிந்துகொள்ளமுடியும்.
இயந்திர கற்றல் (ML) என்பது செயற்கை நுண்ணறிவின் (AI) மாற்றுத் துறையாகும், இது வெளிப்படையாக நிரலாக்கம் செய்யப்படாமல் அனுபவத்திலிருந்து கற்றுக் கொள்ளவும் மேம்படுத்தவும் கணினிகளுக்கு திறனை அளிக்கிறது. பாரம்பரிய நிரலாக்கத்தைப் போலன்றி, ஒரு பணியைச் செய்ய குறிப்பிட்ட அறிவுறுத்தல்கள் வழங்கப்படுகின்றன, MLஇன் தருக்கங்கள் அமைவுகளை தானாக வடிவங்களைக் கற்றுக்கொள்வதற்கும் தரவின் அடிப்படையில் அறிவார்ந்த முடிவுகளை எடுப்பதற்கும் உதவுகிறது.
இயந்திரக் கற்றலின் முக்கியத்துவம் பல தொழில்களில் பரவி, சிக்கலைத் தீர்ப்பதற்கும் முடிவெடுப்பதற்கும் நாம் அணுகும் முறையை மாற்றுகிறது. பின்வரும் நடப்பு உலக எடுத்துக்காட்டுகளைக் கவனித்திடுக.
சுகாதாரம்- மருத்துவlத்திற்கான நோயறிதல்: MLஇன் தருக்கங்கள் நோயாளியின் தரவை பகுப்பாய்வு செய்து புற்றுநோய் போன்ற நோய்களைக் கண்டறிவதற்கும் நோயாளிக்கு ஏற்படவிருக்கின்ற விளைவுகளை முன்னறிவிப்பதற்கும் உதவுகின்றன.
சுகாதாரம்-மருந்து கண்டுபிடிப்பு: புதிய மருந்துகளுக்கு தேவையான மூலக்கூறுகளை அடையாளம் காண்பதன் மூலம் ML ஆனது மருந்து கண்டுபிடிப்பு செயல்முறையை துரிதப்படுத்துகிறது.
நிதி- மோசடி கண்டறிதல்: ML மாதிரிகள் அசாதாரண வடிவங்களைக் கண்டறிந்து நிதி பரிமாற்றங்களில் மோசடி நடவடிக்கைகளைக் கண்டறிந்து, ஏற்புகைசெய்யப்படாத பரிமாற்றங்களுக்கு எதிராகப் பாதுகாக்கின்றன.
நிதி-பங்குச் சந்தை முன்கணிப்பு: முன்கணிப்பு மாதிரிகள் பங்கு விலைகளை முன்னறிவிப்பதற்கும் முதலீட்டு உத்திகளை மேம்படுத்துவதற்கும் வரலாற்றுத் தரவை பகுப்பாய்வு செய்கின்றன.
சந்தைப்படுத்தல்- பரிந்துரை அமைப்புகள்: நெட்ஃபிக்ஸ் , அமேசான் போன்ற தளங்களில் ML இன் தருக்கங்கள் ஆற்றல் பரிந்துரை இயந்திரங்கள், பயனர் விருப்பங்களின் அடிப்படையில் தனிப்பயனாக்கப்பட்ட பரிந்துரைகளை வழங்குகிறது.
சந்தைப்படுத்தல்-வாடிக்கையாளர் பிரிவு: வணிகநிறுவனங்கள் ML ஐப் பயன்படுத்தி நடத்தை அடிப்படையில் வாடிக்கையாளர்களைப் பிரித்து, இலக்கு சந்தைப்படுத்தல் பிரச்சாரங்களைச் செயல்படுத்துகின்றன.
தொழில்நுட்பம்- பேச்சு ஏற்புகை: Siri , Google Assistant போன்ற மெய்நிகர் உதவியாளர்கள் துல்லியமான பேச்சு ஏற்புகைக்கும், இயல்பான மொழி செயலாக்கத்திற்கும் ML ஐப் பயன்படுத்துகின்றனர்.
தொழில்நுட்பம்- உருவப்பட ஏற்புகை: ML ஆனது உருவப்படங்களில் உள்ள பொருட்களை, வடிவங்களை அடையாளம் காண அமைவுகளை செயல்படுத்துகிறது, முகத்தோற்ற ஏற்புகைமானது தொழில்நுட்பம், பாதுகாப்பு அமைப்புகளுக்கு அதிகபங்களிக்கிறது.
இயந்திர கற்றலின் அடிப்படைகளைப் புரிந்துகொள்க
பாரம்பரிய நிரலாக்கமும் இயந்திர கற்றலும்: பாரம்பரிய நிரலாக்கமானது ஒரு பணியைச் செய்வதற்கான வெளிப்படையான வழிமுறைகளை உள்ளடக்கியது, இதில் மேம்படுத்துநர்களின் கணினியில் பின்பற்றவேண்டிய விதிகளையும், தருக்கத்தையும் வரையறுக்கின்றனர். இதற்கு நேர்மாறாக, இயந்திரக் கற்றல் ஆனது வழிமுறைகளை மட்டுமே நம்பியுள்ளது, இது கணினிகளை வெளிப்படையாக நிரலாக்கம் செய்திடாமல் கற்கவும் மாற்றியமைக்கவும் அனுமதிக்கிறது. விதிகள் சிக்கலானதாகவோ அல்லது தெரியாததாகவோ இருக்கின்ற பணிகளுக்கு இந்த தகவமைப்புத் தன்மை MLஐ மிகவும் பொருத்தமானதாக ஆக்குகிறது.
ML இல் தரவின் பங்கு: இயந்திர கற்றலின் மையத்தில் தரவு உள்ளது. MLஇன் தருக்கங்கள் வரலாற்றுத் தரவுகளிலிருந்து கற்றுக்கொள்கின்றன, கணிப்புகள் அல்லது முடிவுகளை எடுப்பதற்கான வடிவங்களையும் உறவுகளையும் அடையாளம் காணும். தரவின் தரம் , அளவு ML மாதிரிகளின் செயல்திறனை நேரடியாக பாதிக்கிறது, பயனுள்ள இயந்திர கற்றல் பயன்பாடுகளுக்கான தரவை சேகரித்தல், சுத்தம் செய்தல் தயாரிப்பதன் முக்கியத்துவத்தை எடுத்துக்காட்டுகிறது.
இயந்திர கற்றலின் வகைகள்
6.1.மேற்பார்வையிடப்பட்ட கற்றல் மேற்பார்வையிடப்பட்ட கற்றல் என்பது முகவரியிடப்பட்ட தரவுத்தொகுப்பில் ஒரு மாதிரியைப் பயிற்றுவிப்பதை உள்ளடக்கியது, அங்கு தருக்கஉள்ளீட்டு வசதிகள் , தொடர்புடைய வெளியீட்டு முகவரிகளுக்கு இடையேயான தொடர்பைக் கற்றுக்கொள்கிறது. பொதுவான எடுத்துக்காட்டுகள் பின்வருமாறு:
உருவப்பட வகைப்பாடு: உருவப்படங்களில் உள்ள பொருட்களை அடையாளம் காணுதல்.
நச்சுமின்னஞ்சல்களை கண்டறிதல்: நச்சுகள் அல்லாத மின்னஞ்சல்களை வேறுபடுத்துதல்.
இது எவ்வாறு செயல்படுகிறது: பயிற்சியின் போது, முன்னறிவிக்கப்பட்ட உண்மையான முகவரிகளுக்கு இடையிலான வேறுபாட்டைக் குறைக்க தருக்கமானது அதன் அளவுருக்களை சரிசெய்கிறது. பயிற்சியளிக்கப்பட்ட மாதிரியானது கண்ணால் காணாத தரவுகளில் கணிப்புகளைச் செய்ய முடியும்.
6.2.மேற்பார்வை செய்யப்படாத கற்றல்: இது முன் வரையறுக்கப்பட்ட வெளியீடுகள் இல்லாமல் வடிவங்களை அல்லது உறவுகளைக் கண்டறிவதை நோக்கமாகக் கொண்டு, பெயரிடப்படாத தரவுகளைக் கையாளுகிறது. எடுத்துக்காட்டுகள் பின்வருமாறு:
தொகுப்பாக்கம்: ஒத்த தரவு புள்ளிகளை ஒன்றாக தொகுத்தல்.
பரிமாணக் குறைப்பு: சிக்கலான தரவுத்தொகுப்புகளை எளிதாக்குதல், அத்தியாவசியத் தகவலைத் தக்கவைத்தல்.
இது எவ்வாறு இயங்குகிறது: மேற்பார்வை செய்யப்படாத கற்றலில் உள்ள தருக்கங்கள் தரவுக்குள் உள்ள உள்ளார்ந்த கட்டமைப்பை ஆய்வுசெய்கின்றன, வெளிப்படையான வழிகாட்டுதல் இல்லாமல் மறைக்கப்பட்ட வடிவங்களை அல்லது உறவுகளை வெளிப்படுத்துகின்றன.
6.3.வலுவூட்டலுடனான கற்றல்: இது பரிசோதனையின், பிழையின் மூலம் ஒரு முகவரின் கற்றல், வெகுமதிகள் அல்லது அபராதங்கள் வடிவில் கருத்துக்களைப் பெறுகிறது. எடுத்துக்காட்டுகள் பின்வருமாறு:
விளையாட்டுகளை விளையாடும் AI: விளையாட்டுகளை விளையாடுவதன் மூலம் உகந்த உத்திகளைக் கற்றுக்கொள்கின்றது.
இயந்திரமனிதக் கட்டுப்பாடு: தொடர்ச்சியான பின்னூட்டம் மூலம் இயந்தர மனிதர்களுக்கு பணிகளைச் செய்யக் கற்பித்தல் செய்யப்படுகின்றது.
இது எவ்வாறு செயல்படுகிறது: முகவர் ஒரு சூழலில் நடவடிக்கைகளை மேற்கொள்கிறார், கருத்துக்களைப் பெறுகிறார் காலப்போக்கில் ஒட்டுமொத்த வெகுமதிகளை அதிகரிக்க அதன் உத்தியை சரிசெய்கிறார்.
இயந்திர கற்றலில் முக்கிய கருத்தமைவுக்கள்
வசதிகள் , முகவரிகள்: இயந்திர கற்றலின் சூழலில், வசதிகள் என்பது தரவுகளின் அளவிடக்கூடிய பண்புகள் அல்லது பொதுவானபண்புகள் ஆகும். எடுத்துக்காட்டாக, ஒரு உருவப்படத்தை அடையாளம் காணும் பணியில், வசதிகளில் புள்ளிகளில் மதிப்புகள், வண்ணங்கள் , வடிவங்கள் இருக்கலாம். பொருத்தமான வசதிகளைத் தேர்ந்தெடுப்பது மிகவும் முக்கியமாகும், ஏனெனில் அவை மாதிரியின் கற்கும், துல்லியமான கணிப்புகளைச் செய்யும் திறனை நேரடியாக பாதிக்கின்றன.
முகவரிகளின்/இலக்குகளின் விளக்கம்: இலக்குகள் அல்லது வெளியீடுகள் என்றும் அறியப்படும் முகவரிகள், கற்றல் செயல்முறையின் விரும்பிய முடிவைக் குறிக்கும். கண்காணிக்கப்படும் கற்றல் சூழ்நிலையில், உள்ளீட்டு வசதிகளின் அடிப்படையில் இந்த முகவரிகளைக் கணிப்பதை தருக்கம் நோக்கமாகக் கொண்டுள்ளது. எடுத்துக்காட்டாக, நச்சுமின்னஞ்சல்களை கண்டறிதல் மாதிரியில், மின்னஞ்சல் நிச்சுநிரலாக உள்ளதா இல்லையா என்பதை முகவரிகள் குறிக்கின்றன.
பயிற்சி தரவும் பரிசோதனை தரவும்
தரவைப் பிரிப்பதன் முக்கியத்துவம்: இயந்திரக் கற்றல் மாதிரியின் செயல்திறனை மதிப்பிடுவதற்கு, கிடைக்கும் தரவை பயிற்சித் தரவு பரிசோதனைத் தரவு என இரண்டு தொகுப்புகளாகப் பிரிப்பது அவசியம். மாதிரியானது பயிற்சித் தரவிலிருந்து வடிவங்களைக் கற்றுக்கொள்கிறது, மேலும் பரிசோதனைத் தரவு, காணப்படாத புதிய எடுத்துக்காட்டுகளுக்கு பொதுமைப்படுத்துவதற்கான அதன் திறனை மதிப்பிடுகிறது. இந்த பிரிவுஆனது மாதிரியின் செயல்திறனின் நியாயமான மதிப்பீட்டை உறுதி செய்கிறது.
அதிகபொருத்தமும் பொருத்தமற்றதும்: ML -ல் உள்ள பொதுவான சவால்கள் அதிகமாக பொருந்துதலும் , பொருந்தாதுஇருப்பதும் ஆகும்.
அதிகஒலி அல்லது பொருத்தமற்ற வடிவங்கள் உள்ளிட்ட பயிற்சித் தரவை ஒரு மாதிரி நன்றாகக் கற்றுக் கொள்ளும்போது, புதிய தரவின் மோசமான செயல்திறன் விளைவிப்பதால் அதிகப்படியான பொருத்தம் ஏற்படுகிறது.
ஒரு மாதிரி மிகவும் எளிமையானதாக இருக்கும் போது, தரவில் உள்ள அடிப்படை வடிவங்களை கண்டுபிடிக்கத் தவறினால், ஒட்டுமொத்தமாக மோசமான செயல்திறனுக்கு வழிவகுக்கும்.
அதிகபொருத்தமும் ,பொருத்தமற்றதும்: இவ்விரண்டிற்கும் இடையே சமநிலைப்படுத்துவது பயனுள்ள ML மாதிரிகளை உருவாக்குவதில் முக்கியமான பண்பாகும்.
பொதுவான MLஇன் தருக்கங்கள்
நேரியல் பின்னடைவு
கருத்து , பயன்பாட்டு நிகழ்வுகள்: நேரியல் பின்னடைவு என்பது ஒன்று அல்லது ஒன்றிற்கு மேற்பட்ட உள்ளீட்டு வசதிகளின் அடிப்படையில் தொடர்ச்சியான விளைவைக் கணிக்கப் பயன்படுத்தப்படும் அடிப்படை மேற்பார்வையிடப்பட்ட கற்றல் வழிமுறையாகும். மாதிரியானது உள்ளீட்டு வசதிகளுக்கும் இலக்கு மாறிகளுக்கும் இடையே ஒரு நேரியல் தொடர்பு இருப்பதாகக் கருதுகிறது. பயன்பாட்டு நிகழ்வுகளில் பின்வருவன அடங்கும்:
வீட்டின் விலையை கணித்தல்: இது வீட்டின் பரப்பளவு சதுர அடிகளில், அறைகளின் எண்ணிக்கை ,இருப்பிடம் போன்ற காரணிகளை அடிப்படையாகக் கொண்டது.
வருவாய் கணிப்பு: இது சந்தைப்படுத்தல் செலவுகளின் அடிப்படையில் விற்பனை வருவாயை மதிப்பிடுவதை உள்ளடக்குகிறது.
இது எவ்வாறு இயங்குகிறது: நேரியல் பின்னடைவு, கணிக்கப்பட்ட , உண்மையான மதிப்புகளுக்கு இடையிலான வேறுபாட்டைக் குறைக்கும் சிறந்த-பொருத்தமான கோட்டினை (நேரியல் சமன்பாடு) கண்டுபிடிப்பதை நோக்கமாகக் கொண்டுள்ளது. பயிற்சியின் போது ஒவ்வொரு உள்ளீட்டு வசதிக்கும் ஒதுக்கப்பட்ட அளவுகளை சரிசெய்வதன் மூலம் இந்த கோடு தீர்மாணிக்கப்படுகிறது.
முடிவு மரங்கள்
கருத்து , பயன்பாட்டு வழக்குகள்: முடிவு மரங்கள் ஆனவை வகைப்பாடு, பின்னடைவு பணிகள் ஆகிய இரண்டிற்கும் பயன்படுத்தப்படுகின்ற பல்துறை வழிமுறைகளாகும். அவை முடிவுகளை ஒரு மர அமைப்பாகக் குறிக்கின்றன, ஒவ்வொரு முனையும் ஒரு குறிப்பிட்ட வசதியின் அடிப்படையில் ஒரு முடிவைக் குறிக்கின்ற. பயன்பாட்டு நிகழ்வுகளில் பின்வருவன அடங்கும்:
கடன்பெறும்தகுதி: வருமானம், கடன் , கடன் வரலாறு போன்ற காரணிகளின் அடிப்படையில் கடன் பெறும்தகுதியை தீர்மாணித்தல்.
நோயறிதல்: நோயாளியின் அறிகுறிகளின் அடிப்படையில் நோய்களை வகைப்படுத்துதல்.
இது எவ்வாறு இயங்குகிறது: இலக்கு மாறியைப் பொறுத்து முடிந்தவரை தூய்மையான துனைக்குழுக்களை உருவாக்க, பண்புகளின் அடிப்படையில் தரவுத்தொகுப்பை முடிவு மரங்கள் பிரிக்கின்றன. இந்த சுழல்நிலை செயல்முறையானது மர அமைப்பில் விளைகிறது, இந்த மாதிரியானது உள்ளீட்டு வசதிகளின் அடிப்படையில் முடிவுகளை எடுக்க அனுமதிக்கிறது.
k-Nearest Neighbours (k-NN)
கருத்து , பயன்பாட்டு நிகழ்வுகள்: k-Nearest Neighbours(k-NN) என்பது வகைப்பாடு , பின்னடைவு ஆகிய இரண்டிற்கும் ஒரு எளிய ஆனால் பயனுள்ள வழிமுறையாகும். இது ஒரு தரவுபுள்ளியின் முகவரியை பெரும்பான்மை இனம் அல்லது அதன் k -அருகிலுள்ள அருகிலுள்ளவைகளின் சராசரியின் அடிப்படையில் வகைப்படுத்துகிறது அல்லது முன்கணிப்பு செய்கிறது. பயன்பாட்டு நிகழ்வுகளில் பின்வருவன அடங்கும்:
உருவப்பட ஏற்புகை: வசதிகளின் அடிப்படையில் ஒத்த உருவப்படங்களை அடையாளம் காணுதல்.
பரிந்துரை அமைப்புகள்: ஒத்த பயனர்களின் விருப்பங்களின் அடிப்படையில் பொருட்களைப் பரிந்துரைத்தல்.
இது எவ்வாறு இயங்குகிறது: கொடுக்கப்பட்ட தரவுப் புள்ளிக்கு, k-NN ஆனது வசதியான இடத்தில் k-அருகிலுள்ளவைகளைக் கண்டறிந்து, பெரும்பான்மை இனம் அல்லது சராசரி மதிப்பை முன்கணிப்பாக ஒதுக்குகிறது.
ML ஐ கற்கும் ஆதாரங்கள்
இணையத்தின் கல்விகள் , பயிற்சிகள்
பாடநெறி ஆண்ட்ரூ பொறியியலாரின் இயந்திர கற்றல்:அடிப்படைக் கருத்துகள், நடைமுறை பயன்பாடுகளை உள்ளடக்கிய பிரபலமான பாடநெறியாகும்.
edX மைக்ரோசாப்ட் மூலம் செயற்கை நுண்ணறிவு (AI) அறிமுகம்: AI , அதன் பயன்பாடுகள் பற்றிய விரிவான கண்ணோட்டத்தை வழங்குகிறது.
Kaggleஇன் கற்றல் இயந்திர கற்றல் விளக்கத்திறன்: இயந்திர கற்றல் மாதிரிகளைப் புரிந்து கொள்ளவும், விளக்கமளிக்கவும் உதவுகிறது.
புத்தகங்கள் , பரிந்துரைக்கப்பட்ட படிப்பான்கள்
Aurélien Géron எழுதிய ‘Hands-On Machine Learning with Scikit-Learn, Keras, TensorFlow ’ என்பது பிரபலமான இயந்திர கற்றல் நூலகங்களுடன் நடைமுறை அனுபவத்திற்கான சிறந்த ஆதாரமாகும்.
செபாஸ்டியன் ராஷ்கா , வஹித் மிர்ஜலிலியின் ஆகியோர் எழுதிய ‘Python Machine Learning’ என்பது இயந்திர கற்றல் , தரவு அறிவியலுக்கு பைத்தானைப் பயன்படுத்தும் விரிவான வழிகாட்டியாகும்.
செயல் திட்டங்களும் சவால்களும்
Kaggle: நடப்பு-உலகப் பிரச்சனைகளுக்கு இயந்திரக் கற்றல் கருத்தமைவுகளைப் பயன்படுத்த Kaggle போட்டிகளில் பங்கேற்றிடுக.
GitHub களஞ்சியங்கள் GitHub இல் இயந்திர கற்றல் செயல்திட்டங்களையும் களஞ்சியங்களையும் ஆய்ந்து மற்றவர்களிடம் இருந்து கற்றுக்கொள்க திறமூல செயல்திட்டங்களுக்கு பங்களித்திடுக.
இயந்திர கற்றல் பணிப்பாய்வு
தரவு சேகரிப்பும் தயாரிப்பும்
சுத்தமான தரவின் முக்கியத்துவம்: சுத்தமான,உயர்தர தரவு வெற்றிகரமான இயந்திர கற்றலின் அடித்தளமாகும். துல்லியமான மாதிரி பயிற்சியை உறுதிப்படுத்த, தரவில் பிழைகள், முரண்பாடுகள் , விடுபட்ட மதிப்புகள் ஆகியன எதுவும் இல்லாமல் இருக்க வேண்டும். தரவுச் சுத்திகரிப்பு என்பது தேவையற்றதை நீக்கிக் கையாளுதல், விடுபட்ட மதிப்புகளை நிவர்த்தி செய்தல் தரவை பொருத்தமான வடிவமைப்பிற்கு மாற்றுதல் போன்ற பணிகளை உள்ளடக்கியது.
வசதியுடனானப் பொறியியல்: இயந்திரக் கற்றல் மாதிரிகளின் செயல்திறனை மேம்படுத்த வசதிகளைத் தேர்ந்தெடுப்பது, மாற்றுவது அல்லது உருவாக்கும் செயல்முறை வசதியுடனானப் பொறியியல் ஆகும். இது தொடர்புடைய வசதிகளைக் கண்டறிதல், அவற்றை சரியான முறையில் அளவிடுதல் மாதிரியின் முன்கணிப்பு சக்தியை மேம்படுத்தக்கூடிய புதிய வசதிகளை உருவாக்குதல் ஆகியவற்றை உள்ளடக்கியது.
மாதிரி பயிற்சி
தருக்கத் தேர்வு: சரியான தருக்கத்தை தேர்ந்தெடுப்பது இயந்திரக் கற்றல் பணிப்பாய்வுகளில் ஒரு முக்கியமான படிமுறையாகும். ஒரு தருக்கத்தைத் தேர்ந்தெடுக்கும்போது சிக்கலின் தன்மை (வகைப்படுத்தல், பின்னடைவு, முதலியன) தரவின் பண்புகள் ஆகியவற்றைக் கவனித்திடுக. வெவ்வேறு தருக்கங்களுடன் பரிசோதனை செய்வது குறிப்பிட்ட பயன்பாட்டு வழக்குக்கு மிகவும் பொருத்தமான ஒன்றைக் கண்டறிய அனுமதிக்கிறது.
ஒத்திசைந்த மிகைநிலையளவுருக்கள்: மிகைநிலையளவுருக்களானவை பயிற்சியின் போது கற்றுக் கொள்ளப்படாத அளவுருக்களாகும், ஆனால் பயிற்சி தொடங்கும் முன் அமைக்கப்பட வேண்டும். மிகைநிலையளவுருக்களை ஒத்திசைவு செய்வது மாதிரியின் செயல்திறனை மேம்படுத்த இந்த அமைப்புகளை சரிசெய்வதை உள்ளடக்குகிறது. கட்டங்கட்டமாகத்தேடல் அல்லது சீரற்ற தேடல் போன்ற நுட்பங்கள் மிகைநிலையளவுரு மதிப்புகளின் சிறந்த கலவையை அடையாளம் காண உதவுகின்றன.
மாதிரி மதிப்பீடு
மதிப்பீட்டிற்கான அளவீடுகள்: வெவ்வேறு இயந்திர கற்றல் பணிகளுக்கு வெவ்வேறு மதிப்பீட்டு அளவீடுகள் தேவை. பொதுவான அளவீடுகளில் துல்லியம், நினைவுபடுத்துதல் , வகைப்படுத்தல் பணிகளுக்கான F1 மதிப்பெண் ஆகியவை அடங்கும், அதே சமயம் சராசரி சதுர பிழை அல்லது R- சதுரமானது பெரும்பாலும் பின்னடைவு பணிகளுக்குப் பயன்படுத்தப்படுகின்றன. ஒரு மாதிரி எவ்வளவு சிறப்பாக செயல்படுகிறது என்பதை மதிப்பிடுவதற்கு இந்த அளவீடுகளைப் புரிந்துகொள்வது அவசியமாகும்.
குறுக்கு சரிபார்ப்பு: குறுக்கு சரிபார்ப்பு என்பது தரவுத்தொகுப்பை பல துனைக்குழுக்களாகப் பிரிப்பதன் மூலம் ஒரு மாதிரியின் செயல்திறனை மதிப்பிடுவதற்குப் பயன்படுத்தப்படுகின்ற ஒரு நுட்பமாகும். மாதிரியானது வெவ்வேறு துனைக்குழுக்களில் பயிற்றுவிக்கப்பட்டு மதிப்பீடு செய்யப்படுகிறது, இது புதிய, காணப்படாத தரவுகளுக்கு நன்கு பொதுவானதாக இருப்பதை உறுதி செய்கிறது.
மாதிரியை வரிசைப்படுத்தல்
புதிய தரவுகளில் கணிப்புகளைச் செய்தல்: ஒரு மாதிரி பயிற்சியளிக்கப்பட்டு மதிப்பீடு செய்யப்பட்டவுடன், அது பயன்படுத்தத் தயாராக உள்ளது. வரிசைப்படுத்தல் என்பது புதிய, நடப்பு உலகத் தரவுகளில் கணிப்புகளைச் செய்ய மாதிரியைப் பயன்படுத்துவதை உள்ளடக்குகிறது. இது ஒரு இணைய பயன்பாடு, API அல்லது ஏற்கனவே உள்ள அமைப்புகளில் ஒருங்கிணைப்பு வடிவத்தில் இருக்கலாம்.
நடப்பு-உலகப் பயன்பாடுகள்: மின்-வணிகத்தில் வாடிக்கையாளர் நடத்தையைக் கணிப்பது முதல் விநியோகச் சங்கிலித் தளவாடங்களை மேம்படுத்துவது வரை பல்வேறு நடப்பு உலகக் காட்சிகளில் இயந்திரக் கற்றல் மாதிரிகள் பயன்பாட்டைக் கண்டறிகின்றது. ஒரு மாதிரியின் வெற்றிகரமான வரிசைப்படுத்தல் நடைமுறை சிக்கல்களைத் தீர்ப்பதற்கும் பல்வேறு களங்களில் தகவலறிந்த முடிவுகளை எடுப்பதற்கும் பங்களிக்கிறது.
இயந்திர கற்றலில் உள்ள சவால்களும் , நெறிமுறைக் கருத்தாய்வுகள்
இயந்திர கற்றலில் சார்பு
சார்புகளைப் புரிந்துகொள்வது: இயந்திரக் கற்றலில் சார்பு என்பது பயிற்சித் தரவின் விளைவாக ஒரு மாதிரியின் கணிப்புகளில் முறையான பிழைகள் இருப்பதைக் குறிக்கிறது. பயிற்சித் தரவின் பதிலியாக இல்லாவிட்டால் அல்லது சார்புகளைக் கொண்டிருந்தால், மாதிரியானது அந்த சார்புகளை நிலைநிறுத்தலாம் பெருக்கலாம், இது நியாயமற்ற அல்லது பாரபட்சமான விளைவுகளுக்கு வழிவகுக்கும்.
சார்புநிலையை நிவர்த்தி செய்வதற்கான வழிகள்: இயந்திரக் கற்றலில் சார்புநிலையை நிவர்த்தி செய்ய கவனமாக பரிசீலிக்க செயலூக்கமான நடவடிக்கைகள் தேவை:
பலதரப்பட்ட பதிலி தரவு: பயிற்சித் தரவு வேறுபட்டது அது சேவை செய்ய விரும்பும் மக்கள்தொகையின் பதிலி என்பதை உறுதிப்படுத்திடுக.
சார்பு கண்டறிதலும் தணிப்பும்: மறு மாதிரி, மறு எடை, அல்லது கற்றல் செயல்பாட்டில் நியாயமான கட்டுப்பாடுகளை இணைத்தல் போன்ற சார்புகளைக் கண்டறிந்து தணிக்க அதற்கான நுட்பங்களைப் பயன்படுத்திடுக.
தனியுரிமை கவலைகள்
ML இல் தரவுத் தனியுரிமை: இயந்திரக் கற்றல் பெரும்பாலும் முக்கியத் தரவைப் பயன்படுத்துவதை உள்ளடக்கியது, தனியுரிமை பற்றிய கவலைகளை எழுப்புகிறது. அநாமதேயமாக்கல், குறியாக்கம் ,பாதுகாப்பான தரவு சேமிப்பு போன்ற நடவடிக்கைகளை செயல்படுத்துவதன் மூலம் தனிநபர்களின் தனியுரிமையைப் பாதுகாப்பது அவசியமாகும்.
விதிமுறைகளுடன் இணங்குதல்: GDPR, HIPAA அல்லது பிற தொழில் சார்ந்த தரநிலைகள் போன்ற தரவு பாதுகாப்பு விதிமுறைகளை கடைபிடிப்பது மிகவும் முக்கியமாகும். ML பயிற்சியாளர்கள் பயனர் தனியுரிமையைப் பாதுகாக்க சட்ட ,நெறிமுறை கட்டமைப்புகளை அறிந்திருக்க வேண்டும் இணங்க வேண்டும்.
இயந்திரக்கற்றலைத் தொடங்கும் மாணவராக இருந்தாலும், பணியில் MLஐ ஒருங்கிணைக்க விரும்பும் ஒரு நிபுணராக இருந்தாலும் அல்லது நமது எதிர்காலத்தை வடிவமைக்கும் தொழில்நுட்பத்தைப் புரிந்து கொள்ள ஆர்வமுள்ளவராக இருந்தாலும், இயந்திர கற்றல் உலகம் கற்றலிற்கும் புதுமைக்குமான முடிவற்ற வாய்ப்புகளை வழங்குகிறதுஎன்றசெய்தியை. நினைவில் வைத்து கொள்க, புரிதலை உறுதிப்படுத்துவதற்கான சிறந்த வழி, நடைமுறையில் பயிற்சி செய்வதாகும். வெவ்வேறு தரவுத்தொகுப்புகளுடன் பரிசோதனை செய்யவும், திட்டப்பணிகளில் பணிபுரியவும், மேலும் தகவலறிந்த, உத்வேகத்துடன் இருக்க துடிப்பான இயந்திர கற்றல் சமூககுழுவுடன் ஈடுபடுக. பயணத்தைத் தொடரும்போது, குறிப்பிட்ட தருக்கங்களில் ஆழ்ந்து மூழ்கி, ஆழ்கற்றல் போன்ற மேம்பட்ட தலைப்புகளை ஆராய்தல் ,நடப்பு உலக செயல்திட்டங்களுக்கு அறிவைப் பயன்படுத்துதல் ஆகியவற்றையும் கருத்தில் கொள்க.