இன்றைய பகுதியில் இயந்திர கற்றலில் பொதுவாக அடிக்கடி பயன்படுத்தப்படும் சொற்களை பற்றிகாண்போம்
கணிமுறை(Algorithm): தரவு செயலாக்கம், கணிதம் அல்லது தானியங்கி பகுத்தறிவு மூலம் சிக்கல்களைத் தீர்க்கப் பயன்படும் சுய–கட்டுப்பாட்டு விதிகளையே கணிமுறை என அழைக்கப்படும்.
ஒழுங்கின்மையை கண்டறிதல்(Anomaly detection): அசாதாரண நிகழ்வுகள் அல்லது மதிப்புகளைக் கொடியிடும் சிக்கல்களைக் கண்டறிய உதவும் ஒரு மாதிரியாகும். எடுத்துக்காட்டாக, கடனட்டையில் மோசடி கண்டறிதலின் வாயிலாக அசாதாரண கொள்முதல்கள் தவிர்க்கப்படுதல்.
வகைப்படுத்தப்பட்ட தரவுகள் (Categorical data): தரவுகளை பல்வேறுவகைகளாக ஒழுங்கமைக்கப்பட்டும் குழுக்களாகவும் பிரித்தல். எடுத்துக்காட்டாக,ஒரு வகை தரவு தொகுப்புினை கொண்டு நாம் பயனம் செய்யஉதவும் ஆட்டோக்களின் தரவுகளான அவை உற்பத்தி செய்யப்பட்டஆண்டு, தயாரிப்பு,மாதிரி , விலை ஆகியவை வகைப்படுத்தப்பட்ட தரவுகளுக்கு எடுத்துகாட்டுகளாகும்
வகைப்பாடு(Classification): ஏற்கனவே அறியப்பட்டுள்ளவகை குழுக்களை கொண்டு தரவுத் தொகுப்பின் அடிப்படையில் தரவு புள்ளிகளை குறிப்பிட்ட வகைகளாக ஒழுங்கமைப்பதற்கான ஒரு மாதிரியாகும். .
பொறியியலின்வசதிகள்(Feature engineering) : இது ஒரு தரவுதொகுப்பு தொடர்பான வசதிகளையும் விளைவுகளையும் மேம்படுத்துவதற்கான பிரித்தெடுக்கும் அல்லது தேர்ந்தெடுக்கும் செயல்முறையாகும். உதாரணமாக, வார விடுமுறை நாட்களில் பயனம் செய்தவர்களை பற்றி பெறப்பட்ட விமான கட்டணத்தரவுகளை கொண்டு விமான கட்டணம் நிர்ணயம் செய்வதை பற்றி முடிவெடுத்தல்.
தகவமைவு(Module): இது ஒரு இயந்திர கற்றல் தொழிலக மாதிரியின் செயல்பாட்டு பகுதியாகும், அதாவது இது தரவுகளின் தொகுதி போன்ற சிறிய தரவு தொகுப்புகளை உள்ளிடவும் திருத்தவும் உதவுகின்றது. ஒரு கணிமுறை(Algorithm)கூட இயந்திர கற்றல் தொழிலகத்தில் ஒரு வகை தகவமைவாக கருதப்படும்.
• மாதிரி(Model): மேற்பார்வை செய்யப்பட்ட கற்றல் மாதிரி என்பது பயிற்சி தரவு, ஒரு கணிமுறை தகவமைவு, மதிப்பெண் மாதிரி தகவமைவு போன்ற செயல்பாட்டு தொகுதிகள் அடங்கிய இயந்திர கற்றல் பரிசோதனையின் விளைவாகும்.
எண்ணிமைதரவு(Numerical data): இது அளவீடுகளின் (தொடர்ச்சியான தரவு) அல்லது எண்ணிக்கைகளின் (தனித்துவமான தரவு) தரவுகளாகும் . மேலும் இது அளவை சார்ந்த தரவுகளென்றும் குறிப்பிடப்படுகின்றது.
பிரித்தல்(Partition): தரவுகளை மாதிரிகளாகப் பிரிக்கும் முறையாகும்
முன்கணிப்பு(Prediction): இயந்திர கற்றல் மாதிரியிலிருந்து ஒரு மதிப்பு அல்லது மதிப்புகளின் முன்னறிவிப்பே முன்கணிப்பாகும். ‘முன்கணிக்கப்பட்ட புள்ளிகள்(Predicted Score)’ என்ற சொற்களை நாம் அடிக்கடி கேள்விபட்டிருக்கலாம். இருப்பினும், முன்கணிக்கப்பட்ட மதிப்பெண்களானவை ஒரு மாதிரியின் இறுதி வெளியீடு அன்று. அதற்கு பதிலாக இந்த மாதிரியின் மதிப்பீடானது புள்ளிகளைப் பின்தொடர்கின்றது.
• பின்னோக்கி செல்லுதல்(Regression): இது ஒரு பழைய காரினுடைய விலையை அது உற்பத்தி செய்த ஆண்டு ,தயாரிப்பு ஆகியவற்றின் அடிப்படையாகக் கொண்டு முன்கணிப்பு செய்வதை போன்று சுதந்திரமான மாறிகளின் அடிப்படையில் மதிப்பைக் முன்கணிப்பு செய்வதற்கான ஒரு மாதிரியாகும்.
• புள்ளிகள் (Score): இது இயந்திர கற்றல் தொழிலகத்தில் புள்ளிகளின் மாதிரி தகவமைவுப் பயன்படுத்தி பயிற்சி பெற்ற வகைப்பாடு அல்லது பின்னோக்கி செல்லும் மாதிரியிலிருந்து உருவாக்கப்படுகின்ற முன்கணிக்கப்பட்ட மதிப்பாகும் .மேலும் வகைப்படுத்தப்பட்ட மாதிரிகள் முன்கணிக்கப்பட்ட மதிப்பின் நிகழ்தகவுக்கான புள்ளிகளையும் தருகின்றன. ஒரு மாதிரியிலிருந்து புள்ளிகளை உருவாக்கியதும், மதிப்பீட்டு மாதிரி தகவமைப் பயன்படுத்தி மாதிரியின் துல்லியத்தை மதிப்பீடு செய்யமுடியும்.
மாதிரி(Sample): இது முழு பிரதிநிதியாக இருக்க விரும்பும் தரவு தொகுப்பின் ஒரு பகுதியாகும். மாதிரிகள் தோராயமாக அல்லது தரவு தொகுப்பின் குறிப்பிட்ட வசதி வாய்ப்புகளின் அடிப்படையில் தேர்ந்தெடுக்கப்படலாம்.
தொடரும்