எளிய தமிழில் Computer Vision 11. படங்களை வகைப்படுத்தல் (image classification)

“ஒரு படம் ஆயிரம் சொற்களுக்கு இணையானது (A picture is worth a thousand words)” என்று ஆங்கிலத்தில் ஒரு பழமொழி உள்ளது. அதாவது பக்கம் பக்கமாக எழுதிப் புரிய வைக்கக் கடினமான ஒரு சிக்கலான கருத்தை ஒற்றைப் படத்தில் தெரிவிக்க முடியும் என்பதே இதன் பொருள். ஆனால் கணினிகளைப் பொறுத்தவரை, அவை ஒரு படத்தில் உள்ளது என்ன என்று புரிந்து கொள்வது மிகக் கடினம். ஏனெனில் அவை பார்ப்பது படத்தையல்ல, ஒரு பெரும் எண்களின் அணியை. ஒரு படத்தின் உள்ளடக்கங்களைக் கணினி புரிந்து கொள்ள, நாம் முதலில் அப்படத்தை வகைப்படுத்த வேண்டும்.

ஆக, ஒரு படத்தில் உள்ள பொருளை நம்மிடம் உள்ள வகைகளில் எந்த வகையைச் சேர்ந்தது என்று முடிவு செய்வதை வகைப்படுத்தல் என்கிறோம்.  

இருவகைப்படுத்தல் (binary classification)

உற்பத்தித் தொழிற்சாலையில் ஏற்புச் சோதனை (acceptance test) செய்யப் படம் எடுக்கிறோம் என்று வைத்துக்கொள்வோம். அப்படத்தை வைத்து நாம் தீர்மானிக்க வேண்டியது ஏற்பு, நிராகரிப்பு என்று இரண்டே வகைகள் தான். மருத்துவத் துறையில் நோய் இருக்கிறதா இல்லையா என்பதைத் தீர்மானிக்க ஒரு நோயாளியின் ஊடுகதிர் (X-ray) படம் எடுக்கலாம். அப்படத்தை வைத்து நாம் தீர்மானிக்க வேண்டியது நோய் உண்டு, இல்லை என்று இரண்டே வகைகள் தான். இம்மாதிரி இரண்டே குழுக்களில் ஒவ்வொறு படமும் எந்தக் குழுவைச் சேர்ந்தது என்பதைக் கணித்தலை இருவகைப்படுத்தல் என்று சொல்கிறோம்.

பலவகைப்படுத்தல் (multiclass classification)

CIFAR-10 தரவுத்தொகுப்பிலிருந்து பொருட்களின் புகைப்படங்கள்

CIFAR-10 தரவுத்தொகுப்பிலிருந்து பொருட்களின் புகைப்படங்கள்

பலவகைப்படுத்தல் என்றால் மூன்று அல்லது அதற்கு மேற்பட்ட வகைகளில் ஒன்றாக படத்திலுள்ள பொருட்களை வகைப்படுத்தல். இதற்கு ஒரு நல்ல எடுத்துக்காட்டு கையால் எழுதப்பட்ட இலக்கங்களை, 1 முதல் 9 மற்றும் 0 ஆக,  பத்து வகைகளில் ஒன்றாக வகைப்படுத்தல். படத்தில் கண்டவாறு வெவ்வேறு பொருட்களின் புகைப்படங்களை வைத்து பலவகைப்படுத்தல் இதைவிடக் கடினமான வேலை.

ஓபன்சிவி பைதான் படங்களை வகைப்படுத்தல் பயிற்சிகள் இங்கே உள்ளன.

கோடுகள், செவ்வகங்கள், வட்டங்கள் மற்றும் உரையைப் படத்தின் மேல் வரைதல் 

நீங்கள் ஒரு பட வகைப்பாடு அல்லது பொருள் கண்டறிதல் செய்ய வேண்டும் என்று வைத்துக்கொள்வோம். இந்த சந்தர்ப்பங்களில், கண்டறிந்த பொருளைச் சுற்றி ஒரு கட்டம் போட வேண்டி வரலாம். வகைப்படுத்தல் செய்யும்போது வகைப் பெயரைப் படத்தின் மேல் எழுத வேண்டி வரலாம். இந்த வேலைகளுக்கெல்லாம் வழிமுறைகள் (methods) நம் மென்பொருட்களில் உள்ளன.

நன்றி

  1. Example of Photographs of Objects From the CIFAR-10 Dataset – Machine Learning Mastery

இத்தொடரில் அடுத்த கட்டுரை: அம்சப் பொருத்தம் (Feature Matching)

முக்கியப் புள்ளி கண்டுபிடிப்பி (keypoint detector). அம்ச விவரிப்பி (feature descriptor). ஓபன்சிவி ஆர்ப் (OpenCV ORB) அம்சப் பொருத்தம்.

ashokramach@gmail.com

%d bloggers like this: