இயந்திரவழி கற்றலுக்கு உதவும் சில திறமூலகருவிகள் (OpenSource Tools)

செயற்கை நுண்ணறிவு, இயந்திரவழி கற்றல் ஆழ்த கற்றல் ஆகியவை பல தசாப்தங்களாக மனிதர்கள் செய்யும் விதத்தில் கணினிகள் பணிகளைச் செய்ய உதவுகின்றன. செயற்கை நுண்ணறிவு (AI) கணினிகளைப் பயன்படுத்தி மனித மூளையின் செயல்பாடுகளைப் பிரதிபலிக்கும் நோக்கத்தைக் கொண்டுள்ளது. அவ்வாறு செய்ய இது கணிதமாதிரிகளையும், புள்ளிவிவர மாதிரிகளையும் பயன்படுத்திகொள்கிறது (எ.கா., நிகழ்தகவு). இயந்திரவழி கற்றல் (ML) மனிதமூளை செயல்பாடுகளின் நிரலாக்க மாதிரிகளைப் பயன்படுத்தி AI மாதிரிகளின் நடத்தையை மேம்படுத்துகிறது, மேலும் இந்த மாதிரிகளின் முடிவுகளை எதிர்கால கணிப்புகளுக்காக சேமிக்கிறது. இந்த தொழில்நுட்பங்கள் மனித நரம்பியல் வலையமைப்பால் ஈர்க்கப்பட்டுள்ளன, இது நமது மூளையின் முக்கிய சேமிப்பக அடுக்காகும். இந்த நரம்பியல் வலைைபின்னல் அடிப்படையி லான தீர்வுகளின் செயலாக்கத் திறன், விரைவான செயலாக்கத்திற்கான விநியோகிக்கப்பட்ட மாதிரியை செயல்படுத்துவதன் மூலம் மேம்படுத்தப்படுகிறது, அத்துடன் பொருள் கண்டறிதல், பகுப்பாய்வு திறன் போன்ற பல்வேறு மனிதமூளை செயல்பாடுகளை உருவகப்படுத்துகிறது. மரபணு வழிமுறைகள் ஆழ்கற்றல் மாதிரிகளை மேம்படுத்துகின்றன. இவை சுய-கற்றல் திறனும் உள்ளுணர்வும் கொண்டவை, எனவே செயற்கை நுண்ணறிவு மாதிரி மொழி (AIML ) ஆனது மாதிரிகளின் பயன்பாடுகளை அதிகமாக செயல்படுத்துகிறது மேலும் அவற்றைப் பயிற்றுவிப்பதற்கானநம்மமுடைய முயற்சியைக் குறைக்கிறது. அவை நரம்பியல் வலைபின்னல்களில் அறிவுத் தளத்தை மேம்படுத்துகின்றன. இந்த தொழில் நுட்பங்கள் அனைத்தும் கணினி அடிப்படையிலான பயன்பாடுகளுக்கு மனிதனைப் போன்ற சிந்தனைக்கு நெருக்கமாக கொண்டுவருவதற்கான திறனை மேம்படுத்த உதவுகின்றன, அதே நேரத்தில் மாதிரிகளை உருவாக்குவதற்கும் பயிற்சி செய்வதற்கும் தேவையான முயற்சியைக் குறைக்கின்றன. AIML கருவிகளின் பொதுவான அம்சங்களை மேம்படுத்திடுவதற்காக பல தொழில்நுட்ப ஜாம்பவான்கள் ஆழ்கற்றல் செயல்திட்டங்களில் பெரும் தொகையை முதலீடு செய்கின்றனர். இவற்றில் பேஸ்புக், இன்டெல் , கூகுள் ஆகியவை அடங்கும். Google Brain என்பது கூகுளில் உள்ள AI ஆராய்ச்சிக் குழுவாகும், இது 2010 ஆம் ஆண்டின் தொடக்கத்தில் கூகுள் இயங்குதளங்களைப் பயன்படுத்தி ஆழ்கற்றல் தீர்வுகளை வடிவமைக்க உருவாக்கப்பட்டது. இந்த குழு உருவாக்கிய முதல் மென்பொருள் DistBelief. ஆகும். பின்னர், TensorFlow, Google Analytics Google Translate போன்ற பல பிரபலமான செயல்திட்டங்களை வெளியிடுவதில் இது முக்கிய பங்கு வகித்தது. தற்போது சந்தையில் பல பிரபலமான இயந்திரவழி கற்றல் கட்டமைப்புகள் உள்ளன, அவற்றில் பல திறமூலகருவிகளாகும். இருப்பினும், வசதியின் அடிப்படையில் ஒரு இயந்திரவழி கற்றல் கருவி அல்லது கட்டமைப்பை நாம் கண்மூடித்தனமாக தேர்ந்தெடுக்க முடியாது. சிக்கலின் சூழல், தரவுத் தேவைகள், செயலாக்க தரவு அளவு, பயிற்சிக்கான தரவு கிடைக்கும் தன்மை, பயிற்சி, தருக்கங்களின் ஆதரவு, காட்சிப்படுத்தல், அறிக்கையிடல் வசதி, நுன்னறிவு அல்லது பயிற்சி மாதிரியைத் தானாக உருவாக்கும் திறன், தேவையான செயலாக்க வேகம் (CPU/GPU) ஆகியவற்றையும் கருத்தில் கொள்ள வேண்டும். , சிலவற்றைப் பெயரிட, நாம் தேர்வு செய்வதற்கு முன். இயந்திரவழி கற்றலில், மாதிரியை உருவாக்குவதற்கு அதிகநேரத்தை எடுத்துக்கொள்ளும் பணியாகும், ஏனெனில் கொடுக்கப்பட்ட சிக்கலுக்கான மாதிரியைச் செயலாக்குவதில் அதிக துல்லியத்தைப் பெற நிறைய பயிற்சி தேவைப்படுகிறது. எடுத்துக்காட்டாக, உருவப்படங்களை அங்கீகரிப்பதில் அதிக துல்லியத்தைப் பெற தரவுத் தொகுப்புகளின் நரம்பியல் வலையமைப்பை உருவாக்க நிறைய பயிற்சிகள் செய்யப்பட வேண்டும்.
புள்ளிவிவரங்கள், அறிவியல் வழிமுறைகள் போன்ற பாரம்பரிய அணுகு முறையைப் பயன்படுத்தி கணக்கீட்டு சிக்கல்கள் பெரும்பாலும் தீர்வுசெய்யப்படு கின்றன. இருப்பினும், இந்த வழிமுறையில் தீர்வுசெய்யப்பட்டால், இந்த சிக்கல்களில் சில நேரத்திலும் முயற்சியின் அடிப்படையிலும் அதிக செலவு கொண்டவை என்பதை நிரூபிக்கின்றன. முன் பயிற்சி பெற்ற இயந்திரவழி கற்றலின் மாதிரிகள் குறைந்த நேரத்தையும் அதிகபணத்தையும் பயன்படுத்தி இத்தகைய பிரச்சனைகளை கையாள முடியும்.
காட்சி வழி பயன்பாட்டு இடைமுகம்(API), உருவப்படவழிAPI , முகம் கண்டறிதல்
1950 களின் முற்பகுதியில் இருந்து 1980 களின் பிற்பகுதி வரை AI முக்கியத்துவம் பெற்றது, பொறியாளர்கள் குறிப்பிட்ட சிக்கல்களைத் தீர்வுசெய்வதற்காக நுன்னறிவுமிக்க இயந்திரங்களையும் செயல்திட்டங்களையும் உருவாக்கினர். AI மாதிரிகளைப் பயிற்றுவிப்பது அதிக செலவும் அதிகநேரத்தையும் எடுத்துக் கொள்வதால், AI தருக்கங்களின் துல்லிய விகிதம் அல்லது செயல்திறன் நிலையானதாக இருந்ததால், 1980 களில் AI இன் துணைக்குழுவாக ML உருவானது. ML மாதிரிகள் வெளிப்படையாக திட்டமிடப்படாமல் தாங்களாகவே கற்றுக் கொள்கின்றன, ஏனெனில் ஒரு சுய-பயிற்சி திறன் மெதுவாக அவற்றில் கட்டமைக்கப்படுகிறது. அவை குறிப்பிட்ட சிக்கல்களைத் தீர்வுசெய்கின்றன மேலும் அதிக துல்லியத்துடன் உருவப்படம் அல்லது பேச்சு அங்கீகாரத்திற்காகப் பயன்படுத்திகொள்ளலாம். ஆழ்கற்றல் (DL) என்பது ML இன் துணைக்குழு ஆகும், இது பல அடுக்கு நரம்பியல் வலையமைப்பைப் பயன்படுத்துகிறது மேலும் அதன் அனுபவத்திலிருந்து (வரலாற்றுத் தரவு என அழைக்கப்படும்) கற்றுக்கொள்வதன் மூலம் துல்லியமும் செயல்திறனையும் மேம்படுத்துகிறது. இது வரலாற்றின் அடிப்படையில் ஒரு மாதிரியை உருவாக்குகிறது மேலும் பெரிய அளவிலான தரவுகளுக்கு மிகவும் திறமையானது. 2010களின் பிற்பகுதியில் ஆழ்கற்றல் வெளிவரத் தொடங்கியது, மேலும் இது பேச்சு அங்கீகாரம், உருவப்படம் அல்லது வடிவ அங்கீகாரம், கானொளிகள், உருவப்படங்களில் பொருள் கண்டறிதல் , மொழி மொழிபெயர்ப்பு ஆகியவற்றில் பரவலாகப் பயன்படுத்தப்படுகிறது.


மாதிரிஉருவ அங்கீகாரம், பேச்சு அறிதல் , தேடல் வசதிகள் போன்ற மனிதனைப் போன்ற முடிவெடுக்கும் சேவைகளை நிர்வகிக்க, பயன்பாடுகளுக்கான AI மாதிரிகளை விரைவாக உருவாக்க சுயஅனுபவஅறிவாற்றல் சேவைகள் உதவுகின்றன. இயந்திர கற்றல் அறிவாற்றல் சேவைகளை பின்வருமாறான, ஐந்து முக்கிய வகை நடவடிக்கைகளாக தொகுக்கலாம்.
காட்சி வழிபயன்பாட்டு இடைமுகம்(API): இந்தச் சேவையானது முகம் கண்டறிதல், பொருள் கண்டறிதல் மாதிரிஉருவத்தினை அறிதல் ஆகியவற்றில் உருவப்படம் ,கானொளிகாட்சி செயலாக்கத்தைக் கையாள உதவுகிறது, இது பிரபலங்கள்/மனித அடையாளத்தைக் கண்டறிதல், கையால் எழுதப்பட்ட எழுத்துகளின் அங்கீகாரம், OCR செயல்பாடுகள் போன்ற குறிப்பிட்ட பயன்பாட்டு வசதிகளை கொண்டது.
மொழிவழிபயன்பாட்டு இடைமுகம்(API): இந்த சேவையானது உணர்ச்சிவய பகுப்பாய்வு, நாம் பேசும் மொழியை புரிந்துகொள்ளுதல் (LUIS என அழைக்கப்படுகிறது), அறிவுத் தளத்திலிருந்து கேள்விகளுக்கு பதிலளிக்கும் நாடாவின்தொடக்க(bot) வசதிகள், மொழியை கண்டறிதல், மொழியை மொழிபெயர்ப்பு, ஒலிப்பு பகுப்பாய்வு போன்றவற்றைக் கையாளுகிறது.
பேச்சு வழிபயன்பாட்டு இடைமுகம்(API): இந்தச் சேவை பேச்சை -உரையாகவும் உரையை -பேச்சாகவும் மாற்றுவதற்கான மொழிபெயர்ப்பு, நிகழ்நேர பேச்சு மொழிபெயர்ப்பு , நகலெடுத்தல், தனிப்பயன் குரல் அளவீடு போன்றவற்றைக் கையாளுகிறது.
அறிந்துகொள்ளுதல் வழிபயன்பாட்டு இடைமுகம்(API): இந்த சேவையானது bot சேவைகள், அறிந்துகொள்ளும் அடிப்படை உருவாக்கத்திற்கான தொடர்பு மைய AI வசதிகள், உரை ஆவணங்களிலிருந்து QA பிரித்தெடுத்தல், குரல் பதில்களிலிருந்து சுய பயிற்சி, உள்ளடக்க தனிப்பயனாக்கம், தனிப்பயனாக்கப்பட்ட கற்றல், சொற்பொருள் பொருத்தம், உள்ளடக்கத் தேடலில் ஒழுங்கின்மை கண்டறிதல் போன்றவற்றை எளிதாக்குகிறது.
தேடுதல்வழிபயன்பாட்டு இடைமுகம்(API): Bing அல்லது Google தேடுதல் இந்த வகை APIகளின் அடிப்படையில் செயல்படுகின்றது, இந்தச் சேவை உருவப் படங்கள், கானொளிகாட்சிகள், உரை ,பேச்சொலி உள்ளடக்கத்திற்கான தேடுதல் வசதியை வழங்குகிறது; உருவப்படத்தை அடையாளம் காணுதல், பிரித்தெடுத்தல் , வகைப்படுத்துதல்; தேடுதல் முடிவுகள் போன்றவற்றின் அடிப்படையில் முன்னணி உருவாக்க வசதிகளைகொணடது.
இவ்வாறான சூழலில் இந்த தொழில்நுட்பங்களுக்கான OpenCV, PyTorch , OpenNN ஆகிய மூன்று திறமூல இயந்திரவழி கற்றல் கட்டமைப்புகளை பற்றி இப்போது காண்போம்.

OpenCV என்பது மிகவும் பிரபலமான காட்சிவழிAPI வசதியுள்ள திறமூல இயந்திர வழி கற்றல் கட்டமைப்புகளில் ஒன்றாகும். இது பல்வேறு நூலகங்கள், வன்பொருள் போலிசெய்கருவிகளை உருவாக்குவதற்காக, வரிசைப்படுத்துதல் , இயந்திரவழி கற்றல் ஆகிய மாதிரிகளை பரிசோதிக்கிறது. OpenCV ஐ செயல்படுத்து பவைகளில் மிக முக்கியமான ஒன்று Microsoft Azure எனும் இயங்குதளமாகும், இது மேம்பட்ட மீபபெரும் தரவு சேவைகளுக்கான MMLSpark வரைச்சட்டகட்டமைப்பிற்கு இதைப் பயன்படுத்திகொள்கிறது. அப்பாச்சியின் Spark இற்கான மைக்ரோசாப்டின் இயந்திரவழிகற்றல்(MMLSpark) வரைச்சட்ட கட்டமைப்பை அறிமுகப்படுத்துவதன் மூலம் Apache Spark வரைச்சட்ட கட்டமைப்பிற்கு Microsoft பங்களித்துள்ளது. ஏரி போன்ற நிறுவனங்களின் தரவுகளின் தீர்வைப் பயன்படுத்தி மீப்பெரும் தரவு செயலாக்கத்தில் Spark வரைச்சட்ட கட்டமைப்பில் OpenCV, மைக்ரோசாப்டின் சுயகற்றல்அறிவின் கருவிப்பெட்டி (CNTK) ,பல இயந்திர கற்றல் கட்டமைப்பின் திறன்களைச் சேர்ப்பதன் மூலம் MMLSpark ஆனது Apache Spark இன் விநியோகிக்கப்பட்ட இயந்திரவழி கற்றல் தீர்வை விரிவுபடுத்துகிறது. MMLSparkஆனது இயந்திரவழி கற்றல் நூலகங்களின் குழுவைக் கொண்டுள்ளது. இவை பின்வருமாறு பட்டியலிடப்படுகின்றன.
அ. Vowpal Wabbit: இவை ட்வீட்களில் (tweets) உணர்ச்சிவய பகுப்பாய்வு போன்ற உரை பகுப்பாய்வுகளை இயக்க இயந்திர கற்றலுக்கான நூலக சேவைகளாகும்.
ஆ. Spark இல் சுயஅனுபவ அறிவாற்றல் சேவைகள்: இவை Sparkஇன் இயந்திரவழிகற்றல்ML பாதைகளில் உள்ள மைக்ரோசாஃப்டின் சுயஅனுபவ அறிவாற்றல் சேவைகளின் அம்சங்களை ஒருங்கிணைத்து, ஒழுங்கின்மை கண்டறிதல் போன்ற சுயஅனுபவஅறிவாற்றல் தரவு மாதிரிகளின் சேவைகளுக்கான தீர்வு வடிவமைப்பைப் பெறுகின்றன.
இ LightBGM: முகத்தின்சுட்டியை(ID)கொண்டுகண்டறிதல் போன்ற முன்கணிப்பு பகுப்பாய்விற்கான பயிற்சியை செயல்படுத்திடும் இயந்திரவழி கற்றல் மாதிரியாகும்.
ஈ. Spark சேவை: இது Spark இன் தொடரோட்ட ஆதாரங்களை எளிதாகப் பயன்படுத்த REST API வசதியை வழங்குகிறது.
உ. Sparkஇல் HTTP: Spark ஆனது HTTP நெறிமுறை அடிப்படையிலான அணுகல்தன்மையை ஒருங்கிணைப்பதில் விநியோகிக்கப்பட்ட மீச்சிறு சேவைகளில் பல்லிய இசையை இயக்குகிறது.
ஊ. சுயஅனுபவஅறிவாற்றல் கருவித்தொகுப்பு (CNTK): தொடரோட்ட தரவில் தரவு சரிபார்ப்புக்கான Spark தீர்வினைை இயக்குவதற்கான மைக்ரோசாப்ட் மூலமான ஆழ்கற்றல் கட்டமைப்பாகும்.
எ. Lime: இது Spark இன்தொடரோட்ட தரவுகளில் விநியோகிக்கப்பட்ட மாதிரிகளுக்கான வகைப்படுத்துதல் மாதிரிகளின் தீர்வாகும்.
ஏ. தன்னியக்கமாக Sparkஇனை கட்டுதல்-உருவாக்குதல்: Spark தொடரோட்ட தரவு மாதிரிகளை மாதிரியாக செய்வதற்கு PySpark (Python) , SparklyR (R நிரலாக்க குறிமுறைவரிகளின் வசதியை இயக்குகிறது.
MMLSpark ஆனது உருவப்பட செயலாக்கம், கானொளிகாட்சி பகுப்பாய்வு, உரை பகுப்பாய்வு போன்றவற்றிற்கான இயந்திரவழி கற்றல் நூலகங்களைப் பயன்படுத்தி மாதிரி தீர்வுகளுக்கு Spark உடன் தரவு செயலாக்கத்தை செயல்படுத்துகிறது. இதனுடைய சமீபத்திய பதிப்பு: 4.5.5 ஆகும் மேலும் விவரங்களுக்கு : opencv.org/ எனும் முகவரியிலுள்ள இதனுடைய அதிகாரப்பூர்வ இணையதளத்திற்கு செல்க

PyTorch என்பது Torch நூலகத்தை அடிப்படையாகக் கொண்டதொரு திறமூல இயந்திரவழி கற்றல் கட்டமைப்பாகும், மேலும் இது முதன்மையாக கணினி காட்சி வழியிலான இயற்கை மொழி செயலாக்கத்திற்கு (NLP) பயன்படுத்தி கொள்ளப்படு கிறது. இது ஃபேஸ்புக் இன் AI ஆய்வகத்தால் உருவாக்கப்பட்டது, இது ஆழ்கற்றல் மாதிரிகளை உருவாக்க உதவுகிறது அவற்றை பைத்தானில் வெளிப் படுத்த அனுமதிக்கிறது. இது GPU , CPUஆகியவைகளைப் பயன்படுத்தி ஆழ்கற்ற லுக்கான உகந்த Tensor நூலகமாகும். NumPy , SciPy போன்ற பொதுவான பைதான் நூலகங்களுடன் இதனுடைய செயலியை நீட்டிக்க முடியும். PyTorch உடன் தொடங்குவதற்கான எளிதான வழி NGC கொள்கலன்களைப் பயன்படுத்துவதாகும். PyTorch NGC கொள்கலன் ஆனது உரையாடலிற்கான AI, இயற்கை மொழி செய லாக்கம், பரிந்துரை அமைப்புகள் , கணினி காட்சி ஆகியவற்றிற்கான பயன் பாடுகளை வடிவமைக்க பயனுள்ளதாக இருக்கின்ற அனைத்து சார்புகளுடன் வெளியிடப் பெறறுள்ளது. இது பின்வருமாறான இரண்டு நல்ல வசதிகளைக் கொண்டுள்ளது:
• வலுவான GPU முடுக்கம் கொண்ட Tensor கணக்கீடுகள்.
• ஆழ்ந்த நரம்பியல் வலைபின்னல்களானவை நாடா அடிப்படையிலான autograd அமைவில் கட்டமைக்கப்பட்டுள்ளன.
PyTorch நூலகம் பின்வரும் கூறுகளைக் கொண்டுள்ளது:
• Torch: இது NumPy போன்ற Tensor நூலகமாகக் கருதப்படுகிறது.
• Torch.autograd: இது நாடா அடிப்படையிலான தானியங்கி வேறுபாடு நூலகம்.
• Torch.jit: குறிமுறைவரிகளிலிருந்து வரிசைப்படுத்தக்கூடிய , உகந்த மாதிரிகளை உருவாக்குவதற்கான Tensorஉரைநிரலாகும்
• Torch.nm: இது ஒரு நரம்பியல் வலைபின்னலிற்கான நூலகமாகும்
• Torch.பன்மைசெயலாக்கம்: பைதானின் பன்மைசெயலாக்கம் தரவுபதிவேற்றும் Hogwild பயிற்சி ஆகியவற்றிற்கு மிகபயனுள்ளது.
• Torch.utils: இவை குறிமுறைவரிகளைப் பயன்படுத்துவதற்கான மேம்படுத்துநர் களுக்கான இதர பயன்பாடுகளாகும்.
முக்கிய வசதிவாய்ப்புகள்:
அ. தயார்நிலையிலான உருவாக்கம்: பயன்படுத்த எளிதானது , இயக்க நேர சூழல்களில் குறிமுறைவரிகளை ஒருங்கிணைக்க நெகிழ்வுத்தன்மைகொண்டுள்ளது.
ஆ. Torchserve: PyTorch ஐ எளிதான முறையில் பயன்படுத்துவதற்கான வலுவான கருவியாகும்.
இ. கைபேசி ஆதரவு: பைதான் முதல் iOS , ஆண்ட்ராய்டு ஆகியவை வரையிலான சூழல்களில் வரிசைப்படுத்துதலையும் – இருமுனைகளுக்கு இடையிலான பணிப்பாய்வுகளையும் ஆதரிக்கிறது.
ஈ. கருவிகளையும் நூலகங்களையும் ஒருங்கிணைப்பதில் உறுதியானது.
உ. நாம் பயன்படுத்தி கொள்ளும் முன்புறபகுதியில் சி++ எனும் கணினி மொழியுடன், வடிவமைப்பு ,கட்டமைப்பினை புரிந்து கொள்ள எளிதாகிறது, மேலும் குறைந்த தாமதம் கொண்டது.
ஊ. தயார்நிலையிலான மேககணினிகணிப்பான : மேககணினி API அடிப்படையிலான தடையற்ற ஒருங்கிணைப்பிற்கு PyTorchஆனதுச் நன்கு துணைபுரிகிறது.
இதனுடைய சமீபத்திய பதிப்பு: 1.11.0 ஆகும் மேலும் விவரங்களுக்கு : pytorch.org/ எனும் முகவரியிலுள்ள இதனுடைய அதிகாரப்பூர்வ இணைய தளத்திற்கு செல்க

OpenNN என்பது C++ அடிப்படையிலான மென்பொருள் நூலகமாகும், இது மேம்பட்ட பகுப்பாய்வுகளுக்காக வடிவமைக்கப்பட்டுள்ளது, நரம்பியல் வலைபின்னல்களை செயல்படுத்துகிறது. இந்நூலகம் நிலையானது நினைவக ஒதுக்கீட்டில் மிக விரைவாக செயல்படுமாறு கட்டமைக்கப்பட்டுள்ளது. குறிமுறைவரிகளின் செயல்திறனை அடைய இது தொடர்ந்து இணையாக மேம்படுத்தப்பட்டு வருகின்றது. இது தரவுச் செயலாக்க முறைகளை செயல்படுத்துகிறது.
முக்கிய வசதிவாய்ப்புகள்:
அ. உயர் செயலாக்க வேகம்
ஆ. எளிதான வடிவமைப்பும் செயல்படுத்தலும்
c. -கருத்தமைவின் நிரூபணம் கொண்டது
ஈ. சி++ எனும் கணினிமொழியை சார்ந்தது
மேலும் விவரங்களுக்கு : www.opennn.net/ எனும் முகவரியிலுள்ள இதனுடைய அதிகாரப்பூர்வ இணையதளத்திற்கு செல்க

%d bloggers like this: