ஆழ்கற்றல் அடிப்படையிலான அரட்டைஅரங்குகள்

  தற்கால அரட்டைஅரங்குகள்அனைத்தும் இயந்திர கற்றல், இயற்கை மொழி செயலாக்கம், செயற்கை நுண்ணறிவு , ஆழ்கற்றல் ஆகியவற்றை விரிவாகப் பயன்படுத்துகின்றன. அவை பொதுவாக எல்லா  வாடிக்கையாளர் சேவைவழங்கிடும் இடங்களில் பயன்படுத்தப்படுகின்றன. ஆழ்கற்றலை அடிப்படையாகக் கொண்ட அரட்டைஅரங்குகள் பாரம்பரிய வகைகளை விட மிகச் சிறந்தவைகளாக விளங்குகின்றன. அதற்கான காரணம் பின்வருமாறு.
வாடிக்கையாளர்களின் நடத்தைகளை மாற்றுவதற்காக தற்போது அரட்டைஅரங்குகள் விரிவாகப் பயன்பட்தி கொள்ளப் படுகின்றன. வழக்கமாக, பாரம்பரிய செயற்கை நுண்ணறிவு (AI) கருத்துக்கள் அரட்டைஅரங்குகளை வடிவமைப்பதில் பயன்படுத்தப்படுகின்றன. இருப்பினும், நவீன பயன்பாடுகள் இதுபோன்ற பரந்த அளவிலான தரவுகளை உருவாக்குகின்றன, இது பாரம்பரிய AI வழிமுறைகளுடன் இதனை இணைத்து ச் செயலாக்குவது என்பது மிக கடினமான செயலாக விளங்குகின்றது.
ஆழ்கற்றல் என்பது AI இன் துணைக்குழு மற்றும் பெரிய அளவிலான தரவுகளை செயலாக்க மிகவும் பொருத்தமான தொழில்நுட்பமாகும். ஆழ்கற்றல் அடிப்படையிலான அமைப்புகள் ஏராளமான தரவுகளின் புள்ளியியல் விவரங்களிலிருந்து கற்றுக்கொள்கின்றன. ஆழ் கற்றலுக்கான சரியான போட்டியாளர்களாக அரட்டை அரங்குகள் போன்ற அமைப்புகள் உள்ளன, ஏனெனில் அவை துல்லியமான செயல்திறனை அடைய கணினியைப் பயிற்றுவிக்க ஏராளமான தரவுகளின் புள்ளியியல் விவரங்கள் தேவைப்படுகின்றன. அரட்டை அரங்குகளின் முக்கிய நோக்கம், அது பெறுகின்ற எந்தவொரு கேள்வி அல்லது செய்திக்கும் மிகவும் பொருத்தமான பதிலை வழங்குவதாகும். அரட்டைஅரங்கிலிருந்து சிறந்த பதிலுக்கு பல வசதிவாய்ப்புகள் உள்ளன, அவை:  
இதில் வழக்கமான ஒரு நடைமுறையில் சிறப்பாகஅரட்டை அடிக்க முடியும்,  உடனுக்குடன் அழைப்பாளரின் கேள்விக்கு பதிலளிக்கமுடியும் , தொடர்புடைய தகவல்களை தொடர்புடைய நிலையில் வழங்கமுடியும்
இதில் உண்மையான உரையாடலைப் போன்றே பின்தொடர்தல் கேள்விகளை எழுப்புதல் ஆகிய செயல்களை செய்திடமுடியும் 
 இந்த ஆழ்கற்றல் தகவல்களை செயலாக்க மனித மனதை உருவகப்படுத்துகிறது. இது பலவிதமான தகவல்களை வகைப்படுத்துவதன் மூலம் மனித மூளையைப் போலவே செயல்படுகிறது, மேலும் இந்த தகவலை அரட்டை அரங்க அமைப்புகளுக்கு ஏற்ற வகையில் வகைப்படுத்துவதற்காக பயன்படும் வசதி வாய்ப்புகளை தானாகவே கண்டுபிடிக்கின்றது.
 ஆழ்கற்றலைப் பயன்படுத்தி அரட்டைஅரங்குகளை வடிவமைப்பதற்கான படிமுறைகள்
ஆழ்கற்றலைப் பயன்படுத்தி அரட்டைஅரங்குகளை வடிவமைக்கும்போது, மனித நிருவாகத்தின் தேவையை முடிந்தவரை குறைத்து கணினியை முழுமையாக தானியக்கமாக ஆக்குவதாகும். இதனை அடைய, வாடிக்கையாளர்களுக்கான சேவையாளர்களின் தேவையை முற்றிலுமாக ஒழித்து, அனைத்து மனித நிபுணர்களையும் ஒரு அரட்டைஅரங்குடன் முழுமையாக மாற்ற வேண்டும்.
   வாடிக்கையாளர்களுடன் தொடர்பு கொள்ளும்போது முக்கியமான சொற்றொடர்களை இயந்திரத்திற்குக் கற்பிப்பதற்காக, வாடிக்கையாளர்களுக்கும் சேவையாளர்களுக்கும் இடையில் இருக்கும் தொடர்புகளை சேகரிப்பதேஅரட்டைஅரங்கை வடிவமைக்கும் முதல் படிமுறையாகும். இது ontology உருவாக்கம் என்று அழைக்கப்படுகிறது.
   தரவுகளை தயாரித்தல் அல்லது தரவுகளின் முன் செயலாக்கம் என்பது அரட்டைஅரங்கை வடிவமைப்பதின் அடுத்த கட்டமாகும்.இது tokenisation, stemming ,lemmatising  போன்ற பல படிமுறைகளை  கொண்டுள்ளது. இந்த கட்டத்தில் பேசும் மொழியின் இலக்கணத்தை இயந்திர புரிதலுடன் ஒருங்கிணைக்ன்கிறது. 
   மூன்றாவது படிமுறையாக  அரட்டைஅரங்கின் பொருத்தமான மாதிரியை தீர்மானிப்பதை உள்ளடக்கியதாகும்.இதில்   மீட்டெடுப்பு அடிப்படையிலானது , உற்பத்திஅடிப்படையிலானது ஆகிய இரண்டு முக்கிய மாதிரிகள் உள்ளன . மீட்டெடுப்பு மாதிரிகள் முன் வரையறுக்கப்பட்ட பதில்களின் களஞ்சியத்தைப் பயன்படுத்துகின்றன, அதே நேரத்தில் உற்பத்தி மாதிரிகள் ஆழ்கற்றல் கருத்துகளைப் பயன்படுத்துகின்ற மீட்டெடுப்பு மாதிரியின் மேம்பட்ட பதிப்புகளாகும்.
இந்நிலையில் வாடிக்கையாளர் தொடர்புகளை திறம்பட கையாள பொருத்தமான நுட்பத்தை முடிவு செய்வதே அடுத்த கட்டசெயலாகும்.
இப்போது நாம் அரட்டைஅரங்கைவடிவமைத்து செயல்படுத்த தயாராக உள்ளோம். செயல்படுத்த பொருத்தமான நிரலாக்க மொழியைப் பயன்படுத்திடுக. இது வெற்றிகரமாக செயல்படுத்தப்பட்டதும், அதில் பிழைகள் இருப்பதைக் கண்டறிய அதை பரிசோதித்திடுக.
அரட்டைஅரங்குகளுக்கான ஆழ்கற்றல் அடிப்படையிலான மாதிரிகள்
உருவாக்குகின்ற மாதிரிகள் ஆழ்கற்றலை அடிப்படையாகக் கொண்டவைகளாகும்.மேலும் அவை அரட்டைஅரங்குகளுக்கான புத்திசாலித்தனமான மாதிரிகளுமாகும், ஆனால் அவற்றை உருவாக்குவதிலும் செயல்படுத்துவதிலும் மிகவும் சிக்கலானவைகளாகும். பேசும் மொழியில் சொற்பொருட்களின் ஒற்றுமையைப் பயன்படுத்துவதால் அவை எந்தவொரு வினவலுக்கும் சிறந்த பதிலை அளிக்கின்றன, இது பொதுவான குணாதிசயங்களைக் கொண்ட சொற்களை அடையாளம் காட்டுகிறது.
தொடர்ச்சியான நரம்பியல் வலைபின்னலின்(Recurrent Neural Network (RNN)) encoder-decoder என்பது அரட்டைஅரங்குகளுக்கான இறுதியாக உருவாக்குகின்ற மாதிரியாகும், மேலும் இது இரண்டு RNNகளை கொண்டதாகும்., encoderஆனது சொற்றொடரை  உள்ளீடாக எடுத்துகொண்டு ஒரு நேரத்தில் ஒருசொல்லை மட்டும் செயலாக்குகிறது. இது சொற்களின் தொடரை முன்னரே தீர்மானிக்கப்பட்ட அளவு அம்ச திசையனாக(vector)மொழிபெயர்க்கிறது. இது குறிப்பிடத்தக்க சொற்களை மட்டுமே எடுத்து தேவையற்றவற்றை நீக்குகின்றது.  இந்தencoderஎனும்மறைகுறியாக்கியானது பல மறைக்கப்பட்ட அடுக்குகளைக் கொண்டுள்ளது, அதில் ஒரு அடுக்கு மற்றொன்றை பாதிக்கின்றது. இறுதி மறைக்கப்பட்ட அடுக்கு முழு வாக்கியத்திற்கும் சுருக்க அடுக்காக செயல்படுகின்றது.
decoderஎனும்எதிர்மறைகுறியாக்கியானது, மறுபுறம், ஒரு நேரத்தில் ஒருசொல்லை மட்டும் மற்றொரு தொடராக உருவாக்குகிறது, இவ்வாறான சூழலாலும் முன்னர் உருவாக்கப்பட்ட சொற்களாலும்இந்த decoderஆனது பாதிக்கப்படுகிறது..
பொதுவாக, இந்த மாதிரியானது நிலையான நீளமான வரிசைசொற்தொடர்களுக்கு மிகவும் பொருத்தமானதாகும்; இருப்பினும், இம்மாதிரியைப் பயிற்றுவிப்பதற்கு முன், மாறியின் நீளத் தொடரை நிலையான நீளத் தொடராக மாற்ற திணிப்பு கருத்துக்களை பயன்படுத்தப்படுகின்றன. உதாரணத்திற்கு: 

Query : [P P P P P P “What” “About” “Placement” “ ?” ]

//நிலையான நீளம் 10.P என்பது தினிப்பு என்று வைத்துக் கொள்க

Response : [ SD “ It” “is” “Almost” “100%” END P P P P ]

// இங்கு SD என்பது decodingதொடங்குதலாகும். END எனில் பதில் முடிந்ததாகும்.  P என்பது திணிப்புஆகும்.
 சொல் உட்பொதிதல் என்பது ஆழ்கற்றல் அடிப்படையிலான அரட்டைஅரங்குகளின் மற்றொரு முக்கிய வசதியாகும். இந்த வசதியின் வாயிலாக சொற்றொடரில் உள்ள சொற்களின் சூழல், சொற்பொருள் , தொடரியல் ஒற்றுமைகள் , பிற சொற்களுடனான உறவைப் பராமரித்தில் ஆகியவற்றை பெறமுடியும். Word2Vec என்பது சொல் உட்பொதிப்பை உருவாக்குகின்ற ஒரு பிரபலமான வழிமுறையாகும். Word2Vecல் இரண்டு முக்கிய நுட்பங்கள் உள்ளன மேலும்  தொடர்ச்சியான சொற்களின் பை(CBOW) ,தொடர்ச்சியான தாவியின்-CSGஆகிய இரண்டு நரம்பியல் வலைபின்னல்களை அடிப்படையாகக் கொண்டவைகளாகும் - .
தொடர்ச்சியான சொற்களின் பைஎனும் வழிமுறையானது பொதுவாக வசதிகளை உருவாக்கும் கருவியாகப் பயன்படுத்தப்படுகிறது. ஒரு சொற்றொடரானதும் முதலில் சொற்களின் பையாக மாற்றப்படுகிறது. அதன் பிறகு, அந்த சொற்றொடரின் தன்மையைக் காட்ட பல்வேறு நடவடிக்கைகள் கணக்கிடப்படுகின்றன.
அதிர்வெண் என்பது CBOW இன் முக்கிய நடவடிக்கையாகும். இது அடிக்கடி வரும் சொற்களுக்கு சிறந்த துல்லியத்தை வழங்குகிறது. தொடர்ச்சியான தாவியின்-CSG எனும் வழிமுறையான் CBOW வழிமுறையின் தலைகீழாகும். இது இலக்கிலிருந்து மூல சூழல் சொற்களைக் கணிக்க முயற்சிக்கின்றது. குறைவான பயிற்சி தரவு தொகுப்புகளில் இது நன்றாக செயல்படுகின்றது.
ஆழ்கற்றலைப் பயன்படுத்தும் அரட்டைஅரங்குகளை உருவாக்கிடுவதற்கான படிமுறைகள் பின்வருமாறு:
படிமுறை 1: கார்பஸ் சொற்களஞ்சியத்தை உருவாக்கிடுக.
படி முறை2: ஒவ்வொரு சொல்லுடனும் ஒரு தனிப்பட்ட எண் அடையாளங்காட்டியை வரைபடமாக்கிடுக.
படி முறை3: சூழல் சொற்களின் அளவை சரி செய்திடுக.
படி முறை4: ஒரு ஜோடி இலக்கு சொற்களை உருவாக்கி சூழல் சொற்களைச் சுற்றி்அமைத்திடுக.
படி முறை5: CBOWவழிமுறை மாதிரிக்கான ஆழ்கற்றல் கட்டமைப்பை உருவாக்கிடுக. இது பின்வரும் வரிசையை உள்ளடக்கியது: சூழல் சொற்களாக உள்ளீடு செய்து துவங்கிடுக, உட்பொதிப்புகள் என்ற சொல்லை ஒழுங்குபடுத்தி, நெருக்கமான மென்பொருளை உருவாக்கிடுக, இலக்கு சொல்லை கணித்திடுக, உண்மையான இலக்கு சொல்லுடன் பொருத்தமாக அமைத்து, இழப்பைக் கணக்கிடுக, உட்பொதித்த அடுக்கைப் புதுப்பிக்க மீண்டும் பரப்புதல் செய்க
படி முறை6: மாதிரியைப் பயிற்றுவித்திடுக.
படி முறை7: மாதிரியை பரிசோதித்திடுக.
அரட்டைஅரங்குகளுக்கான ஆழ்கற்றல் கருவிகள் 

ஆழ்கற்றலைப் பயன்படுத்துகின்ற சிறந்த கருவி TensorFlowஆகும் பயனுள்ள உரையாடலை அடைய இது நேரியல் பின்னடைவைப் பயன்படுத்துன்கிறது. வடிவங்களை அங்கீகரிக்க JSON ஐப் பயன்படுத்துவதன் மூலம் நாம் முதலில் TensorFlow மாதிரியை உருவாக்க வேண்டும். அடுத்த கட்டத்தில் இந்த கட்டமைப்பை மேலேற்றுவதோடு தரவுகளை சூழ்நிலைகளுக்கு ஏற்பகட்டமைப்புசெய்வதும் ஆகும். TensorFlow ஆனது அரட்டை அரங்குகளை யதார்த்தமானதாகவும் மிகவும் பயனுள்ளதாகவும் ஆக்குகிறது.
மைக்ரோசாஃப்ட் உரையாடல
ிற்கான
AI கருவிகள் பயனுள்ள அரட்டை அரங்குகளை வடிவமைக்க மற்றொரு முக்கியமான ஆதாரமாகும். புத்திசாலித்தனமான அரட்டைஅரங்குகளை வடிவமைக்க, இணைக்க, நிறுவுகைசெய்திட நிறைவேற்றுகைசெய்திட இந்த கருவிகளைப் பயன்படுத்தலாம். மைக்ரோசாப்ட் அரங்குகட்டமைப்பாளர்(Bot Builder) மென்பொருள் மேம்பாட்டு கருவி (SDK)ஆனது நுண்ணறிவு கொண்ட அரட்டைஅரங்குகளின் விரைவான, இலவச மற்றும் எளிதான வளர்ச்சிக்கு ஏற்றதாக விளங்குகின்றது.
அரட்டைஅரங்குகள் போன்ற பயன்பாடுகளுக்கான பைதான் அடிப்படையிலான பைடோர்ச் ஒரு சிறந்த திறமூல நூலகமாகும்.
Optim module
நரம்பியல் வலைபின்னல்களின் அடிப்படையில் பல்வேறு வழிமுறைகளை செயல்படுத்துகிறது, அவை திறமையான அரட்டைஅரங்குகளை வடிவமைக்க அவசியமாக தேவைபபடுகின்றன. இது Tensorsகளின் சக்தியையும் வழங்குகிறது, எனவே TensorFlowபோன்ற செயல்பாடுகளையும் கொண்டுள்ளது.
எந்தவொரு மனித தலையீடும் இல்லாமல் வாடிக்கையாளர்களைக் கையாளுவதை நிறுவனங்கள் நோக்கமாகக் கொண்டால்
அரட்டைஅரங்குகள் அவசியம் தேவையாகும்
. விவாதிக்கப்பட்டபடி, பாரம்பரிய மாறுபாடுகளுடன் ஒப்பிடும்போது ஆழ்கற்றல் அடிப்படையிலான அரட்டைஅரங்குகள் சிறந்த வழிமுறையாகும், ஏனெனில் முந்தையவை ஏராளமான தரவுகளை திறமையாகக் கையாளுகின்றன. நவீன சூழலில் அரட்டைஅரங்குகளை உருவாக்குவதற்கான உருவாக்கும் மாதிரிகள் மிகவும் பொருத்தமானவைகளாகும்.

%d bloggers like this: