சில வாரங்களுக்கு முன்.

நித்யா, தன் கணவர் சீனுவிடம்: எனக்கென்னவோ, இந்த துருவங்கள் நாவலில் வரும் மதன் நீ தான்னு தோணுது. கார்த்திகான்னு ஒருத்தி இருந்தாளா?

சீனு : இல்லைனு நான் சொல்லல. மதன் நானாக இருந்தால் நல்லாத்தான் இருக்கும். அப்போதும் அவள் பெயர் நித்யாவாக இருந்திருக்கும்.

நித்யா : மதன் அளவுக்கு இல்லைன்னாலும், ஏதோ ஓரளவுக்கு உனக்கும் வழியத் தெரியுது. சரி, நாம ஒன்னு பண்ணலாமா? “நன்றி சொல்ல உனக்கு வார்த்தை இல்ல எனக்கு நான்தான் மயங்குறேன்!” – மம்முட்டியும் தேவயானியும் பாடுற இந்த பாட்டுக்கு, நம்ப ரெண்டு பேரும் டான்ஸ் ஆடி, ஒரு ரீல்ஸ் வீடியோ போடுவோமா? உன் பிறந்தநாளுக்கு அதை ஸ்டேட்டஸ் வைக்கப் போறேன்.

சீனு நித்யாவிடம் : ஏ பிள்ள. நமக்கு வயசாயிடுச்சு! சும்மா சின்னப் பசங்களோட போட்டி போட்டு இதெல்லாம் பண்ணிட்டு இருக்காத! (தலைவி தேவயானிக்கு என்று ஒரு ரசிகர் கூட்டம் உள்ளது. அவர்களை தொந்தரவு செய்யக் கூடாது. – இப்படிக்கு தேவயானி ரசிகர் மன்ற முன்னாள் தலைவர் )

நித்யா : சரி, ஒரு கேக்காவது செய்து தரியா? நைட்டு 12 மணிக்கு அதை வெட்டி ஸ்டேட்டஸ் போடலாம்!

சீனிவாசன் : அன்னிக்கு என்ன கிழமை? செவ்வாய் கிழமையா! சாரி! நான் ரொம்ப பிஸி. கேக் பண்ண டைம் கிடைக்காது. (நான் கேக் செய்தால் பிஸ்கட், பொறை மாதிரி தான் வருகிறது. அதை உடைத்து நானே தின்ன வேண்டுமாம். என்ன கொடுமை சரவணா!)

நித்யா : அப்ப எப்படித்தான் என் அன்பை வெளிப்படுத்துறது?

சீனிவாசன் : இப்படி கேட்டதே போதும்மா. நீதான் ஜெனரேட்டிவ் ஏ.ஐ பற்றி ரொம்ப நாளா படிச்சிட்டு இருக்கல்ல! அதைப் பற்றிய தொடர் கட்டுரைகளை என் பிறந்தநாளன்று கணியமில் எழுதத் தொடங்கினால் மிகவும் மகிழ்வேன்!

நித்யா : சரி, செய்கிறேன்! ஆனா பிறந்தநாள் கொண்டாட்டம் எதுவும் இல்லைன்னு வருத்தப் படக்கூடாது.

சீனிவாசன் : சே சே. நீ எழுதினால், அதுவே எனக்கு ரொம்ப சந்தோசம். பாட்டாவே பாடி விடுகிறேன் – “நன்றி சொல்ல உனக்கு வார்த்தை இல்ல எனக்கு” (அப்பாடா! ஒரு 4-5 மாதத்துக்கு நித்யா பிஸி. நான் எது செய்தாலும் கண்டுகொள்ள மாட்டாள். இது போதும் எனக்கு, இது போதுமே! வேறென்ன வேண்டும் இது போதுமே ! )

நித்யா – இனிதே என்றும் வாழ்க.
சீனிவாசன் – தங்கள் சித்தம் என் பாக்கியம்.

ஜெனரேட்டிவ் ஏ.ஐ

ஒரு விஷயத்தை செயற்கையாக உருவாக்குவதற்கு Generative AI என்று பெயர். செயற்கையாக அளிக்கப்படும் பதில்கள், செயற்கையாக உருவாக்கப்படும் வீடியோ, புகைப்படங்கள் போன்ற அனைத்தும் ஜென் ஏ.ஐயில் அடங்கும். இதில் உள்ள விஷயங்களை வகைப்படுத்திப் பார்த்தால் அது மொத்தமாக மூன்று data type -இன் கீழ் அடங்கும்.

எழுத்து வடிவம் : Text processing
ஒலி வடிவம் : Sound/Audio processing
ஒளி வடிவம் : Images/Video processing

ஒரு விஷயத்தை ஒரு முறை ப்ரெடிக்ட் செய்வது மெஷின் லேர்னிங் மற்றும் டீப் லேர்னிங் என்றால், அடுத்தடுத்த ப்ரெடிக்க்ஷன்களைத் தொகுத்து ஒரு புதிய விஷயத்தை உருவாக்குவதே ஜெனரேட்டிவ் ஆகும். ஆகவே எந்தெந்த வகை டேட்டாக்களை தொடர்ந்து இணைக்கும் பொழுது, அது ஒரு புதிய விஷயமாக மாறுகிறதோ அவற்றையே ஜென் ஏ.ஐ கையாள்கிறது. பொதுவாக இது Unstructured data- வைக் கையாள்கிறது. ஏனெனில் எண் தரவுகளை (structured) எவ்வளவு தான் தொடர்ச்சியாக கோர்த்து படித்துப் பார்த்தாலும் அதற்கென்று எந்த ஒரு புது அர்த்தமும் உருவாகாது. ஆனால் சொற்களின் தொடர்ச்சி வாக்கியங்களாகும்; வாக்கியங்களின் தொடர்ச்சி கட்டுரைகளாகும்; பல்வேறு பிக்சல்களின் கலவை புதிய புகைப்படங்களை உருவாக்கும்; பல மியூசிக் நோட்ஸ் தொடர்ச்சி புதிய இசையை உருவாகும். ஆகவே இது போன்ற டேட்டாவை எவ்வாறு மேட்ரிக்ஸ் வடிவில் மாற்றி, நியூரல் நெட்வொர்க்குக்கு பயிற்சி அளிக்கப் போகிறோம் என்பதில் தான் நம் திறமை அடங்கியுள்ளது.

ஜெனரேட்டிவ் ஏ.ஐ பற்றித் துவங்குவதற்கு முன்பாக இதற்கு முன்னர் எழுதிய மெஷின் லேர்னிங் மற்றும் டீப் லேர்னிங் புத்தகத்தில் உள்ளவற்றை ஒரு சிறு தொகுப்பாக இங்கு பார்த்துவிடலாம். ஏனெனில் நியூரல் நெட்வொர்க் கட்டமைப்புகளைப் பற்றி தெளிவாகப் புரிந்து கொள்ளாமல், எழுத்துக்களையும், சொற்களையும், பிக்சல்களையும் மேட்ரிக்ஸ் வடிவில் மாற்றி நியூரல் நெட்வொர்க்குக்கு பயிற்சி அளிக்க முடியாது. அதேபோல லீனியர் மற்றும் லாஜிஸ்டிக் சமன்பாடுகளைப் பற்றி தெரிந்து கொள்ளாமல் நியூரல் நெட்வொர்க் பற்றி புரிந்து கொள்ள முடியாது. ஏனெனில் இவ்விரண்டு சமன்பாடுகளை வைத்தே முழு நியூரல் நெட்வொர்க்கும் இயங்குகிறது. ஆகவே இவை அனைத்தையும் ஒருமுறை தெளிவாக, ஆழமாகப் புரிந்து கொண்டு விட்டால் ஜென் ஏ.ஐ என்பதை ஊதித் தள்ளிவிட முடியும். இவை அனைத்தையும் மீண்டும் ஒருமுறை படிப்பது, அரைத்த மாவையே அரைப்பது போல் இருந்தாலும், இந்த மாவு நன்கு அரைக்கப்பட்டால் தான் ஜென் ஏ.ஐ எனும் இட்லி பூப்போல வரும்.

Machine Learning, Deep Learning பற்றிய இலவச மின்னூல்களை இங்கே பதவிறக்கம் செய்யலாம்.

எளிய தமிழில் Machine Learning

freetamilebooks.com/ebooks/learn_machine_learning_in_tamil/

எளிய தமிழில் Deep Learning

freetamilebooks.com/ebooks/learn_deep_learning_in_tamil/

அப்படியே துருவங்கள் நாவலையும் படித்து, லினக்ஸ், காதலில் திளைத்து மகிழுங்கள். ஒரு ரொமான்ஸ் நாவலில் லினக்ஸ் சொல்லித்தரும் மாயப்புத்தகம் அது.

freetamilebooks.com/ebooks/dhuruvangal-technical-novel/

எனது எல்லா மின்னூல்களையும் இங்கே இலவசமாகப் பெறலாம்.

freetamilebooks.com/authors/nithyaduraisamy/

இனி, Gen AI பற்றிக் காண்போம்.

Linear Regression

ஒரு அல்காரிதம் அதனுடைய பயிற்சிக்காக அளிக்கப்படும் எண்களுக்கு இடையே உள்ள தொடர்புகளைப் பயன்படுத்தியே, அந்த எண்களைப் பற்றிக் கற்றுக் கொள்ள முயலுகிறது. அதாவது பயிற்சிக்கு அளிக்கப்படும் டேட்டாக்களுக்கு இடையே உள்ள variance மற்றும் covariance போன்றவற்றைக் கணக்கிட்டு, அதனடிப்படையில் இரண்டு parameters-ஐ உருவாக்குகிறது. அவை முறையே intercept term மற்றும் coefficient term அல்லது ஆல்ஃபா, பீட்டா அல்லது தீட்டா 1, தீட்டா 2 என்றெல்லாம் பல்வேறு பெயர்களில் அழைக்கப்படுகின்றன. அவைகளை கொடுக்கப்பட்டுள்ள ஒவ்வொரு மதிப்புடனும் சேர்த்து உருவாக்குகின்ற புதிய மதிப்புகளையே, தனது புரிதலுக்காகப் பயன்படுத்திக் கொள்கிறது. இந்தப் புதிய மதிப்புகளையும், நம்முடைய ட்ரெய்னிங் டேட்டாவையும் graph போட்டுப் பார்த்தால் அது ஒரிஜினல் டேட்டாவுக்கு மத்தியில் ஒரு நேர்கோடு போலக் காணப்படும். எனவே தான் இது Linear Regression என்று அழைக்கப்படுகிறது. இந்த ஒரிஜினல் டேட்டாவுக்கும் புதிய டேட்டாவுக்கும் இடையே உள்ள வித்தியாசமே error / loss ஆகும். இதைக் கண்டுபிடிக்க உதவுவது cost function எனவும், குறைக்க உதவுவது Gradient Descent எனவும் அழைக்கப்படுகிறது. RMSE என்பது இதனுடைய காஸ்ட் ஃபங்ஷன் வெளிப்படுத்தும் மதிப்பாகும். இதனைக் குறைக்க உதவும் gradient descent நிகழ்வில், மீச்சிறு அளவில் parameters-ன் மதிப்புகளை மாற்றி மீண்டும் error-ஐக் கணக்கிடும். அப்போதும் அது குறையவில்லையெனில், பெராமீட்டர்சை மீண்டும் மாற்றும். Contour Plots என்பது இந்த ப்ராசசை வரைபடமாகக் காட்ட உதவும். இந்த வரைபடத்தில் error கொஞ்சம் கொஞ்சமாகக் குறைந்து கொண்டே வரும்போது, திடீரென ஒரு கட்டத்தில் அதிகரிக்க ஆரம்பிக்கும். எனவே எந்த இடத்தில் இந்த ப்ராசசை நிறுத்த வேண்டும் என்பதைக் குறிப்பிடும் புள்ளியே global optimum ஆகும். அதாவது “குறைந்த error மதிப்பினை வெளிப்படுத்தக்கூடிய பெராமீட்டர் கிடைத்து விட்டது; ஆகவே இந்த சுழற்சியை நிறுத்திக் கொள்ளலாம்!” என்று அர்த்தம். இந்நிலையை அடைவதற்கு convergence என்று பெயர். வெவ்வேறு features-ம் வெவ்வேறு எண் வரம்புகளில் இருப்பின், இந்நிலையை அடைவதற்கு மிகுந்த நேரம் பிடிக்கும் என்பதால், அனைத்தையும் ஒரே மாதிரி எண் வரம்புகளுக்குள் அமைக்க உதவுவதே Features scaling ஆகும்.

— தொடரும்

நித்யா துரைசாமி

nithyadurai87@gmail.com

எளிய தமிழில் Generative AI – 1

ஜெனரேட்டிவ் ஏ.ஐ

Linear Regression

Like this:

Related

2 thoughts on “எளிய தமிழில் Generative AI – 1”

Leave a ReplyCancel reply

ஜெனரேட்டிவ் ஏ.ஐ

Linear Regression

பகிர்ந்து கொள்க

Like this:

Related

2 thoughts on “எளிய தமிழில் Generative AI – 1”

Leave a ReplyCancel reply