எளிய தமிழில் Generative AI – 1

By | February 18, 2025

சில வாரங்களுக்கு முன்.

நித்யா, தன் கணவர் சீனுவிடம்: எனக்கென்னவோ, இந்த துருவங்கள் நாவலில் வரும் மதன் நீ தான்னு தோணுது. கார்த்திகான்னு ஒருத்தி இருந்தாளா?

சீனு : இல்லைனு நான் சொல்லல. மதன் நானாக இருந்தால் நல்லாத்தான் இருக்கும். அப்போதும் அவள் பெயர் நித்யாவாக இருந்திருக்கும்.

நித்யா : மதன் அளவுக்கு இல்லைன்னாலும், ஏதோ ஓரளவுக்கு உனக்கும் வழியத் தெரியுது. சரி, நாம ஒன்னு பண்ணலாமா? “நன்றி சொல்ல உனக்கு வார்த்தை இல்ல எனக்கு நான்தான் மயங்குறேன்!” – மம்முட்டியும் தேவயானியும் பாடுற இந்த பாட்டுக்கு, நம்ப ரெண்டு பேரும் டான்ஸ் ஆடி, ஒரு ரீல்ஸ் வீடியோ போடுவோமா? உன் பிறந்தநாளுக்கு அதை ஸ்டேட்டஸ் வைக்கப் போறேன்.

சீனு நித்யாவிடம் : ஏ பிள்ள. நமக்கு வயசாயிடுச்சு! சும்மா சின்னப் பசங்களோட போட்டி போட்டு இதெல்லாம் பண்ணிட்டு இருக்காத! (தலைவி தேவயானிக்கு என்று ஒரு ரசிகர் கூட்டம் உள்ளது. அவர்களை தொந்தரவு செய்யக் கூடாது. – இப்படிக்கு தேவயானி ரசிகர் மன்ற முன்னாள் தலைவர் )

நித்யா : சரி, ஒரு கேக்காவது செய்து தரியா? நைட்டு 12 மணிக்கு அதை வெட்டி ஸ்டேட்டஸ் போடலாம்!

சீனிவாசன் : அன்னிக்கு என்ன கிழமை? செவ்வாய் கிழமையா! சாரி! நான் ரொம்ப பிஸி. கேக் பண்ண டைம் கிடைக்காது. (நான் கேக் செய்தால் பிஸ்கட், பொறை மாதிரி தான் வருகிறது. அதை உடைத்து நானே தின்ன வேண்டுமாம். என்ன கொடுமை சரவணா!)

நித்யா : அப்ப எப்படித்தான் என் அன்பை வெளிப்படுத்துறது?

சீனிவாசன் : இப்படி கேட்டதே போதும்மா. நீதான் ஜெனரேட்டிவ் ஏ.ஐ பற்றி ரொம்ப நாளா படிச்சிட்டு இருக்கல்ல! அதைப் பற்றிய தொடர் கட்டுரைகளை என் பிறந்தநாளன்று கணியமில் எழுதத் தொடங்கினால் மிகவும் மகிழ்வேன்!

நித்யா : சரி, செய்கிறேன்! ஆனா பிறந்தநாள் கொண்டாட்டம் எதுவும் இல்லைன்னு வருத்தப் படக்கூடாது.

சீனிவாசன் : சே சே. நீ எழுதினால், அதுவே எனக்கு ரொம்ப சந்தோசம். பாட்டாவே பாடி விடுகிறேன் – “நன்றி சொல்ல உனக்கு வார்த்தை இல்ல எனக்கு” (அப்பாடா! ஒரு 4-5 மாதத்துக்கு நித்யா பிஸி. நான் எது செய்தாலும் கண்டுகொள்ள மாட்டாள். இது போதும் எனக்கு, இது போதுமே! வேறென்ன வேண்டும் இது போதுமே ! )

நித்யா – இனிதே என்றும் வாழ்க.
சீனிவாசன் – தங்கள் சித்தம் என் பாக்கியம்.

ஜெனரேட்டிவ் ஏ.ஐ

ஒரு விஷயத்தை செயற்கையாக உருவாக்குவதற்கு Generative AI என்று பெயர். செயற்கையாக அளிக்கப்படும் பதில்கள், செயற்கையாக உருவாக்கப்படும் வீடியோ, புகைப்படங்கள் போன்ற அனைத்தும் ஜென் ஏ.ஐயில் அடங்கும். இதில் உள்ள விஷயங்களை வகைப்படுத்திப் பார்த்தால் அது மொத்தமாக மூன்று data type -இன் கீழ் அடங்கும்.

  • எழுத்து வடிவம் : Text processing
  • ஒலி வடிவம் : Sound/Audio processing
  • ஒளி வடிவம் : Images/Video processing

ஒரு விஷயத்தை ஒரு முறை ப்ரெடிக்ட் செய்வது மெஷின் லேர்னிங் மற்றும் டீப் லேர்னிங் என்றால், அடுத்தடுத்த ப்ரெடிக்க்ஷன்களைத் தொகுத்து ஒரு புதிய விஷயத்தை உருவாக்குவதே ஜெனரேட்டிவ் ஆகும். ஆகவே எந்தெந்த வகை டேட்டாக்களை தொடர்ந்து இணைக்கும் பொழுது, அது ஒரு புதிய விஷயமாக மாறுகிறதோ அவற்றையே ஜென் ஏ.ஐ கையாள்கிறது. பொதுவாக இது Unstructured data- வைக் கையாள்கிறது. ஏனெனில் எண் தரவுகளை (structured) எவ்வளவு தான் தொடர்ச்சியாக கோர்த்து படித்துப் பார்த்தாலும் அதற்கென்று எந்த ஒரு புது அர்த்தமும் உருவாகாது. ஆனால் சொற்களின் தொடர்ச்சி வாக்கியங்களாகும்; வாக்கியங்களின் தொடர்ச்சி கட்டுரைகளாகும்; பல்வேறு பிக்சல்களின் கலவை புதிய புகைப்படங்களை உருவாக்கும்; பல மியூசிக் நோட்ஸ் தொடர்ச்சி புதிய இசையை உருவாகும். ஆகவே இது போன்ற டேட்டாவை எவ்வாறு மேட்ரிக்ஸ் வடிவில் மாற்றி, நியூரல் நெட்வொர்க்குக்கு பயிற்சி அளிக்கப் போகிறோம் என்பதில் தான் நம் திறமை அடங்கியுள்ளது.

ஜெனரேட்டிவ் ஏ.ஐ பற்றித் துவங்குவதற்கு முன்பாக இதற்கு முன்னர் எழுதிய மெஷின் லேர்னிங் மற்றும் டீப் லேர்னிங் புத்தகத்தில் உள்ளவற்றை ஒரு சிறு தொகுப்பாக இங்கு பார்த்துவிடலாம். ஏனெனில் நியூரல் நெட்வொர்க் கட்டமைப்புகளைப் பற்றி தெளிவாகப் புரிந்து கொள்ளாமல், எழுத்துக்களையும், சொற்களையும், பிக்சல்களையும் மேட்ரிக்ஸ் வடிவில் மாற்றி நியூரல் நெட்வொர்க்குக்கு பயிற்சி அளிக்க முடியாது. அதேபோல லீனியர் மற்றும் லாஜிஸ்டிக் சமன்பாடுகளைப் பற்றி தெரிந்து கொள்ளாமல் நியூரல் நெட்வொர்க் பற்றி புரிந்து கொள்ள முடியாது. ஏனெனில் இவ்விரண்டு சமன்பாடுகளை வைத்தே முழு நியூரல் நெட்வொர்க்கும் இயங்குகிறது. ஆகவே இவை அனைத்தையும் ஒருமுறை தெளிவாக, ஆழமாகப் புரிந்து கொண்டு விட்டால் ஜென் ஏ.ஐ என்பதை ஊதித் தள்ளிவிட முடியும். இவை அனைத்தையும் மீண்டும் ஒருமுறை படிப்பது, அரைத்த மாவையே அரைப்பது போல் இருந்தாலும், இந்த மாவு நன்கு அரைக்கப்பட்டால் தான் ஜென் ஏ.ஐ எனும் இட்லி பூப்போல வரும்.

Machine Learning, Deep Learning பற்றிய இலவச மின்னூல்களை இங்கே பதவிறக்கம் செய்யலாம்.

எளிய தமிழில் Machine Learning

freetamilebooks.com/ebooks/learn_machine_learning_in_tamil/

எளிய தமிழில் Deep Learning

freetamilebooks.com/ebooks/learn_deep_learning_in_tamil/

அப்படியே துருவங்கள் நாவலையும் படித்து, லினக்ஸ், காதலில் திளைத்து மகிழுங்கள். ஒரு ரொமான்ஸ் நாவலில் லினக்ஸ் சொல்லித்தரும் மாயப்புத்தகம் அது.

freetamilebooks.com/ebooks/dhuruvangal-technical-novel/

எனது எல்லா மின்னூல்களையும் இங்கே இலவசமாகப் பெறலாம்.

freetamilebooks.com/authors/nithyaduraisamy/

இனி, Gen AI பற்றிக் காண்போம்.

Linear Regression

ஒரு அல்காரிதம் அதனுடைய பயிற்சிக்காக அளிக்கப்படும் எண்களுக்கு இடையே உள்ள தொடர்புகளைப் பயன்படுத்தியே, அந்த எண்களைப் பற்றிக் கற்றுக் கொள்ள முயலுகிறது. அதாவது பயிற்சிக்கு அளிக்கப்படும் டேட்டாக்களுக்கு இடையே உள்ள variance மற்றும் covariance போன்றவற்றைக் கணக்கிட்டு, அதனடிப்படையில் இரண்டு parameters-ஐ உருவாக்குகிறது. அவை முறையே intercept term மற்றும் coefficient term அல்லது ஆல்ஃபா, பீட்டா அல்லது தீட்டா 1, தீட்டா 2 என்றெல்லாம் பல்வேறு பெயர்களில் அழைக்கப்படுகின்றன. அவைகளை கொடுக்கப்பட்டுள்ள ஒவ்வொரு மதிப்புடனும் சேர்த்து உருவாக்குகின்ற புதிய மதிப்புகளையே, தனது புரிதலுக்காகப் பயன்படுத்திக் கொள்கிறது. இந்தப் புதிய மதிப்புகளையும், நம்முடைய ட்ரெய்னிங் டேட்டாவையும் graph போட்டுப் பார்த்தால் அது ஒரிஜினல் டேட்டாவுக்கு மத்தியில் ஒரு நேர்கோடு போலக் காணப்படும். எனவே தான் இது Linear Regression என்று அழைக்கப்படுகிறது. இந்த ஒரிஜினல் டேட்டாவுக்கும் புதிய டேட்டாவுக்கும் இடையே உள்ள வித்தியாசமே error / loss ஆகும். இதைக் கண்டுபிடிக்க உதவுவது cost function எனவும், குறைக்க உதவுவது Gradient Descent எனவும் அழைக்கப்படுகிறது. RMSE என்பது இதனுடைய காஸ்ட் ஃபங்ஷன் வெளிப்படுத்தும் மதிப்பாகும். இதனைக் குறைக்க உதவும் gradient descent நிகழ்வில், மீச்சிறு அளவில் parameters-ன் மதிப்புகளை மாற்றி மீண்டும் error-ஐக் கணக்கிடும். அப்போதும் அது குறையவில்லையெனில், பெராமீட்டர்சை மீண்டும் மாற்றும். Contour Plots என்பது இந்த ப்ராசசை வரைபடமாகக் காட்ட உதவும். இந்த வரைபடத்தில் error கொஞ்சம் கொஞ்சமாகக் குறைந்து கொண்டே வரும்போது, திடீரென ஒரு கட்டத்தில் அதிகரிக்க ஆரம்பிக்கும். எனவே எந்த இடத்தில் இந்த ப்ராசசை நிறுத்த வேண்டும் என்பதைக் குறிப்பிடும் புள்ளியே global optimum ஆகும். அதாவது “குறைந்த error மதிப்பினை வெளிப்படுத்தக்கூடிய பெராமீட்டர் கிடைத்து விட்டது; ஆகவே இந்த சுழற்சியை நிறுத்திக் கொள்ளலாம்!” என்று அர்த்தம். இந்நிலையை அடைவதற்கு convergence என்று பெயர். வெவ்வேறு features-ம் வெவ்வேறு எண் வரம்புகளில் இருப்பின், இந்நிலையை அடைவதற்கு மிகுந்த நேரம் பிடிக்கும் என்பதால், அனைத்தையும் ஒரே மாதிரி எண் வரம்புகளுக்குள் அமைக்க உதவுவதே Features scaling ஆகும்.

— தொடரும்

நித்யா துரைசாமி

nithyadurai87@gmail.com