Author Archives: நித்யா

எளிய தமிழில் Generative AI – 3

Gradient Descent இதன் cost மதிப்பு infinity என்பதால், இதைக் குறைப்பதற்கு ஒன்றுமில்லை, இருந்தாலும் gradient descent முறையில் சரியான பெராமீட்டர்ஸ் கண்டுபிடிக்கலாம். லீனியர் ரெக்ரேஷனில் ஒரு குறிப்பிட்ட error மதிப்பு கொஞ்சம் கொஞ்சமாகக் குறைந்து கொண்டே வரும்போது, அதற்கான வரைபடமானது கின்னம் போன்று குவிந்த நிலையில் அமையும். இந்நிலைக்கு convex என்று பெயர். ஆகவே அக்குவிநிலையின் அடிப்பாகமே குளோபல் ஆப்டிமம் ஆகும். ஆனால் லாஜிஸ்டிக் ரெக்ரேஷனில் error மதிப்பு 0,1 0,1 என ஏறியிறங்கி ஏறியிறங்கி… Read More »

எளிய தமிழில் Generative AI – 2

Polynomial Features லீனியர் அல்காரிதம் போடும் கோடு, ஒரிஜினல் டேட்டாவுக்கு மத்தியில் இல்லாமல், எங்கோ ஒரு ஓரமாகக் காணப்படின் underfitting என்று பெயர். அந்த ஓரத்தில் உள்ள டேட்டாவை மட்டும் அல்காரிதம் cover செய்கிறது என்று அர்த்தம். டேட்டா Non-linear ஆக இருப்பின் இவ்வாறு அமைந்துவிடும். இது போன்ற சமயங்களில் அல்காரிதம் உருவாக்கும் கோடு, நேர்கோடாக இல்லாமல் வளைந்து நெளிந்து அனைத்து மூலைகளில் உள்ள டேட்டாவையும் கவர் செய்யுமாறு அமைப்பதற்கு polynomial Regression என்று பெயர். அன்டர்ஃபிட்டிங் … Read More »

எளிய தமிழில் Generative AI – 1

சில வாரங்களுக்கு முன். நித்யா, தன் கணவர் சீனுவிடம்: எனக்கென்னவோ, இந்த துருவங்கள் நாவலில் வரும் மதன் நீ தான்னு தோணுது. கார்த்திகான்னு ஒருத்தி இருந்தாளா? சீனு : இல்லைனு நான் சொல்லல. மதன் நானாக இருந்தால் நல்லாத்தான் இருக்கும். அப்போதும் அவள் பெயர் நித்யாவாக இருந்திருக்கும். நித்யா : மதன் அளவுக்கு இல்லைன்னாலும், ஏதோ ஓரளவுக்கு உனக்கும் வழியத் தெரியுது. சரி, நாம ஒன்னு பண்ணலாமா? “நன்றி சொல்ல உனக்கு வார்த்தை இல்ல எனக்கு நான்தான்… Read More »

எளிய தமிழில் Pandas – மின்னூல்

Pandas என்பது Python மொழி மூலம் வெள்ளமெனப் பெருகி வரும் தகவல்களை எளிதில் கையாள உதவுகிறது. இந்த நூலைப் படிக்க, பைத்தான் மொழியின் அறிமுகம் அவசியம். பல்வேறு வகைகளில், வடிவங்களில் தகவல் இருப்பதால், அவற்றில் இருந்து தேவையான விவரங்களைப் பெறுவது கடினம். ஆனால் Pandas மூலம், தகவல்களை எளிதில் உருமாற்றி, அவற்றின் பின் உள்ள விவரங்களைப் பெற்று, முக்கிய முடிவுகளை எடுக்கப் பயன்படுத்தலாம். சென்னையில் நடைபெற்று வரும் மூன்றாவது ‘தமிழ் கட்டற்ற மென்பொருள் மாநாடு 2023’ ல்… Read More »

எளிய தமிழில் Pandas-13_Final

Real-time Example ஒரு தொலைக்காட்சி நிறுவனத்தில் உள்ள அனைத்து புரோகிராம்களின் id, அவை எந்த வகையின் கீழ் அமைந்திருக்கின்றன, அவை ஒளிபரப்பப்பட்ட தேதி, அவற்றிருக்கு வழங்கப்பட்ட ரேடிங், ஸ்கோர் போன்ற தரவுகளை கற்பனையாக உருவாக்கி அவற்றின் அடிப்படையில் நாம் இந்த எடுத்துக்காட்டை செய்து பார்க்கப் போகிறோம். இந்த கற்பனைத் தரவு பின்வருமாறு.           category       rating   telecasted_date  program_id  score 0                  news … Read More »

எளிய தமிழில் Pandas-12

Handling Categorical data ஒருவருடைய பாலினம், ரத்தவகை என்பது போன்ற மதிப்புகளைக் குறிப்பிடும் போது ஒருசில குறிப்பிட்ட மதிப்புகளையே திரும்பத் திரும்ப அளிக்க வேண்டிவரும். இதுபோன்ற சமயங்களில் string என்பதற்கு பதிலாக category எனும் தரவுவகையின் கீழ் அமைத்தால் நினைவகப் பகுதியை சற்று சேமிக்கலாம். எனவேதான் இந்த category-ஆனது hybrid வகை datatype என்று அழைக்கப்படுகிறது. இத்தகைய categorical டேட்டாவை வைத்து எழுதப்பட்ட உதாரண நிரல் பின்வருமாறு. This file contains bidirectional Unicode text that… Read More »

எளிய தமிழில் Pandas-11

Handling DateTime தேதி, வருடம், மாதம், நேரம் ஆகியவற்றின் அடிப்படையில் வரும் தரவுகளைக் கையாண்டு, கணக்கிட்டு ஆய்வு செய்வது எப்படி என்று இப்பகுதியில் காணலாம். This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters. Learn more about bidirectional Unicode characters Show… Read More »

எளிய தமிழில் Pandas-10

Handling Null values டேட்டாஃப்பிரேமில் Null மதிப்புகளைக் கையாள்வதில் பல்வேறு விதங்கள் உள்ளன. அவைகளைப் பற்றி இப்பகுதியில் காணலாம். This file contains bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters. Learn more about bidirectional Unicode characters Show hidden characters import pandas… Read More »

எளிய தமிழில் Pandas-9

Metrics தரவுகளைப் பற்றிய புரிதலை இன்னும் நுணுக்கமாகத் துல்லியமாக அமைப்பதற்கு பல்வேறு அளவீடுகள் உதவுகின்றன. அவைகளின் பட்டியலை இப்பகுதியில் காணலாம். பொதுவாக இதுபோன்ற அளவீடுகளைக் கணக்கிடுவதற்கு இந்த உதாரணம் பொருத்தமாக இருக்காது. ஆனாலும் முதலில் இதை வைத்துப் புரிந்து கொண்டால், பின்னர் பெரிய அளவிலான தரவுகளை கையாளும் போது சுலபமாக இருக்கும் என்பதற்காக அதே உதாரணத்தை நான் பயன்படுத்தியுள்ளேன். This file contains bidirectional Unicode text that may be interpreted or compiled differently… Read More »

எளிய தமிழில் Pandas-8

Loops & Functions ஒரு டேட்டாஃப்பிரேமில் உள்ளவற்றை for லூப் மூலம் பல்வேறு விதங்களில் வெளிப்படுத்திக் காட்டலாம். அவை கீழே கொடுக்கப்பட்டுள்ளன. அடுத்து lambda எனும் ஒற்றை வரி பங்ஷன் மூலமும், user defined function மூலமும் டேட்டாஃப்பிரேம் மதிப்புகளில் மாற்றம் செய்வது எப்படி என்று காட்டப்பட்டுள்ளது. கடைசியாக reindex_like() எனும் பங்ஷன் மூலம் ஒரு டேட்டாஃப்பிரேமின் வடிவத்தை மற்றொரு டேட்டாஃப்பிரேமைப் போலவே அமைப்பது எப்படி என்று காட்டப்பட்டுள்ளது. This file contains bidirectional Unicode text… Read More »