Category Archives: கணியம்

எளிய தமிழில் Generative AI – 11

Traditional Vectorization இப்பொழுது நடைமுறையில் இருக்கும் எம்பெடிங் வெக்டருக்கு முன், என்னென்ன பழமையான நடைமுறைகள் இருந்தது, அதிலிருந்த பிரச்சனைகள் என்னென்ன, எதனால் இந்த எம்பெடிங் நடைமுறை உருவானது என்பதையெல்லாம் இப்பகுதியில் காணலாம். ஒருவருக்கு கோபம் வந்துவிட்டால், மனசுல இருக்குற எல்லாவற்றையும் கொட்டித் தீர்க்கிறேன் என்று அனைத்து வார்த்தைகளையும் போட்டு ஒரு மணி நேரம் பேசுவார்களே! அதைப் போன்றதுதான் இந்த bag of words. அதுவே நாலு வார்த்தை கேட்டாலும் நச்சுன்னு கேட்பார்களே! அது nltk பேக்கேஜ். பயிற்சிக்கு… Read More »

எளிய தமிழில் Generative AI – 10

முக்கோணவியல் – வெக்டார் கணிதம் பொதுவாக எண்களை மட்டும் கையாள முக்கோணவியல் தேவையில்லை. ‘இரண்டும் மூன்றும் சமமா?’ என்று கேட்டால் இல்லை எனக் கூறி விடுவோம். ஆனால் (1,2) என்பதும் (2,3) என்பதும் சமமா எனக் கேட்டால் அப்போதுதான் முக்கோணவியல் நோக்கிச் செல்வோம். உடனே ஒரு graph போட்டு (1,2) க்கு ஒரு புள்ளியும் (2,3) ஒரு புள்ளியும் வைத்து நமது கணக்கீடுகளைத் துவங்குவோம். அங்குதான் முக்கோணவியல் அறிமுகம் ஆகிறது. இதுபோன்ற set of எண்களுக்கு வெக்டர்… Read More »

எளிய தமிழில் Generative AI – 9

Word2vec, FastText, Glove இம்மூன்றும் embedding வேலையை செய்வதற்கான pre-trained மாடல்கள் ஆகும். இதில் Word2vec எனும் pre-trained மாடலை பயன்படுத்தி Embedding செய்வதற்கான எடுத்துக்காட்டு பின்வருமாறு. This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters. Learn more about… Read More »

எளிய தமிழில் Generative AI – 8

Sequential vs N-gram Training data இதுவரை நாம் உருவாக்கியுள்ள பயிற்சி டேட்டா அனைத்தையும், முதல் வார்த்தையிலிருந்து துவங்கி கொஞ்சம் கொஞ்சமாக சொற்களை அதிகரிக்கும் வண்ணமே அமைத்துள்ளோம். எடுத்துக்காட்டாக, தமிழ்நாடு இந்தியாவின் தமிழ்நாடு இந்தியாவின் தெற்கே தமிழ்நாடு இந்தியாவின் தெற்கே அமைந்த தமிழ்நாடு இந்தியாவின் தெற்கே அமைந்த ஒரு தமிழ்நாடு இந்தியாவின் தெற்கே அமைந்த ஒரு அழகிய என்று ஒவ்வொரு முறையும் முதல் வார்த்தையிலிருந்தே ஆரம்பிக்கின்றோம். இதன் காரணமாக திடீரென இடையிடையே உள்ள சொற்களைக் கொடுத்து “அடுத்து… Read More »

எளிய தமிழில் Generative AI – 7

Next Word Prediction மேற்கண்ட அனைத்தையும் டென்சார் ஃப்ளோவின் ஒரு பகுதியாக விளங்கும் keras மூலம் செய்வது பற்றி இப்பகுதியில் காண்போம். ஒரு வார்த்தை என்பது ஸ்கேலார் போன்றது, பல வார்த்தைகளின் தொகுப்பான வாக்கியம் என்பது வெக்டார் ஆகியது, பல வாக்கியங்களின் தொகுப்பான உரைநடையானது டென்சார் ஆக மாறியது என்பது இப்போது நாம் அறிந்ததே! இவைகளுக்கிடையே நிகழும் கணக்கீடுகள் தான் டென்சார் ஃப்ளோ ஆகும். இதில் நியூரல் நெட்வொர்க் உருவாக்கத்திற்கென டென்சார் ஃப்ளோவில் விளங்கும் ஒரு மாடியூல்தான்… Read More »

எளிய தமிழில் Generative AI – 6

Training Data from words முதலில் இரண்டு வாக்கியங்களை மட்டும் எடுத்துக் கொண்டு, அதற்கான ட்ரெய்னிங் டேட்டா உருவாக்குவது பற்றிக் காண்போம். இங்கு ‘சூரியன்’ எனக்கொடுத்தால், வரவிருக்கும் அடுத்த வார்த்தை ‘உதிக்கும்’; இவ்விரண்டும் சேர்ந்தால் வரவிருக்கும் அடுத்த வார்த்தை திசை. இதே முறையில், எந்தெந்த வார்த்தைகளைத் தொடர்ந்து, என்னென்ன வார்த்தைகள் வரலாம் எனும் பயிற்சிக்குத் தேவையான டேட்டா, ஒரு வாக்கியத்தில் உள்ள அனைத்து வார்த்தைகளையும் மடக்கி மடக்கி தயாரிக்கப்படுகிறது. இதே போல கோடிக்கணக்கான வாக்கியங்களுக்குச் செய்யும்போது, சூரியனைத்… Read More »

எளிய தமிழில் Generative AI – 5

Computer Vision ஒரு படத்தில் உள்ள வெவ்வேறு objects-ஐ அடையாளம் கண்டுபிடிக்க உதவும் முறைக்கு  Computer Vision என்று பெயர். YOLO (You Only Look Once) எனும் அல்காரிதம் இதற்காகப் பயன்படுகிறது. ஒரு படத்தில் தென்படுகிற ஒவ்வொரு object-இன் மீதும் bounding boxes-ஐத் துல்லியமாக அமைக்க, Intersection over union, Non-max suppression போன்ற வழி வகைகளைக் கையாள்கிறது. அடையாளம் காண வேண்டிய படத்தை Anchor இமேஜ் என வைத்துக்கொண்டு, அதனுடன் பொருந்துகிற பாசிட்டிவ் இமேஜ்… Read More »

[Tinkering] pulseaudio basic tuning for noiseless music in headphones with pavucontrol

 ஹெட்செட்டில் ஒரே இரைச்சல் குறைப்பது எப்படி ? ஹெட்செட்டில் பாடல்கள் கேட்டு பல நாட்கள் ஆயிற்று.  என்னுடைய லினக்ஸ் கணினியில் இசை இசைக்க துவங்கினேன். முழு ஒலியளவையும் வைக்க வில்லை ஆனால் பாடல் இரைச்சலுடனே இருந்தது. சரியென்று ஹெட்செட்டை கழற்றிவிட்டு பாடலை இயக்கினேன். அப்போது பாடல்கள் சரியாக ஒலியளவில் ஒலித்தது. ஹெட்செட்டில் ஏதேனும் குறை இருக்குமோ என்று அதை திறன்பேசியில் இணைத்து சோதித்தேன். அதிலும் சரிவரவே இசைத்தது. என்னடா புது கணினிக்கு வந்த சோதனை என்று ஒரு… Read More »

கட்டற்ற மென்பொருள் மாநாடு TOSS 2025| கட்டற்ற கலைதனை உலகறியச் செய்ய,அனைவரும் வருக!!!! | அழைப்பு மடல்

யாப்புக் கட்டுக்களுக்கு அப்பாற்பட்டு வளர்ந்ததே புதுக்கவிதை வடிவம். இத்தகைய சிறப்பு தனை பாரதி படைத்திட்டதால் தான், இன்று தமிழ் தனில் படைக்கப்படும் கவிதைகளில், வெகுஜன மக்களும் உணர்ந்து கொள்ளும் உயிரோட்டமும், கட்டற்ற சிந்தனை வளமும் கொட்டிக் கிடக்கிறது. அது போல, உலகளாவிய அளவில் கட்டற்ற தொழில்நுட்பம் மிகப்பெரிய வளர்ச்சியை சந்தித்துக் கொண்டிருக்கிறது. கட்டற்ற தொழில்நுட்பம் தன்னை தமிழில் கொண்டுவர வேண்டும் எனும் உயரிய நோக்கத்தோடு கணியம் போன்ற பல்வேறு அமைப்புகள் தொடர்ந்து செயலாற்றுகின்றன. இதற்கு ஊக்கமளிக்கும் வகையில்,… Read More »

யூனிக்ஸ்(unix)பிறந்த கதை

இன்றைய தொழில்நுட்ப காலகட்டத்தில் சேவையகங்கள்(servers), மேககணிமை(cloud computing) போன்ற தொழில்நுட்பங்களில் linux இன் பங்கை மறுக்க முடியாது. மறக்க முடியாது. சூப்பர் கம்ப்யூட்டர்களிலும் இவற்றின் ஆதிக்கம் கொடிகட்டி பறக்கிறது. தற்காலத்தில், மொபைல் உள்ளிட்ட பெரும்பாலான கருவிகளில் பயன்படுத்தப்படும் இயங்குதளங்களுக்கும், முன் குறிப்பிட்ட லினக்ஸ் போன்ற கட்டற்ற சேவைகளுக்கும், முன்னோடியாக விளங்கும் யூனிக்ஸ் குறித்து இந்த கட்டுரையில் பார்க்கவிருக்கிறோம் சிறு இடைவேளைக்குப் பிறகு வாசகர்களை சந்திப்பதில் மிக்க மகிழ்ச்சி. அட்டை கணினிகள் முன்பெல்லாம் சிறு குழந்தைகள் அட்டைப்பெட்டிகளில் படங்களை… Read More »