Tag Archives: large language models

LLM-களின் கட்டமைப்பு மற்றும் செயல்பாடு : பகுதி 2

Large Language Models (LLMs) என்பவை மனித மொழியைப் புரிந்துகொண்டு, அதைப் பகுப்பாய்வு செய்து, உகந்த பதில்களை உருவாக்கும் திறன் கொண்ட செயற்கை நுண்ணறிவு (AI) மாடல்கள் ஆகும். இவை மிகப்பெரிய அளவிலான நியூரல் நெட்வொர்க்குகள் (Neural Networks)-ஆக வடிவமைக்கப்பட்டுள்ளன. இவை எவ்வாறு செயல்படுகின்றன என்பதைப் புரிந்துகொள்ள, LLM-களின் கட்டமைப்பு, பயிற்சி முறைகள், மற்றும் செயல்பாடுகள் பற்றி விரிவாகப் பார்ப்போம். 1. LLM-கள் எப்படி வேலை செய்கின்றன? Large Language Models (LLM-கள்) என்பவை மனித மொழியைப்… Read More »

Large Language Models – ஒரு அறிமுகம்

Large Language Models (LLMs) என்றால் என்ன? மனிதர்கள் ஒரு உரையாடலில் ஈடுபடும் போது, அவர்கள் முன்பு பேசிய விஷயங்களை நினைவில் வைத்துக்கொள்கிறார்கள். உதாரணமாக, நீங்கள் ஒரு உணவகத்தில் உணவு ஆர்டர் செய்யும் போது, முதலில் “இந்த உணவகத்தில் 100 ரூபாய்க்குள் என்ன உணவு கிடைக்கும்?” என்று கேட்டால், உணவக ஊழியர் அதற்கேற்ப ஒரு பதில் கூறுவார். பின்னர் நீங்கள் “அதில் எதாவது காரமான உணவுகள் உள்ளதா?” என்று கேட்டால், அவர் உங்கள் முதல் கேள்வியையும் கருத்தில்… Read More »

AI உலகில் புதுமுகம் DeepSeek

DeepSeek (டீப்சீக்) என்பது ஒரு செயற்கை நுண்ணறிவு [Artificial Intelligence (AI)] மாடல். இதை உருவாக்கியவர் Liang Wenfeng. இதன் புதிய பதிப்பு ஜனவரி 20 அன்று வெளியாகி AI தொழில்நுட்ப வல்லுநர்களை ஆச்சரியத்தில் ஆழ்த்தியுள்ளது. OpenAI போன்ற முன்னணி நிறுவனங்கள் அதிக செலவில் advanced chips-ஐ பயன்படுத்தி AI மாடல்களை உருவாக்குகின்றன. ஆனால் DeepSeek குறைந்த computational resources-ஐ மட்டும் பயன்படுத்தி அதே அளவிற்கு திறமையான AI மாடலை உருவாக்கியிருக்கிறது. இதன் சிறப்பம்சம் மிக குறைந்த… Read More »