AI உலகில் புதுமுகம் DeepSeek

DeepSeek (டீப்சீக்) என்பது ஒரு செயற்கை நுண்ணறிவு [Artificial Intelligence (AI)] மாடல். இதை உருவாக்கியவர் Liang Wenfeng. இதன் புதிய பதிப்பு ஜனவரி 20 அன்று வெளியாகி AI தொழில்நுட்ப வல்லுநர்களை ஆச்சரியத்தில் ஆழ்த்தியுள்ளது.

OpenAI போன்ற முன்னணி நிறுவனங்கள் அதிக செலவில் advanced chips-ஐ பயன்படுத்தி AI மாடல்களை உருவாக்குகின்றன. ஆனால் DeepSeek குறைந்த computational resources-ஐ மட்டும் பயன்படுத்தி அதே அளவிற்கு திறமையான AI மாடலை உருவாக்கியிருக்கிறது. இதன் சிறப்பம்சம் மிக குறைந்த செலவில் உருவாக்கப்பட்டுள்ளது. DeepSeek மொத்தம் $6 million செலவில் train செய்யப்பட்டது, அதே நேரத்தில் OpenAI-ன் GPT-4 போன்ற மாடல்கள் $100 million செலவாகின்றன. குறைவான memory footprint-ஐ கொண்டதால் இது computational efficiency-யை அதிகரிக்கிறது.

இதனால் Nvidia போன்ற chip-making நிறுவனங்கள் பெரும் நஷ்டத்தைச் சந்தித்தன. ஜனவரி 27 அன்று Nvidia-வின் பங்கு மதிப்பு $600 billion வரை சரிந்தது, இது அமெரிக்காவின் வரலாற்றிலேயே மிகப்பெரிய ஒரு நாள் இழப்பு ஆகும்.

DeepSeek-ன் தொழில்நுட்ப அடிப்படை DeepSeek ஒரு Generative AI ஆகும், இது ChatGPT போன்ற chatbots போன்றே செயல்படும். இது Natural Language Processing (NLP) தொழில்நுட்பத்தை பயன்படுத்தி மனிதர்களைப் போல பதிலளிக்க முடியும். DeepSeek Mixture-of-Experts (MoE) எனப்படும் தொழில்நுட்பத்தை பயன்படுத்துகிறது. இது 671 billion parameters கொண்ட ஒரு மாடல் ஆக இருந்தாலும், எந்த ஒரு குறிப்பிட்ட பணிக்காக மட்டும் 37 billion parameters-ஐ செயல்படுத்தும் வகையில் வடிவமைக்கப்பட்டுள்ளது.

எடுத்துக்காட்டு:

ஒரு மொழிபெயர்ப்பு (Translation) செயலில் MoE System எப்படி செயல்படுகிறது என்பதை பார்ப்போம்.

ஆங்கிலத்தில் உள்ள “The weather is pleasant today” என்ற ஒரு வாக்கியத்தை தமிழ் மொழிக்கு மொழிபெயர்க்க வேண்டும் என்று வைத்துக் கொள்ளலாம்.
ஒரு பொதுவான LLM மாடல் அனைத்துப் parameters-ஐ செயல்படுத்தும்.
ஆனால் MoE அமைப்பில்:
- ஒரு set of parameters “Weather-related translations”-ஐ கவனிக்கும்.
- இன்னொரு set “Sentence structure”-ஐ பார்க்கும்.
- மற்றொரு set “Context-based translation”-ஐ கவனிக்கும்.
இதனால் MoE முறை சரியான மொழிபெயர்ப்பை வழங்கும். இதுவே task-specific precision-ஐ மேம்படுத்துகிறது.

இதன் மூலம்:

கணிப்பொறி திறன் (Computational Efficiency) அதிகரிக்கிறது.
சிக்கனமான செயல் முறை (Cost-Effective Processing) உருவாக்கப்படுகிறது.

DeepSeek-ன் Multi-Head Latent Attention (MLA) திறமை, இது பல்வேறு தகவல்களை ஒரே நேரத்தில் ஆராய்ந்து நுண்ணிய தொடர்புகளை கண்டறிந்து, சிறப்பான முடிவுகளை வழங்க உதவுகிறது. DeepSeek அதிக நீளமான context-ஐ பாதுகாக்கும் திறனைக் கொண்டுள்ளது. இது 128K tokens வரை விவரங்களை புரிந்துகொள்ள முடியும்.

இது ஒரு Open-Source AI Model ஆகும், இது GPT-4 போன்ற மாடல்களுக்கு மாற்றாக இருக்கும். இது 95% குறைந்த செலவில் செயல்படுகிறது.

DeepSeek-ன் வளர்ச்சி அமெரிக்க நிதி சந்தையை அதிகமாக பாதித்துள்ளது. DeepSeek-ன் வெற்றியால் அமெரிக்கா மற்றும் மேற்கத்திய நாடுகள் அதிர்ச்சியடைந்துள்ளன.

Nasdaq Index 3% வீழ்ச்சியடைந்தது.
Nvidia-வின் Market Capitalization $3.5 trillion-ல் இருந்து $2.9 trillion-ஆக குறைந்தது.
Apple, Microsoft போன்ற நிறுவனங்களும் பங்குச் சந்தையில் பாதிக்கப்பட்டன.

DeepSeek இப்போது சீனாவின் AI Renaissance (மறுமலர்ச்சி) எனக் கருதப்படுகிறது. ஆனால் Western market-ல் இது regulatory scrutiny (ஒழுங்குமுறை சோதனை) மற்றும் security concerns-ஐ எதிர்கொள்வதற்கான வாய்ப்பு உள்ளது.

தொடர்ந்து, DeepSeek AI உலகளவில் முக்கியமான AI போட்டியாளராக வளருமா என்பது பார்க்க வேண்டிய விஷயம்.

முனைவர் ப. தமிழ் அரசன்

tamilarasanbakthavatchalam@gmail.com

AI உலகில் புதுமுகம் DeepSeek

எடுத்துக்காட்டு:

Like this:

Related

Leave a ReplyCancel reply

எடுத்துக்காட்டு:

பகிர்ந்து கொள்க

Like this:

Related

Leave a ReplyCancel reply