சிறந்த ஐந்து திற மூல செய்யறிவு(AI)மாதிரி API வழங்குநர்கள்

By | February 22, 2026

அறிமுகம்
Open‑weight எனும் மாதிரிகள்ஆனவை செய்யறிவின்(AI) பொருளாதாரத்தையே மாற்றி அமைத்துள்ளன. இன்றைய,மேம்படுத்துநர்கள் Kimi, DeepSeek, Qwen, MiniMax , GPT-OSS போன்ற சக்திவாய்ந்த மாதிரிகளைத் தங்களின் சொந்த உள்கட்டமைப்பில் முழுமையாக இயக்கி, தங்கள் அமைப்புகளின் மீது முழுமையான கட்டுப்பாட்டைத் தக்கவைத்துக்கொண்டு, அவற்றை வளாகத்தில் பயன்படுத்த முடியும்.
இருப்பினும், இந்தச் சுதந்திரம் ஒரு குறிப்பிடத்தக்க சமரசத்துடன் வருகிறது. அதிநவீன Open‑weight எனும்மாதிரிகளை இயக்குவதற்கு பொதுவாக மிகப்பெரிய வன்பொருள் வளங்கள் தேவைப்படுகின்றன; பெரும்பாலும் நூற்றுக்கணக்கான ஜிகாபைட் அளவுகளுடானான GPU எனும்நினைவகம் (சுமார் 500 GB), ஏறக்குறைய அதே அளவு அமைவின் RAM , உயர்தர CPU-க்கள் தேவைப்படுகின்றன. இந்த மாதிரிகள் சந்தேகத்திற்கு இடமின்றி பெரியவை, ஆனால் அவை தனியுரிமை மாற்று மாதிரிகளுக்குப் போட்டியாக இருக்கும் செயல்திறனையும் வெளியீட்டுத் தரத்தையும் வழங்குகின்றன.
இது ஒரு நடைமுறை கேள்வியை எழுப்புகிறது: பெரும்பாலான குழுக்கள் இந்த திற மூல மாதிரிகளை உண்மையில் எவ்வாறு அனுகுகின்றன? உண்மையில், அவ்வாறு அனுகுவதற்காக இரண்டு சாத்தியமான வழிகள் உள்ளன. உயர்தர GPU சேவையகங்களை வாடகைக்கு எடுக்கலாம் அல்லது இந்த மாதிரிகளை அணுக அனுமதிக்கும் , உள்ளீட்டு , வெளியீட்டு tokens.களின் அடிப்படையில் நம்மிடம் கட்டணம் வசூலிக்கும் சிறப்பு API வழங்குநர்கள் மூலம் இந்த மாதிரிகளை அனுகலாம்.
இந்தக் கட்டுரையில், Open‑weight எனும் மாதிரிகளுக்கான முன்னணி API வழங்குநர்களை மதிப்பீடு செய்திடுவோம், விலை, வேகம், தாமதம் , துல்லியம் ஆகியவற்றின் அடிப்படையில் அவற்றை ஒப்பிடுவோம். இந்த சுருக்கமான பகுப்பாய்வு, செயற்கையான பகுப்பாய்வு வழங்கும் செந்தர தரவுகளையும், திறமூலவழிசெலுத்தி வழங்குகின்ற நேரலை வழிசெலுத்தி செயல்திறன் தரவுகளையும் ஒருங்கிணைத்து, இன்று எந்த வழங்குநர்கள் சிறந்த முடிவுகளை வழங்குகிறார்கள் என்பது குறித்த ஒரு உறுதியான, நடப்பு உலகக் கண்ணோட்டத்தை வழங்குகிறது என தெரிந்து கொள்ளலாம்.
# 1. Cerebras: திறமூலமாதிரிகளுக்கான wafer அளவிலான வேகம்
Cerebras ஆனது ஒரு wafer அளவிலான கட்டமைப்பை மையமாகக் கொண்டு உருவாக்கப்பட்டுள்ளது. இது பாரம்பரிய பல GPU கொத்துகளுக்குப் பதிலாக ஒற்றையான, மிகப்பெரிய சில்லைப் பயன்படுத்துகிறது. கணக்கீடு, நினைவகம் ஆகிய இரண்டையும் ஒரே waferஇல் வைத்திருப்பதன் மூலம், GPU அடிப்படையிலான அமைப்புகளில் பெரிய மாதிரி ஊகித்தலை மெதுவாக்கும் பல அலைவரிசை , தகவல் தொடர்பு சிக்கல்களை Cerebrasஆனது நீக்குகிறது.
இந்த வடிவமைப்பு GPT OSS 120B போன்ற பெரிய திறமூல மாதிரிகளுக்கு விதிவிலக்காக வேகமான ஊகித்தலை செயல்படுத்துகிறது. நடப்பு உலக பெஞ்ச்மார்க்குகளில், Cerebras நீண்ட உள்ளீடுகளுக்கு உடனடி பதில்களை வழங்குவதோடு, மிக அதிக செயல்திறனையும் நிலைநிறுத்துகிறது. இது பெரிய கணினியின்மொழி மாதிரிகளைப் பெரிய அளவில் வழங்குவதற்கு கிடைக்கின்ற வேகமான தளங்களில் ஒன்றாக அமைகிறது. GPT OSS 120B மாதிரிக்கான செயல்திறன் கண்ணோட்டம்:
வேகம்: தோராயமாக வினாடிக்கு 2,988 டோக்கன்கள்
தாமதம்: 500 டோக்கன் உருவாக்கத்திற்கு சுமார் 0.26 வினாடிகள்
விலை: ஒரு மில்லியன் டோக்கன்களுக்கு தோராயமாக 0.45 அமெரிக்க டாலர்கள்
GPQA x16 Meidan: தோராயமாக 78 முதல் 79 சதவீதம் வரை, இது சிறந்த செயல்திறன் பிரிவில் இதை நிலைநிறுத்துகிறது
எதற்கு மிகவும் உகந்தது: அதிக போக்குவரத்து கொண்ட SaaS தளங்கள், முகவர் செய்யறிவின்(AI) பைப்லைன்கள் , பெரிய பல்லடுக்கு GPU கொத்துகளை நிர்வகிப்பதில் உள்ள சிக்கல்கள் இல்லாமல், அதிவேக அனுமானம் , அளவிடக்கூடிய வரிசைப்படுத்தல் தேவைப்படும் தர்க்கரீதியான பயன்பாடுகள்.
2. Together.ai: அதிக செயல்திறன்,நம்பகமான அளவிடுதல்
Together AI, ஆனதுGPT OSS 120B போன்ற மிகப்பெரிய திறமூல மாதிரிகளுக்கு மிகவும் நம்பகமான GPU அடிப்படையிலான வரிசைப்படுத்தல்களில் ஒன்றை வழங்குகிறது. அளவிடக்கூடிய GPU உள்கட்டமைப்பின் மீது கட்டமைக்கப்பட்ட Together AI ஆனது, அதன் சீரான இயக்க நேரம், கணிக்கக்கூடிய செயல்திறன் , உற்பத்திப் பணிகளுக்கான போட்டித்தன்மை வாய்ந்த விலை நிர்ணயம் ஆகியவற்றின் காரணமாக, திறமூல மாதிரிகளுக்கான ஒரு இயல்புநிலை வழங்குநராக பரவலாகப் பயன்படுத்தப்படுகிறது.
இந்தத் தளம், தீவிர வன்பொருள் சிறப்புத்தன்மையை வலியுறுத்துவதற்குப் பதிலாக, வேகம், செலவு , நம்பகத்தன்மை ஆகியவற்றைச் சமநிலைப்படுத்துவதில் கவனம் செலுத்துகிறது. premium அல்லது பரிசோதனைக்குரிய உள்கட்டமைப்பில் சிக்கிக்கொள்ளாமல், பெரிய அளவில் நம்பகமான ஊகத்தின் செயல்திறனை விரும்பும் குழுக்களுக்கு இது ஒரு சிறந்த தேர்வாக அமைகிறது. Together AI ஆனது பொதுவாக OpenRouter போன்ற வழிசெலுத்தி அடுக்குகளுக்குப் பின்புலமாக பயன்படுத்தப்படுகிறது, அங்கு இது கிடைக்கும் தன்மை , தாமத அளவீடுகளில் சீராகச் சிறப்பாகச் செயல்படுகிறது.
GPT OSS 120B எனும் மாதிரிக்கான செயல்திறன் கண்ணோட்டம்:
வேகம்: தோராயமாக வினாடிக்கு 917 டோக்கன்கள்
தாமதம்: சுமார் 0.78 வினாடிகள்
விலை: ஒரு மில்லியன் டோக்கன்களுக்கு தோராயமாக 0.26 அமெரிக்க டாலர்கள்
GPQA x16 median: தோராயமாக 78 சதவீதம், இது சிறந்த செயல்திறன் பிரிவில் வைக்கிறது
எதற்குச் சிறந்தது: வலுவான , சீரான செயல்திறன், நம்பகமான அளவிடுதல் , சிறப்பு வன்பொருள் தளங்களுக்குச் செலவழிக்காமல் செலவுத் திறனை விரும்பும் உற்பத்திப் பயன்பாடுகள்.
3. Fireworks AI: மிகக் குறைந்த தாமதம் , பகுத்தறிவுக்கு முன்னுரிமை அளிக்கும் வடிவமைப்பு
Fireworks செய்யறிவு(AI),ஆனது open-weight மாதிரிகளுக்கு குறைந்த தாமதம், வலுவான பகுத்தறிவு செயல்திறனில் கவனம் செலுத்துகின்ற மிகவும் மேம்படுத்தப்பட்ட ஒரு ஊகித்தல் தளத்தை வழங்குகிறது. இந்த நிறுவனத்தின் ஊகித்தல் மேககணினி, பல நிலையான GPU அடுக்குகளுடன் ஒப்பிடும்போது மேம்படுத்தப்பட்ட செயல்திறன் , குறைந்த தாமதத்துடன் பிரபலமான திறமூலமாதிரிகளுக்குச் சேவை செய்ய உருவாக்கப்பட்டுள்ளது. இது பணிச்சுமைகள் முழுவதும் செயலாக்கத்தை விரைவுபடுத்தும் உள்கட்டமைப்பு , மென்பொருள் மேம்படுத்தல்களைப் பயன்படுத்துகிறது.
இந்தத் தளம்,மேம்படுத்துநர்களுக்கு உகந்த API உடன் வேகம், உடனடிப் பதிலளிப்புக்கு முக்கியத்துவம் அளிக்கிறது, இது விரைவான பதில்கள் , மென்மையான பயனர் அனுபவங்கள் முக்கியமான ஊடாடும் பயன்பாடுகளுக்கு ஏற்றதாக அமைகிறது.
GPT-OSS-120B மாதிரிக்கான செயல்திறன் கண்ணோட்டம்:
வேகம்: தோராயமாக வினாடிக்கு 747 டோக்கன்கள்
தாமதம்: சுமார் 0.17 வினாடிகள் (சக போட்டியாளர்களிடையே மிகக் குறைவு)
விலை: ஒரு மில்லியன் டோக்கன்களுக்கு தோராயமாக 0.26 அமெரிக்க டாலர்கள்
GPQA x16 Median: தோராயமாக 78 முதல் 79 சதவீதம் (சிறந்த பிரிவு)
எதற்குச் சிறந்தது: உடனடிப் பதிலளிப்பு , வேகமான பயனர் அனுபவங்கள் முக்கியமான ஊடாடும் உதவியாளர்கள் , முகவர் சார்ந்த பணிப்பாய்வுகள்
4.Groq : நிகழ்நேர முகவர்களுக்கான தனிப்பட்ட வன்பொருள்
Groq தனது கணினிமொழி செயலாக்க அலகு (LPU) ஐச் சுற்றி தனிப்படடதாக உருவாக்கப்பட்ட வன்பொருளையும் , மென்பொருளையும் உருவாக்குகிறது, இது செய்யறிவு(AI) அனுமானத்தை விரைவுபடுத்துகிறது. இந்த LPU, பெரிய மொழி மாதிரிகளை கணிக்கக்கூடிய செயல்திறன் , மிகக் குறைந்த தாமதத்துடன் பெரிய அளவில் இயக்குவதற்காகவே வடிவமைக்கப்பட்டுள்ளது, இது நிகழ்நேரப் பயன்பாடுகளுக்கு மிகவும் உகந்ததாக அமைகிறது.
இதன் கட்டமைப்பு, அதிவேக சில்லின் நினைவகம், பாரம்பரிய GPU அனுமான அமைப்புகளில் காணப்படும் சிக்கல்களைக் குறைக்கும் திட்டவட்டமான செயலாக்கத்தை ஒருங்கிணைப்பதன் மூலம் இதை அடைகிறது. இந்த அணுகுமுறை, உருவாக்கும் செய்யறிவின்(AI), பணிச்சுமைகளில் செயல்திறன் , தாமதம் ஆகியவற்றிற்கான சுந்திரமான அளவுகோல் பட்டியல்களில் இது முதலிடத்தில் இடம்பெற உதவியுள்ளது.
GPT-OSS-120B மாதிரிக்குரிய செயல்திறன் கண்ணோட்டம்:
வேகம்: தோராயமாக வினாடிக்கு 456 டோக்கன்கள்
தாமதம்: சுமார் 0.19 வினாடிகள்
விலை: ஒரு மில்லியன் டோக்கன்களுக்கு தோராயமாக 0.26 அமெரிக்க டாலர்கள்
GPQA x16 Meidan: தோராயமாக 78 சதவீதம், இது சிறந்த செயல்திறன் பிரிவில் இதை நிலைநிறுத்துகிறது
எதற்குச் சிறந்தது: மிகக் குறைந்த தாமதத்துடன் கூடிய வெள்ளோட்ட, நிகழ்நேர copilots, , ஒவ்வொரு மில்லி வினாடி பதிலளிப்பு நேரமும் முக்கியத்துவம் வாய்ந்த அதிர்வெண் கொண்ட முகவர் அழைப்புகள்.
5. Clarifai:நிறுவனங்களுக்கான ஒருங்கிணைப்பும் செலவுத் திறனும்
Clarifai ஆனது ஒரு மரபுமேககணினி செய்யறிவின்(AI) ஒருங்கிணைப்பு தளத்தை வழங்குகிறது, இது open weight மாதிரிகளை பொது மேககணினி, தனியார் மேககணினி அல்லது வளாகத்திலேயிலான உள்கட்டமைப்பில் ஒரு ஒருங்கிணைந்த கட்டுப்பாட்டுத் தளத்துடன் பயன்படுத்த அனுமதிக்கிறது.
அதன் கணக்கீட்டு ஒருங்கிணைப்பு அடுக்கு, தானியங்கிஅளவீடு, GPUஐ பிரித்தல் , திறமையான வளப் பயன்பாடு போன்ற நுட்பங்கள் மூலம் செயல்திறன், அளவிடுதல் , செலவு ஆகியவற்றைச் சமநிலைப்படுத்துகிறது.
இந்த அணுகுமுறை, நிறுவனங்கள் உற்பத்திப் பணிச்சுமைகளில் அதிக செயல்திறன் , குறைந்த தாமதத்தைப் பராமரிக்கும் அதே வேளையில், அனுமானச் செலவுகளைக் குறைக்க உதவுகிறது. GPT-நிலை அனுமானத்திற்கான மிகவும் செலவு குறைந்த , சமநிலையான வழங்குநர்களில் ஒன்றாக Clarifai ஆனது தொடர்ந்து சுதந்திரமான அளவுகோல்களில் இடம்பெறுகிறது.
GPT-OSS-120B மாதிரிக்குரிய செயல்திறன் கண்ணோட்டம்:
வேகம்: தோராயமாக வினாடிக்கு 313 டோக்கன்கள்
தாமதம்: சுமார் 0.27 வினாடிகள்
விலை: ஒரு மில்லியன் டோக்கன்களுக்கு தோராயமாக 0.16 அமெரிக்க டாலர்கள்
GPQA x16 Meidan: தோராயமாக 78 சதவீதம், இது சிறந்த செயல்திறன் பிரிவில் இதை நிலைநிறுத்துகிறது
எதற்குச் சிறந்தது: மரபு வரிசைப்படுத்தல், மேககணினி, வளாகத்திலேயே முழுவதும் ஒருங்கிணைப்பு , திறந்தநிலை மாதிரிகளுக்கான செலவுக் கட்டுப்பாட்டுடன் கூடிய அளவிடுதல் தேவைப்படும் நிறுவனங்கள்.
6.கூடுதலாக: DeepInfra
DeepInfra என்பது செலவு குறைந்த செய்யறிவின்(AI),அனுமான தளமாகும், இது பெரிய மொழி மாதிரிகள், பிற இயந்திர கற்றல் பணிச்சுமைகளைப் பயன்படுத்துவதற்கான எளிய , அளவிடக்கூடிய API ஐ வழங்குகிறது. இந்த சேவை உள்கட்டமைப்பு, அளவிடுதல் ,கண்காணிப்பைக் கையாளுகிறது, இதனால் மேம்படுத்துநர்கள் வன்பொருளை நிர்வகிக்காமல் பயன்பாடுகளை உருவாக்குவதில் கவனம் செலுத்த முடியும். DeepInfra பல பிரபலமான மாதிரிகளை ஆதரிக்கிறது , வழக்கமான தொடரோட்ட அனுமான வாய்ப்புகளுடன் OpenAI- உடன்இணக்கமான API முடிவுபுள்ளிகளை வழங்குகிறது.
DeepInfraஇன் விலை நிர்ணயம் சந்தையில் மிகக் குறைவானது ,பரிசோதனை , பட்ஜெட்-உணர்திறன் திட்டங்களுக்கு கவர்ச்சிகரமானதாக இருந்தாலும், OpenRouter போன்ற வழிசெலுத்தி வலைபின்னல்கள் மற்ற வழங்குநர்களுடன் ஒப்பிடும்போது சில மாதிரி முடிவுபுள்ளிகளுக்கு பலவீனமான நம்பகத்தன்மை அல்லது குறைந்த இயக்க நேரத்தைக் காட்ட முடியும் என்று தெரிவிக்கின்றன.
வேகம்: வினாடிக்கு தோராயமாக 79 முதல் 258 டோக்கன்கள்
தாமதம்: தோராயமாக 0.23 முதல் 1.27 வினாடிகள்
விலை: மில்லியன் டோக்கன்களுக்கு தோராயமாக 0.10 அமெரிக்க டாலர்கள்
GPQA x16 சராசரி: தோராயமாக 78 சதவீதம், அதை சிறந்த செயல்திறன் குழுவில் வைக்கிறது
எதற்கு சிறந்தது: உச்ச நம்பகத்தன்மையை விட செலவு செயல்திறன் மிகவும் முக்கியத்துவம் வாய்ந்த fallback வழங்குநர்களுடன் இணைக்கப்பட்ட தொகுதி அனுமானம் அல்லது முக்கியமானதல்லாத பணிச்சுமைகள்.

 

 

 

 

Leave a Reply