கடந்த பத்தாண்டுளில், செயற்கை நுண்ணறிவு (AI) துறையில் குறிப்பிடத்தக்க முன்னேற்றம் ஏற்பட்டுள்ளது மிகமுக்கியமாக AI ஆனது நமது அன்றாட வாழ்வில் ஒருபகுதியக மிகவும் பரவலாக கலந்துவிட்டது. ஆழ்கற்றல் (DL) அல்லது நவீன செயற்கை நரம்பியல் வலைபின்னல்கள், அதிக அளவிலான தரவுகள் கிடைப்பது , DL மாதிரிகளைப் பயிற்றுவிப்பதற்கான சக்தியைக் கணக்கிடுதல் உள்ளிட்ட பல காரணிகளால் AI இன் பரவலான பயன்பாடும் ஏற்றுக்கொள்வதும் காரணிகளாக இருக்கலாம். மிக சமீபத்தில், உருவாக்கும் AIஆனது பொது மக்களின் கவனத்தை அதிகம் ஈர்த்துவருகின்றது,இது அளவிடக்கூடிய, செயல்திறன் மிக்க பெரிய மொழி மாதிரிகளை (LLMs) உருவாக்கியது. உருவாக்குகின்ற AI ஆனது உரை, படங்கள், கானொளிகள், நிரலாக்க குறிமுறைவரிகள், இசை ஆகியவற்றினை உருவாக்கவும் பயன்படுத்தப்படுகின்றது. உரை விளக்கங்களின் அடிப்படையில் படங்களை உருவாக்கும் பல்வகை மாதிரிகள் உள்ளன (எ.கா., DALL·E) , அதற்கு நேர்மாறாகவும், அத்தகைய கண்டுபிடிப்புகள் மிக வேகமாக வளரவுள்ளன.
உருவாக்குகின்ற AI இன் முன்னேற்றங்கள்
DL மாதிரியின் பயன்பாட்டில் ஒரு முக்கியமான திருப்புமுனையானது 2012 ஆம் ஆண்டு [1] உருவப்படங்களை பல்வேறு குழுக்களாக வகைப்படுத்துவதற்காக நிரூபிக்கப்பட்டது (ImageNet Large Scale Visual Recognition Challenge 2010). இதைத் தொடர்ந்து DL மாதிரிகள் முன்னர் நிறுவப்பட்ட அளவுகோல்களில் கணிசமாக மேம்படுத்தப்பட்ட உரை, உரையடாலில் ஒத்த வகைப்பாடு பணிகளுக்கு DL பயன்படுத்தப்பட்டது. இந்த மாதிரிகள் சிறப்புப் பணிகளுக்காகப் பயிற்று விக்கப்பட்டன , அதிநவீன செயல்திறனை வழங்கின. பரந்த அளவிலான வெளியீடுகளை உருவாக்க DLஇன் பயன்பாடு AI ஆராய்ச்சியாளர்களை கவர்ந்துள்ளது. உருவாக்குகின்ற எதிர்மறை வலைபின்னலகள், இந்த திசையில் ஒரு மைல்கல்போன்ற பணி, 2014 இல் நடத்தப்பட்டது, அங்கு மனித முகங்கள்,எண்களின் உண்மையான தோற்றப் படங்கள் உருவாக்கப்பட்டன. இது பிற களங்களில் உருவாக்குகின்ற AI நுட்பங்களை உருவாக்க மேலும் ஆராய்ச்சிக்கு வழிவகுத்தது.
மொழியின் மாதிரியாக்கம் AIக்கு சவாலான பணியாக உள்ளது. மொழி மாதிரிகளின் குறிக்கோள், சொற்களின் வரிசையைக் கொண்டு அடுத்த சொல்லைக் கணிப்பதாகும். LLMகளுக்கு முன் பயிற்சி பெறுவதற்கு DL பயன்படுத்துவது 2019 இல் நிரூபிக்கப்பட்டது. உருவாக்கும் முன்கூட்டிய பயிற்சிபெற்ற மொழிமாற்றிகள் (Generative pre-trained transformers (GPT)) என்பது ChatGPTஐ இயக்குகின்ற அடிப்படை தொழில்நுட்பமாகும். இந்த மாதிரிகள் வரைகலை செயலாக்க பகுதிகளில் (GPU) அபரிமிதமான கணக்கிடுகின்ற சக்தியைச் செலவழிப்பதன் மூலம் பெரிய அளவிலான உரைவடிவ தரவில் பயிற்றுவிக்கப்பட்டுள்ளன. உரை சுருக்கம், கேள்வி பதில் , குறிமுறைவரிகள் உருவாக்கம் போன்ற பணிகளுக்கான GPT-3/GPT-4 இன் முடிவுகள் கவரச்சியூட்டுபவைகாளாக உள்ளன.
உருவாக்கும் AI மாதிரிகளுக்கான சவால்கள்
பொதுவாக DL மாதிரிகள் பயிற்சி தரவிலிருந்தே கற்றுக்கொள்கின்றன, தரவுகளில் குறிப்பிடப்படும் உலகின் பார்வையை சார்பாளராக்க செயற்கை நரம்பியல் வலைபின்னல்களின் அளவுருக்களை அமைக்கின்றன. இந்த மாதிரிகள் பொதுவாக பாரம்பரிய இயந்திர கற்றல் (ML) மாதிரிகளை விட பெரிய அளவிலான பல உத்திரவுகள் ஆகும். இந்த வலைபின்னல்களும் மாதிரிகளின் அளவும், பயிற்சிக்கான தரவுகளின் அளவு சிறியதாக இருக்கும்போது சவாலாக மாறுகின்றன. பெரும்பாலான உண்மை-உலக தரவுத்தொகுப்புகள் இனங்களில் ஏற்றத்தாழ்வு , (வெளிப்படையாக இல்லாத) உள்ளார்ந்த சார்புகளைக் கொண்டிருக்கலாம். இந்த சவால்களை சமாளிக்க DL மாதிரிகளைப் பயிற்றுவிப்பதற்கான நுட்பங்கள் தொடர்ந்து உருவாக்கப் பட்டுள்ளன. இல்லையெனில், அவை பயிற்சி தரவை மனப்பாடம் செய்ய வாய்ப்புள்ளது, இது அதிகபொருத்தமானதுஎன்றும் அழைக்கப்படுகிறது, மேலும் மாதிரிகள் பார்க்காத தரவை பொதுமைப்படுத்தவோ அல்லது பக்கச்சார்பான முடிவுகளை வழங்கவோ முடியாது.
உருவாக்குகின்ற AI மாதிரிகள் DL நுட்பங்களுக்கு உள்ளார்ந்த சவால்களுக்கு ஆளாகின்றன. கூடுதலாக, மாதிரிகளின் உருவாக்கும் தன்மை உருவாக்கப்பட்ட தரவுகளில் கலைப்பொருட்களை அறிமுகப்படுத்தலாம். எடுத்துக்காட்டாக, AI உருவப்படஉருவாக்குபவைகள் தங்களுடைய கைகளால் செயல்படுத்தி போராடுகின்றன. அவை மிகவேறுபாடாகத் தோற்றமளிக்கின்ற படங்களை உருவாக்கலாம், அவை நமக்குவிளக்க கடினமாக இருக்கும். இந்த சவால்களை சமாளிக்க பல அணுகுமுறைகள் முன்மொழியப்பட்டுள்ளன. ஒரு சொற்றொடரில் அடுத்த சொல்லை கணிப்பதே முதன்மை பணியாகிவிடும் LLMகளுக்கும் இது பொருந்தும். அவை பயிற்றுவிக்கப்பட்ட தரவுகளின் அடிப்படையில் தவறான நிறைவுகளை உருவாக்கலாம் அல்லது தவறான பதில்களை வழங்கலாம். எனவே, பாதுகாப்புத் தகவல்கள், குறிப்பாக, மனிதர்களின் கேள்விகளுக்குப் பதிலளிக்கும் போது, அவற்றை உறுதி செய்யமிகவனமாக இருக்க வேண்டும்.
இது புதுமையான பயன்பாடுகளுக்கு வழி வகுக்கிறது
DL இன் ஆரம்பகால வெற்றியானது வகைப்பாடு போன்ற குறிப்பிட்ட பணிகளுக்காக நிரூபிக்கப்பட்டது, அங்கு மாதிரிகள் ஆழமாகவும் குறுகியதாகவும் இருக்க பயிற்சியளிக்கப்பட்டது. மாறாக, உருவாக்கும் AI மாதிரிகள் பரந்த , ஆழமற்றதாக இருக்கும். DL இன் ஆரம்ப பயன்பாடுகள் வணிகத் தேவைகள் , AI ஆராய்ச்சியாளர்கள் இந்த அளவீடுகளை மேம்படுத்து வதில் கவனம் செலுத்துவதன் மூலம் அதிக துல்லியத்தை வழங்கிடுமாறு வடிவமைக்கப்பட்டுள்ளது. புதப்பானியைவடிவமைத்தல், ஆக்கபூர்வமாக எழுதுதல், புதியகலையைஉருவாக்கதல் போன்ற ஆக்கப்பூர்வமான துறைகளில் AI ஐப் பயன்படுத்துவதற்கான சாத்தியக்கூறுகளை உருவாக்க AI ஆனது புதிய வழியை திறந்துள்ளது. இது இதுவரை தொடாத உயர் திறனுடைய-தீவிரமான பகுதிகளில் AI இன் பரந்த பயன்பாட்டிற்கு வழிவகுக்கக்கூடம். இந்த சமூககு ழுக்கள் AI இன் பயன்பாட்டிற்கு எவ்வாறு மாற்றியமைக்கப்படுகின்றன என்பதன் மூலம் மேலும் ஆராய்ச்சி வழிநடத்தப்படும், மேலும் இது புதுமையான பயன்பாடுகளின் வளர்ச்சியை ஊக்குவிக்கும்.