கடந்த பத்தாண்டுகளில், செயற்கை நுண்ணறிவு (AI) துறையில் குறிப்பிடத்தக்க முன்னேற்றம் ஏற்பட்டுள்ளது மேலும் AIஆனது நமது அன்றாட வாழ்வில் மிகவும் பரவலாகஅத்தியாவசியமாகிவிட்டது. ஆழ்கற்றல் (DL) அல்லது நவீன செயற்கை நரம்பியல் வலைபின்னல்கள், அதிக அளவிலான தரவுகள் கிடைப்பது DL மாதிரிகளைப் பயிற்று விப்பதற்கான சக்தியைக் கணக்கிடுதல் உள்ளிட்ட பல காரணிகளால் AI இன் பரவலான பயன்படுத்துலும் ஏற்றுக்கொள்ளுதலும் காரணமாக இருக்கலாம். அதனை தொடர்ந்து மிக சமீபத்தில், உருவாக்க(Generative) AI ஆனது பொது மக்களின் கவனத்தை ஈர்த்துள்ளது, அளவிடக் கூடிய, செயல்திறன் மிகப் பெரிய கணினிமொழி மாதிரிகளை (LLMs) உருவாக்கியுள்ளன. மேலும்உருவாக்க AI ஆனது உரை, உருவப்படங்கள், கானொளிகாட்சிகள், நிரலாக்க குறிமுறைவரிகள் இசை ஆகியவற்றினை உருவாக்கவும் பயன்படுத்தப் படுகின்றது. உரை விளக்கங்களின் அடிப்படையில் உருவப்படங்களை உருவாக்கும் பல்வகை மாதிரிகள் உள்ளன (எ.கா., DALL·E) அதற்கு நேர்மாறாகவும், அத்தகைய கண்டுபிடிப்புகள் மிக விரைவாக வளரவுள்ளன.
உருவாக்க AI இன் முன்னேற்றங்கள்
DL மாதிரியின் பயன்பாட்டில் ஒரு முக்கியமான திருப்புமுனையானது 2012 ஆம் ஆண்டு உருவப்படங்களை பல்வேறு குழுக்களாக வகைப் படுத்துவதற்காக நிரூபிக்கப்பட்டது . அதனைத் தொடர்ந்து DL மாதிரிகள் முன்னர் நிறுவுகை செய்யப்பட்ட அளவுகோல்களில் கணிசமாக மேம்படுத்தப்பட்ட உரையில், உரையாடலில் ஒத்த வகைப்பாட்டின் பணிகளுக்காக DL பயன்படுத்தப் பட்டது. இந்த மாதிரிகள் சிறப்புப் பணிகளுக்காகவெனப் பயிற்றுவிக்கப்பட்டன. மேலும் இவைஅதிநவீன செயல்திறனையும் வழங்கின. இவ்வாறான சூழலில்பரந்த அளவிலான வெளியீடுகளை உருவாக்க DL இன் பயன்பாடுஆனது AI ஆய்வாளர்களை கவர்ந்துள்ளது. உருவாக்க எதிரி வலைபின்னல்கள் (Generative Adversarial Networks) இந்த திசையின் ஒரு மைல்கல்லாக, 2014 இல் செயல்படுத்தப் பட்டது, அங்கு மனித முகங்கள் , எண்களின் உண்மையான தோற்றப் படங்கள் உருவாக்கப்பட்டன. இது பிற களங்களில் உருவாக்க AIஇன் நுட்பங்களை உருவாக்கிடுவதற்காக மேலும் ஆராய்ச்சிக்கு வழிவகுத்தது.
மொழியின் மாதிரியாக்கம் AIக்கு சவாலான பணியாக இருந்து வருகின்றது. மொழி மாதிரிகளின் குறிக்கோள், சொற்களின் வரிசையைக் கொண்டு அடுத்த சொல்லைக் கணிப்பதாகும். LLMகளுக்கு முன் பயிற்சி பெறுவதற்காக DL பயன்படுத்துவதை 2019 இல் நிரூபிக்கப்பட்டது . முன்கூட்டியே பயிற்சியளிக்க்கப்டட உருவாக்க உருமாற்றிகள் ( Generative pre-trained transformers (GPT)) என்பது ChatGPTஐ இயக்குகின்ற அடிப்படை தொழில் நுட்பமாகும். இந்த மாதிரிகள் வரைகலை செயல்படுத்திடுகின்ற அலகுகளின் (Graphics Processing Units (GPU)) அபரிமிதமான கணிப்பு சக்தியைச் செலவழிப் பதன் மூலம் பெரிய அளவிலான உரைவடிவிலான தரவில் பயிற்றுவிக்கப் பட்டுள்ளன. உரை சுருக்கம், கேள்வி பதில், குறிமுறை வரிகளின் உருவாக்கம் என்பன போன்ற பணிகளுக்கான GPT-3/GPT-4 இன் முடிவுகள் வியக்கத்தக்கதாக உள்ளன.
உருவாக்க AI மாதிரிகளுக்கான சவால்கள்
DL மாதிரிகளானவை பயிற்சி தரவிலிருந்து கற்றுக்கொள்கின்றன மேலும் தரவுகளில் குறிப்பிடப்படும் உலகின் பார்வையை பதிலியாக செயற்கை நரம்பியல் வலைபின்னல்களின் அளவுருக்களை அமைக்கின்றன. இந்த மாதிரிகள் பொதுவாக பாரம்பரிய இயந்திர கற்றல் (ML) மாதிரிகளை விட பெரிய அளவிலான பல ஒழுங்குமுறைகள் ஆகும். இந்த வலைபின்னல் களின் மாதிரிகளின் அளவு, பயிற்சிக்கான தரவுகளின் அளவு ஆகியவை சிறியதாக இருக்கும்போது சவாலாக மாறுகின்றன. பெரும்பாலான உண்மையான நடப்பு-உலகின் தரவுத்தொகுப்புகள் இனங்களில் ஏற்றத்தாழ்வு (வெளிப்படையாக இல்லாத) உள்ளார்ந்த சார்புகளைக் கொண்டிருக்கலாம். இந்த சவால்களை சமாளிக்க DL மாதிரிகளைப் பயிற்றுவிப்பதற்கான நுட்பங்கள் தொடர்ந்து உருவாக்கப்பட்டு வருகின்றன. இல்லையெனில், அவை பயிற்சியளிக்கின்ற தரவை மனப்பாடம் செய்ய வாய்ப்புள்ளது, இது மிகைப்பொருத்தம் (overfitting) என்றும் அழைக்கப்படுகிறது, மேலும் மாதிரிகளை காணாத தரவை பொதுமைப் படுத்தவோ அல்லது பக்கச்சார்பான முடிவுகளை வழங்கவோ முடியாது.
உருவாக்க AIஇன் மாதிரிகள் DL நுட்பங்களுக்கு உள்ளார்ந்த சவால்களுக்கு ஆளாகின்றன. கூடுதலாக, மாதிரிகளின் உருவாக்கும் தன்மை உருவாக்கப் பட்ட தரவுகளில் செயற்கையானஉண்மைகளை அறிமுகப் படுத்தலாம். எடுத்துக்காட்டாக, AIஇன் உருவப்படஉருவாக்கங்கள் தமக்குள் போராடு கின்றன. அவை வித்தியாசமாகத் தோற்றமளிக்கின்ற உருவப் படங்களை உருவாக்கலாம், அவைகளுக்கு விளக்கம் அளிப்பது கடினமாக இருக்கும். இந்த சவால்களை சமாளிக்க பல அணுகுமுறைகள் முன்மொழி யப் பட்டுள்ளன . தொடர்ச்சியான உரையில் அடுத்த சொல்லை கணிப்பதே மீப்பெரும் பணியாக இருக்கின்ற LLMகளுக்கும் இது பொருந்தும். அவை பயிற்றுவிக்கப்பட்ட தரவுகளின் அடிப்படையில் தவறான நிறைவு களை உருவாக்கலாம் அல்லது தவறான பதில்களை வழங்கலாம். எனவே, பாதுகாப்புஅமைப்புகள், குறிப்பாக, மனிதர்களின் கேள்விகளுக்குப் பதிலளிக்கும் போது, அவற்றை உறுதி செய்ய கவனமாக இருக்க வேண்டும் இது. புதுமையான பயன்பாடுகளுக்கு வழி வகுக்கிறது DL இன் துவக்ககால வெற்றியானது வகைப்பாடு போன்ற குறிப்பிட்ட பணிகளுக்காக நிரூபிக்கப்பட்டது, அங்கு மாதிரிகள் ஆழ்ந்தும் குறுகியதாகவும் இருக்க பயிற்சியளிக்கப்பட்டது. மாறாக, உருவாக்க AIஇன் மாதிரிகள் பரந்து, இருக்கின்றன. DL இன் துவக்ககால பயன்பாடுகள் வணிகத் தேவைகள். AI ஆய்வாளர்கள் இந்த அளவீடுகளை மேம்படுத்துவதில் கவனம் செலுத்து வதன் மூலம் அதிக துல்லியத்தை வழங்கிடுமாறு வடிவமைக்கப்பட்டுள்ளது. புதியபாவணைகளை வடிவமைத்தல், ஆக்க பூர்வமாக எழுதுதல் ,புதிய கலையை உருவாக்குதல் போன்ற ஆக்கப் பூர்வமான துறைகளில் AI ஐப் பயன்படுத்துவதற்கான சாத்தியக் கூறுகளை உருவாக்க AI என்பதை பயன் படுத்தி கொள்ள வாய்ப்புள்ளது. இது இதுவரை தொடாத உயர் திறனுடைய பகுதிகளில் AI இன் பரந்த பயன்பாட்டிற்கு வழிவகுக்கும். இந்த சமூக குழுக்கள் AI இன் பயன்பாட்டிற்கு எவ்வாறு மாற்றியமைக்கப் படுகின்றன என்பதன் மூலம் மேலும் ஆய்வு வழிநடத்தப்படும், மேலும் இது புதுமையான பயன்பாடுகளின் வளர்ச்சியை ஊக்குவிக்கக்கூடும்.