நாமே நம்முடைய சொந்த செய்யறிவை(AI) உருவாக்குதல் -பயிற்சித் தொடர்-பகுதி 10: வலுவூட்டல் கற்றல்:பரிசுகளின் மூலம் செய்யறிவில்(AI) கற்பித்தல்
வலுவூட்டல் கற்றல் (RL) என்பது இயந்திரக் கற்றலின் ஒரு கவர்ச்சிகரமான கிளையாகும், அங்கு ஒரு முகவர் தனது சூழலுடன் தொடர்புகொள்வதன் மூலம் கற்றுக்கொள்கிறார், விரும்பத்தக்க செயல்களுக்கு பரிசுகளையும் விரும்பத்தகாத செயல்களுக்கு தண்டனைகளையும் பெறுகிறார். இந்தக் கட்டுரை RL இன் அடிப்படைகளை ஆராய்கிறது, Q-கற்றல், ஆழ்ந்த Q-வலைபின்னல்கள் (DQN) ,படித்திறன்கொள்கையை ஆராய்கிறது. விளையாட்டில் செய்யறிவு (AI) , இயந்திரமனிதன் போன்ற நடப்பு உலக பயன்பாடுகளையும் விவாதிப்போம். 1. வலுவூட்டல் கற்றல் ( Reinforcement Learning (RL)) என்றால் என்ன?… Read More »