Tradotto letteralmente, il termine “reinforcement learning” significa “apprendimento per rinforzo”. Questo termine descrive un metodo nel campo dell’apprendimento automatico. Insieme al supervised learning e all’unsupervised learning, il reinforcement learning è uno dei tre metodi per addestrare gli algoritmi a prendere decisioni in modo indipendente. L’attenzione è rivolta allo sviluppo di soluzioni intelligenti per problemi di controllo complessi.
A differenza del supervised learning e dell’unsupervised learning, questa opzione di apprendimento del machine learning non richiede alcun dato per il condizionamento. Nei due metodi citati, i programmi vengono prima alimentati con dati. Questo passaggio è completamente assente nell’apprendimento per rinforzo, dove i dati vengono invece generati con una strategia trial-and-error durante l’addestramento e contrassegnati, allo stesso tempo, con un’etichetta. In questo caso, il programma svolge diversi cicli di addestramento all’interno di un ambiente di simulazione fino a fornire un risultato esatto. Dunque, invece di confrontare il sistema con i risultati corretti nel corso dell’addestramento (come nel supervised learning), vengono impostati solo degli impulsi a supporto del sistema.
L’obiettivo desiderato di questo addestramento è mettere l’intelligenza artificiale nelle condizioni di risolvere autonomamente problemi di controllo molto complessi senza alcun input umano. Rispetto all’engineering convenzionale, è un metodo più veloce, più efficiente e che offre, idealmente, anche il miglior risultato possibile.
La ricerca sul reinforcement learning si basa spesso sull’utilizzo di giochi. I giochi per computer offrono un ambiente perfetto per esplorare e comprendere il reinforcement learning. Nei giochi per computer vengono, generalmente, prestabiliti un ambiente di simulazione, varie opzioni di controllo e anche un grado di influenza sull’ambiente. Inoltre, pongono di solito un problema o compiti complessi nelle varie sezioni del gioco che devono essere risolti. Nella maggior parte dei giochi, ci sono anche sistemi a punti che si avvicinano molto al sistema di ricompensa dell’apprendimento per rinforzo.
Ricercatori di spicco nel campo dell’intelligenza artificiale ritengono che il reinforcement learning sia un metodo molto promettente per raggiungere l’Intelligenza Artificiale Generale che permetterà, in futuro, alle macchina di prendere le proprie decisioni razionali, proprio come un essere umano, e quindi di portare a termine con successo qualsiasi compito. La macchina osserva, apprende e può risolvere i problemi in modo indipendente.