Cos’è l’apprendimento supervisionato (supervised learning)?
Nell’apprendimento supervisionato, un modello di intelligenza artificiale viene addestrato utilizzando dati etichettati per fare previsioni o classificazioni di nuovi dati sconosciuti. Continua a leggere per saperne di più sull’apprendimento supervisionato.
L’apprendimento supervisionato in sintesi
L’apprendimento automatico consiste nel riconoscimento di schemi e regole da parte dei computer. Invece di reagire unicamente all’input di un utente umano, le macchine devono essere in grado di prendere decisioni in modo autonomo sulla base delle regole apprese. Gli algoritmi possono, ad esempio, imparare a riconoscere correttamente lo spam o a comprendere il contenuto di un’immagine.
Sviluppatori e scienziati utilizzano diversi metodi per l’addestramento e il supervised learning, o apprendimento supervisionato, è probabilmente quello più diffuso. Secondo questo metodo, gli sviluppatori e le sviluppatrici forniscono infatti agli algoritmi una serie preparata di dati come fonte di apprendimento. Il risultato è quindi già noto. Il compito degli algoritmi è solo quello di riconoscere il modello: perché queste informazioni appartengono alla categoria A e non alla categoria B?
L’apprendimento supervisionato si utilizza quindi per algoritmi che hanno lo scopo di categorizzare dati naturali (foto, calligrafie, lingue, ecc.). Un altro campo di applicazione tipico per l’apprendimento supervisionato sono i cosiddetti problemi di regressione. In questo caso, il compito degli algoritmi è quello di fare previsioni, ad esempio sull’andamento dei prezzi o sulla crescita dei clienti.
L’apprendimento semi-supervisionato è invece una forma mista. Con questo metodo di apprendimento si etichetta solo una parte del set di dati. I dati restanti, non categorizzati, vengono assegnati dagli algoritmi in modo indipendente. Un esempio è il riconoscimento facciale di Facebook. Per identificare gli amici basta aggiungere i loro nomi ad alcune foto e l’algoritmo li individuerà autonomamente in quelle restanti.
Esempio di apprendimento supervisionato
Supponiamo, ad esempio, che desideri addestrare algoritmi a distinguere le immagini dei gatti da quelle dei cani. Gli sviluppatori e le sviluppatrici preparerebbero quindi un ampio insieme di dati proprio a questo scopo che conterrà immagini, tutte già provviste di un’etichetta, cioè assegnate a una categoria. Potremmo immaginare tre diversi gruppi: cane, gatto, altro. Un altro fattore importante è che la raccolta di dati sia sufficientemente variegata. In poche parole: se hai solo foto di gatti neri nel tuo set di addestramento, l’algoritmo presupporrà che tutti i gatti siano neri. L’insieme di dati dovrebbe quindi rappresentare tutte le variazioni possibili di una categoria.
Durante l’addestramento, l’algoritmo riceve prima i contenuti (non ordinati), prende autonomamente una decisione e la confronta con l’output specificato dagli sviluppatori e dalle sviluppatrici. Il sistema verifica il proprio risultato con quello corretto e ne trae le conclusioni, che influenzano le valutazioni successive durante l’addestramento. L’addestramento continua fino al momento in cui la macchina non si avvicina abbastanza ai risultati corretti con le proprie valutazioni.

Pro e contro dell’apprendimento supervisionato
Quale metodo di apprendimento scegliere dipende fortemente dalle funzioni che l’algoritmo deve svolgere. Per i problemi di categorizzazione e regressione, l’apprendimento supervisionato è più indicato rispetto ad altri metodi. In generale, esso può essere utilizzato per addestrare specificamente gli algoritmi per un determinato campo di applicazione. Mantenendo il pieno controllo sul materiale di addestramento, basta fornire input e tempo sufficienti per impostare correttamente gli algoritmi. L’elemento chiave è chiaramente l’input, i cui contenuti devono essere il più variegati e rappresentativi possibile. Poiché l’apprendimento supervisionato prevede inoltre che ogni elemento sia etichettato, richiede anche un particolare sforzo da parte di sviluppatori e sviluppatrici.
Sebbene si tratti di un impegno relativamente elevato, ha il vantaggio di rendere il metodo trasparente. Al contrario, l’apprendimento non supervisionato è molto più ambiguo, poiché gli algoritmi funzionano senza veri riferimenti; nell’apprendimento supervisionato il compito della macchina viene definito con precisione. Ma questo può rivelarsi anche uno svantaggio: gli algoritmi appresi operano anche in base alle restrizioni imposte. Quindi non devi aspettarti approcci creativi alle soluzioni.
- Siti web in tempo record
- Soluzioni IA per il tuo business
- Risparmio di tempo e risultati eccellenti
Differenze tra l’apprendimento non supervisionato e l’apprendimento semi-supervisionato
Oltre all’apprendimento supervisionato, esistono anche l’apprendimento non supervisionato e l’apprendimento semi-supervisionato. Di seguito ti spieghiamo le differenze tra questi due metodi di apprendimento e l’apprendimento supervisionato.
Apprendimento supervisionato e apprendimento non supervisionato a confronto
Mentre l’apprendimento supervisionato utilizza insiemi di dati in cui sono noti sia gli input che gli output associati, nell’apprendimento non supervisionato sono noti solo gli input. Di conseguenza, l’apprendimento non supervisionato, a differenza di quello supervisionato, mira a scoprire modelli o strutture sconosciute nei dati. L’apprendimento non supervisionato è quindi adatto anche ad altri tipi di compiti rispetto all’apprendimento supervisionato, ad esempio per il clustering (raggruppamento di dati senza ordinarli in categorie).
Poiché nell’apprendimento non supervisionato i risultati del set di addestramento non sono etichettati, l’impegno di sviluppatori e sviluppatrici è molto minore rispetto all’apprendimento supervisionato, ma sia il processo di addestramento che il risultato finale sono molto meno chiari. È quindi difficile valutare le prestazioni e l’accuratezza dei modelli addestrati.
Apprendimento supervisionato e apprendimento semi-supervisionato a confronto
Uno dei principali svantaggi dell’apprendimento supervisionato è la notevole quantità di tempo che gli sviluppatori e le sviluppatrici devono investire nell’etichettatura dei dati. L’apprendimento semi-supervisionato utilizza sia dati etichettati sia non etichettati per compensare in qualche modo questo svantaggio. Il modello impara prima dai dati etichettati e poi migliora ulteriormente utilizzando i dati non etichettati per riconoscere modelli e strutture.
Il vantaggio principale dell’apprendimento semi-supervisionato è l’efficienza, in quanto è necessario etichettare meno dati e il processo può comunque avere un’accuratezza relativamente elevata. L’apprendimento semi-supervisionato può quindi essere utilizzato per problemi di classificazione simili a quelli dell’apprendimento supervisionato, ma cerca di ottimizzare l’impegno necessario per l’addestramento. Tuttavia, la complessità della modellazione e del bilanciamento dei dati etichettati e non etichettati può rappresentare una sfida.
Ulteriori metodi di apprendimento
L’apprendimento supervisionato, non supervisionato e semi-supervisionato non sono gli unici metodi di apprendimento automatico utilizzati per addestrare l’intelligenza artificiale.
L’apprendimento profondo è un processo di apprendimento in cui modelli già addestrati apprendono dai loro input e continuano a svilupparsi. Tali modelli si basano sulle reti neurali, che sono modellate sul cervello umano.
Esiste anche l’apprendimento per rinforzo, in base al quale un computer impara per tentativi ed errori quali sono le decisioni giuste. L’obiettivo è sviluppare una “policy” che prenda le decisioni migliori per ottenere un risultato ottimale a lungo termine. Un esempio è rappresentato da un’intelligenza artificiale che impara a giocare a un videogioco. L’IA riceve un feedback su ogni decisione dall’ambiente di addestramento e di conseguenza sviluppa strategie di gioco.
L’apprendimento supervisionato è una variante così popolare per l’addestramento degli algoritmi perché sviluppatori e sviluppatrici mantengono il pieno controllo. Mentre i risultati delle altre varianti di addestramento rimangono spesso poco chiari, nel caso dell’apprendimento supervisionato è abbastanza evidente il risultato finale del processo di apprendimento. Questo, però, richiede un elevato sforzo manuale da parte di chi sviluppa questi sistemi.