Il machine learning consiste nel riconoscimento, da parte dei computer, di schemi e regole. Invece di reagire unicamente all’input di un utente umano, le macchine devono essere in grado di prendere decisioni in modo autonomo sulla base delle regole apprese. Gli algoritmi possono, ad esempio, imparare a riconoscere correttamente lo spam o a comprendere il contenuto di un’immagine.
Sviluppatori e scienziati utilizzano diversi metodi per l’addestramento e il supervised learning, o apprendimento supervisionato, è probabilmente quello più diffuso. Secondo questo metodo, gli sviluppatori forniscono infatti agli algoritmi una serie preparata di dati come fonte di apprendimento. Il risultato è quindi già noto. Il compito degli algoritmi è solo quello di riconoscere il modello: perché queste informazioni appartengono alla categoria A e non alla categoria B?
L’apprendimento supervisionato si utilizza quindi per algoritmi che hanno lo scopo di categorizzare dati naturali (foto, calligrafie, lingue, ecc.). Un altro campo di applicazione tipico per il supervised learning sono i cosiddetti problemi di regressione. In questo caso, il compito degli algoritmi è quello di fare previsioni, ad esempio sull’andamento dei prezzi o sulla crescita dei clienti.
Il semi-supervised learning è invece una forma mista. Con questo metodo di apprendimento si etichetta solo una parte del set di dati. I dati restanti, non categorizzati, vengono assegnati dagli algoritmi in modo indipendente. Un esempio è il riconoscimento facciale di Facebook. Per identificare gli amici basta aggiungere i loro nomi ad alcune foto e l’algoritmo li individuerà autonomamente in quelle restanti.