Le reti neurali possono essere utilizzate per il riconoscimento delle immagini. A differenza degli esseri umani, un computer non è in grado di riconoscere se un’immagine raffigura un essere umano, una pianta o un oggetto, ma deve esaminare le caratteristiche individuali della figura. Il computer sa quali caratteristiche sono rilevanti grazie all’algoritmo implementato, oppure può scoprirlo da solo attraverso l’analisi dei dati.
In ogni strato della rete il sistema controlla i segnali di ingresso, cioè le immagini, in base a criteri individuali come il colore, gli angoli e le forme. Dopo ogni controllo, il computer può valutare meglio ciò che è rappresentato nell’immagine.
Inizialmente, i risultati saranno relativamente soggetti ad errori. Se la rete neurale riceve un feedback da un addestratore umano ed è in grado di modificare l’algoritmo, si parla di apprendimento automatico. Nel deep learning l’addestramento umano può essere omesso. In questo caso il sistema impara dalla propria esperienza e diventa tanto migliore quanto più materiale visivo ha a disposizione.
Idealmente, il risultato finale è un algoritmo in grado di identificare il contenuto delle immagini senza errori, indipendentemente dal fatto che queste immagini siano in bianco e nero o in una determinata posa o prospettiva.