Una rete neurale (in inglese “neural network”) è un sistema della tec­no­lo­gia in­for­ma­ti­ca che si ispira alla struttura del cervello umano e che permette ai computer di adottare ca­rat­te­ri­sti­che dell’in­tel­li­gen­za ar­ti­fi­cia­le. Le reti neurali sono un com­po­nen­te centrale e uno dei molti metodi offerti dalle moderne ap­pli­ca­zio­ni di IA, ad esempio dai chatbot come ChatGPT.

Esistono diversi tipi di reti neurali ar­ti­fi­cia­li, ciascuno dei quali offre diverse pos­si­bi­li­tà di ela­bo­ra­zio­ne delle in­for­ma­zio­ni nell’ambito del deep learning. Negli ultimi anni, la ricerca in questo campo ha compiuto passi da gigante. Le reti neurali co­sti­tui­sco­no quindi una tec­no­lo­gia fon­da­men­ta­le per insegnare alle macchine a pensare au­to­no­ma­men­te e per­met­to­no ai computer di risolvere i problemi in modo in­di­pen­den­te e mi­glio­ra­re le proprie capacità. Oggi le reti neurali fanno parte di sistemi mul­ti­mo­da­li in grado di combinare testi, immagini, audio e video.

Come funziona una rete neurale?

Le reti neurali si ispirano al fun­zio­na­men­to biologico del cervello umano, che elabora in­for­ma­zio­ni at­tra­ver­so una rete di neuroni.

Le reti neurali ar­ti­fi­cia­li possono essere descritte come modelli co­sti­tui­ti da almeno due strati, uno strato di ingresso e uno di uscita, e di solito anche da ulteriori strati intermedi (hidden layers). Le reti moderne, come le reti neurali con­vo­lu­zio­na­li (CNN, Con­vo­lu­tio­nal Neural Network) o i modelli tra­sfor­ma­to­ri ne­ces­si­ta­no spesso di un gran numero di strati anche per svolgere compiti semplici, perché la pro­fon­di­tà con­tri­bui­sce alla loro ef­fi­cien­za. Ogni strato della rete contiene un certo numero di neuroni ar­ti­fi­cia­li spe­cia­liz­za­ti.

I software IA di IONOS
Scopri la potenza del­l'in­tel­li­gen­za ar­ti­fi­cia­le
  • Siti web in tempo record
  • Soluzioni IA per il tuo business
  • Risparmio di tempo e risultati ec­cel­len­ti

Ela­bo­ra­zio­ne delle in­for­ma­zio­ni nella rete neurale

L’ela­bo­ra­zio­ne delle in­for­ma­zio­ni nella rete neurale segue sempre la stessa procedura: le in­for­ma­zio­ni sotto forma di modelli o segnali sono tra­sfe­ri­te ai neuroni dello strato di ingresso, dove sono elaborate. A ogni neurone è assegnato un peso, in modo che i neuroni ricevano un’im­por­tan­za diversa. Il peso, insieme a una funzione di tra­sfe­ri­men­to, determina l’ingresso, dove quindi il neurone è inoltrato.

Nella fase suc­ces­si­va una funzione di at­ti­va­zio­ne e un valore di soglia calcolano e ponderano il valore di uscita del neurone. A seconda della va­lu­ta­zio­ne delle in­for­ma­zio­ni e della pon­de­ra­zio­ne, altri neuroni sono collegati e attivati in misura maggiore o minore.

Per mezzo di questo col­le­ga­men­to e di questa pon­de­ra­zio­ne, viene modellato un algoritmo che produce un risultato per ogni ingresso. A ogni ad­de­stra­men­to, la pon­de­ra­zio­ne e quindi l’algoritmo vengono mo­di­fi­ca­ti in modo che la rete fornisca risultati sempre più precisi e migliori.

Rete neurale: esempio di ap­pli­ca­zio­ne

Le reti neurali possono essere uti­liz­za­te per il ri­co­no­sci­men­to delle immagini. A dif­fe­ren­za degli esseri umani, un computer non è in grado di ri­co­no­sce­re se un’immagine raffigura un essere umano, una pianta o un oggetto, ma deve esaminare le ca­rat­te­ri­sti­che in­di­vi­dua­li della figura. Il computer sa quali ca­rat­te­ri­sti­che sono rilevanti grazie all’algoritmo im­ple­men­ta­to oppure può scoprirlo da solo at­tra­ver­so l’analisi dei dati.

In ogni strato della rete il sistema controlla i segnali di ingresso, ossia le immagini, in base a criteri in­di­vi­dua­li come il colore, gli angoli e le forme. Dopo ogni controllo, il computer può valutare meglio ciò che è rap­pre­sen­ta­to nell’immagine.

Ini­zial­men­te, i risultati saranno soggetti a errori. Se la rete neurale riceve un feedback da un ad­de­stra­to­re umano ed è in grado di mo­di­fi­ca­re l’algoritmo, si parla di ap­pren­di­men­to au­to­ma­ti­co. Nel deep learning l’ad­de­stra­men­to umano può essere omesso. In questo caso il sistema impara dalla propria espe­rien­za e diventa tanto migliore quanto più materiale visivo ha a di­spo­si­zio­ne.

Ideal­men­te, il risultato finale è un algoritmo in grado di iden­ti­fi­ca­re il contenuto delle immagini senza errori: a seconda dell’ad­de­stra­men­to, in­di­pen­den­te­men­te dal fatto che queste immagini siano in bianco e nero o in una de­ter­mi­na­ta posa o pro­spet­ti­va.

Tipi di reti neurali

Sono uti­liz­za­te diverse strutture di reti neurali a seconda del metodo di ap­pren­di­men­to usato e dello scopo dell’ap­pli­ca­zio­ne.

Per­cet­tro­ne

La forma più semplice della rete neurale designava in origine una “rete” co­sti­tui­ta da un singolo neurone, alterato da pon­de­ra­zio­ni e da un valore di soglia. Nel frattempo il termine per­cet­tro­ne è usato anche per indicare il modello più semplice di reti feed forward.

Reti feed forward

Queste reti neurali ar­ti­fi­cia­li possono condurre le in­for­ma­zio­ni in una sola direzione di ela­bo­ra­zio­ne. Le reti possono essere mo­no­stra­to, ossia co­sti­tui­te solo da livelli di ingresso e di uscita, o mul­ti­stra­to con vari strati nascosti (in inglese, “hidden layer”).

N.B.

Troverai maggiori in­for­ma­zio­ni sulle reti feed forward nella nostra guida.

Reti ri­cor­ren­ti

Nelle reti ri­cor­ren­ti i valori di uscita di uno strato di un livello superiore vengono uti­liz­za­ti come ingresso a uno strato di livello inferiore. Queste in­ter­con­nes­sio­ni tra strati con­sen­to­no al sistema di creare una memoria. Le reti ri­cor­ren­ti sono uti­liz­za­te, ad esempio, nel ri­co­no­sci­men­to vocale, nella tra­du­zio­ne e nel ri­co­no­sci­men­to della grafia.

N.B.

Maggiori dettagli sull’argomento sono di­spo­ni­bi­li nella nostra guida dedicata alle reti neurali ri­cor­ren­ti.

Reti neurali con­vo­lu­zio­na­li

Queste reti sono un sot­toin­sie­me delle reti mul­ti­stra­to. Sono co­sti­tui­te da almeno cinque strati. Il ri­co­no­sci­men­to dei modelli è eseguito su ogni strato, dove il risultato di uno strato è tra­sfe­ri­to a quello suc­ces­si­vo. Questo tipo di rete neurale è uti­liz­za­to per il ri­co­no­sci­men­to delle immagini.

N.B.

Nella nostra guida sulle reti neurali con­vo­lu­zio­na­li trovi in­for­ma­zio­ni più det­ta­glia­te sull’argomento.

Metodo di ap­pren­di­men­to

Affinché le con­nes­sio­ni nelle reti neurali ar­ti­fi­cia­li siano stabilite cor­ret­ta­men­te per svolgere la loro funzione, le reti devono prima essere ad­de­stra­te. A tal proposito, si possono di­stin­gue­re due metodi fon­da­men­ta­li:

Ap­pren­di­men­to su­per­vi­sio­na­to

Durante l’ap­pren­di­men­to su­per­vi­sio­na­to si definisce un risultato concreto per diverse opzioni di input. Se, ad esempio, le immagini dei gatti devono essere ri­co­no­sciu­te come tali dal sistema, le persone con­trol­la­no il ri­co­no­sci­men­to del sistema e danno un feedback su quale immagine è stata ri­co­no­sciu­ta cor­ret­ta­men­te e quale in modo errato. In questo modo si mo­di­fi­ca­no i pesi nella rete e si ottimizza l’algoritmo.

Ap­pren­di­men­to non su­per­vi­sio­na­to

Nell’ap­pren­di­men­to non su­per­vi­sio­na­to il risultato dell’attività non è spe­ci­fi­ca­to. Il sistema impara esclu­si­va­men­te sulla base delle in­for­ma­zio­ni in ingresso. A questo scopo sono uti­liz­za­te la regola di ap­pren­di­men­to di Hebb o la teoria della risonanza adattiva. Oggi nella pratica ci si concentra su algoritmi come la discesa del gradiente sto­ca­sti­co (SGD).

Aree di ap­pli­ca­zio­ne delle reti neurali

Le reti neurali possono essere uti­liz­za­te con successo so­prat­tut­to se è di­spo­ni­bi­le una grande quantità di dati da valutare e solo una scarsa co­no­scen­za si­ste­ma­ti­ca della soluzione. I casi di ap­pli­ca­zio­ne classici sono il ri­co­no­sci­men­to di testo, immagini e voce, casi in cui i computer esaminano i dati per de­ter­mi­na­te ca­rat­te­ri­sti­che al fine di ef­fet­tua­re un’as­se­gna­zio­ne.

Le reti neurali come le reti neurali con­vo­lu­zio­na­li (CNN) per­met­to­no ai computer di ri­co­no­sce­re i contenuti nelle immagini. Questa tec­no­lo­gia è uti­liz­za­ta nell’analisi per immagini in medicina oppure per il controllo au­to­ma­tiz­za­to della qualità in ambito in­du­stria­le. In questi settori, le reti neurali sono uti­liz­za­te talvolta nella tec­no­lo­gia di re­go­la­zio­ne per mo­ni­to­ra­re i valori di ri­fe­ri­men­to e adottare au­to­ma­ti­ca­men­te le con­tro­mi­su­re in caso di sco­sta­men­ti oppure per definire au­to­no­ma­men­te i valori di ri­fe­ri­men­to sulla base della loro analisi dei dati.

I modelli lin­gui­sti­ci come ChatGPT, che si basano sulle reti neurali, generano testi che suonano rea­li­sti­ci, ri­spon­do­no a domande oppure ana­liz­za­no grandi quantità di dati testuali.

Le reti neurali ar­ti­fi­cia­li possono essere uti­liz­za­te anche per fare pre­vi­sio­ni e si­mu­la­zio­ni, ad esempio nelle pre­vi­sio­ni del tempo o nella dia­gno­sti­ca medica. Per esempio, le reti neurali con­vo­lu­zio­na­li (CNN) per­met­to­no ai computer di ri­co­no­sce­re contenuti nelle immagini. Questa tec­no­lo­gia è uti­liz­za­ta nell’analisi per immagini in ambito medico, ad esempio per iden­ti­fi­ca­re i tumori nelle immagini a raggi X.

Gli sviluppi nel campo dell’ap­pren­di­men­to non su­per­vi­sio­na­to delle reti neurali ar­ti­fi­cia­li stanno ampliando no­te­vol­men­te il campo di ap­pli­ca­zio­ne e le pre­sta­zio­ni delle reti. Tra le ap­pli­ca­zio­ni più im­por­tan­ti delle reti neurali di au­toap­pren­di­men­to citiamo la sintesi vocale degli as­si­sten­ti vocali. I sistemi comeAlexa, Siri e l’as­si­sten­te Google sfruttano le reti neurali per con­ver­ti­re il lin­guag­gio parlato in testi scritti e reagire ai testi stessi. I modelli tra­sfor­ma­to­ri come GPT o BERT hanno ri­vo­lu­zio­na­to la qualità delle tra­du­zio­ni au­to­ma­ti­che.

Storia e pro­spet­ti­ve future

Negli ultimi dieci anni la co­no­scen­za delle reti neurali si è am­pia­men­te diffusa nell’ambito del dibattito sull’in­tel­li­gen­za ar­ti­fi­cia­le, ma della tec­no­lo­gia in sé si è parlato già molti decenni prima.

Le con­si­de­ra­zio­ni sulle reti neurali ar­ti­fi­cia­li risalgono infatti ai primi anni ‘40. Warren McCulloch e Walter Pitts avevano già descritto un modello che collegava le unità ele­men­ta­ri e che si basava sulla struttura del cervello umano, in grado in questo modo di calcolare quasi tutte le funzioni arit­me­ti­che. Nel 1949 Donald Hebb ha svi­lup­pa­to la regola di ap­pren­di­men­to sopra men­zio­na­ta, ancora oggi applicata in molte reti neurali.

Nel 1960 è stata svi­lup­pa­ta una rete neurale che ha trovato un’ap­pli­ca­zio­ne com­mer­cia­le a livello mondiale nel fil­trag­gio dell’eco nei telefoni analogici. In seguito, la ricerca in questo settore si è fermata; da un lato, perché gli scien­zia­ti hanno concluso che il modello di rete neurale non poteva risolvere problemi im­por­tan­ti; dall’altro, perché l’ap­pren­di­men­to efficace dei sistemi ri­chie­de­va grandi quantità di dati digitali che all’epoca non erano di­spo­ni­bi­li.

La si­tua­zio­ne è cambiata solo con l’avvento dei Big Data . Con l’in­tro­du­zio­ne dell’algoritmo di re­tro­pro­pa­ga­zio­ne (in inglese, “bac­k­pro­pa­ga­tion”) è diventato possibile ad­de­stra­re reti mul­ti­stra­to, ponendo la base per i moderni modelli di deep learning. La com­bi­na­zio­ne tra enormi quantità di dati e la potenza di calcolo dei moderni pro­ces­so­ri grafici (GPU) ha portato a un enorme balzo in avanti negli anni 2010. I framework come Ten­sor­Flow e PyTorch hanno reso più ac­ces­si­bi­le lo sviluppo di reti neurali.

L’interesse per l’in­tel­li­gen­za ar­ti­fi­cia­le era tornato e la vittoria di una CNN nel concorso ImageNet del 2012 ha segnato la nascita del moderno deep learning. Da allora, la tec­no­lo­gia ha gua­da­gna­to im­por­tan­za in tempi bre­vis­si­mi e ha effetti su pra­ti­ca­men­te ogni campo dell’in­for­ma­ti­ca.

Da quel momento, lo sviluppo in questo settore è pro­gre­di­to ra­pi­da­men­te. Per quanto pro­met­ten­ti possano essere i risultati, le reti neurali non sono l’unica tec­no­lo­gia per im­ple­men­ta­re l’in­tel­li­gen­za ar­ti­fi­cia­le nei computer, ma solo una pos­si­bi­li­tà, anche se spesso sono pre­sen­ta­te nel dibattito pubblico come l’unica via per­cor­ri­bi­le. Oggi la ricerca va oltre le classiche reti neurali. L’at­ten­zio­ne è rivolta verso i modelli mul­ti­mo­da­li, che combinano testo, immagini e parlato, e sugli approcci alla riduzione del consumo ener­ge­ti­co. Al tempo stesso, le reti neurali si stanno in­te­gran­do sempre più nelle ap­pli­ca­zio­ni quo­ti­dia­ne, dagli smart­pho­ne agli elet­tro­do­me­sti­ci in­tel­li­gen­ti.

Vai al menu prin­ci­pa­le