Nell’ap­pren­di­men­to semi-su­per­vi­sio­na­to, un modello viene ad­de­stra­to con dati eti­chet­ta­ti e non eti­chet­ta­ti. Con un numero inferiore di punti dati eti­chet­ta­ti, l’algoritmo impara a ri­co­no­sce­re i modelli nelle istanze di dati senza una variabile target nota, ottenendo così una mo­del­la­zio­ne più precisa ed ef­fi­cien­te.

Che cos’è l’ap­pren­di­men­to semi-su­per­vi­sio­na­to?

L’ap­pren­di­men­to semi-su­per­vi­sio­na­to (in inglese “semi-su­per­vi­sed learning”) è un approccio ibrido all’ap­pren­di­men­to au­to­ma­ti­co che combina i punti di forza dell’ap­pren­di­men­to su­per­vi­sio­na­to con quelli dell’ap­pren­di­men­to non su­per­vi­sio­na­to. Il metodo prevede l’utilizzo di una piccola quantità di dati eti­chet­ta­ti e di una grande quantità di dati non eti­chet­ta­ti ai fini dell’ad­de­stra­men­to dei modelli di in­tel­li­gen­za ar­ti­fi­cia­le. Ciò consente all’algoritmo di ri­co­no­sce­re i modelli sup­por­ta­ti dai dati eti­chet­ta­ti all’interno di set di dati non eti­chet­ta­ti. Grazie a questo processo di ap­pren­di­men­to combinato, il modello comprende meglio la struttura dei dati non eti­chet­ta­ti, ottenendo pre­vi­sio­ni più accurate.

I software IA di IONOS
Scopri la potenza del­l'in­tel­li­gen­za ar­ti­fi­cia­le
  • Siti web in tempo record
  • Soluzioni IA per il tuo business
  • Risparmio di tempo e risultati ec­cel­len­ti

Premesse per l’ap­pren­di­men­to semi-su­per­vi­sio­na­to

Gli algoritmi pro­get­ta­ti per l’ap­pren­di­men­to semi-su­per­vi­sio­na­to si basano su diverse ipotesi di base sui dati:

  1. Ipotesi di con­ti­nui­tà: i punti più vicini tra loro hanno più pro­ba­bi­li­tà di avere la stessa de­si­gna­zio­ne di uscita.
  2. Ipotesi di cluster: i dati possono essere suddivisi in cluster discreti e i punti collocati nello stesso cluster hanno una maggiore pro­ba­bi­li­tà di avere la stessa etichetta di uscita.
  3. Ipotesi del manifold: i dati si trovano ap­pros­si­ma­ti­va­men­te su un manifold (o varietà, ovvero una col­le­zio­ne di punti connessi tra loro) che ha una di­men­sio­ne minore dello spazio di input. Grazie a questa premessa, è possibile uti­liz­za­re distanze e densità.

Qual è la dif­fe­ren­za tra ap­pren­di­men­to su­per­vi­sio­na­to e non su­per­vi­sio­na­to?

L’ap­pren­di­men­to su­per­vi­sio­na­to, l’ap­pren­di­men­to non su­per­vi­sio­na­to e l’ap­pren­di­men­to semi-su­per­vi­sio­na­to sono tutti approcci fon­da­men­ta­li del machine learning. Ciò che li dif­fe­ren­zia è che ciascuno di essi si avvale di un proprio approccio per ad­de­stra­re i modelli di in­tel­li­gen­za ar­ti­fi­cia­le. La seguente pa­no­ra­mi­ca evidenzia come l’ap­pren­di­men­to semi-su­per­vi­sio­na­to dif­fe­ri­sca dai metodi tra­di­zio­na­li:

  • L’ap­pren­di­men­to su­per­vi­sio­na­to (“su­per­vi­sed learning” in inglese) è ca­rat­te­riz­za­to dal fatto che vengono uti­liz­za­ti solo dati eti­chet­ta­ti. Ogni esempio di dati ha quindi una variabile target o una soluzione nota che l’algoritmo deve prevedere. Questo approccio all’ap­pren­di­men­to au­to­ma­ti­co è con­si­de­ra­to molto preciso, ma necessita di grandi quantità di dati eti­chet­ta­ti, spesso costosi e che ri­chie­do­no molto tempo per essere ottenuti.
  • L’ap­pren­di­men­to non su­per­vi­sio­na­to (“un­su­per­vi­sed learning” in inglese), invece, lavora esclu­si­va­men­te con dati non strut­tu­ra­ti. L’algoritmo cerca di iden­ti­fi­ca­re modelli o strutture nei dati senza spe­ci­fi­ca­re una soluzione. Questo tipo di ap­pren­di­men­to è adatto quando non sono di­spo­ni­bi­li dati eti­chet­ta­ti, ma può essere limitato nella sua ac­cu­ra­tez­za e nel suo potere pre­dit­ti­vo a causa della mancanza di punti di ri­fe­ri­men­to esterni.
  • L’ap­pren­di­men­to semi-su­per­vi­sio­na­to combina entrambi gli approcci uti­liz­zan­do una piccola quantità di dati eti­chet­ta­ti per com­pren­de­re la struttura di un grande insieme di dati non eti­chet­ta­ti. Le tecniche di ap­pren­di­men­to semi-su­per­vi­sio­na­to mo­di­fi­ca­no un algoritmo su­per­vi­sio­na­to per integrare i dati non eti­chet­ta­ti nel modello. In questo modo è possibile ottenere un elevato livello di pre­ci­sio­ne nelle pre­di­zio­ni con uno sforzo di eti­chet­ta­tu­ra re­la­ti­va­men­te ridotto.

Le dif­fe­ren­ze tra i singoli metodi di ap­pren­di­men­to au­to­ma­ti­co possono essere il­lu­stra­te ancora meglio con l’aiuto di un esempio pratico. Facendo un’analogia con la scuola, si può dire che l’ap­pren­di­men­to su­per­vi­sio­na­to è quando alunne e alunni sono su­per­vi­sio­na­ti sia a scuola che a casa. Quando invece hanno il compito di acquisire le co­no­scen­ze in autonomia, si tratta di ap­pren­di­men­to non su­per­vi­sio­na­to. Quando un concetto viene spiegato in classe e raf­for­za­to con i compiti a casa, si parla di ap­pren­di­men­to semi-su­per­vi­sio­na­to.

N.B.

Nel nostro articolo sull’in­tel­li­gen­za ar­ti­fi­cia­le ge­ne­ra­ti­va ap­pro­fon­dia­mo in dettaglio la branca dell’IA che si occupa dell’ad­de­stra­men­to delle macchine.

Come funziona l’ap­pren­di­men­to semi-su­per­vi­sio­na­to?

L’ap­pren­di­men­to semi-su­per­vi­sio­na­to è un processo a più fasi che comprende i seguenti passaggi:

  1. De­fi­ni­zio­ne dell’obiettivo o del problema: in primo luogo, si definisce chia­ra­men­te l’obiettivo o lo scopo del modello di ap­pren­di­men­to au­to­ma­ti­co. Ci si concentra sulle ot­ti­miz­za­zio­ni che si vogliono ottenere at­tra­ver­so l’ap­pren­di­men­to au­to­ma­ti­co.
  2. Eti­chet­ta­tu­ra dei dati: alcuni dei dati non strut­tu­ra­ti vengono eti­chet­ta­ti per fornire in­di­ca­zio­ni all’algoritmo di ap­pren­di­men­to. Il fun­zio­na­men­to dell’ap­pren­di­men­to semi-su­per­vi­sio­na­to richiede l’utilizzo di dati per­ti­nen­ti per l’ad­de­stra­men­to del modello. Ad esempio, se un clas­si­fi­ca­to­re di immagini viene ad­de­stra­to a di­stin­gue­re tra cani e gatti, sarà inutile inserire immagini di au­to­mo­bi­li e treni all’interno dell’ad­de­stra­men­to.
  3. Ad­de­stra­men­to del modello: questa fase prevede che i dati strut­tu­ra­ti vengano uti­liz­za­ti per insegnare al modello quale sia il suo compito e quali siano i risultati de­si­de­ra­ti.
  4. Ad­de­stra­men­to con dati non eti­chet­ta­ti: dopo che il modello è stato ad­de­stra­to con i dati di ad­de­stra­men­to, vengono integrati i dati non eti­chet­ta­ti.
  5. Va­lu­ta­zio­ne e per­fe­zio­na­men­to del modello: le va­lu­ta­zio­ni e gli ag­giu­sta­men­ti del modello sono fon­da­men­ta­li per garantire che il modello creato funzioni cor­ret­ta­men­te. L’ad­de­stra­men­to con­tri­bui­sce al mi­glio­ra­men­to continuo. Il processo viene ripetuto finché l’algoritmo non raggiunge la qualità dei risultati de­si­de­ra­ta.
Immagine: Diagramma esplicativo dell’apprendimento semi-automatico
Il diagramma illustra un semplice esempio di come funziona l’ap­pren­di­men­to semi-su­per­vi­sio­na­to: il modello di in­tel­li­gen­za ar­ti­fi­cia­le fa la pre­vi­sio­ne corretta sulla base dei dati già eti­chet­ta­ti.

Quali sono i vantaggi dell’ap­pren­di­men­to semi-su­per­vi­sio­na­to?

L’ap­pren­di­men­to semi-su­per­vi­sio­na­to risulta par­ti­co­lar­men­te utile in presenza di grandi quantità di dati non eti­chet­ta­ti. In questo caso, infatti, eti­chet­ta­re tutti o la maggior parte dei dati potrebbe risultate ec­ces­si­va­men­te costoso o complesso. Si tratta di un aspetto im­por­tan­te, perché l’ad­de­stra­men­to dei modelli di in­tel­li­gen­za ar­ti­fi­cia­le nor­mal­men­te necessita di una grande quantità di dati eti­chet­ta­ti per fornire il contesto ne­ces­sa­rio. Occorrono centinaia o ad­di­rit­tu­ra migliaia di immagini di ad­de­stra­men­to eti­chet­ta­te affinché un modello di clas­si­fi­ca­zio­ne delle immagini sia in grado di di­stin­gue­re tra due oggetti, ad esempio un tavolo e una sedia. Anche l’eti­chet­ta­tu­ra dei dati, ad esempio nel campo del se­quen­zia­men­to genetico, richiede com­pe­ten­ze spe­ci­fi­che.

L’ap­pren­di­men­to semi-su­per­vi­sio­na­to permette di rag­giun­ge­re un elevato livello di ac­cu­ra­tez­za no­no­stan­te disponga di una piccola quantità di dati eti­chet­ta­ti, dal momento che gli insiemi di dati eti­chet­ta­ti mi­glio­ra­no gli insiemi di dati non eti­chet­ta­ti. I dati strut­tu­ra­ti for­ni­sco­no un aiuto iniziale, che può con­tri­bui­re ad aumentare si­gni­fi­ca­ti­va­men­te la velocità di ap­pren­di­men­to e l’ac­cu­ra­tez­za. Questo approccio consente quindi di ottenere il massimo da una quantità limitata di dati eti­chet­ta­ti, pur uti­liz­zan­do una grande quantità di dati non eti­chet­ta­ti, favorendo così una maggiore ef­fi­cien­za in termini di costi.

N.B.

Na­tu­ral­men­te, l’ap­pren­di­men­to semi-su­per­vi­sio­na­to comporta anche sfide e li­mi­ta­zio­ni: se, ad esempio, i dati ini­zial­men­te eti­chet­ta­ti non sono corretti, po­treb­be­ro emergere con­clu­sio­ni errate con un impatto negativo sulla qualità del modello. In più, il modello può fa­cil­men­te perdere di valore se i dati eti­chet­ta­ti e non eti­chet­ta­ti non sono rap­pre­sen­ta­ti­vi della di­stri­bu­zio­ne com­ples­si­va.

Quali sono i campi di ap­pli­ca­zio­ne più im­por­tan­ti per l’ap­pren­di­men­to semi-su­per­vi­sio­na­to?

L’ap­pren­di­men­to semi-su­per­vi­sio­na­to è oggi uti­liz­za­to in diversi contesti, ma il campo di ap­pli­ca­zio­ne classico rimane quello dei compiti di clas­si­fi­ca­zio­ne. Nella pa­no­ra­mi­ca seguente ri­por­tia­mo una sintesi dei prin­ci­pa­li campi di ap­pli­ca­zio­ne:

  • Clas­si­fi­ca­zio­ne di contenuti web: i motori di ricerca come Google ricorrono all’ap­pren­di­men­to semi-su­per­vi­sio­na­to per valutare la per­ti­nen­za dei siti web per de­ter­mi­na­ti termini di ricerca.
  • Clas­si­fi­ca­zio­ne di testi e immagini: in questo caso l’obiettivo è quello di clas­si­fi­ca­re testi o immagini in una o più categorie pre­de­fi­ni­te. L’ap­pren­di­men­to semi-su­per­vi­sio­na­to si presta molto bene a questo scopo, dato che ha so­li­ta­men­te a che fare con una grande quantità di dati non eti­chet­ta­ti e l’eti­chet­ta­tu­ra di tutti i record di dati sarebbe troppo di­spen­dio­sa in termini di tempo e di costi.
  • Analisi vocale e lin­gui­sti­ca: anche l’eti­chet­ta­tu­ra dei file audio richiede molto tempo. Una soluzione naturale a questo problema è rap­pre­sen­ta­ta dall’ap­pren­di­men­to semi-su­per­vi­sio­na­to.
  • Analisi delle sequenze proteiche: a causa delle di­men­sio­ni notevoli dei filamenti di DNA, l’ap­pren­di­men­to semi-su­per­vi­sio­na­to è adatto all’analisi delle sequenze di proteine.
  • Ri­le­va­men­to di anomalie: l’ap­pren­di­men­to semi-su­per­vi­sio­na­to può essere uti­liz­za­to per rilevare modelli insoliti che dif­fe­ri­sco­no dalla norma.
Vai al menu prin­ci­pa­le