Cos’è l’apprendimento automatico?
L’apprendimento automatico è un sottocampo dell’intelligenza artificiale, dove i modelli computazionali apprendono dai dati per fare previsioni o prendere decisioni senza programmazione esplicita. Non è solo interessante per la scienza e per aziende IT come Google o Microsoft. Anche il mondo del marketing online può trasformarsi grazie agli sviluppi dell’intelligenza artificiale.
Cos’è l’apprendimento automatico?
Essenzialmente le macchine, i computer e i programmi funzionano solamente nel modo in cui è stato per loro precedentemente stabilito: “In caso di A, allora fai B”. Le nostre aspettative nei confronti dei moderni sistemi di computer sono sempre più elevate; ciononostante i programmatori e le programmatrici non sono in grado di prevedere tutti i casi pensabili e di conseguenza insegnare ai computer tutte le rispettive possibili soluzioni. Per questo motivo è indispensabile che il software sia in grado di prendere decisioni in autonomia e di reagire in maniera appropriata a situazioni ignote.
A questo scopo devono però essere presenti degli algoritmi che consentono al programma di apprendere. Ciò significa che il primo passo consiste nel riempire la macchina di dati; successivamente il computer deve capirne la struttura e realizzare un modello così da essere poi in grado di fare delle associazioni. Proprio in questo consiste l’apprendimento automatico.
Quando si parla di sistemi autoapprendenti si pensa anche a termini a essi imparentati: è importante conoscerli per avere una migliore comprensione di tutto il mondo del machine learning.
- Conformità al GDPR e hosting sicuro in Europa
- Potenti modelli basati sull'intelligenza artificiale
- Assenza di vendor lock-in grazie all'open source
Intelligenza artificiale
La ricerca sull’intelligenza artificiale (IA) tenta di creare macchine che siano in grado di agire come un essere umano: i computer e i robot devono analizzare il proprio ambiente e successivamente prendere la decisione migliore. Devono quindi comportarsi in maniera intelligente, secondo i criteri degli esseri umani. E qui sorge il problema della definizione di tali criteri, anche se addirittura non è ancora ben chiaro secondo quali parametri dovremmo valutare la nostra stessa intelligenza. Attualmente l’intelligenza artificiale, o ciò che viene considerata tale, non riesce a simulare un essere umano per intero (inclusa l’intelligenza emotiva). Piuttosto si isolano degli aspetti parziali per riuscire a risolvere determinati compiti. Ciò viene comunemente definita come intelligenza artificiale debole.
Dal 2022, i sistemi con l’IA generativa come l’assistente IA ChatGPT hanno acquisito grande importanza. Questi si basano su trasformatori in grado di generare testi, immagini o codici sulla base di enormi quantità di dati. Tuttavia, si tratta ancora di sistemi specializzati che non possiedono una vera intelligenza generale.
Reti neurali
La neuroinformatica lavora alla progettazione di computer basati sul modello del cervello umano. Questa branca della ricerca sull’intelligenza artificiale considera i sistemi nervosi come da un punto di vista astratto, cioè liberi delle loro proprietà biologiche e limitati al loro modo di funzionamento. Le reti neurali artificiali sono principalmente dei procedimenti matematici astratti più che manifestazioni reali. Viene dunque tessuta una rete di neuroni composta da funzioni matematiche o algoritmi e che, come un cervello umano, è in grado di far fronte a compiti complessi. I collegamenti tra i neuroni sono diversamente potenti e hanno l’abilità di adattarsi ai problemi.
Il progresso delle reti neurali ha portato all’ascesa del deep learning. Si tratta di reti neurali complesse con molti strati (layer) che oggi dominano.
Big data
L’espressione “Big Data” fa semplicemente riferimento a un’enorme quantità di dati. Tuttavia, non c’è un punto definito a partire dal quale si smette di parlare di dati e si inizia a parlare di Big Data. Il fatto che questo fenomeno negli ultimi anni goda di grande risonanza mediatica è dovuto all’origine di questa tipologia di dati: in molti casi il flusso di informazioni è costituito da dati utente (interessi, profili degli spostamenti, dati vitali) rilevati da aziende come Google, Amazon e Facebook per adattarsi più precisamente ai propri utenti. Simili quantità di dati non possono più essere valutate in maniera soddisfacente dai sistemi di computer tradizionali: del resto un software del genere riesce a trovare solamente quello che l’utente cerca. Per questo motivo sono necessari dei sistemi autoapprendenti che sono in grado di scoprire collegamenti ignoti fino a quel momento.
Data mining
Con data mining si definisce l’analisi dei Big Data. La rilevazione dei meri dati ha di per sé un valore relativo. Tuttavia, l’accumulo di informazioni diventa interessante nel momento in cui si estraggono e si valutano le caratteristiche rilevanti, in maniera analoga a come si estrae l’oro. Il data mining si differenzia dall’apprendimento automatico perché si basa sull’applicazione di modelli riconosciuti, invece di trovarne di nuovi. Le metodologie del data mining includono, ad esempio, l’analisi dei cluster, gli alberi decisionali, i metodi di regressione e le analisi delle associazioni. Il data mining oggi è spesso parte dei sistemi di Business Intelligence o viene utilizzato per l’analisi predittiva per prevedere il comportamento del cliente o le tendenze di mercato.
I metodi di apprendimento automatico a confronto
Essenzialmente i ricercatori e le ricercatrici fanno una distinzione tra supervised learning (apprendimento supervisionato), unsupervised learning (apprendimento non supervisionato) e deep learning. Gli algoritmi utilizzati a questo scopo sono molto diversi tra loro.
Apprendimento supervisionato
Nell’apprendimento supervisionato o supervised learning il sistema è alimentato con degli esempi. Gli sviluppatori e le sviluppatrici indicano a quale valore associare l’informazione corrispondente, ad esempio se debba appartenere alla categoria A piuttosto che alla B. A partire da ciò il sistema autoapprendente deduce determinate informazioni e traccia un modello che sarà in grado di riconoscere anche in futuro, così riuscirà a maneggiare meglio i dati sconosciuti. Lo scopo principale è di minimizzare sempre più la quota di errori.
Un esempio noto di apprendimento sorvegliato sono i filtri spam: sulla base di determinate caratteristiche il sistema decide se l’e-mail debba finire nella casella di posta in entrata oppure se in quella dello spam. Se il sistema dovesse fare un errore, in seguito è possibile impostare di nuovo manualmente i parametri a cui il filtro dovrà fare riferimento in futuro. In questo modo il software otterrà risultati sempre migliori.
Apprendimento non supervisionato
Per quanto riguarda l’unsupervised learning, l’apprendimento non supervisionato, il programma tenta di riconoscere per conto suo i modelli ricorrenti. Per farlo ha ad esempio la possibilità di servirsi del clustering: dalla raccolta di tutti i dati seleziona quindi un elemento le cui caratteristiche sono analizzate e confrontate con quelle già esaminate. Se il programma ha già analizzato elementi simili, allora l’oggetto attuale sarà aggiunto a questi; in caso contrario sarà invece isolato.
I sistemi che si basano sull’apprendimento non supervisionato sono attuati anche nelle reti neurali. Si trovano degli esempi di applicazione nella sicurezza di rete: un sistema autoapprendente è qui in grado di riconoscere un comportamento anormale. Nonostante non sia ad esempio possibile associare un cyberattacco a un gruppo noto, il programma è comunque in grado di riconoscere la presenza di una minaccia e provvede quindi a lanciare l’allarme.
Oltre a queste due direzioni principali esistono anche l’apprendimento parzialmente supervisionato (semi-supervised learning), l’apprendimento per rinforzo (reinforcement learning), l’apprendimento attivo (active learning) e l’apprendimento auto-supervisionato. Questi metodi appartengono all’apprendimento supervisionato e si distinguono per natura e modalità di coinvolgimento degli utenti. La variante più rilevante oggi è il cosiddetto apprendimento auto-supervisionato, in cui i sistemi generano autonomamente le attività didattiche, senza coinvolgimento dell’utente.
Deep learning
A differenza degli algoritmi di apprendimento automatico classici come gli alberi decisionali o le macchine a vettori di supporto, il deep learning utilizza reti neurali multistrato per elaborare volumi di dati più complessi. La complessità di questi dati è dovuta al fatto che sono informazioni naturali, ovvero quelle che compaiono nel riconoscimento vocale, del linguaggio scritto o del viso. Per gli esseri umani i dati naturali sono facili da elaborare, mentre non lo sono per una macchina, poiché sono difficili da assimilare matematicamente.
Il deep learning e le reti neurali artificiali sono strettamente connessi tra loro. Il modo in cui si allenano le reti neurali, può essere definito come deep learning: deep (in italiano: profondo) perché la rete dei neuroni è organizzata su diversi livelli gerarchici. Il primo livello è costituito da neuroni in entrata che rilevano i dati, iniziano con la loro analisi e inviano i risultati al prossimo nodo neurale. Alla fine le informazioni, di volta in volta sempre più precise, raggiungono il livello di uscita e la rete emette un valore. I livelli, nel complesso molto numerosi, che si trovano tra entrata e uscita, sono chiamati livelli nascosti (“hidden layers”).
Come funziona l’apprendimento automatico nel marketing?
Oggigiorno l’apprendimento automatico è già di grande utilità per il marketing; al momento sono principalmente le grandi aziende a servirsi di questa tecnologia, prima di tutte Google. I sistemi autoapprendenti sono ancora così nuovi che non si possono ancora semplicemente acquistare come prodotti out of the box. Al loro posto le grandi aziende di internet sviluppano i propri sistemi e hanno quindi un ruolo pionieristico in questo ambito. Siccome alcune nonostante l’interesse commerciale seguono comunque un approccio open source e collaborano con la ricerca indipendente, i progressi nel campo del machine learning sono sempre più rapidi.
Analisi dei dati e pronostici
Accanto a quello creativo, il marketing ha anche sempre un aspetto analitico: le statistiche sul comportamento degli utenti giocano un ruolo importante nella decisione di determinate misure pubblicitarie. Solitamente vale la regola che più è grande la quantità di dati, più informazioni si possono estrapolare. I programmi autoapprendenti riconoscono i modelli ricorrenti e sono in grado di fare delle previsioni attendibili, al contrario degli esseri umani, i quali sono spesso prevenuti nei confronti dei dati.
Solitamente chi analizza i dati parte con delle aspettative che finiscono per essere dei veri e propri pregiudizi, praticamente inevitabili per gli esseri umani, e che sono anche spesso motivo di distorsione. Maggiori sono le quantità di dati prese in esame dagli analisti, più forti sono le divergenze nell’interpretazione dei dati. Anche se le stesse macchine intelligenti possono avere dei pregiudizi perché sono state inconsapevolmente istruite dagli stessi esseri umani ad averne, quando si tratta di fatti concreti agiscono con maggiore oggettività rispetto agli esperti in carne e ossa. Si può quindi dire che le macchine forniscono analisi più affidabili.
Visualizzazione
I sistemi autoapprendenti migliorano e semplificano la rappresentazione dei risultati di analisi, come accade nella automated data visualization, una tecnologia in cui il computer sceglie in autonomia la corretta rappresentazione di dati e informazioni. Ciò è particolarmente importante perché consente agli esseri umani di capire quello che la macchina ha scoperto e previsto. Con enormi flussi di dati diventa difficile rappresentare da soli gli esiti delle valutazioni. Per questo motivo anche la visualizzazione deve avvenire tramite calcoli dei computer.
Personalizzazione e design generativo
Tuttavia, il machine learning può anche esercitare un’influenza sulla creazione di contenuti: come accade ad esempio nel design generativo. Anziché progettare lo stesso percorso per tutti gli utenti, i sistemi dinamici sono in grado di creare esperienze personalizzate grazie all’apprendimento automatico. Nonostante il contenuto visualizzato su un sito web sia ancora fornito da copywriter e designer, tocca al sistema il compito di integrare i componenti specifici per l’utente. Nel frattempo, i sistemi autoapprendenti vengono utilizzati anche nella progettazione o per redigere i contenuti: ad esempio con il Project Dreamcatcher, un innovativo sistema CAD nato dal gruppo di ricerca dell’azienda Autodesk, è possibile fare progettare dei componenti a una macchina. I modelli linguistici di grandi dimensioni (LLM) come ChatGPT possono inoltre creare testi per siti web personalizzati per gruppi di utenti.
Chatbot intelligente ed elaborazione linguistica
Si può utilizzare il machine learning anche per organizzare meglio i chatbot. Molte aziende impiegano già oggi dei programmi che portano a termine una parte del supporto clienti grazie all’aiuto di un chatbot. Tuttavia, in molti casi gli utenti si scocciano in fretta di avere a che fare con dei robot comuni. Invece, un chatbot che si basa su un sistema autoapprendente e che ha un buon riconoscimento vocale (elaborazione del linguaggio naturale) riesce a trasmettere ai clienti la sensazione di stare veramente comunicando con una persona e quindi anche a passare il test di Turing.
Raccomandazioni personalizzate
Amazon e Netflix dimostrano un’ulteriore vantaggio dell’apprendimento automatico per i marketer: le raccomandazioni. Tra gli importanti fattori di successo di queste grandi aziende si ritrova anche la capacità di prevedere ciò che l’utente desidererà avere. I sistemi autoapprendenti sanno consigliare all’utente altri prodotti indipendentemente dai dati raccolti. Ciò che prima era possibile fare solamente su grande scala (“Ai nostri clienti piace il prodotto A, per cui la maggior parte di loro sarà interessata anche al prodotto B.”), ora è possibile anche su scala più ridotta grazie ai programmi moderni (“Alla cliente X sono piaciuti i prodotti A, B e C, per cui probabilmente sarà interessata anche al prodotto D.”).
Riassumendo si può constatare che i sistemi autoapprendenti influenzeranno quattro diversi aspetti del marketing online:
- Quantità: i programmi che funzionano con l’apprendimento automatico e che sono stati istruiti bene riescono a elaborare enormi quantità di dati e a fare quindi delle previsioni per il futuro.
- Velocità: le analisi necessitano di tempo se fatte manualmente. Tramite i sistemi autoapprendenti la velocità del lavoro aumenta e si può quindi reagire più prontamente alle modifiche.
- Automatizzazione: attraverso l’apprendimento automatico è più facile automatizzare i procedimenti. Siccome i sistemi moderni hanno la capacità di adattarsi autonomamente a nuove circostanze con l’aiuto del machine learning, anche complessi processi di automatizzazione diventano possibili.
- Personalizzazione: i software riescono ad assistere innumerevoli clienti. Dato che i sistemi autoapprendenti rilevano ed elaborano dati dal singolo utente, possono occuparsi di questi clienti in maniera personalizzata.
Altri campi di applicazione dei sistemi autoapprendenti
Il marketing non è il solo ad aver trovato diversi impieghi per il machine learning: i sistemi autoapprendenti sono efficaci anche in molti altri ambiti della vita umana. In parte questi contribuiscono ulteriormente al progresso di scienza e tecnologia. In alcuni casi vengono semplicemente utilizzati sotto forma di gadget più o meno grandi per semplificare la vita di ogni giorno. I campi di applicazione presentati sono solo alcuni degli esempi possibili, del resto non è da escludere che in un futuro non troppo lontano l’apprendimento automatico sarà presente in tutti gli aspetti della nostra vita.
Scienza
Ciò che vale per il marketing ha un significato ancora più importante nella scienza. L’elaborazione intelligente dei big data alleggerisce notevolmente il lavoro della ricerca empirica. Ad esempio, grazie ai sistemi autoapprendenti i fisici delle particelle riescono a rilevare e a elaborare molti più dati e a constatare eventuali anomalie. Ma l’apprendimento automatico può essere di aiuto anche nella medicina: già al giorno d’oggi alcuni medici si servono dell’intelligenza artificiale per fare diagnosi e terapie. Inoltre, l’apprendimento automatico è utile anche per la prognosi di diabete o infarti.
Robotica
Oggigiorno i robot sono ormai onnipresenti soprattutto nelle fabbriche: vengono ad esempio impiegati nelle produzioni di massa per automatizzare passaggi lavorativi sempre uguali. Tuttavia, non si tratta di veri e propri sistemi intelligenti, visto che sono programmati solo per eseguire un solo specifico passaggio. Quando i sistemi autoapprendenti vengono utilizzati nella robotica devono essere in grado di risolvere nuovi compiti. Naturalmente questi progressi sono di grande interesse anche per altri settori: dai viaggio nello spazio ai lavori domestici, i robot dotati di intelligenza artificiale possono entrare in azione in numerosi ambiti.
Traffico
Le autovetture autonome sono una grande vetrina per il machine learning. Solo l’apprendimento automatico fa sì che le automobili si muovano in maniera autonoma e sicura nel traffico, invece che solo nei percorsi di prova. Non essendo possibile programmare tutte le situazioni possibili, è indispensabile che i veicoli autonomi facciano riferimento a macchine intelligenti. Ma i sistemi autoapprendenti non si limitano a rivoluzionare i mezzi di trasporto nel traffico: gli algoritmi intelligenti, ad esempio sotto forma di reti neurali artificiali, analizzano il traffico e sviluppano modi più efficienti di gestirlo, come tramite l’accensione intelligente di semafori.
Internet
Già ora l’apprendimento automatico gioca un ruolo significativo per internet. Un esempio sono i filtri spam: attraverso un costante apprendimento i filtri si affinano e riescono a riconoscere sempre meglio le e-mail indesiderate così da bandirle dalla casella di posta in entrata in maniera sempre più affidabile. Lo stesso vale anche per il contrasto di virus e malware: grazie alle nuove tecnologie intelligenti i computer sono più protetti da software dannosi. Anche gli algoritmi di ranking dei motori di ricerca, primo fra tutti RankBrain di Google, sono sistemi autoapprendenti. Anche se l’algoritmo non capisce l’inserimento dell’utente (perché finora non è mai stato cercato da nessuno), può dedurre e fare una proposta che potrebbe essere inerente alla richiesta.
Assistenti personali
Anche tra le proprie quattro mura i computer intelligenti diventano sempre più presenti: ecco che le normali case diventano quindi smart homes , case intelligenti. L’azienda Moley Robotics, ad esempio, sviluppa una cucina intelligente dotata di bracci meccanici che preparano i pasti. Anche gli assistenti personali come Google Home e Amazon Echo, grazie ai quali è possibile monitorare impianti e dispositivi presenti nella propria casa, si servono delle tecnologie di machine learning per comprendere al meglio le esigenze dei propri utenti. Ma molte persone non rinunciano al proprio assistente nemmeno quando sono in giro: Siri, Cortana e Assistente Google consentono agli utenti di dare comandi e fare domande ai propri smartphone tramite comando vocale.
Giochi
Sin dall’inizio della ricerca sull’intelligenza artificiale, la capacità delle macchine di giocare è sempre stato un grande stimolo per i ricercatori e le ricercatrici. I sistemi autoapprendenti sono stati messi alla prova negli scacchi, nella dama e anche nel go, il noto gioco da tavolo cinese tra i più complessi del mondo, sfidati da concorrenti umani. Anche gli sviluppatori e le sviluppatrici di videogiochi ricorrono al machine learning per realizzare progetti più accattivanti. I designer di giochi hanno la possibilità di utilizzare l’apprendimento automatico per creare un un’esperienza di gioco più equilibrata possibile e per fare in modo che gli avversari virtuali si adattino meglio al comportamento dei giocatori umani.
La storia dei sistemi autoapprendenti
I robot e le macchine automatiche fanno parte della vita degli esseri umani già da diverse centinaia di secoli. Già diversi autori della letteratura romantica avevano affrontato la tematica dell’intelligenza artificiale e ancora oggi i robot sono i protagonisti affascinanti di libri, film e videogiochi. La relazione dell’essere umano con la macchina pensante ha sempre oscillato tra timore e fascino.
Gli studi veri e propri sul machine learning sono iniziati solo negli anni ‘50: un’epoca in cui i computer erano ancora in fasce e l’intelligenza artificiale ancora un sogno lontano. Se nei due secoli precedenti scienziati come Thomas Bayes, Adrien-Marie Legendre e Pierre-Simon Laplace avevano gettato le basi per le ricerche future, solo con il lavoro di Alan Turing il concetto di una macchina in grado di apprendere si è finalmente concretizzata.
“In tal caso si dovrebbe ammettere che l’avanzamento della macchina non era stato previsto al momento dell’inserimento delle istruzioni originali. Sarebbe come dire che un allievo ha imparato molto dal maestro ma ha aggiunto ancora di più con il proprio lavoro. Quando ciò accade si è obbligati a riconoscere che la macchina mostra segni di intelligenza.” Alan Turing durante una lezione nel 1947. (Citato da B. E. Carpenter e R. W. Doran (eds.), A. M. Turing’s Ace Report of 1946 and Other Papers)
Nel 1950 Turing sviluppò il test di Turing, noto ancora oggi: si tratta di una sorta di gioco in cui il computer finge di essere un umano con un altro essere umano. Se la macchina riesce a convincere l’essere umano di stare dialogando con una persona in carne e ossa, allora ha superato il test. Appena due anni dopo Arthur Samuel sviluppò un computer che sapeva giocare a dama e che migliorava le sue abilità a ogni partita: il programma aveva la capacità di apprendere. Nel 1957 Frank Rosenblatt sviluppò Perzeptron, il primo algoritmo che poteva essere istruito, quindi in sostanza una rete neurale artificiale.
Nel frattempo, le grandi aziende sono diventate le principali finanziatrici dello sviluppo dell’apprendimento automatico: con Watson, ad esempio, IBM ha sviluppato un computer che possiede un immenso archivio di informazioni ed è in grado di rispondere a domande che vengono poste in un linguaggio naturale. Google e Meta impiegano il machine learning per capire meglio i propri utenti e offrire loro più funzioni.

