Fare pre­vi­sio­ni precise sul futuro con l’aiuto di metodi ma­te­ma­ti­ci è un’ambizione audace che pare però essere ormai talmente tanto vicina da essere a portata di mano, con la Pre­dic­ti­ve Analytics, o meglio in italiano con l’analisi pre­dit­ti­va. Questa me­to­do­lo­gia di analisi dei dati è un sot­to­set­to­re della Big Data Analysis, ovvero l’analisi dei co­sid­det­ti Big Data. L’analisi pre­dit­ti­va mira a fare una pre­vi­sio­ne sui futuri trend in di­sci­pli­ne come la scienza, il marketing, il settore della finanza o quello as­si­cu­ra­ti­vo.

L’elemento più im­por­tan­te di questo metodo di analisi è il co­sid­det­to modello pre­dit­ti­vo. Con questo termine si intende una persona o un’unità che viene misurata per riuscire a predire un possibile com­por­ta­men­to futuro. Un esempio concreto sarebbe ad esempio il caso di una polizza as­si­cu­ra­ti­va, i po­ten­zia­li fattori per il calcolo del rischio del pro­prie­ta­rio di una vettura vengono an­ti­ci­pa­ti, tra questi po­treb­be­ro essere presi in con­si­de­ra­zio­ne i più rilevanti come l’espe­rien­za del guidatore, l’età e la con­di­zio­ne di salute dell’in­te­res­sa­to. Dalla somma di questi fattori può essere calcolato il possibile rischio di incidenti e con­se­guen­te­men­te l’ammontare della polizza as­si­cu­ra­ti­va, tutto questo grazie all’analisi pre­dit­ti­va.

Data Mining: la base di diversi processi di raccolta dei dati analitici

In effetti il concetto Pre­dic­ti­ve Analytics viene spesso uti­liz­za­to come sinonimo per Data Mining. Spesso succede che i metodi del Data Mining giocano un ruolo fon­da­men­ta­le nel processo di ri­le­va­men­to e di iden­ti­fi­ca­zio­ne degli approcci dell’analisi pre­dit­ti­va. La Pre­dic­ti­ve Analytics per­fe­zio­na tuttavia il fun­zio­na­men­to del Data Mining, tenendo conto anche di altre tecniche. In questo modo, anche elementi della teoria dei giochi e l’ap­pren­di­men­to au­to­ma­tiz­za­to delle macchine giocano un ruolo im­por­tan­te. Di con­se­guen­za nell’im­ple­men­ta­zio­ne della Pre­dic­tion Analytics vengono uti­liz­za­ti dei processi di analisi specifici, che si basano su algoritmi complessi, per cercare di ottenere un modello ri­co­no­sci­bi­le da quello che par­reb­be­ro essere i tanti, scon­clu­sio­na­ti, e ap­pa­ren­te­men­te scol­le­ga­ti, post sui vari social media e gli articoli di blog.

Fatto

Il Data Mining tenta di in­di­vi­dua­re i modelli inerenti all’interno di grandi quantità di dati, grazie all’impiego di processi e algoritmi ma­te­ma­ti­ci e sto­ca­sti­ci. Nel migliore dei casi dai risultati ottenuti in questo modo è possibile leggere e an­ti­ci­pa­re quelli che sono i trend e i po­ten­zia­li sviluppi.

Per capire più pre­ci­sa­men­te il fun­zio­na­men­to delle analisi pre­dit­ti­ve, è im­por­tan­te avere una visione d’insieme sui concetti in uso nell’analisi dei Big Data e del Data Mining:

  • Analisi della re­gres­sio­ne: vengono iden­ti­fi­ca­te le in­te­ra­zio­ni tra le diverse variabili di­pen­den­ti e in­di­pen­den­ti. Ad esempio la vendita dipende dal prezzo del prodotto e dalla sol­vi­bi­li­tà dei clienti;
  • Clu­ste­ring: at­tra­ver­so la seg­men­ta­zio­ne dei dati, i po­ten­zia­li clienti possono essere divisi in categorie in base al reddito o a fattori simili;
  • Analisi delle as­so­cia­zio­ni: l’obiettivo è quello di di­mo­stra­re la presenza di strutture tra quelle variabili che ri­con­du­co­no a un risultato identico. Con­se­guen­te­men­te è possibile trarre con­clu­sio­ni sui possibili com­por­ta­men­ti dei clienti e, nella migliore delle ipotesi, prevedere gli acquisti futuri. Se un cliente ad esempio è in­te­res­sa­to in un paio di scarpe, potrebbe essere che sia anche in­te­res­sa­to all’acquisto di una scarpiera.

La dif­fe­ren­zia­zio­ne dell’analisi pre­dit­ti­va

Il ri­co­no­sci­men­to dei modelli pre­dit­ti­vi nelle banche dati ricorda un po’ le capacità in­ter­pre­ta­ti­ve del cervello umano, sebbene l’analisi dei Big Data, dal punto di vista della com­ples­si­tà delle ope­ra­zio­ni, le superi di gran lunga. Ef­fet­ti­va­men­te c’è un parallelo tra le strutture adoperate per il Data Mining e le con­nes­sio­ni neuronali del cervello umano, poiché anche la rete ar­ti­fi­cia­le è capace di iden­ti­fi­ca­re de­ter­mi­na­ti schemi e di me­mo­riz­zar­li, dopo alcuni passaggi. Di con­se­guen­za si può stabilire che il Data Mining sia strut­tu­ral­men­te im­pa­ren­ta­to con la AI, ovvero l’in­tel­li­gen­za ar­ti­fi­cia­le o anche ap­pren­di­men­to au­to­ma­ti­co, dato che i software ap­pren­do­no quasi au­to­no­ma­men­te grazie alle nozioni me­mo­riz­za­te e ac­qui­si­sco­no nuove in­for­ma­zio­ni in base agli schemi immessi e svi­lup­pa­ti.

A questo riguardo sussiste una dif­fe­ren­za im­por­tan­te tra il Data Mining e la Pre­dic­tion Analytics. Il Data Mining con­ven­zio­na­le ha prin­ci­pal­men­te come scopo quello di mostrare gli schemi strut­tu­ra­li contenuti all’interno delle in­for­ma­zio­ni e dei cluster presenti. Il focus su una rie­la­bo­ra­zio­ne quasi au­to­di­dat­ta dei calcoli, svolta pro­gres­si­va­men­te sul database, è tuttavia una ca­rat­te­ri­sti­ca dell’ap­pren­di­men­to au­to­ma­ti­co che gioca un ruolo decisivo nel definire che cos’è l’analisi pre­dit­ti­va. Dall’enorme mole di dati a di­spo­si­zio­ne, gli algoritmi esistenti devono combinare le in­for­ma­zio­ni e trarre nuove con­clu­sio­ni, al fine di riuscire da soli a pro­no­sti­ca­re riguardo ad esempio al com­por­ta­men­to degli utenti, per mezzo delle pre­vi­sio­ni. Questo processo di ri­le­va­men­to viene de­no­mi­na­to come Smart Customer Data.

Settori di utilizzo dell’analisi pre­dit­ti­va

L’in­clu­sio­ne della Pre­dic­ti­ve Analytics si è già affermata in svariati campi. Oltre alle aziende high tech operanti nell’ambito scien­ti­fi­co, anche il sistema sanitario ha già adottato questo metodo per la pre­di­zio­ne del decorso delle malattie. Un settore di utilizzo pro­mi­nen­te è anche quello ener­ge­ti­co, dove alla rete elettrica in­tel­li­gen­te del futuro è stato dato il nome di “Smart Grid”. Questa rete permette di prevedere il consumo ener­ge­ti­co sulla base di modelli di com­por­ta­men­to dei clienti ar­chi­via­ti (Smart Customer Data), al fine di regolare esat­ta­men­te l’ali­men­ta­zio­ne dell’energia idroe­let­tri­ca e di quella eolica.

Come esempio ulteriore può essere men­zio­na­to quello del co­sid­det­to Pre­dic­ti­ve Main­te­nan­ce, dove vengono ar­chi­via­ti i dati attuali di un mac­chi­na­rio in funzione, per riuscire così a de­ter­mi­na­re anzitempo la relativa sol­le­ci­ta­zio­ne e usura. In questo modo è possibile iden­ti­fi­ca­re ve­lo­ce­men­te le vul­ne­ra­bi­li­tà all’interno di una catena pro­dut­ti­va e porvi rimedio prima che si verifichi il peggio, ed evitando quindi che si verifichi il blocco dell’intera catena di pro­du­zio­ne.

L’analisi pre­dit­ti­va può essere meglio impiegata laddove vi sono svariati pacchetti di dati, pos­si­bil­men­te di grandi di­men­sio­ni e ben ripuliti da tutti quei dati superflui o fuor­vian­ti. Tutti i pacchetti di dati vengono perciò integrati nell’analisi, rendendo così il risultato tanto più preciso, quanti più saranno i dati a di­spo­si­zio­ne pro­ve­nien­ti dai vari settori. La maggior parte delle imprese uti­liz­za­no l’effetto sinergia che consiste nell’estendere la propria struttura di business in­tel­li­gen­ce già presente con le funzioni dell’analisi pre­dit­ti­va. Tra i tool più popolari per l’utilizzo della Pre­dic­ti­ve Analytics vi sono:

  • Alpine Data Labs
  • Alteryx
  • Angoss Kno­w­led­ge­STU­DIO
  • BIRT Analytics
  • IBM SPSS Sta­ti­stics and IBM SPSS Modeler
  • KXEN Modeler
  • Ma­the­ma­ti­ca
  • MATLAB

Il prossimo passo dell’analisi dei dati è la Pre­scrip­ti­ve Analytics o analisi pre­scrit­ti­va. Questo metodo parte proprio da dove l’analisi pre­dit­ti­va incontra i propri limiti: si tenta di in­ter­pre­ta­re le in­di­ca­zio­ni com­mer­cia­li, così da riuscire a pilotare lo sviluppo di un trend. I migliori scenari possibili diventano così di più facile rea­liz­za­zio­ne e un de­ter­mi­na­to corso può essere rein­di­riz­za­to verso una nuova direzione. Questo modo di procedere viene reso possibile at­tra­ver­so strutture ana­li­ti­che che si basano su modelli complessi e si­mu­la­zio­ni sto­ca­sti­che. Come nel caso dell’analisi pre­dit­ti­va, anche qui vale che più grande è il numero delle variabili co­no­sciu­te e af­fi­da­bi­li che si possono im­ple­men­ta­re in questo modello, più elevate saranno le pos­si­bi­li­tà che i risultati siano esatti.

Con­clu­sio­ne

Che cos’è l’analisi pre­dit­ti­va o Pre­dic­ti­ve Analytics? Si tratta di un sot­to­set­to­re dell’analisi dei Big Data, il quale si con­trad­di­stin­gue per le sue si­mi­la­ri­tà con il Data Mining. Ma in che cosa si dif­fe­ren­zia­no e come funziona esat­ta­men­te la pre­di­zio­ne di analisi mirate? In questo articolo vi forniamo risposte per quel che riguarda questo metodo di analisi, e vi mostriamo dove, quando e con quali tool viene uti­liz­za­ta l’analisi pre­dit­ti­va.

Vai al menu prin­ci­pa­le