Cos’è il data mining?

Indice

Il termine “data mining” si riferisce all’analisi mirata di grandi quantità di dati per ottenere nuove informazioni potenzialmente utili. Ti illustriamo il termine in modo più dettagliato spiegandoti alcuni dei metodi di analisi associati.

Il data mining in breve

Per dare una definizione di data mining, è utile decifrare la metafora su cui si basa e scoprirne il metodo di analisi alla base. Se si tende a considerare l’output che deriva dal tracciamento costante delle attività dei visitatori e delle visitatrici su internet come una montagna di dati inutile, con il data mining (letteralmente “estrazione dei dati”) si avranno gli strumenti necessari per comprendere i risultati raccolti e accedere alle informazioni rilevanti. Al contrario di quanto avvenga in miniera (il classico luogo dedicato alle estrazioni), qui vengono applicati dei metodi statistici, che consentono di identificare le tendenze e i collegamenti trasversali.

Generalmente, il data mining è strettamente connesso ai big data, cioè delle banche dati che non possono essere comprese manualmente e richiedono quindi un’analisi effettuata con l’aiuto del computer. In linea di massima, però, i metodi di data mining si applicano su qualsiasi quantità di dati. Le conoscenze che vengono acquisite tramite il data mining vengono usate nella strategia impiegata per un business online e nelle varie decisioni di marketing. Ugualmente eterogenei sono i campi di applicazione.

Campi di applicazione del data mining

Il data mining offre la possibilità di ottimizzare l’e-commerce su base scientifica. Infatti, i grandi database, utilizzati nel business online, sono alla base di spiegazioni e pronostici. Elaborati statisticamente e visualizzati sotto forma di statistiche, consentono a chi gestisce un negozio online di identificare i fattori per un business online di successo e di calcolare le strategie di marketing di un negozio online sulla base di modelli. Il data mining viene applicato per:

segmentare i mercati;
analizzare i carrelli;
delineare i profili dei compratori;
calcolare i prezzi dei prodotti;
formulare i pronostici sulla durata dei contratti;
analizzare la domanda;
identificare gli errori nel processo di vendita.

I software IA di IONOS

Scopri la potenza dell'intelligenza artificiale

Siti web in tempo record
Soluzioni IA per il tuo business
Risparmio di tempo e risultati eccellenti

Come funziona il data mining?

Il data mining è considerato una sottofase del Knowledge Discovery in Data (KDD), che comprende le seguenti fasi:

Definire gli obiettivi: in primo luogo, è necessario determinare le domande specifiche a cui si vuole rispondere con l’analisi dei dati. In questo modo è più facile per i professionisti del settore riconoscere i dati pertinenti e i metodi di analisi appropriati.
Pre-elaborazione dei dati: la qualità dei dati di base è decisiva per la natura delle informazioni ottenute attraverso il data mining. I dati rilevanti devono quindi essere ripuliti prima di essere analizzati, al fine di rimuovere duplicati, valori anomali e altre distorsioni. I dati ripuliti possono anche dover essere convertiti nel formato richiesto dalla procedura di analisi.
Analisi dei dati: a questo punto ha luogo l’analisi matematica vera e propria dei dati. I metodi di analisi da utilizzare dipendono in larga misura dagli obiettivi selezionati e dalle caratteristiche dei dati. Si possono utilizzare sia gli algoritmi classici sia i più recenti algoritmi di deep learning basati sulle reti neurali.
Interpretazione dei risultati: prima di tutto, è necessario valutare i risultati dell’analisi. Se i risultati sono comprensibili e informativi, è possibile identificare nuove correlazioni e ottenere approfondimenti che possono a loro volta influenzare le future strategie aziendali.

I metodi del data mining

Per poter estrarre le informazioni rilevanti per il proprio business dai database di grandi dimensioni, si sono affermati diversi metodi, che si basano sull’identificazione di relazioni importanti, schemi, tendenze e si servono di procedimenti statistici.

Identificazione delle anomalie (Outlier Detection): con anomalia si indicano i valori assoluti che emergono dal resto dei dati complessivi, visto che si allontanano dalla tendenza generale della sequenza di misurazione. Nel data mining viene applicata l’identificazione delle anomalie per individuare serie di dati non comuni. Nella pratica questo metodo di data mining si utilizza per smascherare delle transazioni sospette nel caso di falsificazioni di carte di credito.
Analisi del cluster: con cluster si indica un raggruppamento di oggetti, che si basa sulle similitudini dei membri del gruppo. Lo scopo di questo metodo di analisi è la segmentazione dei dati non strutturati. Per questo si applicano gli algoritmi come K-nearest neighbor (KNN) che ricercano nei database di grandi dimensioni le strutture simili per identificare dei nuovi cluster. Se non si riesce ad assegnare una serie di dati a un cluster, questa viene interpretata come un’anomalia. Un classico caso di applicazione per l’analisi del cluster è l’identificazione di gruppi di visitatori.
Classificazione: mentre nel caso dell’analisi del cluster l’identificazione dei nuovi gruppi rimane in primo piano, con la classificazione vengono applicate delle classi predefinite. La distribuzione avviene in base a proprietà concordanti dei singoli dati dal database complessivo. Un metodo comune di classificazione automatica dei dati è rappresentato dall’albero decisionale (“decision tree”). A ogni nodo viene richiesta una proprietà dell’oggetto, la cui presenza o assenza determina la scelta del nodo successivo. Nel settore dell’e-commerce si applica questo procedimento per suddividere i clienti in diversi segmenti.
Analisi di associazione: un’analisi di associazione mira all’identificazione delle relazioni in un database, che sono formulabili come regole finali. Nell’e-commerce si ricorre a questo metodo per identificare le correlazioni dei singoli prodotti presenti nei carrelli, secondo lo schema “se viene comprato un prodotto A, allora viene acquistato anche il prodotto B”.
Analisi di regressione: grazie alle analisi di regressione vengono creati dei modelli di data mining, che hanno il compito di chiarire una variabile dipendente tramite diverse indipendenti. Di norma si può creare, ad esempio, un pronostico per la vendita di un prodotto, instaurando una relazione tra il prezzo del prodotto e il reddito medio di un cliente basandosi su un modello di regressione.

Limiti del data mining

Nel data mining si applicano procedimenti statistici che consentono un’analisi sostanzialmente oggettiva dei database disponibili. Tuttavia, la scelta soggettiva del processo di analisi, come pure di diversi algoritmi e parametri sulla base di determinate previsioni, può portare alla falsificazione dei risultati (probabilmente voluta). È possibile aggirare questi effetti affidando i processi di data mining a servizi esterni.

Per concludere, è da notare che il data mining fornisce risultati solo sotto forma di schemi e collegamenti trasversali. Si ottengono delle risposte solo quando i risultati dell’analisi vengono interpretati in relazione alle domande precedenti e agli obiettivi preposti.

Articoli popolari

Vendere domini: come guadagnare con i domini?

Comprare e vendere domini può essere un'attività lucrativa, se si sa come procedere. Vi…

5 alternative a Nextcloud a confronto

Scopri le migliori alternative a Nextcloud, ideali per diverse esigenze di archiviazione…

I 7 migliori servizi di backup online a confronto

Salva i tuoi dati al sicuro nel cloud. Ti presentiamo 7 servizi per proteggere i tuoi…

Aggiornamento a Debian 13: come funziona

Questa guida ti mostra come eseguire un aggiornamento a Debian 13, preparare il tuo…

4 alternative gratuite a InDesign di Adobe

I software Adobe sono troppo costosi? Sul web sono disponibili alcune alternative gratuite…

Articoli simili

sakkmesterkeshutterstock

Big Data: definizione ed esempi

Compriamo spesso online, prenotiamo le nostre vacanze e cerchiamo regali per i nostri cari, senza pensare che lasciamo una traccia ogni volta che effettuiamo una ricerca e ogni volta che inseriamo da qualche parte il nostro indirizzo di posta elettronica. Molte delle informazioni…

Protezione dei Dati
Database
Negozio Online
E-Commerce
Dati di Grandi Dimensioni

kentohshutterstock

Data Driven Marketing: dai big data agli smart data

Quando siamo su Internet e guardiamo prodotti e offerte, lasciamo sempre una traccia. Tramite analisi e algoritmi il Data Driven Marketing consente di mettere insieme i tasselli del puzzle. I marketer possono utilizzare questi dati e ricavarne informazioni di qualità per gestire…

Google Analytics
Dati di Grandi Dimensioni
Analisi dei Dati

JirsakShutterstock

I tool di data mining permettono un’analisi dei dati approfondita

Nell’era digitale i dati crescono sempre più e le piccole e medie imprese si ritrovano a dover gestire grandi quantità complesse di dati. Per riuscire comunque a carpire le informazioni desiderate da queste serie di dati, si usano dei tool di data mining. Grazie a questi vengono…

Database
Dati di Grandi Dimensioni
Analisi dei Dati

Ranjit Karmakarshutterstock

Google Data Studio: mettete i vostri dati in bella mostra

L’analisi dei dati è per molti solamente una questione puramente teorica. Ma tuttavia per fornire i risultati ai propri clienti bisogna trasformare i dati in qualcosa di concreto e visibile. Con Google Data Studio potete raccogliere i dati di diverse fonti in un report chiaro. In…

Negozio Online
E-Commerce
Dati di Grandi Dimensioni
Analisi dei Dati

faithieShutterstock

Che cos’è l’analisi del sentiment?

L’analisi del sentiment utilizza una sorta di riconoscimento degli stati d’animo da parte delle macchine. Questo metodo determina, attraverso l’analisi dei testi, quale atteggiamento le persone hanno nei confronti di un determinato prodotto o marchio. Inoltre, gli strumenti di…

Intelligenza artificiale
Guida

Cos’è il data mining?

Il data mining in breve

Campi di ap­pli­ca­zio­ne del data mining

Come funziona il data mining?

I metodi del data mining

Limiti del data mining

Campi di applicazione del data mining