Nei DataFrame di Pandas per Python è possibile utilizzare la funzione unique() per rilevare i valori univoci presenti in una colonna di un DataFrame. In questo modo puoi ottenere una panoramica efficiente dei diversi valori all’interno di un record di dati.

Il tuo web hosting come mai prima d'ora
  • Certificato SSL e protezione DDoS
  • Velocità, flessibilità e scalabilità
  • Dominio e consulente personale
  • 1 anno gratis del gestionale di fatturazione elettronica FlexTax

La sintassi di DataFrame.unique() in Pandas

La sintassi di base per l’utilizzo di unique() in Pandas è semplice, in quanto la funzione non richiede alcun parametro:

DataFrame['column_name'].unique()
python

Ricorda che con i DataFrame di Pandas è possibile applicare unique() solo su una specifica colonna del DataFrame. Pertanto, occorre prima specificare tale colonna. La funzione unique() restituisce un array numpy con i valori univoci secondo la sequenza in cui si presentano; i valori non vengono ordinati.

N.B.

Se hai già una lunga esperienza nella programmazione in Python, di sicuro conosci anche l’equivalente numpy della funzione unique() di Pandas. Per motivi di efficienza è preferibile utilizzare la versione di Pandas.

Utilizzo di unique() in Pandas

È possibile utilizzare unique() sui DataFrame in Pandas specificando prima una colonna in cui cercare i valori univoci.

Nell’esempio seguente usiamo un DataFrame contenente informazioni su diverse persone.

import pandas as pd
# Creazione di un DataFrame di esempio
data = {
    'Nome': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'Età': [24, 27, 22, 32, 29],
    'Città': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)
print(df)
python

Il DataFrame risultante si presenta così:

Nome    Età      Città
0    Alice     24     New York
1    Bob     27  Los Angeles
2  Charlie     22     New York
3    David     32    Chicago
4   Edward     29  Los Angeles

A questo punto cerchiamo le città in cui vivono queste persone. A tal fine occorre elencare ciascuna città una volta sola. Applichiamo quindi la funzione unique() di Pandas sulla colonna del DataFrame che contiene le città:

# Trova le città univoche
unique_cities = df['Città'].unique()
print(unique_cities)
python

Il risultato è un array numpy che riporta ciascuna città una volta sola. In questo modo scopriamo che le persone vivono in tre città diverse: New York, Los Angeles e Chicago.

['New York' 'Los Angeles' 'Chicago']
Hai trovato questo articolo utile?
Vai al menu principale