Nei DataFrame di Pandas per Python è possibile uti­liz­za­re la funzione unique() per rilevare i valori univoci presenti in una colonna di un DataFrame. In questo modo puoi ottenere una pa­no­ra­mi­ca ef­fi­cien­te dei diversi valori all’interno di un record di dati.

Web Hosting
Diventa il n°1 della rete con il provider di hosting n°1 in Europa
  • Di­spo­ni­bi­li­tà garantita al 99,99%
  • Dominio, SSL ed e-mail inclusi
  • As­si­sten­za 24/7 in lingua italiana

La sintassi di DataFrame.unique() in Pandas

La sintassi di base per l’utilizzo di unique() in Pandas è semplice, in quanto la funzione non richiede alcun parametro:

DataFrame['column_name'].unique()
python

Ricorda che con i DataFrame di Pandas è possibile applicare unique() solo su una specifica colonna del DataFrame. Pertanto, occorre prima spe­ci­fi­ca­re tale colonna. La funzione unique() re­sti­tui­sce un array numpy con i valori univoci secondo la sequenza in cui si pre­sen­ta­no; i valori non vengono ordinati.

N.B.

Se hai già una lunga espe­rien­za nella pro­gram­ma­zio­ne in Python, di sicuro conosci anche l’equi­va­len­te numpy della funzione unique() di Pandas. Per motivi di ef­fi­cien­za è pre­fe­ri­bi­le uti­liz­za­re la versione di Pandas.

Utilizzo di unique() in Pandas

È possibile uti­liz­za­re unique() sui DataFrame in Pandas spe­ci­fi­can­do prima una colonna in cui cercare i valori univoci.

Nell’esempio seguente usiamo un DataFrame con­te­nen­te in­for­ma­zio­ni su diverse persone.

import pandas as pd
# Creazione di un DataFrame di esempio
data = {
    'Nome': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'Età': [24, 27, 22, 32, 29],
    'Città': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)
print(df)
python

Il DataFrame ri­sul­tan­te si presenta così:

Nome    Età      Città
0    Alice     24     New York
1    Bob     27  Los Angeles
2  Charlie     22     New York
3    David     32    Chicago
4   Edward     29  Los Angeles

A questo punto cerchiamo le città in cui vivono queste persone. A tal fine occorre elencare ciascuna città una volta sola. Ap­pli­chia­mo quindi la funzione unique() di Pandas sulla colonna del DataFrame che contiene le città:

# Trova le città univoche
unique_cities = df['Città'].unique()
print(unique_cities)
python

Il risultato è un array numpy che riporta ciascuna città una volta sola. In questo modo scopriamo che le persone vivono in tre città diverse: New York, Los Angeles e Chicago.

['New York' 'Los Angeles' 'Chicago']
Vai al menu prin­ci­pa­le