Nei DataFrame di Pandas per Python è possibile utilizzare la funzione unique() per rilevare i valori univoci presenti in una colonna di un DataFrame. In questo modo puoi ottenere una panoramica efficiente dei diversi valori all’interno di un record di dati.

Web Hosting
Diventa il n°1 della rete con il provider di hosting n°1 in Europa
  • Disponibilità garantita al 99,99%
  • Dominio, SSL ed e-mail inclusi
  • Assistenza 24/7 in lingua italiana

La sintassi di DataFrame.unique() in Pandas

La sintassi di base per l’utilizzo di unique() in Pandas è semplice, in quanto la funzione non richiede alcun parametro:

DataFrame['column_name'].unique()
python

Ricorda che con i DataFrame di Pandas è possibile applicare unique() solo su una specifica colonna del DataFrame. Pertanto, occorre prima specificare tale colonna. La funzione unique() restituisce un array numpy con i valori univoci secondo la sequenza in cui si presentano; i valori non vengono ordinati.

N.B.

Se hai già una lunga esperienza nella programmazione in Python, di sicuro conosci anche l’equivalente numpy della funzione unique() di Pandas. Per motivi di efficienza è preferibile utilizzare la versione di Pandas.

Utilizzo di unique() in Pandas

È possibile utilizzare unique() sui DataFrame in Pandas specificando prima una colonna in cui cercare i valori univoci.

Nell’esempio seguente usiamo un DataFrame contenente informazioni su diverse persone.

import pandas as pd
# Creazione di un DataFrame di esempio
data = {
    'Nome': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
    'Età': [24, 27, 22, 32, 29],
    'Città': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)
print(df)
python

Il DataFrame risultante si presenta così:

Nome    Età      Città
0    Alice     24     New York
1    Bob     27  Los Angeles
2  Charlie     22     New York
3    David     32    Chicago
4   Edward     29  Los Angeles

A questo punto cerchiamo le città in cui vivono queste persone. A tal fine occorre elencare ciascuna città una volta sola. Applichiamo quindi la funzione unique() di Pandas sulla colonna del DataFrame che contiene le città:

# Trova le città univoche
unique_cities = df['Città'].unique()
print(unique_cities)
python

Il risultato è un array numpy che riporta ciascuna città una volta sola. In questo modo scopriamo che le persone vivono in tre città diverse: New York, Los Angeles e Chicago.

['New York' 'Los Angeles' 'Chicago']
Hai trovato questo articolo utile?
Vai al menu principale