DataFrame[].unique() in Pandas: rilevamento dei valori univoci
Nei DataFrame di Pandas per Python è possibile utilizzare la funzione unique()
per rilevare i valori univoci presenti in una colonna di un DataFrame. In questo modo puoi ottenere una panoramica efficiente dei diversi valori all’interno di un record di dati.
- Certificato SSL e protezione DDoS
- Velocità, flessibilità e scalabilità
- Dominio e consulente personale
- 1 anno gratis del gestionale di fatturazione elettronica FlexTax
La sintassi di DataFrame.unique()
in Pandas
La sintassi di base per l’utilizzo di unique()
in Pandas è semplice, in quanto la funzione non richiede alcun parametro:
DataFrame['column_name'].unique()
pythonRicorda che con i DataFrame di Pandas è possibile applicare unique()
solo su una specifica colonna del DataFrame. Pertanto, occorre prima specificare tale colonna. La funzione unique()
restituisce un array numpy con i valori univoci secondo la sequenza in cui si presentano; i valori non vengono ordinati.
Se hai già una lunga esperienza nella programmazione in Python, di sicuro conosci anche l’equivalente numpy della funzione unique()
di Pandas. Per motivi di efficienza è preferibile utilizzare la versione di Pandas.
Utilizzo di unique()
in Pandas
È possibile utilizzare unique()
sui DataFrame in Pandas specificando prima una colonna in cui cercare i valori univoci.
Nell’esempio seguente usiamo un DataFrame contenente informazioni su diverse persone.
import pandas as pd
# Creazione di un DataFrame di esempio
data = {
'Nome': ['Alice', 'Bob', 'Charlie', 'David', 'Edward'],
'Età': [24, 27, 22, 32, 29],
'Città': ['New York', 'Los Angeles', 'New York', 'Chicago', 'Los Angeles']
}
df = pd.DataFrame(data)
print(df)
pythonIl DataFrame risultante si presenta così:
Nome Età Città
0 Alice 24 New York
1 Bob 27 Los Angeles
2 Charlie 22 New York
3 David 32 Chicago
4 Edward 29 Los Angeles
A questo punto cerchiamo le città in cui vivono queste persone. A tal fine occorre elencare ciascuna città una volta sola. Applichiamo quindi la funzione unique()
di Pandas sulla colonna del DataFrame che contiene le città:
# Trova le città univoche
unique_cities = df['Città'].unique()
print(unique_cities)
pythonIl risultato è un array numpy che riporta ciascuna città una volta sola. In questo modo scopriamo che le persone vivono in tre città diverse: New York, Los Angeles e Chicago.
['New York' 'Los Angeles' 'Chicago']