Pandas loc[]: selezione di dati dai DataFrame

Indice

DataFrame.loc[] è un metodo per DataFrame disponibile nella libreria Pandas per Python che serve a selezionare i dati da un DataFrame sulla base di identificatori (label o etichette). In questo modo è possibile estrarre righe e colonne di un DataFrame in modo mirato.

Web Hosting

Diventa il n°1 della rete con il provider di hosting n°1 in Europa

Disponibilità garantita al 99,99%
Dominio, SSL ed e-mail inclusi
Assistenza 24/7 in lingua italiana

La sintassi di `loc[]` in Pandas

Il metodo loc[] richiede come parametro l’assegnazione dell’etichetta desiderata. Per il resto la sintassi è molto semplice:

DataFrame.loc[selection]

python

Con loc[] in Pandas la selezione avviene principalmente in base alle etichette. Il parametro passato può essere quindi un’etichetta singola, una lista o una slice di etichette. Tuttavia, è anche possibile utilizzare degli array booleani.

Confronto fra `loc[]` e `iloc[]`

Mentre DataFrame.loc[] in Pandas seleziona i dati in base alle etichette, il metodo DataFrame.iloc, dal nome simile al precedente, serve a selezionare i dati secondo posizioni basate su numeri interi.

L’esempio di codice seguente permette di chiarire le differenze. Innanzitutto, creiamo un DataFrame in Pandas:

import pandas as pd
# DataFrame di esempio
data = {'Nome': ['Anna', 'Bruno', 'Cristiano'], 'Età': [23, 35, 30]}
df = pd.DataFrame(data)
print(df)

python

Il DataFrame risultante si presenta così:

Nome    Età
0   Anna     23
1   Bruno    35
2  Cristiano 30

A questo punto, per estrarre “Anna” dal DataFrame è possibile utilizzare sia loc[] che iloc[] in Pandas. Il risultato è lo stesso, ma il percorso per arrivarci è diverso:

# Con loc per etichetta
print(df.loc[0, 'Nome'])  # Risultato: 'Anna'
# Con iloc per posizione
print(df.iloc[0, 0])  # Risultato: 'Anna'

python

Applicazione di `DataFrame.loc[]` in Pandas

Il metodo loc[] in Pandas ti permette di estrarre sottoinsiemi dal tuo DataFrame. L’estrazione può riguardare righe o colonne, singole o multiple: loc[] permette quindi di mettere in pratica diversi vari casi d’uso.

Selezione di una singola riga

Nelle parti seguenti è riportato un DataFrame di esempio con i seguenti dati:

import pandas as pd
data = {
    'Nome': ['Anna', 'Bruno', 'Cristiano'],
    'Età': [23, 35, 30],
    'Città': ['Roma', 'Torino', 'Milano']
}
df = pd.DataFrame(data)
print(df)

python

Il DataFrame risultante si presenta così:

Nome    Età   Città
0   Anna     23   Roma
1   Bruno    35   Torino
2  Cristiano 30   Milano

Per selezionare i dati della riga con l’indice 1 (che corrisponde a Bruno), è possibile utilizzare loc[] in Pandas:

dati_bruno = df.loc[1]
print(dati_bruno)

python

Il risultato è quello previsto:

Nome       Bruno
Età        35
Città      Torino
Nome: 1, dtype: object

Selezione di più colonne

DataFrame.loc[] è adatto anche per selezionare un sottoinsieme di colonne. Il codice seguente permette di selezionare le colonne “Nome” e “Città” per tutte le righe:

nome_città = df.loc[:, ['Nome', 'Città']]
print(nome_città)

python

Il risultato è un sottoinsieme del DataFrame originale:

Nome     Città
0   Anna      Roma
1   Bruno     Torino
2  Cristiano  Milano

Selezione condizionale

Con loc[] in Pandas è anche possibile selezionare le righe in base a una condizione. A tal fine è sufficiente utilizzare gli operatori di confronto booleani. Ad esempio, il codice seguente serve a filtrare tutte le persone che hanno più di 25 anni:

maggiore_di_25 = df.loc[df['Età'] > 25]
print(maggiore_di_25)

python

Lo snippet di codice precedente dà come risultato il seguente DataFrame, che contiene solo i dati delle persone che hanno più di 25 anni:

Nome     Età     Città
1   Bruno     35     Torino
2  Cristiano  30     Milano

Articoli popolari

Vendere domini: come guadagnare con i domini?

Comprare e vendere domini può essere un'attività lucrativa, se si sa come procedere. Vi…

5 alternative a Nextcloud a confronto

Scopri le migliori alternative a Nextcloud, ideali per diverse esigenze di archiviazione…

I 7 migliori servizi di backup online a confronto

Salva i tuoi dati al sicuro nel cloud. Ti presentiamo 7 servizi per proteggere i tuoi…

Aggiornamento a Debian 13: come funziona

Questa guida ti mostra come eseguire un aggiornamento a Debian 13, preparare il tuo…

4 alternative gratuite a InDesign di Adobe

I software Adobe sono troppo costosi? Sul web sono disponibili alcune alternative gratuite…

Articoli simili

ESB Professionalshutterstock

DataFrame in Pandas: manipolazione delle tabelle in modo rapido e chiaro in Python

Il modulo Pandas è uno dei più potenti strumenti per la manipolazione dei dati in Python. Una delle strutture di dati centrali in Pandas è DataFrame. I DataFrame ti permettono di manipolare dati strutturati e bidimensionali in modo chiaro ed efficiente. In questo articolo ti…

Python Pandas

Mr. Kosalshutterstock

Pandas: conoscere l’indice dei DataFrame

L’indicizzazione dei DataFrame in Pandas è un potente strumento che ti permette di lavorare con i dati in modo efficiente ed efficace. Esistono vari metodi per accedere in modo mirato ai dati e ai sottoinsiemi del tuo DataFrame e modificarli. In questo articolo ti spieghiamo che…

Python Pandas

BEST-BACKGROUNDSShutterstock

La funzione iterrows() in Pandas: come eseguire l’iterazione sui DataFrame

La funzione DataFrame.iterrows() in Pandas è una possibilità per eseguire iterazioni sulle righe di un DataFrame. È utilizzata in particolare quando è necessaria un’elaborazione riga per riga, ad esempio durante l’esecuzione di calcoli. In questo articolo scoprirai meglio come…

Python Pandas

ra2 studioShutterstock

Tabella in Pandas: formattare i DataFrame come tabelle

Visualizzare un DataFrame con Python Pandas sotto forma di tabella è un’operazione di base che può essere eseguita in molti modi diversi. Pandas offre numerose opzioni per gestire e visualizzare le tabelle indipendentemente dallo scopo, ad esempio è possibile elaborare l’output…

Python Pandas

Mr. Kosalshutterstock

La funzione any() di pandas in Python

Il metodo DataFrame any() di Pandas è uno strumento efficiente per verificare rapidamente se esiste almeno un valore vero in un asse specifico di un dataframe. È particolarmente utile quando si analizzano e si convalidano i dati. Nell’articolo ti indichiamo come puoi utilizzare…

Python Pandas

Ranjit Karmakarshutterstock

DataFrame describe() in Pandas in breve

Il metodo DataFrame.describe() in Pandas è un modo rapido per generare un completo riepilogo statistico dei dati numerici presenti in un DataFrame. La capacità di adeguare i quantili e specificare i tipi di dati lo rende estremamente flessibile e adatto per le più svariate…

Python Pandas

Pandas loc[]: selezione di dati dai DataFrame

La sintassi di loc[] in Pandas

Confronto fra loc[] e iloc[]

Ap­pli­ca­zio­ne di DataFrame.loc[] in Pandas

Selezione di una singola riga

Selezione di più colonne

Selezione con­di­zio­na­le

La sintassi di `loc[]` in Pandas

Confronto fra `loc[]` e `iloc[]`

Applicazione di `DataFrame.loc[]` in Pandas

Selezione condizionale