La funzione iterrows() in Pandas: come eseguire l’iterazione sui DataFrame

Indice

La funzione iterrows() serve a eseguire iterazioni sulle righe di un DataFrame in Pandas. Per ciascuna riga, questa funzione restituisce una tupla di Python composta dall’indice e da una serie che contiene i dati della riga in questione.

Web Hosting

Miglior Hosting per il tuo sito web o negozio

Disponibilità garantita al 99,99%
Dominio, SSL ed e-mail inclusi
Assistenza 24/7 in lingua italiana

La sintassi di `iterrows()` in Pandas

La sintassi di base di DataFrame.iterrows() in Pandas è semplice, in quanto questa funzione non richiede alcun parametro:

df.iterrows()

python

Nell’esempio di codice precedente, df indica il DataFrame su cui eseguire l’iterazione.

Utilizzo della funzione `iterrows()` in Pandas

Di solito la funzione DataFrame.iterrows() è utilizzata quando è necessario elaborare i dati riga per riga. Per questo motivo si trova spesso in combinazione con i cicli for su Python.

Somma dei valori di una colonna

Qui di seguito facciamo ricorso a un DataFrame con le colonne “Nome”, “Età” e “Punteggio”:

import pandas as pd
# Creazione di un DataFrame di esempio
data = {'Nome': ['Anna', 'Bruno', 'Clara'],
    'Età': [23, 35, 29],
    'Punteggio': [88, 92, 85]}
df = pd.DataFrame(data)
print(df)

python

Il codice precedente dà il seguente DataFrame come risultato:

Nome    Età     Punteggio
0   Anna     23         88
1   Bruno    35         92
2   Clara    29         85

Quindi passiamo a calcolare i punteggi. A tal fine è possibile utilizzare DataFrame.iterrows() in Pandas:

# Calcolo del totale dei punteggi
total_score = 0
for index, row in df.iterrows():
    total_score += row['Punteggio']
print(f"Il totale dei punteggi è: {total_score}")

python

In questo esempio la funzione iterrows() di Pandas viene utilizzata per eseguire iterazioni sulle righe e sommare i valori nella colonna “Punteggio” progressivamente. Il risultato si presenta così:

Il totale dei punteggi è: 265

N.B.

Lavorando con iterrows() in Pandas è necessario fare attenzione a non modificare mai direttamente i dati su cui si esegue l’iterazione. A seconda del tipo di dati, ciò potrebbe non portare al risultato desiderato e potrebbe causare un comportamento imprevisto.

Modifica condizionale della riga

È possibile utilizzare la funzione iterrows() anche per applicare condizioni a singole righe del DataFrame. Immagina di voler ottenere i nomi di tutte le persone che hanno più di 30 anni e che si trovano nel DataFrame che già conosciamo:

# Richiama i nomi delle persone che hanno più di 30 anni
names = []
for index, row in df.iterrows():
    if row['Età'] > 30:
        names.append(row['Nome'])
print(f"Persone con più di 30 anni: {names}")

python

Nel codice di esempio utilizziamo DataFrame.iterrows() di Pandas per eseguire un’iterazione sulle righe del record di dati. All’interno del ciclo for vengono presi in considerazione i valori della colonna “Età” per memorizzare soltanto i nomi delle persone nella lista di Python names che hanno più di 30 anni. A tal fine utilizziamo la funzione append() di Python. Questa procedura dà il seguente risultato:

Persone con più di 30 anni: ['Bruno']

N.B.

La funzione DataFrames.iterrows() di Pandas è facile da usare, ma deve essere utilizzata con cautela per il fatto che potrebbe essere meno efficiente con i DataFrame più estesi. In molti casi sono disponibili alternative più performanti, come apply() o il calcolo vettoriale con Pandas.

Articoli popolari

Vendere domini: come guadagnare con i domini?

Comprare e vendere domini può essere un'attività lucrativa, se si sa come procedere. Vi…

5 alternative a Nextcloud a confronto

Scopri le migliori alternative a Nextcloud, ideali per diverse esigenze di archiviazione…

I 7 migliori servizi di backup online a confronto

Salva i tuoi dati al sicuro nel cloud. Ti presentiamo 7 servizi per proteggere i tuoi…

Aggiornamento a Debian 13: come funziona

Questa guida ti mostra come eseguire un aggiornamento a Debian 13, preparare il tuo…

4 alternative gratuite a InDesign di Adobe

I software Adobe sono troppo costosi? Sul web sono disponibili alcune alternative gratuite…

Articoli simili

ra2 studioShutterstock

Pandas di Python: la libreria per l’analisi e la manipolazione dei dati

Pandas di Python semplifica l’elaborazione, la manipolazione e l’analisi di insiemi di dati. Si tratta di uno strumento particolarmente utile per chi si occupa di analisi di dati e di ricerca. Ti mostriamo i vantaggi dell’uso della libreria Pandas e ti spieghiamo come utilizzare…

Python
Python Pandas

ESB Professionalshutterstock

DataFrame in Pandas: manipolazione delle tabelle in modo rapido e chiaro in Python

Il modulo Pandas è uno dei più potenti strumenti per la manipolazione dei dati in Python. Una delle strutture di dati centrali in Pandas è DataFrame. I DataFrame ti permettono di manipolare dati strutturati e bidimensionali in modo chiaro ed efficiente. In questo articolo ti…

Python Pandas

Mr. Kosalshutterstock

La funzione any() di pandas in Python

Il metodo DataFrame any() di Pandas è uno strumento efficiente per verificare rapidamente se esiste almeno un valore vero in un asse specifico di un dataframe. È particolarmente utile quando si analizzano e si convalidano i dati. Nell’articolo ti indichiamo come puoi utilizzare…

Python Pandas

UndreyShutterstock

Pandas per Python: il metodo iloc[]

Lavorando con i DataFrame in Pandas per Python è possibile che non tutte le righe o colonne di un DataFrame siano utili per l’analisi dei dati. Il metodo iloc[] per i DataFrame in Pandas è quindi uno strumento utile per selezionare la riga o le colonne desiderate in base ai loro…

Python Pandas

REDPIXEL.PLShutterstock

Pandas mean(): come calcolare facilmente la media

La funzione DataFrame.mean() di Pandas è una funzione per il calcolo dei valori medi in un DataFrame. Essa consente di gestire i valori NaN in modo flessibile e permette di calcolare i valori medi sia in righe che in colonne. In questo articolo scoprirai di più sui parametri…

Python Pandas

UndreyShutterstock

Pandas per Python: unione di dataframe con merge()

Il metodo merge() per i DataFrame in Pandas offre ai programmatori e alle programmatrici varie opzioni per combinare i dati provenienti da fonti diverse. I parametri permettono agli utenti di eseguire diverse tipologie di operazioni join per soddisfare le proprie esigenze di…

Python Pandas

La funzione iterrows() in Pandas: come eseguire l’ite­ra­zio­ne sui DataFrame

La sintassi di iterrows() in Pandas

Utilizzo della funzione iterrows() in Pandas

Somma dei valori di una colonna

Modifica con­di­zio­na­le della riga

La funzione iterrows() in Pandas: come eseguire l’iterazione sui DataFrame

La sintassi di `iterrows()` in Pandas

Utilizzo della funzione `iterrows()` in Pandas

Modifica condizionale della riga