Pandas: conoscere l’indice dei DataFrame

Indice

L’indicizzazione dei DataFrame in Pandas per Python consente un accesso efficiente e diretto a dati specifici all’interno di un DataFrame. Con l’indice di un DataFrame in Pandas è possibile selezionare righe e colonne specifiche, facilitando molto l’analisi dei dati.

Web Hosting

Diventa il n°1 della rete con il provider di hosting n°1 in Europa

Disponibilità garantita al 99,99%
Dominio, SSL ed e-mail inclusi
Assistenza 24/7 in lingua italiana

Che cosa fa l’indicizzazione?

L’indicizzazione di un DataFrame in Pandas serve a facilitare la selezione di determinati elementi del DataFrame. A tal fine è possibile selezionare righe e colonne in base alle loro posizioni o ai loro nomi. Gli indici possono essere utili per trovare e manipolare i dati più velocemente offrendo una specie di “anagrafe” della struttura dei dati.

La sintassi di `DataFrame.index` in Pandas

È possibile visualizzare le etichette dell’indice di un DataFrame in Pandas utilizzando la proprietà index. La sintassi si presenta così:

DataFrame.index

python

Sintassi per l’indicizzazione di DataFrame

Esistono diverse possibilità per indicizzare i DataFrame in Pandas. La sintassi per l’indicizzazione varia a seconda dell’operazione desiderata.

Indicizzazione con etichette (nomi delle colonne)

I DataFrame in Pandas possono sfruttare i nomi delle colonne per l’indicizzazione. A tal fine creiamo innanzitutto un DataFrame di esempio:

import pandas as pd
# Creazione di un DataFrame di esempio
data = {
    'Nome': ['Alice', 'Bob', 'Charlie'],
    'Età': [25, 30, 35],
    'Città': ['New York', 'Los Angeles', 'Chicago']
}
df = pd.DataFrame(data)
print(df)

python

Il DataFrame si presenta così:

Nome  Età      Città
0    Alice   25     New York
1    Bob   30  Los Angeles
2  Charlie   35    Chicago

Se ora desideri accedere a tutti i valori di una colonna specifica, puoi utilizzare il suo nome insieme all’operatore [] per l’indicizzazione. È sufficiente indicare il nome della colonna nell’operatore di indicizzazione sotto forma di stringa di Python:

# Accesso alla colonna “Età”
print(df['Età'])

python

Come risultato otterrai i diversi valori delle età:

0    25
1    30
2    35
Nome: Età, dtype: int64

Se non ti interessa una colonna sola, ma più colonne, puoi semplicemente specificare i loro nomi nell’operatore di indicizzazione, separandoli con delle virgole.

Indicizzazione con `loc[]` (nomi delle righe)

Per accedere a una riga specifica del tuo DataFrame devi utilizzare l’indicizzatore loc in Pandas. A questo indicizzatore è possibile assegnare il nome o il numero della riga. Nell’esempio di codice seguente prendiamo in considerazione lo stesso DataFrame già usato in precedenza, ma in questo caso dobbiamo estrarre la colonna zero con i valori di “Alice”:

print(df.loc[0])

python

Come previsto, il risultato mostra ora i valori relativi ad “Alice”:

Nome        Alice
Età          25
Città    New York
Nome: 0, dtype: object

Indicizzazione con `iloc[]` (numeri di riga e colonna)

Esiste un’altra possibilità, probabilmente la più utilizzata, per accedere a elementi specifici del tuo DataFrame, ossia tramite i numeri di riga e colonna. Per lavorare con l’indice numerico dei DataFrame in Pandas è necessario utilizzare la proprietà iloc dei DataFrame.

# Accesso alla riga zero
print(df.iloc[0])
# Accesso al valore nella riga zero e nella prima colonna
print(df.iloc[0, 1])

python

L’utilizzo di iloc[] dà i risultati seguenti e restituisce i valori previsti:

Nome        Alice
Età          25
Città    New York
Nome: 0, dtype: object
25

Indicizzazione di singoli valori

Se ti interessa soltanto un valore specifico del tuo DataFrame, l’indicizzatore at ti permette di estrarre quel valore specifico in modo rapido ed elegante. È sufficiente definire la riga e la colonna in questione in cui cercare il valore con i loro nomi. In pratica, se ti interessa trovare il luogo di residenza di Bob, devi utilizzare la colonna “Città” e la prima riga:

print(df.at(1, 'Città'))

python

Come desiderato, il risultato è il luogo di residenza di Bob, ossia “Los Angeles”.

In alternativa è possibile utilizzare l’indicizzatore iat, simile ad at, ma che funziona con la posizione anziché con il nome. Lo stesso risultato dell’esempio di codice precedente si ottiene utilizzando iat come segue:

print(df.iat(1, 2))

python

Indicizzazione booleana

È possibile indicizzare i sottoinsiemi di un DataFrame anche in base a una condizione specifica. In questo caso si parla di indicizzazione booleana. La condizione da verificare deve restituire il valore True o False e va inserita direttamente nell’operatore di indicizzazione. Per estrarre solo le righe in cui la persona ha più di 30 anni è possibile procedere come segue:

# Selezione delle righe in cui l'età è maggiore di 30
print(df[df[Età] > 30])

python

Come previsto, la condizione sopra indicata si applica solo a “Charlie”, che ha 35 anni. Il risultato è quindi:

Nome  Età    Città
2  Charlie   35    Chicago

N.B.

Ricorda che con l’indicizzazione booleana puoi utilizzare qualsiasi operatore di confronto booleano che restituisca i valori True o False. Troverai ulteriori informazioni sui diversi operatori Python nell’articolo della nostra guida sull’argomento.

Articoli popolari

Vendere domini: come guadagnare con i domini?

Comprare e vendere domini può essere un'attività lucrativa, se si sa come procedere. Vi…

5 alternative a Nextcloud a confronto

Scopri le migliori alternative a Nextcloud, ideali per diverse esigenze di archiviazione…

I 7 migliori servizi di backup online a confronto

Salva i tuoi dati al sicuro nel cloud. Ti presentiamo 7 servizi per proteggere i tuoi…

Aggiornamento a Debian 13: come funziona

Questa guida ti mostra come eseguire un aggiornamento a Debian 13, preparare il tuo…

4 alternative gratuite a InDesign di Adobe

I software Adobe sono troppo costosi? Sul web sono disponibili alcune alternative gratuite…

Articoli simili

BEST-BACKGROUNDSShutterstock

La funzione iterrows() in Pandas: come eseguire l’iterazione sui DataFrame

La funzione DataFrame.iterrows() in Pandas è una possibilità per eseguire iterazioni sulle righe di un DataFrame. È utilizzata in particolare quando è necessaria un’elaborazione riga per riga, ad esempio durante l’esecuzione di calcoli. In questo articolo scoprirai meglio come…

Python Pandas

Mr. Kosalshutterstock

La funzione any() di pandas in Python

Il metodo DataFrame any() di Pandas è uno strumento efficiente per verificare rapidamente se esiste almeno un valore vero in un asse specifico di un dataframe. È particolarmente utile quando si analizzano e si convalidano i dati. Nell’articolo ti indichiamo come puoi utilizzare…

Python Pandas

ESB Professionalshutterstock

DataFrame in Pandas: manipolazione delle tabelle in modo rapido e chiaro in Python

Il modulo Pandas è uno dei più potenti strumenti per la manipolazione dei dati in Python. Una delle strutture di dati centrali in Pandas è DataFrame. I DataFrame ti permettono di manipolare dati strutturati e bidimensionali in modo chiaro ed efficiente. In questo articolo ti…

Python Pandas

ra2 studioShutterstock

Pandas di Python: la libreria per l’analisi e la manipolazione dei dati

Pandas di Python semplifica l’elaborazione, la manipolazione e l’analisi di insiemi di dati. Si tratta di uno strumento particolarmente utile per chi si occupa di analisi di dati e di ricerca. Ti mostriamo i vantaggi dell’uso della libreria Pandas e ti spieghiamo come utilizzare…

Python
Python Pandas

UndreyShutterstock

Pandas per Python: il metodo iloc[]

Lavorando con i DataFrame in Pandas per Python è possibile che non tutte le righe o colonne di un DataFrame siano utili per l’analisi dei dati. Il metodo iloc[] per i DataFrame in Pandas è quindi uno strumento utile per selezionare la riga o le colonne desiderate in base ai loro…

Python Pandas

REDPIXEL.PLShutterstock

Pandas mean(): come calcolare facilmente la media

La funzione DataFrame.mean() di Pandas è una funzione per il calcolo dei valori medi in un DataFrame. Essa consente di gestire i valori NaN in modo flessibile e permette di calcolare i valori medi sia in righe che in colonne. In questo articolo scoprirai di più sui parametri…

Python Pandas

Pandas: conoscere l’indice dei DataFrame

Che cosa fa l’in­di­ciz­za­zio­ne?

La sintassi di DataFrame.index in Pandas

Sintassi per l’in­di­ciz­za­zio­ne di DataFrame

In­di­ciz­za­zio­ne con etichette (nomi delle colonne)

In­di­ciz­za­zio­ne con loc[] (nomi delle righe)

In­di­ciz­za­zio­ne con iloc[] (numeri di riga e colonna)

In­di­ciz­za­zio­ne di singoli valori

In­di­ciz­za­zio­ne booleana

Che cosa fa l’indicizzazione?

La sintassi di `DataFrame.index` in Pandas

Sintassi per l’indicizzazione di DataFrame

Indicizzazione con etichette (nomi delle colonne)

Indicizzazione con `loc[]` (nomi delle righe)

Indicizzazione con `iloc[]` (numeri di riga e colonna)

Indicizzazione di singoli valori

Indicizzazione booleana