Computer 4 dummy

Informatica facile a portata di tutti

Pandas – Funzione Apply

In questo capitolo dedicato alla libreria Pandas vediamo come la funzione Apply ci permette di aggiungere e gestire colonne aggiuntive al nostro DataFrame. L’indice di questa guida è disponibile a questo link: https://computer4dummy.altervista.org/programmazione-guide-alla-programmazione/python-data-analisi/panda-per-python/

Aggiungere una colonna al DataFrame

Supponiamo di voler aggiungere una colonna composta dalla data di riferimento presa dalla prima colonna del dataframe che è in formato stringa e vogliamo trasformarla in formato data.

Importare datetime

Per prima cosa importiamo la libreria datetime con il seguente comando:

from datetime import datetime

con la funzione strptime convertiamo una data in formato testo in una data così:

datetime.strptime("1949-05", "%Y-%m")
Out[17]: datetime.datetime(1949, 5, 1, 0, 0)

Aggiungere una colonna con la data

Ora aggiungiamo la colonna con i dati che ci interessano al dataframe “df” con il comando:

df['dt'] = df.apply(lambda row:datetime.strptime(row['mese'], "%Y-%m"), axis=1)

per vedere il risultato basta quindi digitare il comando info() per visualizzare la struttura dei dati:

df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 144 entries, 0 to 143
Data columns (total 4 columns):
mese          144 non-null object
passeggeri    144 non-null int64
uno           144 non-null int64
dt            144 non-null datetime64[ns]
dtypes: datetime64[ns](1), int64(2), object(1)
memory usage: 4.6+ KB

L’ultima colonna contiene 144 record di tipo datatime64.