Pandas – Funzione Apply
In questo capitolo dedicato alla libreria Pandas vediamo come la funzione Apply ci permette di aggiungere e gestire colonne aggiuntive al nostro DataFrame. L’indice di questa guida è disponibile a questo link: https://computer4dummy.altervista.org/programmazione-guide-alla-programmazione/python-data-analisi/panda-per-python/
Aggiungere una colonna al DataFrame
Supponiamo di voler aggiungere una colonna composta dalla data di riferimento presa dalla prima colonna del dataframe che è in formato stringa e vogliamo trasformarla in formato data.
Importare datetime
Per prima cosa importiamo la libreria datetime con il seguente comando:
from datetime import datetime
con la funzione strptime convertiamo una data in formato testo in una data così:
datetime.strptime("1949-05", "%Y-%m") Out[17]: datetime.datetime(1949, 5, 1, 0, 0)
Aggiungere una colonna con la data
Ora aggiungiamo la colonna con i dati che ci interessano al dataframe “df” con il comando:
df['dt'] = df.apply(lambda row:datetime.strptime(row['mese'], "%Y-%m"), axis=1)
per vedere il risultato basta quindi digitare il comando info() per visualizzare la struttura dei dati:
df.info() <class 'pandas.core.frame.DataFrame'> RangeIndex: 144 entries, 0 to 143 Data columns (total 4 columns): mese 144 non-null object passeggeri 144 non-null int64 uno 144 non-null int64 dt 144 non-null datetime64[ns] dtypes: datetime64[ns](1), int64(2), object(1) memory usage: 4.6+ KB
L’ultima colonna contiene 144 record di tipo datatime64.