Funzionalità DateTime di Python e Pandas: cosa devi sapere?

Pubblicato: 2021-03-09

In questo articolo, tratteremo le funzionalità DateTime dei panda e offriremo approfondimenti sulle loro esigenze mentre si lavora con set di dati di serie temporali in Python.

Python è tra i primi cinque linguaggi di programmazione in termini di utilizzo in tutto il mondo. Circa il 44% degli sviluppatori mondiali lo utilizza regolarmente per attività relative alla scienza dei dati. Ed è la vasta varietà di librerie Python che deve essere accreditata per questo. Pandas è una di queste librerie di analisi dei dati.

È scritto esclusivamente in C o python, lasciando il posto a un codice sorgente back-end altamente ottimizzato. Inoltre, Python ha una sintassi chiara e una curva di apprendimento bassa, ideale per i principianti. Con la conoscenza di questo linguaggio si può implementare qualsiasi cosa, dai microprogetti alle macro imprese.

Gli sviluppatori Python che hanno un livello adeguato di conoscenza ed esperienza con la libreria Pandas sono anche richiesti per diversi lavori di scienza dei dati, tra cui analista di dati, analista aziendale e ingegnere di apprendimento automatico. Queste traiettorie di carriera richiedono ai candidati di avere familiarità con le statistiche, l'analisi dei big data, l'analisi predittiva (usando python), la visualizzazione, ecc.

Gli studenti di ingegneria interessati all'analisi possono, quindi, scegliere diplomi specialistici che enfatizzano queste abilità. Puoi conseguire certificazioni a breve termine come il PG Diploma in Data Science di IIIT-Bangalore o prendere in considerazione l'adesione a programmi accreditati a livello globale, come M.Sc. in Data Science presso la Liverpool John Moores University (LJMU), Inghilterra.

Ora che ti abbiamo fornito un breve background dell'importanza di Python e panda nel campo della tecnologia moderna, iniziamo il nostro tutorial passo-passo sui panda DateTime .

Sommario

Spiegazione delle variabili DateTime

È probabile che incontrerai DateTime nella fase intermedia dell'apprendimento di Python, ad esempio quando stai lavorando a un progetto. Supponiamo di dover implementare un progetto di e-commerce che richiede di definire strategie sulla pipeline della catena di approvvigionamento. Ciò includerebbe il calcolo del tempo per la spedizione degli ordini, il numero di giorni per la consegna, tra le altre cose.

Se non hai familiarità con i componenti di data e ora in Python, questo aspetto di data science di questo problema può essere difficile da decifrare per un principiante. D'altra parte, se sai come gestire queste funzionalità, puoi raccogliere informazioni approfondite da quasi tutti i set di dati.

Per chi non lo sapesse, la classe date in Python si occupa delle date del calendario gregoriano. Questa classe accetta "anno, mese e giorno" come argomenti interi. Considerando che la classe time comprende argomenti interi fino a microsecondi.

Ecco una panoramica della variabile DateTime di Python, insieme alla funzione Pandas, per iniziare!

Lavorare con DateTime in Python

Considera le istruzioni di esempio fornite di seguito per capire come creare un oggetto data della classe DateTime in Python.

dalla data di importazione datetime

d1 = data (2021,2,23)

stampa(d1)

print(tipo(d1))

Risultato

2021-04-23

<classe 'datetime.date'>

Ora, estraiamo alcune altre caratteristiche, come giorno, mese e anno, dall'oggetto data creato sopra. Lo faremo usando l'oggetto data del giorno locale corrente, che implica l'uso della funzione today().

# data odierna

d1 = data.oggi()

stampa(d1)

# giorno

print ('Giorno : ' , d1.giorno)

# mese

print( 'Mese : ' , d1.mese)

# anno

print( 'Anno : ' ,d1.anno)

Oggetto DateTime restituito

2021-02-23

Giorno : 23

Mese: 2

Anno : 2021

Un'altra classe del modulo DateTime che accetta valori interi e restituisce un oggetto è il tempo. Diamo un'occhiata a come è fatto in Python.

dall'ora di importazione data e ora

t1 = (12,20,12,40)

stampa(t1)

stampa(tipo(t1))

Risultato

12:20:12.000040

<classe 'dataora.ora'>

Come puoi vedere, l'oggetto del tempo sopra è ridotto ai microsecondi. Quindi, ora puoi estrarre dall'oggetto gli attributi temporali come l'ora, il minuto, il secondo e il microsecondo.

#ora

print('Ora:'t1.ora)

#minuto

print('Minuto:'t1.minuto)DataOra

Puoi ripetere la stessa cosa per secondi e microsecondi.

Ecco alcuni altri metodi che potresti trovare utili:

  • replace(): per aggiornare le vecchie date.
  • weekday(): per restituire un valore intero per qualsiasi giorno della settimana; Lunedì è 0 e domenica è 6.
  • isoweekday(): per valori interi di un giorno della settimana compresi tra 1 e 7.
  • isocalendar(): per affettare il valore del giorno dell '"anno" da un determinato set di dati.
  • isleap(): per verificare se è un anno bisestile.
  • fromisoformat(): per convertire il modulo di stringa in formato ISO in un oggetto DateTime.
  • isoformat(): per generare la data in formato ISO dall'oggetto DateTime.
  • format(): per definire il tuo formato univoco.

Ora che hai capito come creare oggetti DateTime in Python, vediamo come li supporta la libreria Pandas.

Pandas to_datetime Esempio

Con i panda, puoi eseguire una varietà di attività di analisi dei dati, in particolare con gli oggetti python DateTime. Alcuni dei metodi più importanti includono to_datetime(). Ecco come lo gestisci:

  • Con il metodo pandas to_datetime, puoi convertire la data e l'ora in formato stringa in oggetti DateTime

# a_dataora

date = pd.to_datetime( '24 aprile 2020')

data di stampa)

stampa (tipo(data))

Risultato

2021-02-23 00:00:00

<class pandas._libs.tslib.timestamp.Timestamp'>

Riesci a notare qualcosa di strano qui? L'oggetto restituito da pandas to_datetime non è lo stesso. È un Timestamp invece di un oggetto DateTime. Ecco come la libreria Pandas restituisce un oggetto; timestamp è l'equivalente della funzione DateTime di Python.

La necessità di DateTime

Esistono diversi scenari di vita reale in cui le informazioni vengono raccolte in un periodo, consentendo di estrarre gli attributi di data e ora per comprendere un particolare problema. Ad esempio, vuoi analizzare le tue abitudini di lettura. Puoi scavare i tuoi schemi per decostruire se preferisci leggere durante i fine settimana o nei giorni feriali, di notte o al mattino e così via. Quindi, puoi accumulare tutti i libri e gli articoli interessanti che vuoi leggere in un mese e organizzare il tuo programma.

Con questo, ti abbiamo fornito un riepilogo "come fare per" sulla gestione della manipolazione della data e dell'ora in Python e nei panda DateTime . Ci auguriamo che tu possa mettere in pratica ciò che abbiamo imparato in questo articolo e padroneggiare l'arte di lavorare con i set di dati di serie temporali!

Impara i corsi di scienza dei dati dalle migliori università del mondo. Guadagna programmi Executive PG, programmi di certificazione avanzati o programmi di master per accelerare la tua carriera.

Conclusione

Se sei interessato a saperne di più su Python, le sue varie librerie, inclusi Pandas, e la sua applicazione nella scienza dei dati, dai un'occhiata al Diploma PG in Data Science di IIIT-B e upGrad, creato per i professionisti che lavorano e offre oltre 10 casi di studio e progetti, workshop pratici pratici, tutoraggio con esperti del settore, 1 contro 1 con tutor del settore, oltre 400 ore di apprendimento e assistenza al lavoro con le migliori aziende.

Quali caratteristiche rendono Pandas una libreria popolare?

Le seguenti sono le caratteristiche che rendono Pandas una delle librerie Python più popolari:
I panda ci forniscono vari frame di dati che non solo consentono una rappresentazione efficiente dei dati, ma ci consentono anche di manipolarli.
Fornisce funzionalità di allineamento e indicizzazione efficienti che forniscono metodi intelligenti per etichettare e organizzare i dati.
Alcune funzionalità di Panda rendono il codice pulito e ne aumentano la leggibilità, rendendolo così più efficiente.
Può anche leggere più formati di file. JSON, CSV, HDF5 ed Excel sono alcuni dei formati di file supportati da Pandas.
La fusione di più set di dati è stata una vera sfida per molti programmatori. I panda superano anche questo e uniscono più set di dati in modo molto efficiente.
Pandas fornisce anche l'accesso ad altre importanti librerie Python come Matplotlib e NumPy, il che la rende una libreria altamente efficiente.

Quali sono i metodi della funzione DateTime di Pandas?

DateTime è una caratteristica importante di Pandas che restituisce la data e l'ora in tempo reale della tua posizione in vari formati. Di seguito sono elencate alcune delle sue caratteristiche che potresti trovare utili:
replace(): aggiorna le vecchie date.
weekday(): restituisce un valore intero per ogni giorno a partire da lunedì come 0 fino a domenica come 6.
isoweekday(): restituisce valori interi di un giorno della settimana compresi tra 1 e 7.
isocalendar(): per affettare il valore del giorno dell '"anno" da un determinato set di dati.
isleap(): controlla una funzione se è un anno bisestile.
fromisoformat(): per convertire il modulo di stringa in formato ISO in un oggetto DateTime.
isoformat(): per generare la data in formato ISO dall'oggetto DateTime.
format(): per definire il tuo formato univoco.

In che modo la libreria Pandas differisce da Numpy?

Pandas e Numpy sono senza dubbio le due librerie più utilizzate di Python. Il confronto seguente identifica le differenze principali tra le librerie Panda e Numpy.
A. Panda -
1. È preferito per l'analisi e la visualizzazione di dati tabulari.
2. I dati di vari formati di file possono essere facilmente importati utilizzando Pandas. Supporta XLSX, ZIP, testo, HTML, XML, JSON, ecc.
3. Mostra prestazioni più veloci quando si tratta di una grande quantità di dati.
4. Richiede relativamente più spazio nella memoria.
B. Numpy -
1. È preferito per eseguire operazioni matematiche e calcoli numerici.
2. I dati archiviati in array multidimensionali sono supportati in questa libreria.
3. Funziona meglio quando si tratta di quantità di dati inferiori.
4. Consuma meno spazio di memoria.