Caracteristica DateTime a lui Python și Pandas: Ce trebuie să știți?

Publicat: 2021-03-09

În acest articol, vom acoperi caracteristicile panda DateTime și vom oferi informații despre nevoile lor în timp ce lucrăm cu seturi de date din seria temporală în python.

Python este printre primele cinci limbaje de programare în ceea ce privește utilizarea pe tot globul. Aproximativ 44% dintre dezvoltatorii lumii îl folosesc în mod regulat pentru sarcini legate de știința datelor. Și marea varietate de biblioteci Python este cea care trebuie creditată pentru acest lucru. Pandas este o astfel de bibliotecă de analiză a datelor.

Este scris pur în C sau python, făcând loc unui cod sursă back-end extrem de optimizat. Mai mult, python are o sintaxă clară și o curbă de învățare scăzută, ideală pentru începători. Cu cunoștințele acestui limbaj se poate implementa orice, de la micro-proiecte la macro-întreprinderi.

Dezvoltatorii Python care au un nivel adecvat de cunoștințe și experiență cu biblioteca Pandas sunt, de asemenea, solicitați pentru mai multe locuri de muncă în știința datelor, inclusiv analist de date, analist de afaceri și inginer de învățare automată. Aceste traiectorii de carieră necesită ca candidații să fie familiarizați cu statisticile, analiza datelor mari, analiza predictivă (folosind python), vizualizarea etc.

Studenții de inginerie interesați de analiză pot, prin urmare, să opteze pentru diplome de specialitate care subliniază aceste abilități. Puteți fie să urmați certificări pe termen scurt, cum ar fi Diploma PG în Știința datelor de la IIIT-Bangalore, fie să vă gândiți să vă alăturați unor programe acreditate la nivel global, cum ar fi M.Sc. în știința datelor de la Liverpool John Moores University (LJMU), Anglia.

Acum că v-am oferit un scurt context al relevanței python-ului și panda-urilor în domeniul tehnologiei moderne, să începem tutorialul nostru pas cu pas despre panda DateTime .

Cuprins

Explicarea variabilelor DateTime

Este posibil să întâlniți DateTime în etapa intermediară a învățării python, să zicem când lucrați la un proiect. Să presupunem că trebuie să implementați un proiect de comerț electronic care vă solicită să elaborați o strategie cu privire la conducta lanțului de aprovizionare. Aceasta ar include stabilirea timpului pentru expedierea comenzilor, a numărului de zile pentru livrare, printre altele.

Dacă nu sunteți familiarizat cu componentele de dată și oră din Python, acest aspect al științei datelor al acestei probleme poate fi greu de rezolvat pentru un novice. Pe de altă parte, dacă știți cum să gestionați aceste funcții, puteți aduna informații profunde din aproape orice set de date.

Pentru cei neinițiați, clasa de date din python se ocupă de datele din calendarul gregorian. Această clasă acceptă „an, lună și zi” ca argumente întregi. În timp ce, clasa de timp cuprinde argumente întregi de până la microsecunde.

Iată o prezentare generală a variabilei DateTime a lui Python, împreună cu funcția Pandas, pentru a începe!

Lucrul cu DateTime în Python

Luați în considerare exemplele de declarații de mai jos pentru a înțelege cum să creați un obiect data din clasa DateTime în python.

de la datetime data importului

d1 = data (2021,2,23)

imprimare(d1)

imprimare(tip (d1))

Rezultat

23-04-2021

<clasa „datetime.date”>

Acum, să extragem și alte caracteristici, cum ar fi ziua, luna și anul, din obiectul dată creat mai sus. O vom face utilizând obiectul de dată local curent, care implică utilizarea funcției today().

# data actuală

d1 = data.azi()

imprimare(d1)

# zi

print ('Ziua : ' , d1.zi)

# lună

print('Lună: ', d1.lună)

# an

print('Anul: ',d1.an)

Obiect DateTime returnat

23-02-2021

Ziua: 23

Luna: 2

Anul: 2021

O altă clasă a modulului DateTime care acceptă valori întregi și returnează un obiect este timpul. Să vedem cum se face în python.

de la datetime ora importului

t1 = (12,20,12,40)

print(t1)

imprimare(tip(t1))

Rezultat

12:20:12.000040

<clasa „datetime.time”>

După cum puteți vedea, obiectul de timp de mai sus se reduce la microsecunde. Deci, acum puteți extrage atribute de timp precum ora, minutul, secunda și microsecunda din obiect.

#ora

print('Hour:'t1.hour)

#minut

print('Minut:'t1.minut)DateTime

Puteți repeta același lucru pentru secunde și microsecunde.

Iată câteva alte metode pe care le-ați găsi utile:

  • înlocuire(): Pentru a actualiza datele vechi.
  • weekday(): Pentru a returna o valoare întreagă pentru orice zi a săptămânii; Luni este 0 și duminica este 6.
  • isoweekday(): pentru valori întregi ale unei zile a săptămânii care sunt între 1 și 7.
  • isocalendar(): Pentru a tăia valoarea zilei „anului” dintr-un set de date dat.
  • isleap(): Pentru a verifica dacă este un an bisect.
  • fromisoformat(): Pentru a converti forma de șir în format ISO într-un obiect DateTime.
  • isoformat(): Pentru a genera data în format ISO din obiectul DateTime.
  • format(): Pentru a defini formatul dvs. unic.

Acum că ați înțeles cum să creați obiecte DateTime în python, să vedem cum le acceptă biblioteca Pandas.

Pandas to_datetime Exemplu

Cu panda, puteți efectua o varietate de sarcini de analiză a datelor, în special cu obiectele Python DateTime. Unele dintre metodele proeminente includ to_datetime(). Iată cum te descurci:

  • Cu metoda pandas to_datetime, puteți converti data și ora în format șir în obiecte DateTime

# to_datetime

data = pd.to_datetime( '24 aprilie 2020′)

data printarii)

tipărire (tip(data))

Rezultat

23-02-2021 00:00:00

<clasa panda._libs.tslib.timestamp.Timestamp'>

Poți observa ceva ciudat aici? Obiectul returnat de panda to_datetime nu este același. Este un timestamp în loc de un obiect DateTime. Acesta este modul în care biblioteca Pandas returnează un obiect; timestamp este echivalentul său cu caracteristica DateTime a lui Python.

Nevoia de DateTime

Există mai multe scenarii din viața reală în care informațiile sunt adunate pe o perioadă, permițându-vă să extrageți atributele de dată și oră pentru a înțelege o anumită problemă. De exemplu, doriți să vă analizați obiceiurile de lectură. Vă puteți dezgropa tiparele pentru a deconstrui dacă preferați să citiți în weekend sau în timpul săptămânii, noaptea sau dimineața și așa mai departe. Apoi, puteți acumula toate cărțile și articolele interesante pe care doriți să le citiți într-o lună și să vă organizați programul.

Cu aceasta, v-am oferit un rezumat „cum să” despre gestionarea manipulării date-ora în python, precum și în panda DateTime . Sperăm să exersați ceea ce am învățat în acest articol și să stăpâniți arta de a lucra cu seturi de date din serii de timp!

Învață cursuri de știință a datelor de la cele mai bune universități din lume. Câștigă programe Executive PG, programe avansate de certificat sau programe de master pentru a-ți accelera cariera.

Concluzie

Dacă sunteți interesat să aflați mai multe despre Python, despre diferitele sale biblioteci, inclusiv despre Pandas, și despre aplicarea sa în știința datelor, consultați Diploma PG în știința datelor de la IIIT-B și upGrad, care este creată pentru profesioniști care lucrează și oferă peste 10 studii de caz și proiecte, ateliere practice practice, mentorat cu experți din industrie, 1-la-1 cu mentori din industrie, peste 400 de ore de învățare și asistență la locul de muncă cu firme de top.

Ce caracteristici fac din Pandas o bibliotecă populară?

Următoarele sunt caracteristicile care fac din Pandas una dintre cele mai populare biblioteci Python:
Pandas ne oferă diverse cadre de date care nu numai că permit o reprezentare eficientă a datelor, dar ne permit și să le manipulăm.
Oferă funcții eficiente de aliniere și indexare care oferă modalități inteligente de etichetare și organizare a datelor.
Unele caracteristici ale Pandas fac codul curat și îi sporesc lizibilitatea, făcându-l astfel mai eficient.
De asemenea, poate citi mai multe formate de fișiere. JSON, CSV, HDF5 și Excel sunt unele dintre formatele de fișiere acceptate de Pandas.
Fuzionarea mai multor seturi de date a fost o adevărată provocare pentru mulți programatori. Pandas depășesc acest lucru și îmbină mai multe seturi de date foarte eficient.
Pandas oferă, de asemenea, acces la alte biblioteci importante Python, cum ar fi Matplotlib și NumPy, ceea ce o face o bibliotecă foarte eficientă.

Care sunt metodele caracteristicii DateTime din Pandas?

DateTime este o caracteristică importantă a lui Pandas, care returnează data și ora în timp real a locației dvs. în diferite formate. Mai jos sunt câteva dintre caracteristicile sale pe care le puteți găsi utile:
înlocuire(): Actualizează datele vechi.
weekday(): Returnează o valoare întreagă pentru fiecare zi începând de luni ca 0 până duminică ca 6.
isoweekday(): returnează valori întregi ale unei zile a săptămânii care sunt între 1 și 7.
isocalendar(): Pentru a tăia valoarea zilei „anului” dintr-un set de date dat.
isleap(): Verifică o funcție dacă este un an bisect.
fromisoformat(): Pentru a converti forma de șir în format ISO într-un obiect DateTime.
isoformat(): Pentru a genera data în format ISO din obiectul DateTime.
format(): Pentru a defini formatul dvs. unic.

Prin ce diferă biblioteca Pandas de Numpy?

Pandas și Numpy sunt fără îndoială cele două biblioteci cele mai utilizate din Python. Următoarea comparație identifică diferențele de bază dintre bibliotecile Pandas și Numpy.
A. Pandas -
1. Este de preferat pentru analizarea și vizualizarea datelor tabelare.
2. Datele din diferite formate de fișiere pot fi importate cu ușurință folosind Pandas. Suportă XLSX, ZIP, text, HTML, XML, JSON etc.
3. Arată performanță mai rapidă atunci când este tratat cu o cantitate mare de date.
4. Ocupă relativ mai mult spațiu în memorie.
B. Numpy -
1. Este de preferat pentru efectuarea de operatii matematice si calcule numerice.
2. Datele stocate în matrice multidimensionale sunt acceptate în această bibliotecă.
3. Funcționează mai bine atunci când este tratat cu cantități mai mici de date.
4. Consumă mai puțin spațiu de memorie.