DateTime-Funktion von Python und Pandas: Was Sie wissen müssen

Veröffentlicht: 2021-03-09

In diesem Artikel werden wir die DateTime- Funktionen von Pandas behandeln und Einblicke in ihre Bedürfnisse beim Arbeiten mit Zeitreihen-Datasets in Python geben.

Python gehört zu den fünf weltweit am häufigsten verwendeten Programmiersprachen. Etwa 44 % der Entwickler weltweit verwenden es regelmäßig für datenwissenschaftliche Aufgaben. Und es ist die große Vielfalt an Python-Bibliotheken, die dafür angerechnet werden müssen. Pandas ist eine solche Datenanalysebibliothek.

Es ist rein in C oder Python geschrieben und macht Platz für hochoptimierten Back-End-Quellcode. Darüber hinaus hat Python eine klare Syntax und eine niedrige Lernkurve, ideal für Anfänger. Mit der Kenntnis dieser Sprache kann man alles von Mikroprojekten bis hin zu Makrounternehmen umsetzen.

Python-Entwickler, die über ein angemessenes Maß an Wissen und Erfahrung mit der Pandas-Bibliothek verfügen, sind auch für verschiedene Data-Science-Jobs gefragt, darunter Datenanalysten, Business-Analysten und Ingenieure für maschinelles Lernen. Diese Karrierewege erfordern, dass Kandidaten mit Statistiken, Big-Data-Analysen, Predictive Analytics (mit Python), Visualisierung usw. vertraut sind.

Ingenieurstudenten, die sich für Analytik interessieren, können sich daher für spezialisierte Abschlüsse entscheiden, die diese Fähigkeiten betonen. Sie können entweder kurzfristige Zertifizierungen wie das PG Diploma in Data Science vom IIIT-Bangalore anstreben oder die Teilnahme an weltweit akkreditierten Programmen wie M.Sc. in Data Science von der Liverpool John Moores University (LJMU), England.

Nachdem wir Ihnen nun einen kurzen Hintergrund zur Relevanz von Python und Pandas im modernen Technologiebereich gegeben haben, beginnen wir mit unserem Schritt-für-Schritt-Tutorial zu Pandas DateTime .

Inhaltsverzeichnis

Erklärung von DateTime-Variablen

Sie werden DateTime wahrscheinlich in der Zwischenphase des Erlernens von Python begegnen, sagen wir, wenn Sie an einem Projekt arbeiten. Angenommen, Sie müssen ein E-Commerce-Projekt implementieren, bei dem Sie eine Strategie für die Lieferkettenpipeline entwickeln müssen. Dazu gehört unter anderem, die Zeit für den Versand von Bestellungen und die Anzahl der Tage für die Lieferung herauszufinden.

Wenn Sie mit den Datums- und Zeitkomponenten in Python nicht vertraut sind, kann dieser datenwissenschaftliche Aspekt dieses Problems für einen Anfänger schwer zu knacken sein. Wenn Sie andererseits wissen, wie man mit diesen Funktionen umgeht, können Sie aus fast jedem Datensatz tiefe Einblicke gewinnen.

Für Uneingeweihte befasst sich die Datumsklasse in Python mit den Daten aus dem gregorianischen Kalender. Diese Klasse akzeptiert „Jahr, Monat und Tag“ als ganzzahlige Argumente. Wohingegen die Zeitklasse ganzzahlige Argumente bis zu Mikrosekunden umfasst.

Hier ist eine Übersicht über die DateTime-Variable von Python zusammen mit der Pandas-Funktion, um Ihnen den Einstieg zu erleichtern!

Arbeiten mit DateTime in Python

Betrachten Sie die unten angegebenen Beispielanweisungen, um zu verstehen, wie ein Datumsobjekt der DateTime-Klasse in Python erstellt wird.

von datetime Importdatum

d1 = Datum (2021,2,23)

drucken (d1)

drucken (typ (d1))

Ergebnis

2021-04-23

<Klasse 'datetime.date'>

Lassen Sie uns nun einige andere Merkmale wie Tag, Monat und Jahr aus dem oben erstellten Datumsobjekt extrahieren. Wir werden dies mit dem Datumsobjekt des aktuellen lokalen Tages tun, was die Verwendung der Funktion today() beinhaltet.

# heutiges Datum

d1 = datum.heute()

drucken (d1)

# Tag

print ('Tag : ' , d1.day)

# Monat

print( 'Monat : ' , d1.Monat)

# Jahr

print( 'Jahr : ' ,d1.year)

Zurückgegebenes DateTime-Objekt

2021-02-23

Tag: 23

Monat: 2

Jahr: 2021

Eine weitere Klasse des DateTime-Moduls, die ganzzahlige Werte akzeptiert und ein Objekt zurückgibt, ist time. Schauen wir uns an, wie es in Python gemacht wird.

ab datetime Importzeit

t1 = (12,20,12,40)

drucken(t1)

print(typ(t1))

Ergebnis

12:20:12.000040

<Klasse 'datetime.time'>

Wie Sie sehen können, ist das obige Zeitobjekt auf Mikrosekunden genau. Sie können also jetzt Zeitattribute wie Stunde, Minute, Sekunde und Mikrosekunde aus dem Objekt extrahieren.

#Stunde

print('Stunde:'t1.hour)

#Minute

print('Minute:'t1.minute)DateTime

Sie können dasselbe für Sekunden und Mikrosekunden wiederholen.

Hier sind einige andere Methoden, die Sie nützlich finden würden:

  • replace(): Um alte Daten zu aktualisieren.
  • weekday(): Um einen ganzzahligen Wert für jeden Wochentag zurückzugeben; Montag ist 0 und Sonntag ist 6.
  • isoweekday(): Für ganzzahlige Werte eines Wochentags, die zwischen 1 und 7 liegen.
  • isocalendar(): Um den Wert des Tages des „Jahres“ aus einem gegebenen Datensatz herauszuschneiden.
  • isleap(): Um zu prüfen, ob es sich um ein Schaltjahr handelt.
  • fromisoformat(): Zum Konvertieren einer Zeichenfolge im ISO-Format in ein DateTime-Objekt.
  • isoformat(): Zum Generieren von Datumsangaben im ISO-Format aus dem DateTime-Objekt.
  • format(): Um Ihr einzigartiges Format zu definieren.

Nachdem Sie nun verstanden haben, wie DateTime-Objekte in Python erstellt werden, sehen wir uns an, wie die Pandas-Bibliothek sie unterstützt.

Pandas to_datetime Beispiel

Mit Pandas können Sie eine Vielzahl von Datenanalyseaufgaben durchführen, insbesondere mit Python-DateTime-Objekten. Zu den bekanntesten Methoden gehört to_datetime(). So gehen Sie damit um:

  • Mit der pandas to_datetime-Methode können Sie Datum und Uhrzeit im Zeichenfolgenformat in DateTime-Objekte konvertieren

# to_datetime

date = pd.to_datetime( '24. April 2020')

Datum des Drucks)

drucken (Typ (Datum))

Ergebnis

2021-02-23 00:00:00

<class pandas._libs.tslib.timestamp.Timestamp'>

Können Sie hier etwas Seltsames bemerken? Das von pandas to_datetime zurückgegebene Objekt ist nicht dasselbe. Es ist ein Timestamp anstelle eines DateTime-Objekts. So gibt die Pandas-Bibliothek ein Objekt zurück; timestamp ist das Äquivalent der DateTime-Funktion von Python.

Die Notwendigkeit für DateTime

Es gibt mehrere reale Szenarien, in denen Informationen über einen bestimmten Zeitraum gesammelt werden, sodass Sie die Datums- und Zeitattribute extrahieren können, um ein bestimmtes Problem zu verstehen. Beispielsweise möchten Sie Ihre Lesegewohnheiten analysieren. Sie können Ihre Muster ausgraben, um zu dekonstruieren, ob Sie lieber an Wochenenden oder Wochentagen, nachts oder morgens lesen und so weiter. Dann können Sie alle interessanten Bücher und Artikel, die Sie in einem Monat lesen möchten, sammeln und Ihren Zeitplan organisieren.

Damit haben wir Ihnen eine Zusammenfassung zum Umgang mit der Datums- und Uhrzeitmanipulation in Python sowie Pandas DateTime gegeben . Wir hoffen, dass Sie das, was wir in diesem Artikel gelernt haben, anwenden und die Kunst der Arbeit mit Zeitreihendatensätzen beherrschen!

Lernen Sie Datenwissenschaftskurse von den besten Universitäten der Welt. Verdienen Sie Executive PG-Programme, Advanced Certificate-Programme oder Master-Programme, um Ihre Karriere zu beschleunigen.

Fazit

Wenn Sie daran interessiert sind, mehr über Python, seine verschiedenen Bibliotheken, einschließlich Pandas, und seine Anwendung in der Datenwissenschaft zu erfahren, sehen Sie sich das PG-Diplom in Datenwissenschaft von IIIT-B & upGrad an, das für Berufstätige erstellt wurde und mehr als 10 Fallstudien und Projekte, praktische Workshops, Mentoring mit Branchenexperten, 1-on-1 mit Branchenmentoren, über 400 Stunden Lernen und Arbeitsassistenz bei Top-Unternehmen.

Welche Funktionen machen Pandas zu einer beliebten Bibliothek?

Die folgenden Funktionen machen Pandas zu einer der beliebtesten Python-Bibliotheken:
Pandas stellen uns verschiedene Datenrahmen zur Verfügung, die nicht nur eine effiziente Datendarstellung ermöglichen, sondern uns auch ermöglichen, sie zu manipulieren.
Es bietet effiziente Ausrichtungs- und Indizierungsfunktionen, die intelligente Möglichkeiten zur Kennzeichnung und Organisation der Daten bieten.
Einige Funktionen von Pandas machen den Code sauberer und erhöhen seine Lesbarkeit, wodurch er effizienter wird.
Es kann auch mehrere Dateiformate lesen. JSON, CSV, HDF5 und Excel sind einige der von Pandas unterstützten Dateiformate.
Das Zusammenführen mehrerer Datensätze war für viele Programmierer eine echte Herausforderung. Pandas überwinden auch dies und führen mehrere Datensätze sehr effizient zusammen.
Pandas bietet auch Zugriff auf andere wichtige Python-Bibliotheken wie Matplotlib und NumPy, was es zu einer hocheffizienten Bibliothek macht.

Was sind die Methoden der DateTime-Funktion von Pandas?

Die DateTime ist eine wichtige Funktion von Pandas, die das Datum und die Uhrzeit Ihres Standorts in Echtzeit in verschiedenen Formaten zurückgibt. Im Folgenden sind einige der Funktionen aufgeführt, die Sie möglicherweise nützlich finden:
replace(): Aktualisiert alte Daten.
weekday(): Gibt einen ganzzahligen Wert für jeden Tag zurück, beginnend mit Montag als 0 bis Sonntag als 6.
isoweekday(): Gibt ganzzahlige Werte eines Wochentags zurück, die zwischen 1 und 7 liegen.
isocalendar(): Um den Wert des Tages des „Jahres“ aus einem gegebenen Datensatz herauszuschneiden.
isleap(): Überprüft eine Funktion, ob es sich um ein Schaltjahr handelt.
fromisoformat(): Zum Konvertieren einer Zeichenfolge im ISO-Format in ein DateTime-Objekt.
isoformat(): Zum Generieren von Datumsangaben im ISO-Format aus dem DateTime-Objekt.
format(): Um Ihr einzigartiges Format zu definieren.

Wie unterscheidet sich die Pandas-Bibliothek von Numpy?

Pandas und Numpy sind zweifellos die beiden am häufigsten verwendeten Bibliotheken von Python. Der folgende Vergleich identifiziert die Kernunterschiede zwischen den Pandas- und den Numpy-Bibliotheken.
A. Pandas -
1. Es wird bevorzugt zum Analysieren und Visualisieren von Tabellendaten verwendet.
2. Daten aus verschiedenen Dateiformaten können mit Pandas einfach importiert werden. Es unterstützt XLSX, ZIP, Text, HTML, XML, JSON usw.
3. Es zeigt eine schnellere Leistung, wenn mit einer großen Datenmenge umgegangen wird.
4. Es nimmt relativ mehr Platz im Speicher ein.
B. Numpy -
1. Es wird bevorzugt zur Durchführung mathematischer Operationen und numerischer Berechnungen verwendet.
2. Die in mehrdimensionalen Arrays gespeicherten Daten werden in dieser Bibliothek unterstützt.
3. Es funktioniert besser, wenn mit kleineren Datenmengen umgegangen wird.
4. Es verbraucht weniger Speicherplatz.