Funkcja DateTime w Pythonie i Pandach: co musisz wiedzieć?

Opublikowany: 2021-03-09

W tym artykule omówimy funkcje pand DateTime i zaoferujemy wgląd w ich potrzeby podczas pracy z zestawami danych szeregów czasowych w Pythonie.

Python jest jednym z pięciu najlepszych języków programowania pod względem użycia na całym świecie. Około 44% programistów na świecie używa go regularnie do zadań związanych z nauką o danych. I jest to ogromna różnorodność bibliotek Pythona, które należy za to przypisać. Jedną z takich bibliotek do analizy danych jest Pandas.

Jest napisany wyłącznie w C lub pythonie, ustępując miejsca wysoce zoptymalizowanemu kodowi źródłowemu zaplecza. Co więcej, python ma przejrzystą składnię i niską krzywą uczenia się, idealną dla początkujących. Ze znajomością tego języka można realizować wszystko, od mikroprojektów po makroprzedsiębiorstwa.

Deweloperzy Pythona, którzy mają odpowiedni poziom wiedzy i doświadczenia z biblioteką Pandas, są również poszukiwani na kilku stanowiskach związanych z nauką danych, w tym analitykiem danych, analitykiem biznesowym i inżynierem uczenia maszynowego. Te trajektorie kariery wymagają od kandydatów znajomości statystyki, analityki big data, analityki predykcyjnej (przy użyciu Pythona), wizualizacji itp.

Studenci inżynierii zainteresowani analityką mogą zatem wybrać specjalistyczne stopnie, które kładą nacisk na te umiejętności. Możesz ubiegać się o certyfikaty krótkoterminowe, takie jak PG Diploma in Data Science z IIIT-Bangalore, lub rozważyć dołączenie do programów akredytowanych na całym świecie, takich jak mgr inż. Doktor nauk o danych na Uniwersytecie Johna Mooresa w Liverpoolu (LJMU), Anglia.

Teraz, gdy przedstawiliśmy krótkie tło znaczenia pytona i pand we współczesnej dziedzinie technologii, zacznijmy nasz samouczek krok po kroku dotyczący pand DateTime .

Spis treści

Wyjaśnienie zmiennych daty i godziny

Prawdopodobnie spotkasz DateTime na pośrednim etapie nauki Pythona, powiedzmy, gdy pracujesz nad projektem. Załóżmy, że musisz wdrożyć projekt e-commerce, który wymaga opracowania strategii dotyczącej potoku łańcucha dostaw. Obejmuje to między innymi ustalenie czasu wysyłki zamówień, liczby dni na dostawę.

Jeśli nie jesteś zaznajomiony z komponentami daty i godziny w Pythonie, ten aspekt analizy danych tego problemu może być trudny do złamania dla nowicjusza. Z drugiej strony, jeśli wiesz, jak obsługiwać te funkcje, możesz zebrać szczegółowe informacje z prawie każdego zestawu danych.

Dla niewtajemniczonych klasa dat w Pythonie dotyczy dat z kalendarza gregoriańskiego. Ta klasa akceptuje „rok, miesiąc i dzień” jako argumenty całkowite. Natomiast klasa czasu zawiera argumenty całkowite do mikrosekund.

Oto przegląd zmiennej DateTime Pythona wraz z funkcją Pandy, aby zacząć!

Praca z DateTime w Pythonie

Rozważ przykładowe instrukcje podane poniżej, aby zrozumieć, jak utworzyć obiekt daty klasy DateTime w pythonie.

od datetime data importu

d1 = data (2021,2,23)

drukuj(d1)

drukuj(typ(d1))

Wynik

2021-04-23

<klasa 'datagodzina.data'>

Teraz wydobądźmy kilka innych cech, takich jak dzień, miesiąc i rok, z utworzonego powyżej obiektu daty. Zrobimy to za pomocą aktualnego lokalnego obiektu daty, co wiąże się z użyciem funkcji Today().

# aktualna data dnia

d1 = data.dzisiaj()

drukuj(d1)

# dzień

print ('Dzień : ' , d1.dzień)

# miesiąc

print( 'Miesiąc : ' , d1.miesiąc)

# rok

print( 'Rok : ' ,d1.rok)

Zwrócony obiekt DateTime

2021-02-23

Dzień : 23

Miesiąc : 2

Rok : 2021

Kolejną klasą modułu DateTime, która akceptuje wartości całkowite i zwraca obiekt, jest czas. Przyjrzyjmy się, jak to się robi w Pythonie.

od daty i godziny importu

t1 = (12,20,12,40)

drukuj(t1)

drukuj(typ(t1))

Wynik

12:20:12.000040

<klasa 'datagodzina.godzina'>

Jak widać, powyższy obiekt czasu sprowadza się do mikrosekund. Możesz więc teraz wyodrębnić z obiektu atrybuty czasu, takie jak godzina, minuta, sekunda i mikrosekunda.

#godzina

print('Godzina:'t1.godz)

#minuta

print('Minuta:'t1.minuta)DataGodzina

Możesz powtórzyć to samo przez sekundy i mikrosekundy.

Oto kilka innych metod, które mogą Ci się przydać:

  • replace(): Aktualizacja starych dat.
  • weekday(): Aby zwrócić wartość całkowitą dla dowolnego dnia tygodnia; Poniedziałek to 0, a niedziela to 6.
  • isoweekday(): Dla wartości całkowitych dnia tygodnia z przedziału od 1 do 7.
  • isocalendar(): Wycina wartość dnia „roku” z danego zbioru danych.
  • isleap(): Aby sprawdzić, czy jest to rok przestępny.
  • fromisoformat(): Konwertuje formę ciągu w formacie ISO na obiekt DateTime.
  • isoformat(): Aby wygenerować datę w formacie ISO z obiektu DateTime.
  • format(): Aby zdefiniować swój unikalny format.

Teraz, gdy zrozumiałeś, jak tworzyć obiekty DateTime w Pythonie, zobaczmy, jak obsługuje je biblioteka Pandas.

Pandy to_datetime Przykład

Dzięki pandom możesz wykonywać różne zadania analizy danych, zwłaszcza w przypadku obiektów DateTime w języku Python. Niektóre z najbardziej znanych metod to to_datetime(). Oto jak sobie z tym radzisz:

  • Za pomocą metody pandas to_datetime możesz konwertować datę i godzinę w formacie ciągu na obiekty DateTime

# do_datagodzina

date = pd.to_datetime( '24 kwietnia 2020′)

drukuj(data)

drukuj (rodzaj(data))

Wynik

2021-02-23 00:00:00

<class pandas._libs.tslib.timestamp.Timestamp'>

Czy zauważasz tutaj coś dziwnego? Obiekt zwrócony przez pandas to_datetime nie jest taki sam. Jest to znacznik czasu zamiast obiektu DateTime. W ten sposób biblioteka Pandas zwraca obiekt; znacznik czasu jest jego odpowiednikiem funkcji DateTime w Pythonie.

Potrzeba DateTime

Istnieje kilka rzeczywistych scenariuszy, w których informacje są gromadzone przez pewien okres, co pozwala wyodrębnić atrybuty daty i godziny w celu zrozumienia konkretnego problemu. Na przykład chcesz przeanalizować swoje nawyki czytelnicze. Możesz wykopać swoje wzorce, aby zdekonstruować, czy wolisz czytać w weekendy, w dni powszednie, w nocy czy rano i tak dalej. Następnie możesz zebrać wszystkie interesujące książki i artykuły, które chcesz przeczytać w ciągu miesiąca i uporządkować swój harmonogram.

W ten sposób przedstawiliśmy podsumowanie „jak to zrobić” dotyczące obsługi manipulacji datą i godziną w pythonie, a także w pandach DateTime . Mamy nadzieję, że przećwiczysz to, czego nauczyliśmy się w tym artykule i opanujesz sztukę pracy z zestawami danych szeregów czasowych!

Ucz się kursów nauki o danych z najlepszych światowych uniwersytetów. Zdobywaj programy Executive PG, Advanced Certificate Programs lub Masters Programs, aby przyspieszyć swoją karierę.

Wniosek

Jeśli chcesz dowiedzieć się więcej o Pythonie, jego różnych bibliotekach, w tym Pandas, i jego zastosowaniu w nauce o danych, sprawdź IIIT-B i upGrad's PG Diploma in Data Science, który jest stworzony dla pracujących profesjonalistów i oferuje ponad 10 studiów przypadków i projekty, praktyczne warsztaty praktyczne, mentoring z ekspertami branżowymi, indywidualny z mentorami branżowymi, ponad 400 godzin nauki i pomocy w pracy z najlepszymi firmami.

Jakie funkcje sprawiają, że Pandas jest popularną biblioteką?

Oto cechy, które sprawiają, że Pandas jest jedną z najpopularniejszych bibliotek Pythona:
Pandy dostarczają nam różne ramki danych, które nie tylko pozwalają na wydajną reprezentację danych, ale także umożliwiają nam manipulowanie nimi.
Zapewnia wydajne funkcje wyrównywania i indeksowania, które zapewniają inteligentne sposoby etykietowania i organizowania danych.
Niektóre cechy Pand sprawiają, że kod jest czysty i zwiększa jego czytelność, dzięki czemu jest bardziej wydajny.
Może również czytać wiele formatów plików. JSON, CSV, HDF5 i Excel to tylko niektóre z formatów plików obsługiwanych przez Pandy.
Łączenie wielu zestawów danych było prawdziwym wyzwaniem dla wielu programistów. Pandy również to przezwyciężają i bardzo skutecznie łączą wiele zestawów danych.
Pandas zapewnia również dostęp do innych ważnych bibliotek Pythona, takich jak Matplotlib i NumPy, co czyni go bardzo wydajną biblioteką.

Jakie są metody funkcji DateTime w Pandas?

DateTime to ważna funkcja Pand, która zwraca datę i godzinę Twojej lokalizacji w czasie rzeczywistym w różnych formatach. Poniżej znajdują się niektóre z jego funkcji, które mogą okazać się przydatne:
replace(): aktualizuje stare daty.
weekday(): Zwraca liczbę całkowitą dla każdego dnia od poniedziałku jako 0 do niedzieli jako 6.
isoweekday(): Zwraca liczby całkowite dnia tygodnia z zakresu od 1 do 7.
isocalendar(): Wycina wartość dnia „roku” z danego zbioru danych.
isleap(): Sprawdza funkcję, jeśli jest to rok przestępny.
fromisoformat(): Konwertuje formę ciągu w formacie ISO na obiekt DateTime.
isoformat(): Aby wygenerować datę w formacie ISO z obiektu DateTime.
format(): Aby zdefiniować swój unikalny format.

Czym różni się biblioteka Pandy od Numpy?

Pandas i Numpy to bez wątpienia dwie najczęściej używane biblioteki Pythona. Poniższe porównanie identyfikuje podstawowe różnice między bibliotekami Pandas i Numpy.
A. Pandy -
1. Jest preferowany do analizy i wizualizacji danych tabelarycznych.
2. Za pomocą Pand można łatwo importować dane z różnych formatów plików. Obsługuje XLSX, ZIP, tekst, HTML, XML, JSON itp.
3. Pokazuje większą wydajność w przypadku dużej ilości danych.
4. Zajmuje stosunkowo więcej miejsca w pamięci.
B. Numpy -
1. Preferowany do wykonywania operacji matematycznych i obliczeń numerycznych.
2. Biblioteka ta obsługuje dane przechowywane w tablicach wielowymiarowych.
3. Działa lepiej w przypadku mniejszych ilości danych.
4. Zużywa mniej miejsca w pamięci.