Fitur DateTime dari Python dan Pandas: Apa yang Perlu Anda Ketahui?
Diterbitkan: 2021-03-09Dalam artikel ini, kami akan membahas fitur DateTime panda dan menawarkan wawasan tentang kebutuhan mereka saat bekerja dengan kumpulan data deret waktu di python.
Python adalah salah satu dari lima bahasa pemrograman teratas dalam hal penggunaan di seluruh dunia. Sekitar 44% pengembang dunia menggunakannya secara teratur untuk tugas-tugas yang berhubungan dengan ilmu data. Dan itu adalah berbagai macam perpustakaan python yang perlu dikreditkan untuk ini. Pandas adalah salah satu perpustakaan analisis data tersebut.
Ini murni ditulis dalam C atau python, memberi jalan bagi kode sumber back-end yang sangat dioptimalkan. Selain itu, python memiliki sintaks yang jelas dan kurva belajar yang rendah, ideal untuk pemula. Seseorang dapat mengimplementasikan apa saja mulai dari proyek mikro hingga perusahaan makro dengan pengetahuan bahasa ini.
Pengembang Python yang memiliki tingkat pengetahuan dan pengalaman yang memadai dengan perpustakaan Pandas juga diminati untuk beberapa pekerjaan ilmu data, termasuk analis data, analis bisnis, dan insinyur pembelajaran mesin. Lintasan karir ini mengharuskan kandidat untuk terbiasa dengan statistik, analitik data besar, analitik prediktif (menggunakan python), visualisasi, dll.
Oleh karena itu, mahasiswa teknik yang tertarik dengan analitik dapat mengambil gelar khusus yang menekankan keterampilan ini. Anda dapat mengejar sertifikasi jangka pendek seperti PG Diploma dalam Ilmu Data dari IIIT-Bangalore atau mempertimbangkan untuk bergabung dengan program terakreditasi global, seperti M.Sc. dalam Ilmu Data dari Liverpool John Moores University (LJMU), Inggris.
Sekarang setelah kami memberi Anda latar belakang singkat tentang relevansi python dan panda di bidang teknologi modern, mari kita mulai tutorial langkah demi langkah tentang panda DateTime .
Daftar isi
Menjelaskan Variabel DateTime
Anda mungkin menemukan DateTime pada tahap menengah belajar python, katakanlah ketika Anda sedang mengerjakan sebuah proyek. Misalkan Anda harus mengimplementasikan proyek e-commerce yang mengharuskan Anda menyusun strategi tentang pipa rantai pasokan. Ini akan mencakup mencari tahu waktu untuk pengiriman pesanan, jumlah hari untuk pengiriman, antara lain.
Jika Anda tidak terbiasa dengan komponen tanggal dan waktu di Python, aspek ilmu data dari masalah ini mungkin sulit dipecahkan untuk pemula. Di sisi lain, jika Anda tahu cara menangani fitur ini, Anda dapat mengumpulkan wawasan mendalam dari hampir semua kumpulan data.
Untuk yang belum tahu, kelas tanggal dalam python berhubungan dengan tanggal dari kalender Gregorian. Kelas ini menerima "tahun, bulan, dan hari" sebagai argumen bilangan bulat. Sedangkan, kelas waktu terdiri dari argumen integer hingga mikrodetik.
Berikut adalah ikhtisar variabel DateTime python, bersama dengan fungsi Pandas, untuk membantu Anda memulai!
Bekerja dengan DateTime dengan Python
Pertimbangkan contoh pernyataan yang diberikan di bawah ini untuk memahami cara membuat objek tanggal dari kelas DateTime dengan python.
dari tanggal impor datetime
d1 = tanggal (2021,2,23)
cetak (d1)
cetak(tipe(d1))
Hasil
2021-04-23
<kelas 'datetime.date'>
Sekarang, mari kita ekstrak beberapa fitur lain, seperti hari, bulan, dan tahun, dari objek tanggal yang dibuat di atas. Kami akan melakukannya menggunakan objek tanggal hari lokal saat ini, yang melibatkan penggunaan fungsi today() .
# tanggal hari ini
d1 = tanggal.hari ini()
cetak (d1)
# hari
print('Hari : ' , h1.hari)
# bulan
print( 'Bulan : ' , h1.bulan)
# tahun
print('Tahun : ' ,d1.tahun)
Objek DateTime yang dikembalikan
2021-02-23
Hari : 23
Bulan : 2
Tahun : 2021
Kelas lain dari modul DateTime yang menerima nilai integer dan mengembalikan objek adalah waktu. Mari kita lihat bagaimana hal itu dilakukan dengan python.
dari waktu impor datetime
t1 = (12,20,12,40)
cetak (t1)
cetak(tipe(t1))
Hasil
12:20:12.000040
<kelas 'datetime.time'>
Seperti yang Anda lihat, objek waktu di atas turun ke mikrodetik. Jadi, Anda sekarang dapat mengekstrak atribut waktu seperti jam, menit, detik, dan mikrodetik dari objek.
#jam
print('Jam:'t1.jam)
#menit
print('Menit:'t1.menit)TanggalWaktu
Anda dapat mengulangi hal yang sama untuk detik dan mikrodetik.
Berikut adalah beberapa metode lain yang menurut Anda berguna:
- replace(): Untuk memperbarui tanggal lama.
- weekday(): Untuk mengembalikan nilai integer untuk setiap hari dalam seminggu; Senin adalah 0 dan Minggu adalah 6.
- isoweekday(): Untuk nilai integer hari kerja yang berkisar antara 1 hingga 7.
- isocalendar(): Untuk mengiris nilai hari dalam 'tahun' dari kumpulan data yang diberikan.
- isleap(): Untuk memeriksa apakah itu tahun kabisat.
- fromisoformat(): Untuk mengubah bentuk string dalam format ISO menjadi objek DateTime.
- isoformat(): Untuk menghasilkan tanggal format ISO dari objek DateTime.
- format(): Untuk menentukan format unik Anda.
Sekarang setelah Anda memahami cara membuat objek DateTime dengan python, mari kita lihat bagaimana perpustakaan Pandas mendukungnya.
Pandas to_datetime Contoh
Dengan panda, Anda dapat melakukan berbagai tugas analisis data, terutama dengan objek DateTime python. Beberapa metode yang menonjol termasuk to_datetime(). Inilah cara Anda menanganinya:
- Dengan metode pandas to_datetime, Anda dapat mengonversi tanggal dan waktu format string menjadi objek DateTime
#to_datetime
tanggal = pd.to_datetime( '24 April 2020′)
tanggal cetak)
cetak (ketik (tanggal))
Hasil
2021-02-23 00:00:00
<class pandas._libs.tslib.timestamp.Timestamp'>
Bisakah Anda melihat sesuatu yang aneh di sini? Objek yang dikembalikan oleh pandas to_datetime tidak sama. Ini adalah Timestamp, bukan objek DateTime. Beginilah cara perpustakaan Pandas mengembalikan objek; timestamp setara dengan fitur DateTime python.
Kebutuhan untuk DateTime
Ada beberapa skenario kehidupan nyata di mana informasi dikumpulkan selama suatu periode, memungkinkan Anda untuk mengekstrak atribut tanggal dan waktu untuk memahami masalah tertentu. Misalnya, Anda ingin menganalisis kebiasaan membaca Anda. Anda dapat menggali pola Anda untuk mendekonstruksi apakah Anda lebih suka membaca selama akhir pekan atau hari kerja, di malam hari atau di pagi hari, dan seterusnya. Kemudian, Anda dapat mengumpulkan semua buku dan artikel menarik yang ingin Anda baca dalam sebulan dan mengatur jadwal Anda.
Dengan ini, kami telah memberi Anda ringkasan 'cara' tentang penanganan manipulasi tanggal-waktu di python serta panda DateTime . Kami harap Anda mempraktikkan apa yang kami pelajari di artikel ini dan menguasai seni bekerja dengan kumpulan data deret waktu!
Pelajari kursus ilmu data dari Universitas top dunia. Dapatkan Program PG Eksekutif, Program Sertifikat Tingkat Lanjut, atau Program Magister untuk mempercepat karier Anda.
Kesimpulan
Jika Anda tertarik untuk mempelajari lebih lanjut tentang Python, berbagai perpustakaannya, termasuk Pandas, dan aplikasinya dalam ilmu data, lihat Diploma PG IIIT-B & upGrad dalam Ilmu Data yang dibuat untuk para profesional yang bekerja dan menawarkan 10+ studi kasus & proyek, lokakarya praktis, bimbingan dengan pakar industri, tatap muka dengan mentor industri, 400+ jam pembelajaran dan bantuan pekerjaan dengan perusahaan-perusahaan top.
Berikut ini adalah fitur-fitur yang menjadikan Pandas salah satu library Python paling populer: DateTime adalah fitur penting Panda yang mengembalikan tanggal dan waktu real-time lokasi Anda dalam berbagai format. Di bawah ini adalah beberapa fiturnya yang mungkin berguna bagi Anda: Pandas dan Numpy tidak diragukan lagi adalah dua perpustakaan Python yang paling banyak digunakan. Perbandingan berikut mengidentifikasi perbedaan inti antara perpustakaan Pandas dan Numpy.Fitur apa yang membuat Pandas menjadi perpustakaan populer?
Panda memberi kita berbagai bingkai data yang tidak hanya memungkinkan representasi data yang efisien tetapi juga memungkinkan kita untuk memanipulasinya.
Ini menyediakan fitur penyelarasan dan pengindeksan yang efisien yang menyediakan cara cerdas untuk memberi label dan mengatur data.
Beberapa fitur Pandas membuat kode bersih dan meningkatkan keterbacaannya, sehingga membuatnya lebih efisien.
Itu juga dapat membaca berbagai format file. JSON, CSV, HDF5, dan Excel adalah beberapa format file yang didukung oleh Pandas.
Penggabungan beberapa kumpulan data telah menjadi tantangan nyata bagi banyak programmer. Panda juga mengatasi ini dan menggabungkan beberapa kumpulan data dengan sangat efisien.
Pandas juga menyediakan akses ke pustaka Python penting lainnya seperti Matplotlib dan NumPy yang menjadikannya pustaka yang sangat efisien. Apa metode fitur DateTime dari Pandas?
replace(): Memperbarui tanggal lama.
weekday(): Mengembalikan nilai integer untuk setiap hari mulai dari Senin sebagai 0 hingga Minggu sebagai 6.
isoweekday(): Mengembalikan nilai integer hari kerja antara 1 hingga 7.
isocalendar(): Untuk mengiris nilai hari dalam 'tahun' dari kumpulan data yang diberikan.
isleap(): Memeriksa fungsi jika itu adalah tahun kabisat.
fromisoformat(): Untuk mengubah bentuk string dalam format ISO menjadi objek DateTime.
isoformat(): Untuk menghasilkan tanggal format ISO dari objek DateTime.
format(): Untuk menentukan format unik Anda. Bagaimana perpustakaan Pandas berbeda dari Numpy?
A. Panda -
1. Lebih disukai untuk menganalisis dan memvisualisasikan data tabular.
2. Data dari berbagai format file dapat dengan mudah diimpor menggunakan Pandas. Mendukung XLSX, ZIP, teks, HTML, XML, JSON, dll.
3. Ini menunjukkan kinerja yang lebih cepat ketika menangani sejumlah besar data.
4. Dibutuhkan relatif lebih banyak ruang di memori.
B. Lemah -
1. Lebih disukai untuk melakukan operasi matematika dan perhitungan numerik.
2. Data yang disimpan dalam array multi-dimensi didukung di perpustakaan ini.
3. Performanya lebih baik saat menangani jumlah data yang lebih kecil.
4. Mengkonsumsi lebih sedikit ruang memori.