Fonctionnalité DateTime de Python et Pandas : que devez-vous savoir ?

Publié: 2021-03-09

Dans cet article, nous couvrirons les fonctionnalités DateTime des pandas et offrirons un aperçu de leurs besoins tout en travaillant avec des ensembles de données de séries chronologiques en python.

Python fait partie des cinq premiers langages de programmation en termes d'utilisation dans le monde. Environ 44 % des développeurs dans le monde l' utilisent régulièrement pour des tâches liées à la science des données. Et c'est la grande variété de bibliothèques python qui doit être créditée pour cela. Pandas est l'une de ces bibliothèques d'analyse de données.

Il est purement écrit en C ou en python, laissant la place à un code source back-end hautement optimisé. De plus, Python a une syntaxe claire et une faible courbe d'apprentissage, idéale pour les débutants. On peut mettre en œuvre n'importe quoi, des micro-projets aux macro-entreprises avec la connaissance de cette langue.

Les développeurs Python qui ont un niveau adéquat de connaissances et d'expérience avec la bibliothèque Pandas sont également recherchés pour plusieurs emplois en science des données, notamment ceux d'analyste de données, d'analyste commercial et d'ingénieur en apprentissage automatique. Ces trajectoires de carrière exigent que les candidats soient familiarisés avec les statistiques, l'analyse de données volumineuses, l'analyse prédictive (utilisant python), la visualisation, etc.

Les étudiants en génie intéressés par l'analytique peuvent donc opter pour des diplômes spécialisés qui mettent l'accent sur ces compétences. Vous pouvez soit poursuivre des certifications à court terme comme le diplôme PG en science des données de l'IIIT-Bangalore, soit envisager de rejoindre des programmes accrédités à l'échelle mondiale, tels que M.Sc. en science des données de l'Université John Moores de Liverpool (LJMU), Angleterre.

Maintenant que nous vous avons donné un bref aperçu de la pertinence de python et des pandas dans le domaine de la technologie moderne, commençons notre tutoriel étape par étape sur les pandas DateTime .

Table des matières

Expliquer les variables DateTime

Vous êtes susceptible de rencontrer DateTime au stade intermédiaire de l'apprentissage de python, par exemple lorsque vous travaillez sur un projet. Supposons que vous deviez mettre en œuvre un projet de commerce électronique qui vous oblige à élaborer une stratégie concernant le pipeline de la chaîne d'approvisionnement. Il s'agirait notamment de déterminer le délai d'expédition des commandes, le nombre de jours de livraison, entre autres.

Si vous n'êtes pas familier avec les composants de date et d'heure en Python, cet aspect de la science des données de ce problème peut être difficile à déchiffrer pour un novice. D'un autre côté, si vous savez comment gérer ces fonctionnalités, vous pouvez recueillir des informations approfondies à partir de presque tous les ensembles de données.

Pour les non-initiés, la classe date en python traite des dates du calendrier grégorien. Cette classe accepte "année, mois et jour" comme arguments entiers. Alors que la classe de temps comprend des arguments entiers jusqu'à des microsecondes.

Voici un aperçu de la variable DateTime de python, ainsi que de la fonction Pandas, pour vous aider à démarrer !

Travailler avec DateTime en Python

Considérez les exemples d'instructions donnés ci-dessous pour comprendre comment créer un objet date de la classe DateTime en python.

à partir de la date d'importation datetime

j1 = date (2021,2,23)

impression(d1)

impression(type(d1))

Résultat

2021-04-23

<classe 'dateheure.date'>

Maintenant, extrayons quelques autres caractéristiques, telles que le jour, le mois et l'année, à partir de l'objet date créé ci-dessus. Nous le ferons en utilisant l'objet de date du jour local actuel, ce qui implique l'utilisation de la fonction today().

# date actuelle

d1 = date.aujourd'hui()

impression(d1)

# journée

print('Jour : ' , j1.jour)

# mois

print( 'Mois : ' , j1.mois)

# an

print( 'Année : ' ,d1.année)

Objet DateTime renvoyé

2021-02-23

Jour : 23

Mois : 2

Année : 2021

Une autre classe du module DateTime qui accepte les valeurs entières et renvoie un objet est le temps. Voyons comment c'est fait en python.

à partir de l'heure d'importation datetime

t1 = (12,20,12,40)

impression(t1)

impression(type(t1))

Résultat

12:20:12.000040

<classe 'dateheure.heure'>

Comme vous pouvez le voir, l'objet de temps ci-dessus est réduit aux microsecondes. Ainsi, vous pouvez maintenant extraire des attributs de temps tels que l'heure, la minute, la seconde et la microseconde de l'objet.

#heure

print('Heure:'t1.heure)

#minute

print('Minute:'t1.minute)DateHeure

Vous pouvez répéter la même chose pendant des secondes et des microsecondes.

Voici quelques autres méthodes qui pourraient vous être utiles :

  • replace() : pour mettre à jour les anciennes dates.
  • weekday() : pour renvoyer une valeur entière pour n'importe quel jour de la semaine ; Lundi est 0 et dimanche est 6.
  • isoweekday() : pour les valeurs entières d'un jour de la semaine comprises entre 1 et 7.
  • isocalendar() : Pour découper la valeur du jour de l'année à partir d'un ensemble de données donné.
  • isleap() : pour vérifier s'il s'agit d'une année bissextile.
  • fromisoformat() : pour convertir la forme de chaîne au format ISO en un objet DateTime.
  • isoformat() : pour générer une date au format ISO à partir de l'objet DateTime.
  • format() : Pour définir votre format unique.

Maintenant que vous avez compris comment créer des objets DateTime en python, voyons comment la bibliothèque Pandas les prend en charge.

Pandas to_datetime Exemple

Avec pandas, vous pouvez effectuer diverses tâches d'analyse de données, en particulier avec des objets Python DateTime. Certaines des méthodes les plus importantes incluent to_datetime(). Voici comment vous le gérez :

  • Avec la méthode pandas to_datetime, vous pouvez convertir la date et l'heure au format chaîne en objets DateTime

# to_datetime

date = pd.to_datetime( '24 avril 2020′)

date d'impression)

imprimer (type(date))

Résultat

2021-02-23 00:00:00

<classe pandas._libs.tslib.timestamp.Timestamp'>

Pouvez-vous remarquer quelque chose d'étrange ici? L'objet retourné par pandas to_datetime n'est pas le même. C'est un horodatage au lieu d'un objet DateTime. C'est ainsi que la bibliothèque Pandas renvoie un objet ; timestamp est son équivalent de la fonctionnalité DateTime de python.

Le besoin de DateTime

Il existe plusieurs scénarios réels où les informations sont collectées sur une période, ce qui vous permet d'extraire les attributs de date et d'heure pour comprendre un problème particulier. Par exemple, vous souhaitez analyser vos habitudes de lecture. Vous pouvez déterrer vos schémas pour déconstruire si vous préférez lire le week-end ou en semaine, la nuit ou le matin, etc. Ensuite, vous pouvez accumuler tous les livres et articles intéressants que vous souhaitez lire en un mois et organiser votre emploi du temps.

Avec cela, nous vous avons donné un résumé "comment faire" sur la gestion de la manipulation date-heure en python ainsi que pandas DateTime . Nous espérons que vous mettrez en pratique ce que nous avons appris dans cet article et que vous maîtriserez l'art de travailler avec des ensembles de données de séries chronologiques !

Apprenez des cours de science des données dans les meilleures universités du monde. Gagnez des programmes Executive PG, des programmes de certificat avancés ou des programmes de maîtrise pour accélérer votre carrière.

Conclusion

Si vous souhaitez en savoir plus sur Python, ses différentes bibliothèques, y compris Pandas, et son application en science des données, consultez le diplôme PG en science des données de IIIT-B & upGrad, créé pour les professionnels en activité et proposant plus de 10 études de cas et projets, ateliers pratiques, mentorat avec des experts de l'industrie, 1-on-1 avec des mentors de l'industrie, plus de 400 heures d'apprentissage et d'aide à l'emploi avec les meilleures entreprises.

Quelles fonctionnalités font de Pandas une bibliothèque populaire ?

Voici les fonctionnalités qui font de Pandas l'une des bibliothèques Python les plus populaires :
Les pandas nous fournissent diverses trames de données qui permettent non seulement une représentation efficace des données, mais nous permettent également de les manipuler.
Il fournit des fonctionnalités d'alignement et d'indexation efficaces qui fournissent des moyens intelligents d'étiqueter et d'organiser les données.
Certaines fonctionnalités de Pandas rendent le code propre et augmentent sa lisibilité, le rendant ainsi plus efficace.
Il peut également lire plusieurs formats de fichiers. JSON, CSV, HDF5 et Excel sont quelques-uns des formats de fichiers pris en charge par Pandas.
La fusion de plusieurs ensembles de données a été un véritable défi pour de nombreux programmeurs. Les pandas surmontent également cela et fusionnent très efficacement plusieurs ensembles de données.
Pandas donne également accès à d'autres bibliothèques Python importantes telles que Matplotlib et NumPy, ce qui en fait une bibliothèque très efficace.

Quelles sont les méthodes de la fonctionnalité DateTime de Pandas ?

Le DateTime est une fonctionnalité importante de Pandas qui renvoie la date et l'heure en temps réel de votre position dans différents formats. Voici quelques-unes de ses fonctionnalités qui pourraient vous être utiles :
replace() : met à jour les anciennes dates.
weekday() : renvoie une valeur entière pour chaque jour, du lundi sous la forme 0 au dimanche sous la forme 6.
isoweekday() : renvoie les valeurs entières d'un jour de la semaine comprises entre 1 et 7.
isocalendar() : Pour découper la valeur du jour de l'année à partir d'un ensemble de données donné.
isleap() : Vérifie une fonction si c'est une année bissextile.
fromisoformat() : pour convertir la forme de chaîne au format ISO en un objet DateTime.
isoformat() : pour générer une date au format ISO à partir de l'objet DateTime.
format() : Pour définir votre format unique.

En quoi la bibliothèque Pandas diffère-t-elle de Numpy ?

Pandas et Numpy sont sans aucun doute les deux bibliothèques les plus utilisées de Python. La comparaison suivante identifie les principales différences entre les bibliothèques Pandas et Numpy.
A. Les pandas -
1. Il est préférable d'analyser et de visualiser des données tabulaires.
2. Les données de différents formats de fichiers peuvent être facilement importées à l'aide de Pandas. Il prend en charge XLSX, ZIP, texte, HTML, XML, JSON, etc.
3. Il affiche des performances plus rapides lorsqu'il traite une grande quantité de données.
4. Il prend relativement plus d'espace dans la mémoire.
B.Numpy -
1. Il est préférable d'effectuer des opérations mathématiques et des calculs numériques.
2. Les données stockées dans des tableaux multidimensionnels sont prises en charge dans cette bibliothèque.
3. Il fonctionne mieux lorsqu'il traite de petites quantités de données.
4. Il consomme moins d'espace mémoire.