Función DateTime de Python y Pandas: ¿Qué necesita saber?

Publicado: 2021-03-09

En este artículo, cubriremos las características de pandas DateTime y ofreceremos información sobre sus necesidades mientras trabajamos con conjuntos de datos de series temporales en python.

Python se encuentra entre los cinco principales lenguajes de programación en términos de uso en todo el mundo. Alrededor del 44 % de los desarrolladores del mundo lo usan regularmente para tareas relacionadas con la ciencia de datos. Y es la gran variedad de bibliotecas de python las que deben ser acreditadas por esto. Pandas es una de esas bibliotecas de análisis de datos.

Está escrito puramente en C o Python, dando paso a un código fuente de back-end altamente optimizado. Además, Python tiene una sintaxis clara y una curva de aprendizaje baja, ideal para principiantes. Uno puede implementar cualquier cosa, desde microproyectos hasta macroempresas con el conocimiento de este lenguaje.

Los desarrolladores de Python que tienen un nivel adecuado de conocimiento y experiencia con la biblioteca de Pandas también tienen demanda para varios trabajos de ciencia de datos, incluidos analista de datos, analista de negocios e ingeniero de aprendizaje automático. Estas trayectorias profesionales requieren que los candidatos estén familiarizados con estadísticas, análisis de big data, análisis predictivo (usando python), visualización, etc.

Los estudiantes de ingeniería interesados ​​en el análisis pueden, por lo tanto, optar por títulos especializados que enfaticen estas habilidades. Puede buscar certificaciones a corto plazo como el Diploma PG en ciencia de datos de IIIT-Bangalore o considerar unirse a programas acreditados a nivel mundial, como M.Sc. en Ciencia de Datos de la Universidad John Moores de Liverpool (LJMU), Inglaterra.

Ahora que le hemos brindado una breve reseña de la relevancia de Python y Pandas en el campo de la tecnología moderna, comencemos nuestro tutorial paso a paso sobre Pandas DateTime .

Tabla de contenido

Explicación de las variables de fecha y hora

Es probable que encuentre DateTime en la etapa intermedia de aprendizaje de Python, por ejemplo, cuando está trabajando en un proyecto. Suponga que tiene que implementar un proyecto de comercio electrónico que requiere que elabore una estrategia sobre la canalización de la cadena de suministro. Esto incluiría calcular el tiempo de envío de los pedidos, la cantidad de días para la entrega, entre otras cosas.

Si no está familiarizado con los componentes de fecha y hora en Python, este aspecto de ciencia de datos de este problema puede ser difícil de resolver para un principiante. Por otro lado, si sabe cómo manejar estas funciones, puede recopilar información detallada de casi cualquier conjunto de datos.

Para los no iniciados, la clase de fecha en python trata con las fechas del calendario gregoriano. Esta clase acepta "año, mes y día" como argumentos enteros. Mientras que la clase de tiempo comprende argumentos enteros hasta microsegundos.

¡Aquí hay una descripción general de la variable DateTime de Python, junto con la función Pandas, para que pueda comenzar!

Trabajando con DateTime en Python

Considere las declaraciones de ejemplo que se dan a continuación para comprender cómo crear un objeto de fecha de la clase DateTime en python.

desde fecha y hora fecha de importación

d1 = fecha (2021,2,23)

imprimir (d1)

imprimir (tipo (d1))

Resultado

2021-04-23

<clase 'fechahora.fecha'>

Ahora, extraigamos algunas otras características, como día, mes y año, del objeto de fecha creado anteriormente. Lo haremos usando el objeto de fecha del día local actual, lo que implica usar la función today().

# fecha actual

d1 = fecha.hoy()

imprimir (d1)

# día

imprimir ('Día: ', d1.día)

# mes

imprimir('Mes:', d1.mes)

# año

imprimir('Año:',d1.año)

Objeto DateTime devuelto

2021-02-23

Día : 23

Mes : 2

Año : 2021

Otra clase del módulo DateTime que acepta valores enteros y devuelve un objeto es time. Veamos cómo se hace en python.

desde fechahora hora de importación

t1 = (12,20,12,40)

imprimir (t1)

imprimir (tipo (t1))

Resultado

12:20:12.000040

<clase 'fechahora.hora'>

Como puede ver, el objeto de tiempo anterior se reduce a microsegundos. Por lo tanto, ahora puede extraer atributos de tiempo como la hora, el minuto, el segundo y el microsegundo del objeto.

#hora

imprimir('Hora:'t1.hora)

#minuto

imprimir('Minuto:'t1.minuto)FechaHora

Puedes repetir lo mismo durante segundos y microsegundos.

Aquí hay algunos otros métodos que le resultarán útiles:

  • replace (): para actualizar fechas antiguas.
  • día de la semana (): para devolver un valor entero para cualquier día de la semana; El lunes es 0 y el domingo es 6.
  • isoweekday(): para valores enteros de un día de la semana entre 1 y 7.
  • isocalendar(): para dividir el valor del día del 'año' de un conjunto de datos determinado.
  • isleap(): Para comprobar si es un año bisiesto.
  • fromisoformat(): para convertir la forma de cadena en formato ISO en un objeto DateTime.
  • isoformat(): para generar una fecha en formato ISO a partir del objeto DateTime.
  • format (): para definir su formato único.

Ahora que ha entendido cómo crear objetos DateTime en python, veamos cómo la biblioteca Pandas los admite.

Pandas to_datetime Ejemplo

Con pandas, puede realizar una variedad de tareas de análisis de datos, especialmente con objetos de Python DateTime. Algunos de los métodos destacados incluyen to_datetime(). Así es como lo manejas:

  • Con el método pandas to_datetime, puede convertir la fecha y la hora en formato de cadena en objetos DateTime

# to_datetime

fecha = pd.to_datetime('24 de abril de 2020')

fecha de impresion)

imprimir (tipo (fecha))

Resultado

2021-02-23 00:00:00

<clase pandas._libs.tslib.timestamp.Timestamp'>

¿Puedes notar algo extraño aquí? El objeto devuelto por pandas to_datetime no es el mismo. Es una marca de tiempo en lugar de un objeto DateTime. Así es como la biblioteca de Pandas devuelve un objeto; timestamp es su equivalente de la función DateTime de python.

La necesidad de fecha y hora

Hay varios escenarios de la vida real en los que se recopila información durante un período, lo que le permite extraer los atributos de fecha y hora para comprender un problema en particular. Por ejemplo, desea analizar sus hábitos de lectura. Puede desenterrar sus patrones para deconstruir si prefiere leer durante los fines de semana o entre semana, por la noche o por la mañana, y así sucesivamente. Luego, puedes acumular todos los libros y artículos interesantes que quieras leer en un mes y organizar tu agenda.

Con esto, le hemos dado un resumen de "cómo hacer" sobre el manejo de la manipulación de fecha y hora en python, así como en pandas DateTime . ¡Esperamos que practique lo que aprendimos en este artículo y domine el arte de trabajar con conjuntos de datos de series temporales!

Aprenda cursos de ciencia de datos de las mejores universidades del mundo. Obtenga programas Executive PG, programas de certificados avanzados o programas de maestría para acelerar su carrera.

Conclusión

Si está interesado en obtener más información sobre Python, sus diversas bibliotecas, incluidos Pandas, y su aplicación en la ciencia de datos, consulte el Diploma PG en ciencia de datos de IIIT-B y upGrad, creado para profesionales que trabajan y ofrece más de 10 estudios de casos y proyectos, talleres prácticos, tutoría con expertos de la industria, 1 a 1 con mentores de la industria, más de 400 horas de aprendizaje y asistencia laboral con las mejores empresas.

¿Qué características hacen de Pandas una biblioteca popular?

Las siguientes son las características que hacen de Pandas una de las bibliotecas de Python más populares:
Los pandas nos brindan varios marcos de datos que no solo permiten una representación eficiente de los datos, sino que también nos permiten manipularlos.
Proporciona características eficientes de alineación e indexación que brindan formas inteligentes de etiquetar y organizar los datos.
Algunas características de Pandas hacen que el código sea limpio y aumentan su legibilidad, haciéndolo así más eficiente.
También puede leer múltiples formatos de archivo. JSON, CSV, HDF5 y Excel son algunos de los formatos de archivo compatibles con Pandas.
La fusión de múltiples conjuntos de datos ha sido un verdadero desafío para muchos programadores. Los pandas también superan esto y fusionan múltiples conjuntos de datos de manera muy eficiente.
Pandas también brinda acceso a otras bibliotecas Python importantes como Matplotlib y NumPy, lo que la convierte en una biblioteca altamente eficiente.

¿Cuáles son los métodos de la función DateTime de Pandas?

DateTime es una característica importante de Pandas que devuelve la fecha y la hora en tiempo real de su ubicación en varios formatos. A continuación se presentan algunas de sus características que pueden resultarle útiles:
replace (): actualiza las fechas antiguas.
día de la semana (): devuelve un valor entero para cada día a partir del lunes como 0 hasta el domingo como 6.
isoweekday(): Devuelve valores enteros de un día de la semana que están entre 1 y 7.
isocalendar(): para dividir el valor del día del 'año' de un conjunto de datos dado.
isleap(): Comprueba una función si es un año bisiesto.
fromisoformat(): para convertir la forma de cadena en formato ISO en un objeto DateTime.
isoformat(): para generar una fecha en formato ISO a partir del objeto DateTime.
format (): para definir su formato único.

¿En qué se diferencia la biblioteca Pandas de Numpy?

Pandas y Numpy son sin duda las dos bibliotecas más utilizadas de Python. La siguiente comparación identifica las diferencias principales entre las bibliotecas Pandas y Numpy.
A. Pandas -
1. Se prefiere para analizar y visualizar datos tabulares.
2. Los datos de varios formatos de archivo se pueden importar fácilmente usando Pandas. Admite XLSX, ZIP, texto, HTML, XML, JSON, etc.
3. Muestra un rendimiento más rápido cuando se trata de una gran cantidad de datos.
4. Ocupa relativamente más espacio en la memoria.
B. Entumecido -
1. Se prefiere para realizar operaciones matemáticas y cálculos numéricos.
2. Esta biblioteca admite los datos almacenados en matrices multidimensionales.
3. Funciona mejor cuando se trata de cantidades de datos más pequeñas.
4. Consume menos espacio de memoria.