Recurso DateTime do Python e Pandas: O que você precisa saber?

Publicados: 2021-03-09

Neste artigo, abordaremos os recursos DateTime do pandas e forneceremos informações sobre suas necessidades ao trabalhar com conjuntos de dados de séries temporais em python.

Python está entre as cinco principais linguagens de programação em termos de uso em todo o mundo. Cerca de 44% dos desenvolvedores do mundo o usam regularmente para tarefas relacionadas à ciência de dados. E é a grande variedade de bibliotecas python que precisam ser creditadas por isso. Pandas é uma dessas bibliotecas de análise de dados.

É puramente escrito em C ou python, abrindo caminho para código-fonte de back-end altamente otimizado. Além disso, python possui sintaxe clara e baixa curva de aprendizado, ideal para iniciantes. Pode-se implementar desde microprojetos até macroempresas com o conhecimento dessa linguagem.

Os desenvolvedores Python que têm um nível adequado de conhecimento e experiência com a biblioteca Pandas também estão em demanda para vários trabalhos de ciência de dados, incluindo analista de dados, analista de negócios e engenheiro de aprendizado de máquina. Essas trajetórias de carreira exigem que os candidatos estejam familiarizados com estatísticas, análise de big data, análise preditiva (usando python), visualização etc.

Estudantes de engenharia interessados ​​em análise podem, portanto, buscar diplomas especializados que enfatizem essas habilidades. Você pode buscar certificações de curto prazo, como o PG Diploma in Data Science do IIIT-Bangalore, ou considerar ingressar em programas credenciados globalmente, como M.Sc. em Ciência de Dados pela Liverpool John Moores University (LJMU), Inglaterra.

Agora que fornecemos um breve histórico da relevância de python e pandas no campo da tecnologia moderna, vamos começar nosso tutorial passo a passo sobre pandas DateTime .

Índice

Explicando as Variáveis ​​DateTime

É provável que você encontre DateTime no estágio intermediário de aprendizado de python, digamos, quando estiver trabalhando em um projeto. Suponha que você precise implementar um projeto de comércio eletrônico que exija que você crie estratégias sobre o pipeline da cadeia de suprimentos. Isso inclui descobrir o tempo de envio dos pedidos, o número de dias para entrega, entre outras coisas.

Se você não estiver familiarizado com os componentes de data e hora em Python, esse aspecto de ciência de dados desse problema pode ser difícil de decifrar para um iniciante. Por outro lado, se você souber como lidar com esses recursos, poderá coletar insights profundos de praticamente qualquer conjunto de dados.

Para os não iniciados, a classe date em python lida com as datas do calendário gregoriano. Esta classe aceita “ano, mês e dia” como argumentos inteiros. Considerando que, a classe de tempo compreende argumentos inteiros de até microssegundos.

Aqui está uma visão geral da variável DateTime do python, juntamente com a função Pandas, para você começar!

Trabalhando com DateTime em Python

Considere as instruções de exemplo fornecidas abaixo para entender como criar um objeto de data da classe DateTime em python.

de datetime data de importação

d1 = data (2021,2,23)

imprimir(d1)

print(tipo(d1))

Resultado

23-04-2021

<class 'datetime.date'>

Agora, vamos extrair alguns outros recursos, como dia, mês e ano, do objeto de data criado acima. Faremos isso usando o objeto de data do dia local atual, que envolve o uso da função today().

#data atual

d1 = data.hoje()

imprimir(d1)

# dia

print('Dia: ', d1.dia)

# mês

print( 'Mês : ' , d1.mês)

# ano

print('Ano:',d1.ano)

Objeto DateTime retornado

23-02-2021

Dia: 23

Mês: 2

Ano: 2021

Outra classe do módulo DateTime que aceita valores inteiros e retorna um objeto é time. Vamos ver como isso é feito em python.

de datetime hora de importação

t1 = (12,20,12,40)

imprimir(t1)

print(tipo(t1))

Resultado

12:20:12.000040

<class 'datetime.time'>

Como você pode ver, o objeto de tempo acima está reduzido a microssegundos. Assim, agora você pode extrair atributos de tempo como hora, minuto, segundo e microssegundo do objeto.

#hora

print('Hora:'t1.hora)

#minuto

print('Minuto:'t1.minuto)DataHora

Você pode repetir a mesma coisa por segundos e microssegundos.

Aqui estão alguns outros métodos que você acharia úteis:

  • replace(): Para atualizar datas antigas.
  • weekday(): Para retornar um valor inteiro para qualquer dia da semana; Segunda-feira é 0 e domingo é 6.
  • isoweekday(): Para valores inteiros de um dia da semana que estão entre 1 e 7.
  • isocalendar(): Para fatiar o valor do dia do 'ano' de um determinado conjunto de dados.
  • isleap(): Para verificar se é um ano bissexto.
  • fromisoformat(): Para converter o formato de string no formato ISO em um objeto DateTime.
  • isoformat(): Para gerar a data no formato ISO do objeto DateTime.
  • format(): Para definir seu formato exclusivo.

Agora que você entendeu como criar objetos DateTime em python, vamos ver como a biblioteca Pandas os suporta.

Exemplo de pandas to_datetime

Com os pandas, você pode executar uma variedade de tarefas de análise de dados, especialmente com objetos DateTime do Python. Alguns dos métodos proeminentes incluem to_datetime(). Aqui está como você lida com isso:

  • Com o método pandas to_datetime, você pode converter data e hora do formato de string em objetos DateTime

# to_datetime

data = pd.to_datetime('24 de abril de 2020′)

data de impressão)

imprimir (tipo(data))

Resultado

23-02-2021 00:00:00

<class pandas._libs.tslib.timestamp.Timestamp'>

Você pode notar algo estranho aqui? O objeto retornado por pandas to_datetime não é o mesmo. É um carimbo de data/hora em vez de um objeto DateTime. É assim que a biblioteca Pandas retorna um objeto; timestamp é seu equivalente ao recurso DateTime do python.

A necessidade de DateTime

Existem vários cenários da vida real em que as informações são coletadas durante um período, permitindo que você extraia os atributos de data e hora para entender um problema específico. Por exemplo, você deseja analisar seus hábitos de leitura. Você pode desenterrar seus padrões para desconstruir se prefere ler durante os fins de semana ou durante a semana, à noite ou de manhã e assim por diante. Então, você pode acumular todos os livros e artigos interessantes que deseja ler em um mês e organizar sua agenda.

Com isso, fornecemos um resumo de 'como' sobre como lidar com a manipulação de data e hora em python, bem como em pandas DateTime . Esperamos que você pratique o que aprendemos neste artigo e domine a arte de trabalhar com conjuntos de dados de séries temporais!

Aprenda cursos de ciência de dados das melhores universidades do mundo. Ganhe Programas PG Executivos, Programas de Certificado Avançado ou Programas de Mestrado para acelerar sua carreira.

Conclusão

Se você estiver interessado em aprender mais sobre Python, suas várias bibliotecas, incluindo Pandas, e sua aplicação em ciência de dados, confira IIIT-B & upGrad's PG Diploma in Data Science, que é criado para profissionais que trabalham e oferece mais de 10 estudos de caso e projetos, workshops práticos práticos, orientação com especialistas do setor, 1-on-1 com mentores do setor, mais de 400 horas de aprendizado e assistência de trabalho com as principais empresas.

Quais recursos tornam o Pandas uma biblioteca popular?

A seguir estão os recursos que tornam o Pandas uma das bibliotecas Python mais populares:
Os pandas nos fornecem vários quadros de dados que não apenas permitem uma representação eficiente dos dados, mas também nos permitem manipulá-los.
Ele fornece recursos eficientes de alinhamento e indexação que fornecem maneiras inteligentes de rotular e organizar os dados.
Alguns recursos do Pandas tornam o código limpo e aumentam sua legibilidade, tornando-o mais eficiente.
Ele também pode ler vários formatos de arquivo. JSON, CSV, HDF5 e Excel são alguns dos formatos de arquivo suportados pelo Pandas.
A fusão de vários conjuntos de dados tem sido um verdadeiro desafio para muitos programadores. Os pandas também superam isso e mesclam vários conjuntos de dados com muita eficiência.
O Pandas também fornece acesso a outras bibliotecas Python importantes, como Matplotlib e NumPy, o que o torna uma biblioteca altamente eficiente.

Quais são os métodos do recurso DateTime do Pandas?

O DateTime é um recurso importante do Pandas que retorna a data e hora em tempo real da sua localização em vários formatos. Abaixo estão alguns de seus recursos que podem ser úteis:
replace(): Atualiza datas antigas.
weekday(): Retorna um valor inteiro para cada dia começando de segunda-feira como 0 até domingo como 6.
isoweekday(): Retorna valores inteiros de um dia da semana que estão entre 1 e 7.
isocalendar(): Para fatiar o valor do dia do 'ano' de um determinado conjunto de dados.
isleap(): Verifica uma função se for um ano bissexto.
fromisoformat(): Para converter o formato de string no formato ISO em um objeto DateTime.
isoformat(): Para gerar a data no formato ISO do objeto DateTime.
format(): Para definir seu formato exclusivo.

Como a biblioteca Pandas difere do Numpy?

Pandas e Numpy são sem dúvida as duas bibliotecas mais usadas do Python. A comparação a seguir identifica as principais diferenças entre as bibliotecas Pandas e Numpy.
A. Pandas -
1. É preferível para analisar e visualizar dados tabulares.
2. Os dados de vários formatos de arquivo podem ser facilmente importados usando o Pandas. Ele suporta XLSX, ZIP, texto, HTML, XML, JSON, etc.
3. Apresenta um desempenho mais rápido quando lida com uma grande quantidade de dados.
4. Ocupa relativamente mais espaço na memória.
B. Numpy -
1. É preferível para realizar operações matemáticas e cálculos numéricos.
2. Os dados armazenados em arrays multidimensionais são suportados nesta biblioteca.
3. Tem melhor desempenho quando lida com quantidades menores de dados.
4. Consome menos espaço de memória.