Python 和 Pandas 的 DateTime 特性:你需要知道什么?

已发表: 2021-03-09

在本文中,我们将介绍pandas 的 DateTime功能,并在使用 Python 处理时间序列数据集时提供对它们需求的见解。

Python 是全球使用量排名前五的编程语言之一。 全球44% 的开发人员经常将其用于与数据科学相关的任务。 这需要归功于种类繁多的python库。 Pandas 就是这样一种数据分析库。

它纯粹是用 C 或 python 编写的,为高度优化的后端源代码让路。 此外,python 语法清晰,学习曲线低,非常适合初学者。 有了这门语言的知识,就可以实现从微型项目到宏观企业的任何事情。

对 Pandas 库有足够知识和经验的 Python 开发人员也需要一些数据科学工作,包括数据分析师、业务分析师和机器学习工程师。 这些职业轨迹要求候选人熟悉统计、大数据分析、预测分析(使用 python)、可视化等。

因此,对分析感兴趣的工科学生可以攻读强调这些技能的专业学位。 您可以追求短期认证,例如IIIT-Bangalore的数据科学 PG 文凭,或者考虑加入全球认可的课程,例如M.Sc。 英国利物浦约翰摩尔斯大学 (LJMU)数据科学博士。

现在我们已经为您简要介绍了 python 和 pandas 在现代科技领域的相关性,让我们开始我们关于pandas DateTime的分步教程

目录

解释日期时间变量

在学习 python 的中间阶段,你可能会遇到 DateTime,比如当你在做一个项目时。 假设您必须实施一个电子商务项目,该项目需要您制定供应链管道战略。 这将包括确定运输订单的时间、交货天数等。

如果您不熟悉 Python 中的日期和时间组件,那么对于新手来说,这个问题的数据科学方面可能很难破解。 另一方面,如果您知道如何处理这些特征,您几乎可以从任何数据集中收集深刻的见解。

对于初学者来说,python 中的日期类处理公历中的日期。 此类接受“年、月和日”作为整数参数。 然而,时间类包含最大为微秒的整数参数。

这是 python 的 DateTime 变量以及 Pandas 函数的概述,可以帮助您入门!

在 Python 中使用 DateTime

考虑下面给出的示例语句,以了解如何在 python 中创建 DateTime 类的日期对象。

从日期时间导入日期

d1 = 日期 (2021,2,23)

打印(d1)

打印(类型(d1))

结果

2021-04-23

<class 'datetime.date'>

现在,让我们从上面创建的日期对象中提取一些其他特征,例如日、月和年。 我们将使用当前本地日期对象来执行此操作,这涉及到使用 today() 函数。

# 当前日期

d1 = date.today()

打印(d1)

# 日

打印('天:',d1.day)

# 月

print('月份:', d1.month)

# 年

print('年份:',d1.year)

返回的日期时间对象

2021-02-23

天 : 23

月 : 2

年份 : 2021

DateTime 模块的另一类接受整数值并返回一个对象是时间。 让我们看看它是如何在 python 中完成的。

从日期时间导入时间

t1 = (12,20,12,40)

打印(t1)

打印(类型(t1))

结果

12:20:12.000040

<class 'datetime.time'>

如您所见,上述时间对象精确到微秒。 因此,您现在可以从对象中提取时间属性,例如小时、分钟、秒和微秒。

#小时

print('小时:'t1.hour)

#分钟

print('Minute:'t1.minute)DateTime

你可以重复同样的事情几秒和几微秒。

以下是您会发现有用的其他一些方法:

  • replace():更新旧日期。
  • weekday():返回一周中任何一天的整数值; 星期一是 0,星期日是 6。
  • isoweekday():适用于 1 到 7 之间的工作日整数值。
  • isocalendar():从给定的数据集中切出“年”的日期值。
  • isleap():检查是否是闰年。
  • fromisoformat():将 ISO 格式的字符串形式转换为 DateTime 对象。
  • isoformat():从 DateTime 对象生成 ISO 格式日期。
  • format():定义您的独特格式。

现在您已经了解了如何在 python 中创建 DateTime 对象,让我们看看 Pandas 库是如何支持它们的。

熊猫 to_datetime示例

使用 pandas,您可以执行各种数据分析任务,尤其是使用 python DateTime 对象。 一些突出的方法包括 to_datetime()。 以下是您的处理方式:

  • 通过 pandas 的 to_datetime 方法,您可以将字符串格式的日期和时间转换为 DateTime 对象

# to_datetime

date = pd.to_datetime('2020 年 4 月 24 日')

打印(日期)

打印(类型(日期))

结果

2021-02-23 00:00:00

<class pandas._libs.tslib.timestamp.Timestamp'>

你能注意到这里有什么奇怪的吗? pandas to_datetime返回的对象不一样。 它是 Timestamp 而不是 DateTime 对象。 这就是 Pandas 库返回对象的方式; 时间戳相当于 python 的 DateTime 功能。

日期时间的需要

有几个真实场景会在一段时间内收集信息,允许您提取日期和时间属性以了解特定问题。 例如,您想分析您的阅读习惯。 你可以挖掘你的模式来解构你喜欢在周末还是工作日、晚上还是早上等等阅读。 然后,你可以把一个月内想读的所有有趣的书籍和文章都积累起来,整理好你的日程安排。

有了这个,我们为您提供了关于在 python 和pandas DateTime中处理日期时间操作的“如何”摘要 我们希望您练习我们在本文中学到的知识,并掌握使用时间序列数据集的艺术!

学习世界顶尖大学的数据科学课程获得行政 PG 课程、高级证书课程或硕士课程,以加快您的职业生涯。

结论

如果您有兴趣了解更多有关 Python、它的各种库(包括 Pandas)及其在数据科学中的应用的信息,请查看 IIIT-B 和 upGrad 的数据科学 PG 文凭,该文凭专为在职专业人士创建,提供 10 多个案例研究和项目、实践实践研讨会、与行业专家的指导、与行业导师的一对一、400 多个小时的学习和顶级公司的工作协助。

哪些功能使 Pandas 成为受欢迎的图书馆?

以下是使 Pandas 成为最受欢迎的 Python 库之一的特性:
Pandas 为我们提供了各种数据帧,这些数据帧不仅允许有效的数据表示,而且使我们能够对其进行操作。
它提供有效的对齐和索引功能,提供标记和组织数据的智能方式。
Pandas 的一些特性使代码更简洁,增加了可读性,从而提高了效率。
它还可以读取多种文件格式。 JSON、CSV、HDF5 和 Excel 是 Pandas 支持的一些文件格式。
对于许多程序员来说,合并多个数据集是一个真正的挑战。 Pandas 也克服了这一点,并且非常有效地合并了多个数据集。
Pandas 还提供对其他重要 Python 库的访问,例如 Matplotlib 和 NumPy,这使其成为一个高效的库。

Pandas 的 DateTime 特性有哪些方法?

DateTime 是 Pandas 的一个重要功能,它以各种格式返回您所在位置的实时日期和时间。 以下是您可能会发现有用的一些功能:
replace():更新旧日期。
weekday():返回从星期一为 0 到星期日为 6 的每一天的整数值。
isoweekday():返回工作日的整数值,介于 1 到 7 之间。
isocalendar():从给定的数据集中切出“年”的日期值。
isleap():检查函数是否是闰年。
fromisoformat():将 ISO 格式的字符串形式转换为 DateTime 对象。
isoformat():从 DateTime 对象生成 ISO 格式日期。
format():定义您的独特格式。

Pandas 库与 Numpy 有何不同?

Pandas 和 Numpy 无疑是 Python 最常用的两个库。 以下比较确定了 Pandas 和 Numpy 库之间的核心差异。
A. 熊猫-
1. 首选用于分析和可视化表格数据。
2. 使用 Pandas 可以轻松导入各种文件格式的数据。 它支持 XLSX、ZIP、文本、HTML、XML、JSON 等。
3、在处理大量数据时表现出更快的性能。
4. 占用内存相对较多。
B. 麻木-
1. 适合进行数学运算和数值计算。
2. 本库支持多维数组存储的数据。
3. 在处理少量数据时表现更好。
4.它消耗更少的内存空间。