Python 和 Pandas 的 DateTime 特性:你需要知道什麼?
已發表: 2021-03-09在本文中,我們將介紹pandas 的 DateTime功能,並在使用 Python 處理時間序列數據集時提供對它們需求的見解。
Python 是全球使用量排名前五的編程語言之一。 全球約44% 的開發人員經常將其用於與數據科學相關的任務。 這需要歸功於種類繁多的python庫。 Pandas 就是這樣一種數據分析庫。
它純粹是用 C 或 python 編寫的,為高度優化的後端源代碼讓路。 此外,python 語法清晰,學習曲線低,非常適合初學者。 有了這門語言的知識,就可以實現從微型項目到宏觀企業的任何事情。
對 Pandas 庫有足夠知識和經驗的 Python 開發人員也需要一些數據科學工作,包括數據分析師、業務分析師和機器學習工程師。 這些職業軌跡要求候選人熟悉統計、大數據分析、預測分析(使用 python)、可視化等。
因此,對分析感興趣的工科學生可以攻讀強調這些技能的專業學位。 您可以追求短期認證,例如IIIT-Bangalore的數據科學 PG 文憑,或者考慮加入全球認可的課程,例如M.Sc。 英國利物浦約翰摩爾斯大學 (LJMU)數據科學博士。
現在我們已經為您簡要介紹了 python 和 pandas 在現代科技領域的相關性,讓我們開始我們關於pandas DateTime的分步教程。
目錄
解釋日期時間變量
在學習 python 的中間階段,你可能會遇到 DateTime,比如當你在做一個項目時。 假設您必須實施一個電子商務項目,該項目需要您制定供應鏈管道戰略。 這將包括確定運輸訂單的時間、交貨天數等。
如果您不熟悉 Python 中的日期和時間組件,那麼對於新手來說,這個問題的數據科學方面可能很難破解。 另一方面,如果您知道如何處理這些特徵,您幾乎可以從任何數據集中收集深刻的見解。
對於初學者來說,python 中的日期類處理公曆中的日期。 此類接受“年、月和日”作為整數參數。 然而,時間類包含最大為微秒的整數參數。
這是 python 的 DateTime 變量以及 Pandas 函數的概述,可以幫助您入門!
在 Python 中使用 DateTime
考慮下面給出的示例語句,以了解如何在 python 中創建 DateTime 類的日期對象。
從日期時間導入日期
d1 = 日期 (2021,2,23)
打印(d1)
打印(類型(d1))
結果
2021-04-23
<class 'datetime.date'>
現在,讓我們從上面創建的日期對像中提取一些其他特徵,例如日、月和年。 我們將使用當前本地日期對象來執行此操作,這涉及到使用 today() 函數。
# 當前日期
d1 = date.today()
打印(d1)
# 日
打印('天:',d1.day)
# 月
print('月份:', d1.month)
# 年
print('年份:',d1.year)
返回的日期時間對象
2021-02-23
天 : 23
月 : 2
年份 : 2021
DateTime 模塊的另一類接受整數值並返回一個對像是時間。 讓我們看看它是如何在 python 中完成的。
從日期時間導入時間
t1 = (12,20,12,40)
打印(t1)
打印(類型(t1))
結果
12:20:12.000040
<class 'datetime.time'>
如您所見,上述時間對象精確到微秒。 因此,您現在可以從對像中提取時間屬性,例如小時、分鐘、秒和微秒。
#小時
print('小時:'t1.hour)
#分鐘
print('Minute:'t1.minute)DateTime
你可以重複同樣的事情幾秒和幾微秒。
以下是您會發現有用的其他一些方法:
- replace():更新舊日期。
- weekday():返回一周中任何一天的整數值; 星期一是 0,星期日是 6。
- isoweekday():適用於 1 到 7 之間的工作日整數值。
- isocalendar():從給定的數據集中切出“年”的日期值。
- isleap():檢查是否是閏年。
- fromisoformat():將 ISO 格式的字符串形式轉換為 DateTime 對象。
- isoformat():從 DateTime 對像生成 ISO 格式日期。
- format():定義您的獨特格式。
現在您已經了解瞭如何在 python 中創建 DateTime 對象,讓我們看看 Pandas 庫是如何支持它們的。
熊貓 to_datetime示例
使用 pandas,您可以執行各種數據分析任務,尤其是使用 python DateTime 對象。 一些突出的方法包括 to_datetime()。 以下是您的處理方式:
- 通過 pandas 的 to_datetime 方法,您可以將字符串格式的日期和時間轉換為 DateTime 對象
# to_datetime
date = pd.to_datetime('2020 年 4 月 24 日')
打印(日期)
打印(類型(日期))
結果
2021-02-23 00:00:00
<class pandas._libs.tslib.timestamp.Timestamp'>
你能注意到這裡有什麼奇怪的嗎? pandas to_datetime返回的對像不一樣。 它是 Timestamp 而不是 DateTime 對象。 這就是 Pandas 庫返回對象的方式; 時間戳相當於 python 的 DateTime 功能。
日期時間的需要
有幾個真實場景會在一段時間內收集信息,允許您提取日期和時間屬性以了解特定問題。 例如,您想分析您的閱讀習慣。 你可以挖掘你的模式來解構你喜歡在周末還是工作日、晚上還是早上等等閱讀。 然後,你可以把一個月內想讀的所有有趣的書籍和文章都積累起來,整理好你的日程安排。
有了這個,我們為您提供了關於在 python 和pandas DateTime中處理日期時間操作的“如何”摘要。 我們希望您練習我們在本文中學到的知識,並掌握使用時間序列數據集的藝術!
學習世界頂尖大學的數據科學課程。 獲得行政 PG 課程、高級證書課程或碩士課程,以加快您的職業生涯。
結論
如果您有興趣了解更多有關 Python、它的各種庫(包括 Pandas)及其在數據科學中的應用的信息,請查看 IIIT-B 和 upGrad 的數據科學 PG 文憑,該文憑專為在職專業人士創建,提供 10 多個案例研究和項目、實踐實踐研討會、與行業專家的指導、與行業導師的一對一、400 多個小時的學習和頂級公司的工作協助。
以下是使 Pandas 成為最受歡迎的 Python 庫之一的特性: DateTime 是 Pandas 的一個重要功能,它以各種格式返回您所在位置的實時日期和時間。 以下是您可能會發現有用的一些功能: Pandas 和 Numpy 無疑是 Python 最常用的兩個庫。 以下比較確定了 Pandas 和 Numpy 庫之間的核心差異。哪些功能使 Pandas 成為受歡迎的圖書館?
Pandas 為我們提供了各種數據幀,這些數據幀不僅允許有效的數據表示,而且使我們能夠對其進行操作。
它提供有效的對齊和索引功能,提供標記和組織數據的智能方式。
Pandas 的一些特性使代碼更簡潔,增加了可讀性,從而提高了效率。
它還可以讀取多種文件格式。 JSON、CSV、HDF5 和 Excel 是 Pandas 支持的一些文件格式。
對於許多程序員來說,合併多個數據集是一個真正的挑戰。 Pandas 也克服了這一點,並且非常有效地合併了多個數據集。
Pandas 還提供對其他重要 Python 庫的訪問,例如 Matplotlib 和 NumPy,這使其成為一個高效的庫。 Pandas 的 DateTime 特性有哪些方法?
replace():更新舊日期。
weekday():返回從星期一為 0 到星期日為 6 的每一天的整數值。
isoweekday():返回工作日的整數值,介於 1 到 7 之間。
isocalendar():從給定的數據集中切出“年”的日期值。
isleap():檢查函數是否是閏年。
fromisoformat():將 ISO 格式的字符串形式轉換為 DateTime 對象。
isoformat():從 DateTime 對像生成 ISO 格式日期。
format():定義您的獨特格式。 Pandas 庫與 Numpy 有何不同?
A. 熊貓-
1. 首選用於分析和可視化表格數據。
2. 使用 Pandas 可以輕鬆導入各種文件格式的數據。 它支持 XLSX、ZIP、文本、HTML、XML、JSON 等。
3、在處理大量數據時表現出更快的性能。
4. 佔用內存相對較多。
B. 麻木-
1. 適合進行數學運算和數值計算。
2. 本庫支持多維數組存儲的數據。
3. 在處理少量數據時表現更好。
4.它消耗更少的內存空間。