PythonとPandasのDateTime機能:知っておくべきことは?

公開: 2021-03-09

この記事では、パンダのDateTime機能について説明し、Pythonで時系列データセットを操作する際のパンダのニーズについての洞察を提供します。

Pythonは、世界中で使用されているプログラミング言語の上位5つに含まれています。 世界の開発者の44%が、データサイエンス関連のタスクに定期的に使用しています。 そして、これについてクレジットする必要があるのは、多種多様なPythonライブラリです。 パンダはそのようなデータ分析ライブラリの1つです。

純粋にCまたはPythonで記述されており、高度に最適化されたバックエンドソースコードに道を譲ります。 さらに、Pythonは明確な構文と低い学習曲線を備えており、初心者に最適です。 この言語の知識があれば、マイクロプロジェクトからマクロ企業まで何でも実装できます。

Pandasライブラリに関する十分なレベルの知識と経験を持つPython開発者は、データアナリスト、ビジネスアナリスト、機械学習エンジニアなど、いくつかのデータサイエンスの仕事にも需要があります。 これらのキャリアの軌跡では、候補者は統計、ビッグデータ分析、予測分析(Pythonを使用)、視覚化などに精通している必要があります。

したがって、分析に関心のある工学部の学生は、これらのスキルを強調する専門的な学位を取得することができます。 IIIT-BangaloreのデータサイエンスのPGディプロマのような短期認定を取得するかM.Scなどの世界的に認定されたプログラムへの参加を検討することができます。 イギリスのリバプールジョンムーア大学(LJMU)でデータサイエンスの博士号を取得。

現代の技術分野におけるPythonとパンダの関連性の簡単な背景を説明したので、パンダのDateTimeに関するステップバイステップのチュートリアルを始めましょう

目次

DateTime変数の説明

プロジェクトに取り組んでいるときなど、Pythonの学習の中間段階でDateTimeに遭遇する可能性があります。 サプライチェーンパイプラインについて戦略を立てる必要があるeコマースプロジェクトを実装する必要があるとします。 これには、注文の発送までの時間、配達までの日数などを把握することが含まれます。

Pythonの日付と時刻のコンポーネントに精通していない場合、この問題のこのデータサイエンスの側面は、初心者にとっては難しいかもしれません。 一方、これらの機能の処理方法を知っている場合は、ほとんどすべてのデータセットから深い洞察を収集できます。

初心者の場合、Pythonの日付クラスはグレゴリオ暦の日付を扱います。 このクラスは、整数引数として「年、月、日」を受け入れます。 一方、時間クラスはマイクロ秒までの整数引数で構成されます。

これは、PythonのDateTime変数の概要と、Pandas関数を使用して開始するためのものです。

PythonでのDateTimeの操作

PythonでDateTimeクラスの日付オブジェクトを作成する方法を理解するために、以下に示すステートメントの例を検討してください。

日時インポート日から

d1 =日付(2021,2,23)

print(d1)

print(type(d1))

結果

2021-04-23

<クラス'datetime.date'>

次に、上記で作成した日付オブジェクトから、日、月、年などの他の機能を抽出してみましょう。 これは、today()関数の使用を含む現在のローカル日の日付オブジェクトを使用して行います。

#現在の日付

d1 = date.today()

print(d1)

# 日

印刷('日:'、d1.day)

# 月

print('月:'、d1.month)

# 年

print('年:'、d1.year)

返されたDateTimeオブジェクト

2021-02-23

日:23

月:2

年:2021年

整数値を受け入れてオブジェクトを返すDateTimeモジュールの別のクラスはtimeです。 Pythonでどのように行われるかを見てみましょう。

日時インポート時刻から

t1 =(12,20,12,40)

print(t1)

print(type(t1))

結果

12:20:12.000040

<クラス'datetime.time'>

ご覧のとおり、上記の時間オブジェクトはマイクロ秒単位です。 そのため、オブジェクトから時間、分、秒、マイクロ秒などの時間属性を抽出できるようになりました。

#時間

print('時間:' t1.hour)

#分

print('分:' t1.minute)DateTime

同じことを数秒とマイクロ秒繰り返すことができます。

役立つと思われる他の方法を次に示します。

  • replace():古い日付を更新します。
  • weekday():任意の曜日の整数値を返します。 月曜日は0、日曜日は6です。
  • isoweekday():1〜7の平日の整数値の場合。
  • isocalendar():指定されたデータセットから「年」の日の値をスライスします。
  • isleap():うるう年かどうかを確認します。
  • fromisoformat():ISO形式の文字列形式をDateTimeオブジェクトに変換します。
  • isoformat():DateTimeオブジェクトからISO形式の日付を生成します。
  • format():独自のフォーマットを定義します。

PythonでDateTimeオブジェクトを作成する方法を理解したので、Pandasライブラリがそれらをどのようにサポートするかを見てみましょう。

パンダto_datetimeの

パンダを使用すると、特にpython DateTimeオブジェクトを使用して、さまざまなデータ分析タスクを実行できます。 著名なメソッドには、to_datetime()が含まれます。 処理方法は次のとおりです。

  • pandas to_datetimeメソッドを使用すると、文字列形式の日付と時刻をDateTimeオブジェクトに変換できます。

#to_datetime

date = pd.to_datetime( '2020年4月24日')

印刷(日付)

印刷(type(date))

結果

2021-02-23 00:00:00

<class pandas._libs.tslib.timestamp.Timestamp'>

ここで何か奇妙なことに気付くことができますか? pandasto_datetimeによって返されるオブジェクトは同じではありません。 これは、DateTimeオブジェクトではなくタイムスタンプです。 これは、Pandasライブラリがオブジェクトを返す方法です。 タイムスタンプは、PythonのDateTime機能に相当します。

日時の必要性

情報が一定期間にわたって収集される実際のシナリオがいくつかあり、特定の問題を理解するために日付と時刻の属性を抽出できます。 たとえば、読書の習慣を分析したいとします。 パターンを掘り下げて、週末や平日、夜や朝などに読書を好むかどうかを分解することができます。 そうすれば、1か月で読みたい興味深い本や記事をすべて集めて、スケジュールを整理することができます。

これにより、PythonとパンダのDateTimeでの日時操作の処理に関する「ハウツー」の概要を説明しました この記事で学んだことを実践し、時系列データセットを操作する技術を習得してください。

世界のトップ大学からデータサイエンスコース学びましょうエグゼクティブPGプログラム、高度な証明書プログラム、または修士プログラムを取得して、キャリアを早急に進めましょう。

結論

Python、Pandasを含むさまざまなライブラリ、およびデータサイエンスへの応用について詳しく知りたい場合は、働く専門家向けに作成され、10以上のケーススタディを提供するIIIT-BおよびupGradのデータサイエンスのPGディプロマをご覧ください。プロジェクト、実践的なハンズオンワークショップ、業界の専門家とのメンターシップ、業界のメンターとの1対1、400時間以上の学習とトップ企業との仕事の支援。

パンダを人気のあるライブラリにする機能は何ですか?

以下は、Pandasを最も人気のあるPythonライブラリの1つにする機能です。
パンダは、効率的なデータ表現を可能にするだけでなく、それを操作することもできるさまざまなデータフレームを提供します。
データにラベルを付けて整理するインテリジェントな方法を提供する、効率的な配置およびインデックス作成機能を提供します。
Pandasの一部の機能により、コードがクリーンになり、読みやすさが向上するため、コードがより効率的になります。
また、複数のファイル形式を読み取ることもできます。 JSON、CSV、HDF5、およびExcelは、Pandasでサポートされているファイル形式の一部です。
複数のデータセットをマージすることは、多くのプログラマーにとって大きな課題でした。 パンダもこれを克服し、複数のデータセットを非常に効率的にマージします。
Pandasは、MatplotlibやNumPyなどの他の重要なPythonライブラリへのアクセスも提供するため、非常に効率的なライブラリになります。

パンダのDateTime機能のメソッドは何ですか?

DateTimeは、現在地のリアルタイムの日付と時刻をさまざまな形式で返すPandasの重要な機能です。 以下は、役立つと思われる機能の一部です。
replace():古い日付を更新します。
weekday():月曜日を0として、日曜日を6として開始する毎日の整数値を返します。
isoweekday():1から7までの平日の整数値を返します。
isocalendar():指定されたデータセットから「年」の日の値をスライスします。
isleap():うるう年かどうか関数をチェックします。
fromisoformat():ISO形式の文字列形式をDateTimeオブジェクトに変換します。
isoformat():DateTimeオブジェクトからISO形式の日付を生成します。
format():独自のフォーマットを定義します。

PandasライブラリはNumpyとどのように異なりますか?

PandasとNumpyは、間違いなくPythonで最もよく使用される2つのライブラリです。 次の比較は、PandasライブラリとNumpyライブラリの主な違いを示しています。
A.パンダ-
1.表形式のデータの分析と視覚化に適しています。
2. Pandasを使用すると、さまざまなファイル形式のデータを簡単にインポートできます。 XLSX、ZIP、テキスト、HTML、XML、JSONなどをサポートします。
3.大量のデータを処理すると、パフォーマンスが向上します。
4.メモリ内のスペースが比較的多くなります。
B.ゴツゴツ-
1.数学演算や数値計算を行う場合に適しています。
2.多次元配列に格納されているデータは、このライブラリでサポートされています。
3.少量のデータを処理するとパフォーマンスが向上します。
4.それはより少ないメモリスペースを消費します。