ميزة DateTime في Python و Pandas: ما الذي تحتاج إلى معرفته؟

نشرت: 2021-03-09

في هذه المقالة ، سنغطي ميزات الباندا DateTime ونقدم رؤى حول احتياجاتهم أثناء العمل مع مجموعات بيانات السلاسل الزمنية في Python.

تعد Python من بين أفضل خمس لغات برمجة من حيث الاستخدام في جميع أنحاء العالم. يستخدمه حوالي 44 ٪ من مطوري العالم بانتظام في المهام المتعلقة بعلوم البيانات. وهي مجموعة كبيرة ومتنوعة من مكتبات البايثون التي يجب أن يُنسب إليها الفضل في ذلك. Pandas هي واحدة من مكتبات تحليل البيانات.

إنه مكتوب بحتة بلغة C أو python ، مما يفسح المجال لشفرة مصدر خلفية محسّنة للغاية. علاوة على ذلك ، فإن لغة Python تتميز بتركيب واضح ومنحنى تعليمي منخفض ، مما يجعلها مثالية للمبتدئين. يمكن للمرء تنفيذ أي شيء من المشاريع الصغيرة إلى المشاريع الكبيرة بمعرفة هذه اللغة.

مطورو Python الذين لديهم مستوى كافٍ من المعرفة والخبرة بمكتبة Pandas مطالبون أيضًا بالعديد من وظائف علوم البيانات ، بما في ذلك محلل البيانات ومحلل الأعمال ومهندس التعلم الآلي. تتطلب هذه المسارات الوظيفية أن يكون المرشحون على دراية بالإحصاءات وتحليلات البيانات الضخمة والتحليلات التنبؤية (باستخدام Python) والتصور وما إلى ذلك.

لذلك ، يمكن لطلاب الهندسة المهتمين بالتحليلات الحصول على درجات متخصصة تؤكد على هذه المهارات. يمكنك إما الحصول على شهادات قصيرة الأجل مثل دبلوم PG في علوم البيانات من IIIT-Bangalore أو التفكير في الانضمام إلى البرامج المعتمدة عالميًا ، مثل M.Sc. في علم البيانات من جامعة ليفربول جون مورس (LJMU) ، إنجلترا.

الآن بعد أن قدمنا ​​لك خلفية موجزة عن أهمية الثعبان والباندا في مجال التكنولوجيا الحديثة ، فلنبدأ البرنامج التعليمي خطوة بخطوة حول الباندا DateTime .

جدول المحتويات

شرح متغيرات التاريخ والوقت

من المحتمل أن تواجه DateTime في المرحلة المتوسطة من تعلم Python ، على سبيل المثال عندما تعمل في مشروع. لنفترض أن عليك تنفيذ مشروع تجارة إلكترونية يتطلب منك وضع إستراتيجيات حول خط أنابيب سلسلة التوريد. سيشمل ذلك معرفة وقت طلبات الشحن وعدد أيام التسليم ، من بين أشياء أخرى.

إذا لم تكن معتادًا على مكونات التاريخ والوقت في Python ، فقد يكون من الصعب على المبتدئ حل هذا الجانب من علم البيانات لهذه المشكلة. من ناحية أخرى ، إذا كنت تعرف كيفية التعامل مع هذه الميزات ، فيمكنك جمع رؤى عميقة من أي مجموعة بيانات تقريبًا.

بالنسبة للمبتدئين ، تتعامل فئة التاريخ في لغة الثعبان مع التواريخ من التقويم الغريغوري. يقبل هذا الفصل "السنة والشهر واليوم" كوسائط عدد صحيح. في حين أن فئة الوقت تشتمل على وسيطات صحيحة تصل إلى ميكروثانية.

فيما يلي نظرة عامة على متغير DateTime من Python ، جنبًا إلى جنب مع وظيفة Pandas ، لتبدأ!

العمل مع DateTime في Python

ضع في اعتبارك أمثلة العبارات الواردة أدناه لفهم كيفية إنشاء كائن تاريخ لفئة DateTime في Python.

من تاريخ استيراد التاريخ والوقت

d1 = التاريخ (2021،2،23)

طباعة (d1)

طباعة (نوع (d1))

نتيجة

2021-04-23

<class 'datetime.date'>

الآن ، دعنا نستخرج بعض الميزات الأخرى ، مثل اليوم والشهر والسنة ، من كائن التاريخ الذي تم إنشاؤه أعلاه. سنفعل ذلك باستخدام كائن تاريخ اليوم المحلي الحالي ، والذي يتضمن استخدام وظيفة today ().

# تاريخ اليوم الحالي

d1 = date.today ()

طباعة (d1)

# يوم

طباعة ('Day:'، d1.day)

# شهر

print ('شهر:'، d1.month)

# عام

print ('Year:'، d1.year)

تم إرجاع كائن DateTime

2021-02-23

اليوم: 23

الشهر: 2

العام: 2021

فئة أخرى من الوحدة النمطية DateTime تقبل قيمًا صحيحة وتعيد كائنًا هي الوقت. دعونا نلقي نظرة على كيفية القيام بذلك في بيثون.

من وقت استيراد التاريخ والوقت

t1 = (12،20،12،40)

طباعة (t1)

طباعة (نوع (t1))

نتيجة

12: 20: 12.000040

<class 'datetime.time'>

كما ترى ، فإن كائن الوقت أعلاه قد انخفض إلى ميكروثانية. لذلك ، يمكنك الآن استخراج سمات الوقت مثل الساعة والدقيقة والثانية والميكرو ثانية من الكائن.

#ساعة

print ('الساعة:' t1.hour)

#اللحظة

print ('Minute:' t1.minute) التاريخ والوقت

يمكنك تكرار نفس الشيء لثوانٍ وميكروثانية.

فيما يلي بعض الطرق الأخرى التي قد تجدها مفيدة:

  • استبدل (): لتحديث التواريخ القديمة.
  • weekday (): لإرجاع قيمة عدد صحيح لأي يوم من أيام الأسبوع ؛ الإثنين 0 والأحد 6.
  • isoweekday (): لقيم الأعداد الصحيحة ليوم من أيام الأسبوع التي تتراوح من 1 إلى 7.
  • isocalendar (): لتقطيع قيمة يوم "السنة" من مجموعة بيانات معينة.
  • isleap (): للتحقق مما إذا كانت سنة كبيسة.
  • fromisoformat (): لتحويل نموذج السلسلة بتنسيق ISO إلى كائن DateTime.
  • isoformat (): لإنشاء تاريخ بتنسيق ISO من كائن التاريخ والوقت.
  • format (): لتحديد التنسيق الفريد الخاص بك.

الآن بعد أن فهمت كيفية إنشاء كائنات DateTime في Python ، دعنا نرى كيف تدعمها مكتبة Pandas.

الباندا to_datetime مثال

باستخدام الباندا ، يمكنك تنفيذ مجموعة متنوعة من مهام تحليل البيانات ، خاصةً مع كائنات Python DateTime. تتضمن بعض الطرق البارزة to_datetime (). إليك كيفية التعامل معها:

  • باستخدام طريقة pandas to_datetime ، يمكنك تحويل تاريخ ووقت تنسيق السلسلة إلى كائنات DateTime

# تاريخ_الوقت

التاريخ = pd.to_datetime ('24th of April، 2020 ′)

تاريخ الطباعة)

طباعة (نوع (تاريخ))

نتيجة

2021-02-23 00:00:00

<class pandas._libs.tslib.timestamp.Timestamp '>

هل يمكنك ملاحظة شيء غريب هنا؟ الكائن الذي تم إرجاعه بواسطة pandas to_datetime ليس هو نفسه. إنه طابع زمني بدلاً من كائن التاريخ والوقت. هذه هي الطريقة التي تُرجع بها مكتبة Pandas كائنًا ؛ الطابع الزمني هو ما يعادله لميزة DateTime من Python.

الحاجة إلى التاريخ والوقت

هناك العديد من سيناريوهات الحياة الواقعية حيث يتم جمع المعلومات على مدار فترة ، مما يسمح لك باستخراج سمات التاريخ والوقت لفهم مشكلة معينة. على سبيل المثال ، تريد تحليل عادات القراءة الخاصة بك. يمكنك البحث عن الأنماط الخاصة بك لتفكيك ما إذا كنت تفضل القراءة خلال عطلات نهاية الأسبوع أو أيام الأسبوع ، في الليل أو في الصباح ، وما إلى ذلك. بعد ذلك ، يمكنك تجميع كل الكتب والمقالات الشيقة التي تريد قراءتها خلال شهر وتنظيم جدولك الزمني.

من خلال هذا ، قدمنا ​​لك ملخصًا عن "كيفية" معالجة التلاعب بالتاريخ والوقت في لغة الثعبان وكذلك الباندا DateTime . نأمل أن تمارس ما تعلمناه في هذه المقالة وأن تتقن فن العمل باستخدام مجموعات بيانات السلاسل الزمنية!

تعلم دورات علوم البيانات من أفضل الجامعات في العالم. اربح برامج PG التنفيذية أو برامج الشهادات المتقدمة أو برامج الماجستير لتتبع حياتك المهنية بشكل سريع.

خاتمة

إذا كنت مهتمًا بمعرفة المزيد عن Python ، ومكتباتها المختلفة ، بما في ذلك Pandas ، وتطبيقها في علم البيانات ، فراجع IIIT-B & upGrad's دبلوم PG في علوم البيانات الذي تم إنشاؤه للمهنيين العاملين ويقدم أكثر من 10 دراسات حالة و المشاريع ، وورش العمل العملية ، والإرشاد مع خبراء الصناعة ، وجهاً لوجه مع موجهين في الصناعة ، وأكثر من 400 ساعة من التعلم والمساعدة في العمل مع الشركات الكبرى.

ما الميزات التي تجعل Pandas مكتبة شعبية؟

فيما يلي الميزات التي تجعل Pandas واحدة من مكتبات Python الأكثر شهرة:
تزودنا Pandas بإطارات بيانات مختلفة لا تسمح فقط بتمثيل فعال للبيانات ولكنها تمكننا أيضًا من معالجتها.
يوفر ميزات محاذاة وفهرسة فعالة توفر طرقًا ذكية لتصنيف البيانات وتنظيمها.
بعض ميزات Pandas تجعل الكود نظيفًا ويزيد من قابليته للقراءة ، مما يجعله أكثر كفاءة.
يمكنه أيضًا قراءة تنسيقات ملفات متعددة. JSON و CSV و HDF5 و Excel هي بعض تنسيقات الملفات التي يدعمها Pandas.
كان دمج مجموعات البيانات المتعددة تحديًا حقيقيًا للعديد من المبرمجين. تغلب الباندا على هذا أيضًا ودمج مجموعات بيانات متعددة بكفاءة عالية.
يوفر Pandas أيضًا الوصول إلى مكتبات Python المهمة الأخرى مثل Matplotlib و NumPy مما يجعلها مكتبة عالية الكفاءة.

ما هي طرق ميزة DateTime في Pandas؟

يعد DateTime ميزة مهمة في Pandas تُرجع تاريخ الوقت الحقيقي ووقت موقعك بتنسيقات مختلفة. فيما يلي بعض ميزاته التي قد تجدها مفيدة:
استبدال (): لتحديث التواريخ القديمة.
weekday (): إرجاع قيمة عدد صحيح لكل يوم بدءًا من الاثنين بالرقم 0 حتى الأحد على شكل 6.
isoweekday (): إرجاع قيم الأعداد الصحيحة ليوم من أيام الأسبوع بين 1 إلى 7.
isocalendar (): لتقطيع قيمة يوم "السنة" من مجموعة بيانات معينة.
isleap (): للتحقق من دالة إذا كانت سنة كبيسة.
fromisoformat (): لتحويل نموذج السلسلة بتنسيق ISO إلى كائن DateTime.
isoformat (): لإنشاء تاريخ بتنسيق ISO من كائن التاريخ والوقت.
format (): لتحديد التنسيق الفريد الخاص بك.

كيف تختلف مكتبة الباندا عن Numpy؟

لا شك أن Pandas و Numpy هما المكتبتان الأكثر استخدامًا في Python. تحدد المقارنة التالية الاختلافات الجوهرية بين مكتبات Pandas ومكتبات Numpy.
إيه. الباندا -
1. إنه مفضل لتحليل وتصور البيانات الجدولية.
2. يمكن استيراد البيانات من تنسيقات ملفات مختلفة بسهولة باستخدام Pandas. وهو يدعم XLSX ، و ZIP ، والنص ، و HTML ، و XML ، و JSON ، وما إلى ذلك.
3. إنها تظهر أداء أسرع عند التعامل مع كمية كبيرة من البيانات.
4. تأخذ مساحة أكبر نسبيًا في الذاكرة.
نومبي -
1. يفضل إجراء العمليات الحسابية والحسابات العددية.
2. يتم دعم البيانات المخزنة في مصفوفات متعددة الأبعاد في هذه المكتبة.
3. يؤدي بشكل أفضل عند التعامل مع كميات أقل من البيانات.
4. تستهلك مساحة ذاكرة أقل.