ما هو الإحصاء الوصفي؟ التعريف ، شرح الأنواع
نشرت: 2021-08-13يتم تنظيم الإحصاءات الوصفية وتلخيص خصائص مجموعة البيانات. يُعرف جمع الملاحظات من المجتمع أو العينة بالكامل بمجموعة البيانات. الخطوة الأولى بعد جمع البيانات هي وصف استجابات الخصائص مثل متوسط متغير واحد أو العلاقة بين متغيرين. على سبيل المثال ، يعطينا إيجاد علاقة بين العمر والإبداع تحليلًا إحصائيًا.
الخطوة التالية هي العثور على الإحصائيات الاستدلالية ، والتي تشير إلى ما إذا كانت بياناتك تدحض أو تؤكد الفرضية. كما أنه يساعدنا على تحديد ما إذا كان السكان المعممون يؤثرون عليه. في هذه الأيام ، يولي الباحثون أهمية كبيرة لعلوم البيانات والبيانات الضخمة ، مما يجعل هذه البيانات تتم معالجتها بأقصى قدر من التدقيق. هذا هو المكان الذي يبدأ فيه الإحصاء الوصفي.
تتمثل إحدى الخطوات الأساسية لتحليل الإحصاء الوصفي في أنه يعطي أوصافًا ، ويعرض نقاط البيانات بشكل بناء ، ويوفر معلومات بيانات ثاقبة. يمنحك أيضًا استنتاجًا لتوزيع البيانات ، ويساعدك على اكتشاف القيم المتطرفة ، ويمكّنك من تحديد أوجه التشابه بين المتغيرات.
جدول المحتويات
أنواع الإحصاء الوصفي
التوزيع بتكرار
يُظهر توزيع التردد عدد أو تكرار النتائج المختلفة في عينة أو مجموعة بيانات. يتم استخدامه لكل من البيانات النوعية والكمية ويتم تقديمه عادةً في شكل رسم بياني أو جدول. كل إدخال في الرسم البياني أو الجدول يكون مصحوبًا بتكرار أو عدد تكرارات القيم في نطاق أو فاصل زمني أو مجموعة محددة.
لتوضيح ذلك ، هو ملخص أو عرض تقديمي للبيانات المجمعة المصنفة بناءً على الفئات الحصرية. كما أنه يعرض عدد التكرارات في كل فئة معنية. وبالتالي ، فإنه يشير إلى طريقة أكثر تنظيماً وتنظيماً لتقديم البيانات الأولية.
بعض أمثلة بيانات توزيع التردد عبارة عن رسوم بيانية أو مخططات مستخدمة في عرض التردد. بالإضافة إلى ذلك ، تعد المخططات الدائرية والمخططات الشريطية والمخططات الخطية والمدرج التكراري أيضًا مؤشرًا لتوزيع التردد.
النزعة المركزية
يشير الاتجاه المركزي عمومًا إلى ملخص مجموعة البيانات الوصفية ، باستخدام قيمة واحدة تعكس مركز توزيع البيانات. وبالتالي ، تُعرف مقاييس الاتجاه المركزي عمومًا باسم مقاييس الموقع المركزي. الجوانب الثلاثة الأساسية للاتجاه المركزي هي:
يعني
يعتبر الوسط هو الاتجاه المركزي الأكثر شعبية. إنها القيمة المتوسطة أو الأكثر شيوعًا لمجموعة البيانات. لتحديد المتوسط ، هو أبسط متوسط رياضي لرقمين أو أكثر. يتم الحصول على المتوسط من خلال مجموعة الأرقام في البيانات ، والتي يمكن حسابها بأكثر من طريقة. هناك نوعان من المتوسطات - المتوسط الحسابي والمتوسط الهندسي.
على سبيل المثال ، للعثور على متوسط مجموعة البيانات التالية ؛ 2،3،4،5،6. بعد ذلك ، يكون متوسط هذه البيانات هو أربعة عن طريق إضافة مجموعة البيانات ببساطة وتقسيمها على عدد القيم في مجموعة البيانات.
الوسيط
الوسيط هو الدرجة المتوسطة لأي مجموعة بيانات بترتيب تصاعدي أو تنازلي. وبالتالي ، فإن قائمة الأرقام وصفية في مجموعة البيانات أكثر من المتوسط.
على سبيل المثال ، في حالة مجموعة البيانات الفردية {3 ، 13 ، 2 ، 34 ، 11 ، 26 ، 47} ، تحتاج أولاً إلى ترتيب البيانات {2،3،11،13،26،34،47 } ، الوسيط هنا هو 13 لأن هناك أعدادًا متساوية على جانبي المتسلسلة. من ناحية أخرى ، في حالة مجموعة البيانات الزوجية {3 ، 13 ، 2 ، 34 ، 11 ، 17 ، 27 ، 47} ، تحتاج أولاً إلى ترتيب البيانات بترتيب {2،3،11،13 ، 17،26،34،47} ، هنا الوسيط سيكون مجموع رقمين في منتصف السلسلة مقسومًا على 2. لذلك ، فإن الوسيط سيكون 13 + 17/2 ، وهو ما يساوي 15.
الوضع
يشير الوضع إلى قيمة النتيجة الأكثر شيوعًا في البيانات. قد تحتوي مجموعة البيانات على وضع واحد ، وأكثر من وضع واحد ، ولا يوجد وضع على الإطلاق.
على سبيل المثال ، مجموعة البيانات التي تحتوي على أرقام {3،5،6،6،6،8،9} ، سيكون الوضع 6 ، وفي حالة عدم وجود نفس الأرقام لمجموعة البيانات ، عندئذٍ تعتبر هذه البيانات بلا وضع .
تقلب
التباين هو مقياس للإحصاءات الموجزة التي تعكس درجة التشتت في عينة. كما يقيس التباين الذي يحدد مدى تباعد نقاط البيانات عن المركز.
يشير الانتشار والتشتت والتباين إلى عرض ونطاق قيم التوزيع في البيانات. يتم استخدام الانحراف المعياري والتباين والنطاق لتصوير جوانب ومكونات مختلفة للانتشار.
النطاق في مجموعة القيم يصور درجة التشتت أو المسافة المثالية بين أدنى وأعلى القيم ضمن البيانات. يستخدم الانحراف المعياري لإنشاء متوسط التباين في مجموعة من البيانات. كما يوفر نظرة ثاقبة على الاختلاف أو المسافة بين القيم في مجموعة البيانات. يصور القيمة المتوسطة للبيانات أيضًا. أخيرًا ، يعكس درجة الانتشار.
أهمية الإحصاء الوصفي
بيانات يقظة
يجب أن تمتلك البيانات التي يتم جمعها للإحصاء الوصفي درجة عالية من الموضوعية. لذلك ، يحتاج المرء إلى توخي مزيد من اليقظة لأنه إذا أظهرت الإحصائيات خصائص مختلفة للبيانات المستخرجة ولا تتطابق مع الاتجاهات ، فلن تكون ذات فائدة.
نهج أوسع
يتم قياس الإحصاء الوصفي ليكون أوسع من الطريقة الكمية. يهدف إلى تقديم صورة أوسع للظاهرة أو الحدث. يمكن أن يستخدم هذا عددًا واحدًا من المتغيرات أو أي عدد من المتغيرات لإجراء البحث.
العلاقة الطبيعية
تعتبر هذه البيانات الإحصائية طريقة أفضل لجمع المعلومات لأنها طبيعية وتعرض العالم كما هو. يبحث في السلوك الواقعي للبيانات للتأكد من دقة الاتجاهات المستخرجة.
مرن
يعطي الإحصاء الوصفي الدراسة طريقة جديدة لتعلم الأشياء. على سبيل المثال ، يمكن للباحثين استخدام دراسة حالة ترتبط بكل من الارتباط والنوعية لوصف ظاهرة الإحصاء الوصفي. يمكن للمرء استخدام دراسات الحالة لوصف الأحداث والأشخاص والمؤسسات. سيمكن هذا الباحثين من فهم أنماط البيانات والسلوك.
احصل على شهادة علوم البيانات عبر الإنترنت من أفضل الجامعات في العالم. اربح برامج PG التنفيذية أو برامج الشهادات المتقدمة أو برامج الماجستير لتتبع حياتك المهنية بشكل سريع.
تحديد المتغيرات والفرضيات
تأتي الإحصاءات الوصفية في متناول اليد أثناء تحديد الفرضيات والمتغيرات الجديدة التي يمكن تحليلها بشكل أكبر من خلال الدراسات التجريبية والاستنتاجية. علاوة على ذلك ، فهي مفيدة جدًا لأن هامش الخطأ ضئيل نسبيًا ، ويتم الحصول على الاتجاهات مباشرة من خصائص البيانات.
ليستنتج
الإحصائيات الوصفية ضرورية لتصور البيانات لأنها تمكن خبراء البيانات من تقديم نتائجهم بشكل هادف بحيث يمكن لأصحاب المصلحة التقنيين وغير التقنيين فهمها. من خلال تلخيص البيانات الكمية المعقدة من خلال تمثيلات رسومية مناسبة ، تعمل الإحصائيات الوصفية على تبسيط عملية تفسير البيانات ، مما يسهل على الشركات اتخاذ قرارات تستند إلى البيانات.
إذا كنت مهتمًا بمعرفة المزيد حول المفاهيم والأساليب الإحصائية المختلفة المستخدمة في علم البيانات ، فتأكد من مراجعة برنامج upGrad التنفيذي PG في دورات علوم البيانات . يتم تدريس هذه الدورات من قبل أعضاء هيئة التدريس من أفضل الجامعات الوطنية والأجنبية ، وسوف تزودك بالمهارات والمعرفة ذات الصلة بالصناعة.