สถิติเชิงพรรณนาคืออะไร? ความหมาย ประเภทอธิบาย
เผยแพร่แล้ว: 2021-08-13สถิติเชิงพรรณนาได้รับการจัดระเบียบและสรุปคุณลักษณะของชุดข้อมูล การรวบรวมข้อสังเกตจากประชากรทั้งหมดหรือกลุ่มตัวอย่างเรียกว่าชุดข้อมูล ขั้นตอนแรกหลังจากรวบรวมข้อมูลคือการอธิบายการตอบสนองของคุณลักษณะต่างๆ เช่น ค่าเฉลี่ยของตัวแปรหนึ่งตัวหรือความสัมพันธ์ระหว่างตัวแปรสองตัว ตัวอย่างเช่น การค้นหาความเชื่อมโยงระหว่างอายุกับความคิดสร้างสรรค์ทำให้เราวิเคราะห์ทางสถิติได้
ขั้นตอนต่อไปคือการหาสถิติอนุมาน ซึ่งระบุว่าข้อมูลของคุณหักล้างหรือยืนยันสมมติฐานหรือไม่ นอกจากนี้ยังช่วยให้เราตัดสินใจว่าประชากรทั่วไปมีอิทธิพลต่อมันหรือไม่ ทุกวันนี้ นักวิจัยให้ความสำคัญอย่างมากกับวิทยาศาสตร์ข้อมูลและข้อมูลขนาดใหญ่ ทำให้ข้อมูลนี้ถูกประมวลผลด้วยการตรวจสอบอย่างละเอียดถี่ถ้วน นี่คือจุดเริ่มต้นของสถิติเชิงพรรณนา
ขั้นตอนสำคัญประการหนึ่งในการวิเคราะห์สถิติเชิงพรรณนาคือการให้คำอธิบาย แสดงจุดข้อมูลอย่างสร้างสรรค์ และให้ข้อมูลข้อมูลเชิงลึก นอกจากนี้ยังให้ข้อสรุปของการกระจายข้อมูล ช่วยคุณตรวจจับค่าผิดปกติ และช่วยให้คุณสามารถระบุความคล้ายคลึงระหว่างตัวแปรต่างๆ
สารบัญ
ประเภทของสถิติเชิงพรรณนา
การกระจายความถี่
การกระจายความถี่จะแสดงจำนวนหรือความถี่ของผลลัพธ์ต่างๆ ในกลุ่มตัวอย่างหรือชุดข้อมูล ใช้สำหรับทั้งข้อมูลเชิงคุณภาพและเชิงปริมาณ และโดยทั่วไปจะแสดงในรูปแบบกราฟหรือตาราง แต่ละรายการในกราฟหรือตารางจะมาพร้อมกับความถี่หรือจำนวนของค่าที่เกิดขึ้นในช่วง ช่วงเวลา หรือกลุ่มเฉพาะ
เพื่อให้ชัดเจน เป็นการสรุปหรือการนำเสนอของข้อมูลที่จัดกลุ่มตามคลาสพิเศษ นอกจากนี้ยังแสดงจำนวนครั้งในแต่ละหมวดหมู่ที่เกี่ยวข้อง ดังนั้นจึงบ่งชี้ถึงวิธีการที่มีระเบียบและมีโครงสร้างมากขึ้นในการนำเสนอข้อมูลดิบ
ตัวอย่างข้อมูลการกระจายความถี่ ได้แก่ กราฟหรือแผนภูมิที่ใช้ในการนำเสนอความถี่ นอกจากนี้ แผนภูมิวงกลม แผนภูมิแท่ง แผนภูมิเส้น และฮิสโตแกรมยังเป็นตัวบ่งชี้การกระจายความถี่อีกด้วย
แนวโน้มกลาง
แนวโน้มจากส่วนกลางโดยทั่วไปหมายถึงสรุปชุดข้อมูลเชิงพรรณนา โดยใช้ค่าเดียวที่สะท้อนถึงศูนย์กลางของการกระจายข้อมูล ดังนั้นการวัดแนวโน้มจากส่วนกลางจึงเป็นที่รู้จักกันอย่างแพร่หลายว่าเป็นการวัดตำแหน่งศูนย์กลาง สามประเด็นหลักของแนวโน้มศูนย์กลางคือ:
หมายถึง
ค่าเฉลี่ยถือเป็นแนวโน้มศูนย์กลางที่ได้รับความนิยมมากที่สุด เป็นค่าเฉลี่ยหรือค่าทั่วไปของชุดข้อมูล เพื่อกำหนดค่าเฉลี่ย มันคือค่าเฉลี่ยทางคณิตศาสตร์ที่ง่ายที่สุดของตัวเลขสองตัวหรือมากกว่า ค่าเฉลี่ยถูกกำหนดโดยชุดของตัวเลขในข้อมูล ซึ่งสามารถคำนวณได้มากกว่าหนึ่งวิธี ค่าเฉลี่ยมีสองประเภท – ค่าเฉลี่ยเลขคณิตและค่าเฉลี่ยเรขาคณิต
ตัวอย่างเช่น การหาค่าเฉลี่ยของชุดข้อมูลต่อไปนี้ 2,3,4,5,6. จากนั้น ค่าเฉลี่ยของข้อมูลนี้คือสี่โดยการเพิ่มชุดข้อมูลและหารด้วยจำนวนค่าในชุดข้อมูล
ค่ามัธยฐาน
ค่ามัธยฐานคือคะแนนกลางของชุดข้อมูลใดๆ ที่เรียงลำดับจากน้อยไปมากหรือมากไปหาน้อย ดังนั้น รายการตัวเลขในชุดข้อมูลจึงมีคำอธิบายมากกว่าค่าเฉลี่ย
ตัวอย่างเช่น ในกรณีของชุดข้อมูลคี่ที่ {3, 13, 2, 34, 11, 26,47} คุณต้องจัดเรียงข้อมูลก่อน {2,3,11,13,26,34,47 } ในที่นี้ค่ามัธยฐานคือ 13 เนื่องจากมีตัวเลขเท่ากันที่ด้านใดด้านหนึ่งของชุดข้อมูล ในทางกลับกัน ในกรณีที่ชุดข้อมูลมีค่าเท่ากับ {3, 13, 2, 34, 11, 17, 27, 47} คุณต้องจัดเรียงข้อมูลตามลำดับ {2,3,11,13, 17,26,34,47} ในที่นี้ค่ามัธยฐานจะเป็นผลรวมของตัวเลขสองหลักที่อยู่ตรงกลางของอนุกรมหารด้วย 2 ดังนั้นค่ามัธยฐานจะเป็น 13+17/2 ซึ่งเท่ากับ 15
โหมด
โหมดหมายถึงค่าคะแนนที่บ่อยที่สุดในข้อมูล ชุดข้อมูลอาจมีหนึ่งโหมด มากกว่าหนึ่งโหมด และไม่มีโหมดเลย
ตัวอย่างเช่น ชุดข้อมูลที่มีตัวเลข {3,5,6,6,6,8,9} โหมดจะเป็น 6 และในกรณีที่ชุดข้อมูลไม่มีตัวเลขเหมือนกัน จะถือว่าข้อมูลนั้นไม่มีโหมด .
ความแปรปรวน
ความแปรปรวนคือการวัดสถิติสรุปที่สะท้อนถึงระดับการกระจายตัวในตัวอย่าง นอกจากนี้ยังวัดความแปรปรวนที่กำหนดระยะที่จุดข้อมูลปรากฏจากจุดศูนย์กลาง
การแพร่กระจาย การกระจาย และความแปรปรวนหมายถึงความกว้างและช่วงของค่าการกระจายในข้อมูล ส่วนเบี่ยงเบนมาตรฐาน ความแปรปรวน และช่วงใช้เพื่ออธิบายลักษณะและส่วนประกอบต่างๆ ของการแพร่กระจาย
ช่วงในชุดค่าแสดงระดับการกระจายตัวหรือระยะห่างในอุดมคติระหว่างค่าต่ำสุดและสูงสุดภายในข้อมูล ค่าเบี่ยงเบนมาตรฐานใช้ในการสร้างความแปรปรวนเฉลี่ยในชุดข้อมูล นอกจากนี้ยังให้ข้อมูลเชิงลึกเกี่ยวกับความแตกต่างหรือระยะห่างระหว่างค่าในชุดข้อมูล มันแสดงให้เห็นค่าเฉลี่ยของข้อมูลเช่นกัน ในที่สุดก็สะท้อนถึงระดับของการแพร่กระจาย
ความสำคัญของสถิติเชิงพรรณนา
ข้อมูลเฝ้าระวัง
ข้อมูลที่รวบรวมสำหรับสถิติเชิงพรรณนาต้องมีความเป็นกลางในระดับสูง ดังนั้น เราจึงต้องระมัดระวังเป็นพิเศษ เพราะหากสถิติแสดงลักษณะที่แตกต่างกันของข้อมูลที่ดึงออกมาและไม่ตรงกับแนวโน้ม มันจะไม่มีประโยชน์
แนวทางที่กว้างขึ้น
สถิติเชิงพรรณนาวัดได้กว้างกว่าวิธีเชิงปริมาณ มีจุดมุ่งหมายเพื่อให้ภาพรวมของปรากฏการณ์หรือเหตุการณ์ที่กว้างขึ้น ซึ่งสามารถใช้ตัวแปรจำนวนเดียวหรือตัวแปรจำนวนเท่าใดก็ได้เพื่อทำการวิจัย
ความสัมพันธ์ทางธรรมชาติ
ข้อมูลทางสถิตินี้ถือเป็นวิธีการเก็บรวบรวมข้อมูลที่ดีกว่า เนื่องจากเป็นข้อมูลธรรมชาติและแสดงให้โลกเห็นว่ามีอยู่จริง โดยจะศึกษาพฤติกรรมในชีวิตจริงของข้อมูลเพื่อให้แน่ใจว่าแนวโน้มที่ดึงออกมามีความถูกต้องแม่นยำ
ยืดหยุ่นได้
สถิติเชิงพรรณนาช่วยให้การศึกษามีวิธีการใหม่ในการเรียนรู้สิ่งต่างๆ ตัวอย่างเช่น นักวิจัยสามารถใช้กรณีศึกษาที่มีทั้งความสัมพันธ์และเชิงคุณภาพเพื่ออธิบายปรากฏการณ์ของสถิติเชิงพรรณนา สามารถใช้กรณีศึกษาเพื่อบรรยายเหตุการณ์ ผู้คน และสถาบันได้ ซึ่งจะช่วยให้นักวิจัยเข้าใจรูปแบบและพฤติกรรมของข้อมูล
รับ ใบรับรองวิทยาศาสตร์ข้อมูล ออนไลน์จากมหาวิทยาลัยชั้นนำของโลก รับโปรแกรม PG สำหรับผู้บริหาร โปรแกรมประกาศนียบัตรขั้นสูง หรือโปรแกรมปริญญาโท เพื่อติดตามอาชีพของคุณอย่างรวดเร็ว
ระบุตัวแปรและสมมติฐาน
สถิติเชิงพรรณนามีประโยชน์ในขณะที่ระบุสมมติฐานและตัวแปรใหม่ที่สามารถวิเคราะห์เพิ่มเติมผ่านการศึกษาเชิงทดลองและเชิงอนุมาน ยิ่งไปกว่านั้น มันมีประโยชน์มากเนื่องจากขอบของข้อผิดพลาดค่อนข้างน้อย และแนวโน้มมาจากคุณสมบัติข้อมูลโดยตรง
สรุป
สถิติเชิงพรรณนามีความสำคัญต่อการแสดงข้อมูลเป็นภาพ เนื่องจากช่วยให้ผู้เชี่ยวชาญด้านข้อมูลนำเสนอสิ่งที่ค้นพบอย่างมีความหมาย เพื่อให้ผู้มีส่วนได้ส่วนเสียทั้งด้านเทคนิคและที่ไม่ใช่ด้านเทคนิคสามารถเข้าใจได้ ด้วยการสรุปข้อมูลเชิงปริมาณที่ซับซ้อนผ่านการนำเสนอแบบกราฟิกที่เหมาะสม สถิติเชิงพรรณนาทำให้กระบวนการตีความข้อมูลง่ายขึ้น ทำให้ธุรกิจสามารถตัดสินใจโดยใช้ข้อมูลได้ง่ายขึ้น
หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับแนวคิดและวิธีการทางสถิติต่างๆ ที่ใช้ในวิทยาศาสตร์ข้อมูล อย่าลืมตรวจสอบ หลักสูตร Executive PG ของ upGrad ในหลักสูตร Data Science สอนโดยคณาจารย์จากมหาวิทยาลัยชั้นนำในประเทศและต่างประเทศ หลักสูตรเหล่านี้จะช่วยให้คุณมีทักษะและความรู้ที่เกี่ยวข้องกับอุตสาหกรรม