อธิบายการกระจายปัวซองและกระบวนการปัวซอง [พร้อมตัวอย่าง]

เผยแพร่แล้ว: 2021-01-08

การแจกแจงแบบปัวซองเป็นหัวข้อภายใต้ทฤษฎีความน่าจะเป็นและสถิติที่ธุรกิจและตลาดการค้าใช้อย่างแพร่หลาย ใช้เพื่อคาดการณ์ปริมาณการเปลี่ยนแปลงจากอัตราการเกิดขึ้นเฉลี่ยที่กำหนดภายในกรอบเวลา ซึ่งจะอธิบายโดยละเอียดในหัวข้อต่อไปนี้

สารบัญ

กระบวนการปัวซอง

กระบวนการปัวซองเป็นกระบวนการสุ่มที่ใช้กันอย่างแพร่หลายสำหรับการสร้างแบบจำลองชุดของเหตุการณ์ที่ไม่ต่อเนื่องซึ่งเกิดขึ้นเมื่อทราบค่าเฉลี่ยของเหตุการณ์ แต่เหตุการณ์เกิดขึ้นแบบสุ่ม เนื่องจากเหตุการณ์ต่างๆ เกิดขึ้นโดยบังเอิญ จึงอาจเกิดขึ้นทีละเหตุการณ์ หรืออาจใช้เวลานานระหว่างสองเหตุการณ์

เวลาเฉลี่ยของเหตุการณ์เป็นค่าคงที่เท่านั้น ตัวอย่างเช่น หากทราบว่าในเมืองใดเมืองหนึ่ง แผ่นดินไหวเกิดขึ้นโดยเฉลี่ยสี่ครั้งต่อปี นี่อาจหมายความว่าแผ่นดินไหวสี่ครั้งอาจเกิดขึ้นสี่วันติดต่อกันในหนึ่งปี หรือเวลาระหว่างแผ่นดินไหวสองครั้งอาจเป็นเจ็ดเดือน

นี่คือกระบวนการปัวซอง และสามารถคำนวณความน่าจะเป็นของแต่ละเหตุการณ์ได้

เป็นสิ่งสำคัญที่กระบวนการปัวซองต้องเป็นไปตามเกณฑ์ต่อไปนี้:

  • เหตุการณ์ควรเป็นอิสระจากกัน ดังนั้น การเกิดขึ้นของเหตุการณ์หนึ่งไม่ควรส่งผลกระทบต่อความน่าจะเป็นของอีกเหตุการณ์หนึ่งที่เกิดขึ้น
  • อัตราเฉลี่ยของเหตุการณ์ กล่าวคือ เหตุการณ์ต่อช่วงเวลาคงที่
  • เหตุการณ์สองเหตุการณ์ไม่ควรเกิดขึ้นพร้อมกัน

อ่าน: การกระจายความน่าจะเป็น

การกระจายปัวซอง

ตั้งชื่อตามนักคณิตศาสตร์ชาวฝรั่งเศสชื่อ Simeon Denis Poisson การแจกแจงแบบปัวซองเป็นการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องที่ใช้ในการทำนายความน่าจะเป็นของเหตุการณ์เฉพาะที่เกิดขึ้นเมื่อทราบอัตราเฉลี่ยของเหตุการณ์ ในตัวอย่างข้างต้น การแจกแจงแบบปัวซองสามารถใช้ทำนายความน่าจะเป็นของแผ่นดินไหวที่เกิดขึ้นในช่วงเวลาหนึ่งของปี

นอกจากนี้ยังสามารถใช้เพื่อคาดการณ์เหตุการณ์ที่เกิดขึ้นในช่วงเวลาที่กำหนดอื่นๆ เช่น พื้นที่ ปริมาตร หรือระยะทาง

ฟังก์ชันมวลของความน่าจะเป็นแบบแจกแจงแบบปัวซองให้ความน่าจะเป็นของการสังเกตเหตุการณ์ k เหตุการณ์ในช่วงเวลาที่กำหนดเมื่อกำหนดระยะเวลาและค่าเฉลี่ยเหตุการณ์ต่อเวลา สูตรมีดังนี้:

P (k เหตุการณ์ในช่วงเวลา) = e-λ * λk/k!

ในที่นี้ λ แลมบ์ดา คือพารามิเตอร์อัตรา k คือจำนวนครั้งที่เหตุการณ์เกิดขึ้นในช่วงเวลาหนึ่ง e คือตัวเลขของออยเลอร์ และ k! คือแฟกทอเรียลของ k

จากตัวอย่างง่ายๆ เราจะเห็นว่าสามารถคำนวณความน่าจะเป็นได้อย่างไร หากจำนวนแผ่นดินไหวเฉลี่ยที่เมืองหนึ่งเมืองหนึ่งเป็น 2 ครั้งต่อปี ให้เราคำนวณความน่าจะเป็นที่จะเกิดแผ่นดินไหว 3 ครั้งในเมืองในปีหน้า

ในที่นี้ k คือ 3, λ คือ 2 และ e คือเลขของออยเลอร์ เช่น 2.71828 แทนค่าเหล่านี้ในสมการข้างต้น เราจะได้ P เท่ากับ 0.180 ซึ่งหมายความว่าความน่าจะเป็นคือ 18% เราสรุปได้ว่าความน่าจะเป็นที่เมืองจะเกิดแผ่นดินไหว 3 ครั้งในปีหน้าคือ 18%

คุณสมบัติของการกระจายปัวซอง

  • ค่าเฉลี่ยของตัวแปรสุ่มแบบกระจายปัวซองคือ λ นี่คือค่าที่คาดหวังเช่นกัน
  • ความแปรปรวนของตัวแปรสุ่มแบบกระจายปัวซองก็เหมือนกับค่าเฉลี่ย λ
  • จำนวนการทดลองใช้ในการ แจกแจงแบบปัวซอง อาจมีจำนวนมาก จึงสามารถเข้าใกล้อนันต์ได้
  • ความน่าจะเป็นคงที่ของความสำเร็จในการทดลองแต่ละครั้งมีน้อยมาก ดังนั้นจึงใกล้เป็นศูนย์
  • เนื่องจาก การแจกแจงแบบปัวซอง มีลักษณะเฉพาะด้วยพารามิเตอร์เดียว λ จึงเรียกอีกอย่างว่าการแจกแจงแบบหนึ่งพารามิเตอร์
  • คล้ายกับการแจกแจงทวินาม การ แจกแจงแบบปัวซอง สามารถเป็นแบบเดี่ยวหรือแบบสองกิริยาได้ ขึ้นอยู่กับพารามิเตอร์อัตรา λ หากไม่ใช่จำนวนเต็ม การแจกแจงจะเป็น uni-modal และหากเป็นจำนวนเต็ม ก็จะเป็น bi-modal

ตัวอย่างการกระจายปัวซอง

มีหลายภาคส่วนที่สามารถใช้การแจกแจงแบบปัวซองเพื่อทำนายความน่าจะเป็นของเหตุการณ์ ใช้ในสาขาวิทยาศาสตร์มากมายและเป็นที่นิยมในภาคธุรกิจด้วย ตัวอย่างบางส่วนระบุไว้ด้านล่าง

1. ตรวจสอบปริมาณสินค้าที่ต้องการตลอดปี หากธุรกิจ/ซูเปอร์มาร์เก็ต/ร้านค้าทราบจำนวนเฉลี่ยของผลิตภัณฑ์ที่ลูกค้าใช้ในหนึ่งปี พวกเขาสามารถใช้รูปแบบการจัดจำหน่ายปัวซองเพื่อคาดการณ์ว่าสินค้าจะขายได้มากกว่าในเดือนใด วิธีนี้สามารถช่วยจัดเก็บผลิตภัณฑ์ในปริมาณที่ต้องการและป้องกันการสูญเสียได้

2. ตรวจรับพนักงานบริการลูกค้า หากบริษัทสามารถคำนวณจำนวนการโทรโดยเฉลี่ยในหนึ่งวันที่ต้องจัดการเกินสิบห้านาที ก็สามารถใช้แบบจำลองนี้ในการคาดคะเนจำนวนการโทรสูงสุดต่อชั่วโมงที่ต้องใช้เวลามากกว่าสิบห้านาที โดยการคำนวณนี้ พวกเขาสามารถประเมินว่าพวกเขาต้องการพนักงานเพิ่มหรือไม่

3. สามารถใช้ทำนายความน่าจะเป็นของการเกิดน้ำท่วม พายุ และภัยธรรมชาติอื่นๆ สิ่งนี้สามารถเกิดขึ้นได้หากทราบจำนวนเฉลี่ยของภัยพิบัติดังกล่าวต่อปี ด้วยการคาดการณ์เหล่านี้ ควบคู่ไปกับการใช้งานทางเทคโนโลยีอื่นๆ จึงสามารถหลีกเลี่ยงการสูญเสียมนุษย์และทรัพย์สินในหลายประเทศหรือภูมิภาคได้

4. สามารถใช้ในภาคการเงินได้เช่นกัน แต่อาจไม่จำเป็นต้องแม่นยำเสมอไป ซึ่งจะช่วยในการประมาณความน่าจะเป็นที่ตลาดหุ้นจะขึ้นหรือลงในช่วงเวลาใดเวลาหนึ่ง

5. แบบจำลองการกระจายแบบปัวซองยังสามารถใช้ในฟิสิกส์ ชีววิทยา ดาราศาสตร์ ฯลฯ ในการทำนายความน่าจะเป็นที่อุกกาบาตจะเข้าสู่ชั้นบรรยากาศของโลกและมองเห็นได้ในภูมิภาคต่างๆ ของโลก

บทสรุป

หัวข้อยอดนิยมในสถิติ การแจกแจงแบบปัวซองได้รับการอธิบายอย่างละเอียดผ่านส่วนต่างๆ ในบทความนี้ เป็นหัวข้อสำคัญที่ต้องทำความเข้าใจสำหรับนักเรียนและมืออาชีพที่สนใจเรียนรู้เกี่ยวกับสถิติและความน่าจะเป็น

แบบจำลองนี้สามารถนำมาใช้ในชีวิตจริงและในวิชาต่างๆ เช่น ฟิสิกส์ ชีววิทยา ดาราศาสตร์ ธุรกิจ การเงิน ฯลฯ เพื่อประมาณความน่าจะเป็นของเหตุการณ์ที่เกิดขึ้นตามที่กล่าวไว้ในตัวอย่าง หัวข้อที่คล้ายกันในสถิติ วิทยาศาสตร์ข้อมูล แมชชีนเลิร์นนิง ฯลฯ สามารถพบได้ใน upGrad ซึ่งจะช่วยให้เราขยายการเรียนรู้และนำแนวคิดเหล่านี้ไปใช้กับปัญหาต่างๆ

หากคุณสนใจที่จะเรียนรู้เพิ่มเติมเกี่ยวกับแมชชีนเลิร์นนิง โปรดดูที่ IIIT-B & upGrad's PG Diploma in Machine Learning & AI ซึ่งออกแบบมาสำหรับมืออาชีพที่ทำงานและมีการฝึกอบรมที่เข้มงวดมากกว่า 450 ชั่วโมง กรณีศึกษาและการมอบหมายมากกว่า 30 รายการ IIIT- สถานะศิษย์เก่า B, 5+ โครงการหลักที่ใช้งานได้จริง & ความช่วยเหลือด้านงานกับบริษัทชั้นนำ

กระบวนการปัวซองแตกต่างจากการแจกแจงปัวซองอย่างไร

กระบวนการปัวซองเป็นแบบอย่างสำหรับชุดของเหตุการณ์ที่ไม่ต่อเนื่อง ซึ่งทราบเวลาเฉลี่ยระหว่างเหตุการณ์ที่เกิดขึ้น แต่ไม่ทราบเวลาที่แน่นอน ในทางกลับกัน การแจกแจงแบบปัวซองเป็นการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องที่อธิบายความน่าจะเป็นของเหตุการณ์ที่มีกระบวนการปัวซองเกิดขึ้นในช่วงเวลาที่กำหนด มีองค์ประกอบของเหตุการณ์ที่เกิดขึ้นเป็นลำดับในเวลาเมื่อพูดถึงกระบวนการปัวซอง แต่ไม่มีองค์ประกอบดังกล่าวเมื่อพูดถึงตัวแปรสุ่มและการแจกแจงของตัวแปรเหล่านี้ในการแจกแจงปัวซอง และเราก็แค่มีตัวแปรสุ่มที่มีการแจกแจงที่เกี่ยวข้อง

แบบจำลองการถดถอยปัวซองมีความหมายอย่างไร

ตัวแบบถดถอยปัวซองเป็นเพียงตัวอย่างของตัวแบบเชิงเส้นทั่วไป แบบจำลองการถดถอยปัวซองใช้สำหรับแบบจำลองข้อมูลการนับและตารางฉุกเฉิน ในกรณีของแบบจำลองการนับ มีการปรับการถดถอยปัวซองต่างๆ ที่เป็นประโยชน์ ด้วยปัจจัยอิสระอย่างน้อยหนึ่งปัจจัย การถดถอยปัวซองใช้เพื่อทำนายตัวแปรตามที่สร้างขึ้นจากข้อมูลการนับ ตัวแปรที่เราตั้งเป้าจะทำนายเรียกว่าตัวแปรตาม

การแจกแจงแบบปัวซองแตกต่างจากการแจกแจงแบบทวินามอย่างไร

การแจกแจงทั้งสองอยู่ภายใต้ความน่าจะเป็น การแจกแจงแบบทวินามหมายถึงความน่าจะเป็นของการทดลองซ้ำจำนวนหนึ่งในชุดข้อมูลที่กำหนด ในทางกลับกัน การแจกแจงแบบปัวซองจะอธิบายการแจกแจงข้อมูลไบนารีจากตัวอย่างที่ไม่สิ้นสุด และระบุจำนวนเหตุการณ์อิสระที่เกิดขึ้นแบบสุ่มในช่วงเวลาหนึ่งๆ