Fungsi Massa Probabilitas: Distribusi & Sifat Diskrit

Diterbitkan: 2021-02-08

Daftar isi

pengantar

Probabilitas telah menjadi aspek penting dalam bidang Ilmu Data. Ini telah memainkan peran penting dalam kehidupan analis data dan ilmuwan data. Konsep yang digunakan dalam teori probabilitas harus diketahui oleh orang-orang di domain Ilmu Data. Metode statistik yang digunakan untuk membuat prediksi tertentu didasarkan pada teori probabilitas dan statistik sehingga menjadikan probabilitas sebagai bagian penting dari domain ilmu data.

Probabilitas memberikan informasi tentang terjadinya suatu peristiwa tertentu di bawah beberapa asumsi yaitu Ini menunjukkan kemungkinan suatu peristiwa terjadi. Untuk mewakili kemungkinan nilai yang berbeda yang dapat diambil oleh variabel acak, kami menggunakan distribusi probabilitas.

Sebuah variabel acak dapat disebut sebagai hasil yang berbeda yang mungkin dalam situasi tertentu. Untuk mengilustrasikan, jika sebuah dadu dilempar, maka hasil yang mungkin untuk situasi ini adalah nilai mulai dari 1 sampai 6 yang menjadi nilai dari variabel acak.

Distribusi Probabilitas dapat terdiri dari dua jenis: – Diskrit dan Kontinu. Distribusi diskrit adalah untuk variabel yang hanya mengambil sejumlah nilai dalam suatu rentang. Distribusi kontinu adalah untuk variabel yang dapat mengambil jumlah nilai yang tidak terbatas dalam suatu rentang. Pada artikel ini, kita akan mengeksplorasi lebih jauh ke dalam distribusi diskrit dan kemudian ke Fungsi Massa Probabilitas.

Distribusi Diskrit

Distribusi diskrit mewakili probabilitas hasil yang berbeda untuk variabel acak diskrit. Secara sederhana, ini memungkinkan kita untuk memahami pola hasil yang berbeda dalam variabel acak. Itu tidak lain adalah representasi dari semua probabilitas variabel acak yang disatukan.

Untuk membuat distribusi probabilitas untuk variabel acak, kita perlu memiliki hasil dari variabel acak bersama dengan probabilitas yang terkait dan kemudian kita dapat menghitung fungsi distribusi probabilitasnya.

Beberapa jenis distribusi diskrit terdaftar sebagai berikut: –

  1. Distribusi Binomial: – Jumlah hasil dalam satu percobaan hanya bisa dua (ya atau tidak, sukses atau gagal, dll). Contoh: – Melempar koin
  2. Distribusi Bernoulli: – Sebuah versi khusus dari distribusi Binomial di mana jumlah percobaan yang dilakukan dalam percobaan selalu sama dengan 1.
  3. Distribusi Poisson: – Ini memberikan probabilitas suatu peristiwa yang terjadi beberapa kali dalam periode waktu tertentu. Contoh: – Berapa kali film akan diputar pada Sabtu malam.
  4. Distribusi Seragam: – Distribusi ini mengasumsikan bahwa probabilitas untuk semua hasil dalam variabel acak adalah sama. Contoh: – Pelemparan sebuah dadu (karena semua sisi memiliki peluang yang sama untuk muncul).

Anda dapat merujuk ke tautan ini untuk detail lebih lanjut tentang jenis distribusi kontinu dan diskrit. Untuk menghitung probabilitas variabel acak dengan nilainya sama dengan beberapa nilai dalam rentang, digunakan Fungsi Massa Probabilitas (PMF). Untuk setiap distribusi, rumus fungsi massa probabilitas bervariasi.

Untuk kejelasan yang lebih baik tentang fungsi massa probabilitas, mari kita lihat sebuah contoh. Misalkan kita harus mencari tahu posisi pukulan mana dalam kriket yang memiliki kemungkinan lebih besar untuk mencetak satu abad dalam sebuah tim, asalkan kita memiliki beberapa data terkait. Sekarang karena hanya ada 11 posisi bermain dalam tim, variabel acak akan mengambil nilai mulai dari 1 hingga 11.

Fungsi Massa Probabilitas, juga disebut Fungsi Densitas Diskrit akan memungkinkan kita untuk mengetahui probabilitas mencetak satu abad untuk setiap posisi yaitu P(X=1), P(X=2)….P(X=11). Setelah menghitung semua probabilitas, kita dapat menghitung distribusi probabilitas dari variabel acak tersebut.

Rumus umum untuk fungsi massa probabilitas adalah sebagai berikut: –

P X (x k ) = P(X = x k ) untuk k = 1,2,…k

di mana,

X = Variabel acak diskrit.

x k = Nilai yang mungkin dari variabel acak.

P = Peluang peubah acak sama dengan x k .

Banyak yang bingung antara Probability Mass Function (PMF) dan Probability Density Function (PDF). Untuk menghapus ini, fungsi massa probabilitas adalah untuk variabel acak diskrit yaitu variabel yang dapat mengambil sejumlah nilai dalam suatu rentang.

Fungsi kepadatan probabilitas digunakan untuk variabel acak kontinu. yaitu variabel yang dapat mengambil jumlah nilai yang tak terbatas dalam suatu rentang. Fungsi massa probabilitas membantu dalam perhitungan statistik umum seperti mean dan varians dari distribusi diskrit.

Dapatkan sertifikasi ilmu data dari Universitas top dunia. Bergabunglah dengan Program PG Eksekutif, Program Sertifikat Tingkat Lanjut, atau Program Magister kami untuk mempercepat karir Anda.

Sifat-sifat Fungsi Massa Probabilitas

  1. Probabilitas semua nilai yang mungkin dari variabel acak harus berjumlah 1. [ P X (x k ) = 1]
  2. Semua probabilitas harus bisa 0 atau lebih besar dari 0. [P(x k ) 0]
  3. Probabilitas setiap peristiwa yang terjadi berkisar dari 0 hingga 1. [1 P(x k ) 0]

Kesimpulan

Konsep probabilitas seperti Fungsi Massa Probabilitas telah sangat berguna dalam domain ilmu data. Konsep-konsep ini mungkin tidak digunakan dalam setiap aspek proyek ilmu data atau dalam hal ini di seluruh proyek juga. Tapi ini tidak meremehkan pentingnya teori probabilitas dalam domain ini.

Penerapan teori probabilitas telah memberikan hasil yang luar biasa tidak hanya dalam domain ilmu data tetapi domain lain dari industri juga karena dapat membantu dalam wawasan menarik dan pengambilan keputusan yang selalu membuatnya patut dicoba.

Artikel ini memberikan gambaran tentang pentingnya probabilitas dalam bidang ilmu data, memperkenalkan konsep dasar probabilitas seperti distribusi probabilitas dan fungsi massa probabilitas. Artikel ini terutama berfokus pada suku-suku variabel diskrit karena fungsi massa probabilitas digunakan untuk suku-suku tersebut. Terminologi yang digunakan untuk variabel kontinu berbeda, tetapi ideologi keseluruhan dari konsep ini tetap sama dengan yang dijelaskan dalam artikel ini.

Bagaimana distribusi probabilitas diskrit berbeda dari distribusi probabilitas kontinu?

Distribusi probabilitas diskrit atau distribusi hanya diskrit menghitung probabilitas variabel acak yang dapat diskrit. Misalnya, jika kita melempar koin dua kali, nilai kemungkinan variabel acak X yang menunjukkan jumlah kepala adalah {0, 1, 2} dan bukan nilai acak apa pun.
Bernoulli, Binomial, Hypergeometric adalah beberapa contoh dari distribusi probabilitas diskrit.
Di sisi lain, distribusi probabilitas kontinu memberikan probabilitas nilai acak yang dapat berupa bilangan acak apa pun. Misalnya, nilai variabel acak X yang menunjukkan tinggi penduduk suatu kota dapat berupa angka apa pun seperti 161,2, 150,9, dll.
Normal, T Student, Chi-kuadrat adalah beberapa contoh distribusi kontinu.

Jelaskan distribusi hipergeometrik?

Distribusi hipergeometrik adalah distribusi diskrit di mana kami mempertimbangkan jumlah keberhasilan atas jumlah percobaan tanpa penggantian apapun. Jenis distribusi seperti itu berguna dalam kasus di mana kita perlu menemukan probabilitas sesuatu tanpa menggantinya.
Katakanlah kita memiliki tas yang penuh dengan bola merah dan hijau dan kita harus mencari peluang terambilnya bola hijau dalam 5 percobaan tetapi setiap kali kita mengambil bola, kita tidak mengembalikannya ke kantong. Ini adalah contoh tepat dari distribusi hipergeometrik.

Apa pentingnya probabilitas dalam Ilmu Data?

Karena ilmu data adalah tentang mempelajari data, probabilitas memainkan peran kunci di sini. Alasan berikut menjelaskan bagaimana probabilitas merupakan bagian tak terpisahkan dari ilmu data:
1. Ini membantu analis dan peneliti membuat prediksi dari kumpulan data. Hasil estimasi semacam ini merupakan dasar untuk analisis data lebih lanjut.
2. Probabilitas juga digunakan saat mengembangkan algoritma yang digunakan dalam model pembelajaran mesin. Ini membantu dalam menganalisis kumpulan data yang digunakan untuk melatih model.
3. Ini memungkinkan Anda untuk mengukur data dan memperoleh hasil seperti turunan, rata-rata, dan distribusi.
4. Semua hasil yang dicapai dengan menggunakan probabilitas akhirnya merangkum data. Ringkasan ini juga membantu dalam mengidentifikasi outlier yang ada dalam kumpulan data.