Penjelasan Naive Bayes Classifier

Diterbitkan: 2022-09-28

Daftar isi

pengantar

Jika Anda tertarik dengan pembelajaran mesin, kecerdasan buatan, atau ilmu data, Anda harus mengetahui pentingnya asumsi. Pembelajaran mesin atau model berbasis risiko lainnya dikembangkan berdasarkan asumsi tertentu dan konvensi yang telah ditentukan sebelumnya yang memungkinkan pengembang mendapatkan hasil yang diinginkan. Jika pengembang tidak mempertimbangkan asumsi saat membangun model, itu dapat mengganggu data dan menyebabkan hasil yang tidak akurat. Pengklasifikasi Naive Bayes adalah salah satu contoh klasik dari asumsi matematika dalam model statistik.

Program AI & ML kami di AS

Master of Science dalam Pembelajaran Mesin & AI dari LJMU dan IIITB Program PG Eksekutif dalam Pembelajaran Mesin & Kecerdasan Buatan dari IIITB
Untuk Jelajahi semua kursus kami, kunjungi halaman kami di bawah ini.
Kursus Pembelajaran Mesin

Blog ini menjelaskan teorema Bayes, Pengklasifikasi Naive Bayes, dan berbagai modelnya.

Apa itu Pengklasifikasi Naive Bayes?

Pengklasifikasi Naive Bayes didasarkan pada teorema Bayes yang dikemukakan oleh Thomas Bayes, seorang matematikawan Inggris. Jadi sebelum Anda memahami Pengklasifikasi Naive Bayes, penting untuk mengetahui teorema Bayes. Teorema Bayes, juga dikenal sebagai Hukum Bayes atau Aturan Bayes, menentukan peluang terjadinya atau tidak terjadinya suatu peristiwa. Secara sederhana, ini memberi tahu probabilitas suatu peristiwa yang terjadi.

Teorema Bayes populer digunakan dalam pembelajaran mesin untuk memprediksi kelas secara akurat. Ini menghitung probabilitas bersyarat tugas klasifikasi dalam pembelajaran mesin. Tugas klasifikasi mengacu pada aktivitas yang dilakukan oleh algoritma pembelajaran mesin untuk memecahkan masalah. Anda dapat memahami ini lebih baik dengan contoh email spam. Algoritma pembelajaran mesin belajar untuk mengklasifikasikan email sebagai spam atau bukan spam. Oleh karena itu, dalam model pembelajaran mesin, teorema Bayes digunakan untuk memprediksi aktivitas klasifikasi atau segregasi.

Teorema Naive Bayes adalah bagian dari teorema Bayes. Karena fungsi utamanya adalah klasifikasi tugas, kami juga menyebutnya sebagai Naive Bayes Classifier. Teorema ini juga membuat asumsi naif bahwa semua fitur kelas tidak bergantung satu sama lain, oleh karena itu disebut teorema Naive Bayes. Jika kita membahas pembelajaran mesin, Naive Bayes Classifier adalah algoritma yang menerapkan teorema Bayes untuk memprediksi suatu peristiwa sambil mengasumsikan bahwa atribut kelas tertentu tidak tergantung satu sama lain. Atribut-atribut ini juga dianggap sama dan dapat eksis tanpa bergantung pada fitur lain.

Kita dapat menggunakan Naive Bayes Classifier untuk banyak fungsi, seperti mendiagnosis penyakit tertentu jika serangkaian gejala tersedia, ramalan cuaca, kelembaban, suhu, dan faktor lainnya. Dengan kata sederhana, Anda dapat menggunakan algoritma naive Bayes untuk setiap proses data yang memerlukan klasifikasi multikelas biner atau multi guna. Naive Bayes Classifier bekerja pada konsep probabilitas bersyarat. Artinya, peluang terjadinya suatu peristiwa bergantung pada terjadinya peristiwa lain. Misalnya, peluang bersyarat terjadinya peristiwa A bergantung pada terjadinya peristiwa B.

Dapatkan Sertifikasi Machine Learning dari Universitas top dunia. Dapatkan Master, PGP Eksekutif, atau Program Sertifikat Tingkat Lanjut untuk mempercepat karier Anda.

Bekerja dari Naive Bayes Classifier

Pengklasifikasi Naive Bayes digunakan untuk mencari peluang keluaran jika masukan tersedia. Naive Bayes Classifier memecahkan masalah pemodelan prediksi dengan mengkategorikan kelas menggunakan label yang berbeda. Algoritme pembelajaran mesin berdasarkan model probabilitas dapat memecahkan tantangan kompleks seperti itu.

Misalnya, ada label kelas y1, y2, y3…….yn dan variabel input x1, x2, x3……xk dalam masalah klasifikasi. Pertama, kita perlu menghitung probabilitas bersyarat dari label kelas y yang berbeda dalam kasus input x. Kemudian kami mempertimbangkan fitur dengan probabilitas bersyarat tertinggi sebagai klasifikasi yang paling sesuai.

Model yang berbeda dari Naive Bayes Classifier

Ini adalah tiga jenis pengklasifikasi Naive Bayes.

  • Gaussian Naive Bayes – Gaussian Naive Bayes menggunakan distribusi normal atau Gaussian untuk mendukung data kontinu. Teorema distribusi normal menganalisis data jika ada kemungkinan bahwa data kontinu akan terdistribusi secara merata di atas atau di bawah rata-rata.
  • Multinomial Naive Bayes – Kami menggunakan multinomial Naive Bayes classifier ketika klasifikasi fitur diskrit diperlukan, misalnya, jumlah kata untuk klasifikasi teks. Ini secara statistik menganalisis konten dokumen dan menetapkannya ke kelas.
  • Bernoulli Naive Bayes – Bernoulli Naive Bayes mirip dengan Multinomial Naive Bayes. Ini juga digunakan untuk data diskrit. Namun, ia hanya menerima fitur biner – 0 dan 1. Jadi, dalam kasus fitur biner dalam dataset, kita harus menggunakan Bernoulli Naive Bayes.

Keuntungan dan Kerugian dari Naive Bayes Classifier

Fitur paling signifikan dari Naive Bayes Classifier adalah ia dapat mengelola data kontinu dan diskrit. Keakuratan Naive Bayes Classifier meningkat dengan jumlah data karena memberikan hasil yang lebih akurat jika dataset besar digunakan. Berikut adalah beberapa kelebihan dan kekurangan dari Naive Bayes Classifier.

Keuntungan dari Naive Bayes Classifier

  • Sangat scalable – Salah satu keuntungan paling signifikan dari Naive Bayes Classifier adalah sangat scalable karena asumsi naifnya.
  • Lebih sedikit periode pelatihan – Kami membutuhkan sejumlah kecil data pelatihan untuk melatih Pengklasifikasi Naive Bayes. Jadi, periode pelatihannya relatif singkat dibandingkan dengan algoritma lainnya.
  • Sederhana – Keuntungan signifikan lainnya dari Naive Bayes Classifier adalah mudah dibuat. Selain itu, dapat dengan mudah digunakan untuk mengklasifikasikan kumpulan data yang besar.

Kekurangan dari Naive Bayes Classifier

  • Keterbatasan dalam penggunaan di dunia nyata – Naive Bayes Classifier membuat asumsi naif bahwa berbagai fitur dari suatu kelas tidak bergantung satu sama lain. Karena fenomena ini jarang terjadi di dunia nyata, algoritme dapat digunakan untuk tujuan yang terbatas.
  • Masalah frekuensi nol – Jika set data pelatihan memiliki nilai tambah yang hilang nanti, Pengklasifikasi Naive Bayes menandai nilai itu sebagai nol karena tidak ada frekuensi. Jadi, ketika probabilitas nilai yang berbeda dikalikan, probabilitas berbasis frekuensi menjadi nol karena algoritme telah menetapkan nilai nol ke data yang hilang, yang dapat menyebabkan hasil yang tidak akurat.

Penggunaan Naive Bayes Classifier dalam Pembelajaran Mesin dan Kecerdasan Buatan

Algoritma Naive Bayes bermanfaat dalam pembelajaran mesin dan kecerdasan buatan karena asumsinya bahwa semua atribut dari suatu kelas tidak bergantung satu sama lain. Berikut adalah beberapa kegunaan praktis dari Naive Bayes Classifier dalam Pembelajaran Mesin dan Kecerdasan Buatan:

  • Memprediksi kanker usus besar – Para peneliti telah menyarankan menggunakan model Naive Bayes Classifier untuk memprediksi kanker usus besar. Ini bisa menjadi salah satu kegunaan paling luar biasa dari Naive Bayes Classifier. Hal ini dapat dimungkinkan dengan data kanker usus besar seperti kisaran hemoglobin, dan jumlah sel darah merah dan putih dalam tubuh pasien usus besar sebagai data pelatihan untuk model tersebut. Algoritme dapat memprediksi kanker usus besar jika hemoglobin dan sel darah pasien berada dalam kisaran yang sama.
  • Manajemen risiko lalu lintas – Naive Bayes Classifier juga dapat digunakan untuk manajemen risiko lalu lintas. Pengklasifikasi Naive Bayes dapat memprediksi risiko mengemudi pengemudi dan lalu lintas jalan berdasarkan data pelatihan.

Blog Pembelajaran Mesin dan Kecerdasan Buatan Populer

IoT: Sejarah, Sekarang & Masa Depan Tutorial Pembelajaran Mesin: Belajar ML Apa itu Algoritma? Sederhana & Mudah
Gaji Insinyur Robotika di India : Semua Peran Sehari dalam Kehidupan Seorang Insinyur Pembelajaran Mesin: Apa yang mereka lakukan? Apa itu IoT (Internet of Things)
Permutasi vs Kombinasi: Perbedaan antara Permutasi dan Kombinasi 7 Tren Teratas dalam Kecerdasan Buatan & Pembelajaran Mesin Pembelajaran Mesin dengan R: Semua yang Perlu Anda Ketahui

Kesimpulan

Naive Bayes Classifier adalah algoritme ramah pemula yang menyederhanakan klasifikasi dalam pembelajaran mesin dan kecerdasan buatan. Algoritma Naive Bayes digunakan untuk berbagai aplikasi praktis seperti perlindungan spam, prakiraan cuaca, dan diagnosis medis menggunakan ML dan Ai. Jadi, jika Anda sangat tertarik dengan pembelajaran mesin dan ingin berkarir di bidang ini, Anda harus tahu tentang Naive Bayes Classifier dan algoritme dasar lainnya. Anda dapat mengejar gelar Master of Science dalam Pembelajaran Mesin dan Kecerdasan Buatan dari upGrad untuk mempelajari algoritme dan keterampilan ML dan AI lainnya secara mendalam. Kursus ini juga memberikan kesempatan untuk mengerjakan proyek pembelajaran mesin kehidupan nyata, memungkinkan Anda untuk memperoleh keterampilan, meningkatkan CV Anda, dan meraih beberapa peluang kerja di AI dan ML.

Bisakah kita menggunakan teorema Naive Bayes untuk regresi?

Ya, Naive Bayes Classifier dapat digunakan untuk regresi. Sebelumnya, penerapannya terbatas pada tugas klasifikasi. Namun, dengan modifikasi bertahap, sekarang kita dapat menggunakannya untuk regresi, yang berarti Naive Bayes Classifier dapat diterapkan pada klasifikasi generatif dan diskriminatif.

Apakah Naive Bayes Classifier lebih baik daripada regresi logistik?

Baik regresi logistik maupun Naive Bayes Classifier adalah algoritma klasifikasi linier yang menggunakan data kontinu. Namun, jika ada bias atau fitur yang berbeda di kelas, maka Naive Bayes Classifier akan memberikan akurasi yang lebih baik daripada regresi logistik karena asumsi naif.

Tugas pembelajaran mesin apa yang dapat dilakukan oleh Naive Bayes Classifier?

Naive Bayes Classifier memfasilitasi tugas pembelajaran yang diawasi dalam pembelajaran mesin. Algoritma mengklasifikasikan data sesuai dengan data pelatihan yang diberikan sebelumnya. Algoritma Naive Bayes memprediksi klasifikasi yang terbentuk pada input-output atau pengalaman sebelumnya.