Regresi Logistik Biner: Gambaran Umum, Kemampuan, dan Asumsi
Diterbitkan: 2021-10-05Salah satu definisi Machine Learning yang paling diterima adalah seperti ini:
“Sebuah program komputer dikatakan belajar dari pengalaman E sehubungan dengan beberapa kelas tugas T dan ukuran kinerja P, jika kinerjanya pada tugas-tugas di T, yang diukur dengan P, meningkat dengan pengalaman E.”
Sekarang, untuk meningkatkan kinerja mesin dari waktu ke waktu pada kelas tugas yang sama, algoritme yang berbeda digunakan untuk mengoptimalkan keluaran mesin dan membawanya lebih dekat ke hasil yang diinginkan. Analisis Regresi adalah salah satu teknik dasar dan paling sering digunakan untuk membuat mesin meningkatkan kinerjanya.
Ini terdiri dari serangkaian teknik pembelajaran mesin untuk memprediksi variabel output berkelanjutan berdasarkan satu atau lebih nilai variabel prediktor. Analisis Regresi bertujuan untuk mengembangkan persamaan matematis yang dapat mendefinisikan variabel kontinu sebagai fungsi dari variabel prediktor.
Dalam salah satu artikel kami sebelumnya, kami melihat Regresi Logistik dan bagaimana menerapkan Regresi Logistik dengan Python. Kami juga berbicara secara singkat tentang tiga jenis Regresi Logistik yang berbeda dalam Pembelajaran Mesin. Dalam artikel ini, mari memberi Anda panduan yang sedikit mendetail tentang Regresi Logistik Biner beserta ikhtisar, kemampuan, dan asumsinya.
Daftar isi
Gambaran Umum Regresi Logistik Biner
Regresi Logistik Biner atau Binomial dapat dipahami sebagai jenis Regresi Logistik yang berhubungan dengan skenario di mana hasil yang diamati untuk variabel dependen hanya dalam biner, yaitu hanya dapat memiliki dua jenis yang mungkin. Kedua jenis kelas ini bisa 0 atau 1, lulus atau gagal, mati atau hidup, menang atau kalah, dan seterusnya.
Regresi Logistik Multinomial bekerja dalam skenario di mana hasilnya dapat memiliki lebih dari dua kemungkinan jenis – penyakit A vs penyakit B vs penyakit C – yang tidak dalam urutan tertentu. Namun jenis lain dari Regresi Logistik adalah Regresi Logistik Ordinal yang berhubungan dengan variabel dependen secara berurutan.
Dalam Regresi Logistik Biner, keluaran yang mungkin umumnya didefinisikan sebagai 0 atau 1 karena ini menghasilkan interpretasi dan pemahaman yang paling mudah tentang model regresi. Jika hasil tertentu untuk setiap variabel dependen adalah hasil yang berhasil atau patut dicatat, itu dikodekan sebagai 0, dan jika tidak berhasil atau gagal, itu dikodekan sebagai 0.
Secara sederhana, Regresi Logistik Biner dapat digunakan untuk memprediksi dengan cermat dan akurat peluang menjadi kasus berdasarkan nilai prediktor atau variabel independen.
Kemampuan Regresi Logistik Biner – Jenis Pertanyaan yang Dapat Dijawab
Seperti disebutkan di atas, Regresi Logistik Biner sangat cocok untuk skenario di mana output dapat menjadi milik salah satu dari dua kelas atau grup. Akibatnya, Regresi Logistik Biner paling cocok untuk menjawab pertanyaan-pertanyaan berikut ini:
- Apakah kemungkinan terkena kanker berubah untuk setiap KG tambahan seseorang kelebihan berat badan?
- Apakah probabilitas tersebut bervariasi untuk setiap bungkus rokok yang dihisap per hari?
- Apakah berat badan, asupan lemak, asupan kalori, dan usia mempengaruhi kemungkinan terkena serangan jantung?
Seperti yang Anda lihat, jawaban dari ketiga pertanyaan di atas dapat berupa ya atau tidak, 0 atau 1. Oleh karena itu, Regresi Logistik Biner dapat digunakan untuk menjawab pertanyaan-pertanyaan ini dengan tepat.
Asumsi Utama Regresi Logistik Biner
Seperti halnya algoritma Pembelajaran Mesin lainnya, Regresi Logistik Biner juga bekerja pada beberapa asumsi. Inilah mereka:
- Variabel terikat bersifat dikotomis. Artinya, itu ada atau tidak ada tetapi tidak pernah keduanya sekaligus.
- Seharusnya tidak ada outlier dalam data.
- Seharusnya tidak ada korelasi atau multikolinearitas yang tinggi di antara prediktor yang berbeda. Hal ini dapat dinilai dengan menggunakan matriks korelasi antara prediktor yang berbeda.
Kesimpulannya
Regresi Logistik Biner membantu di banyak kasus penggunaan Pembelajaran Mesin. Dari mencari tahu para pelanggar pinjaman hingga membantu bisnis untuk mempertahankan pelanggan – Regresi Logistik Biner dapat diperluas untuk memecahkan bahkan masalah bisnis yang lebih kompleks. Namun, Anda harus ingat bahwa ini hanyalah salah satu dari samudra teknik algoritme Pembelajaran Mesin. Setelah Anda menguasai analisis regresi, Anda sedang menuju ke topik yang lebih kompleks dan bernuansa.
Namun, jika Anda masih berjuang untuk memahami Analisis Regresi dan memulai perjalanan Machine Learning Anda, kami sarankan Anda daftar kursus Machine Learning kami . Di upGrad, kami memiliki basis pelajar di 85+ negara, dengan 40.000+ pelajar berbayar secara global, dan program kami telah memengaruhi lebih dari 500.000 profesional yang bekerja.
Master of Science kami dalam Pembelajaran Mesin dan Kecerdasan Buatan , yang ditawarkan bekerja sama dengan Liverpool John Moores University, dirancang untuk membantu pelajar memulai dari awal dan memperoleh pembelajaran yang cukup untuk mengerjakan proyek kehidupan nyata. Bantuan karir 360 derajat kami akan memastikan bahwa Anda sepenuhnya siap untuk mengambil peran teratas dalam industri ini. Jadi, hubungi kami hari ini, dan rasakan kekuatan pembelajaran sejawat dan jaringan global!
Model statistik Bayesian didasarkan pada prosedur matematika dan menggunakan konsep probabilitas untuk memecahkan masalah statistik. Mereka memberikan bukti bagi orang untuk mengandalkan data baru dan membuat perkiraan berdasarkan parameter model. Ini adalah teknik yang berguna dalam statistik di mana kita mengandalkan data dan informasi baru untuk memperbarui probabilitas hipotesis menggunakan teorema Bayes. Model Bayesian unik karena semua parameter dalam model statistik, baik yang diamati atau tidak, diberi distribusi probabilitas bersama.Untuk apa model statistik Bayesian digunakan?
Apa itu Inferensi Bayesian?
Apakah model Bayesian unik?