二元逻辑回归:概述、能力和假设
已发表: 2021-10-05机器学习最被接受的定义之一是这样的:
“如果计算机程序在任务 T 中的性能(以 P 衡量)随着经验 E 而提高,则可以说计算机程序从经验 E 中学习某类任务 T 和性能度量 P。”
现在,为了随着时间的推移提高机器在同一类任务上的性能,使用不同的算法来优化机器的输出并使其更接近预期的结果。 回归分析是使机器提高性能的基本和最常用的技术之一。
它由一系列机器学习技术组成,用于根据一个或多个预测变量的值来预测连续输出变量。 回归分析旨在开发一个数学方程,可以将连续变量定义为预测变量的函数。
在我们之前的一篇文章中,我们研究了逻辑回归以及如何在 Python 中实现逻辑回归。 我们还简要讨论了机器学习中三种不同的逻辑回归。 在本文中,让我们稍微详细地介绍一下二元逻辑回归及其概述、功能和假设。
目录
二元逻辑回归概述
二元或二项式 Logistic 回归可以理解为处理其中因变量的观察结果只能是二元的场景的 Logistic 回归类型,即它只能有两种可能的类型。 这两种类型可以是 0 或 1,通过或失败,死或活,赢或输,等等。
多项 Logistic 回归适用于结果可能有两种以上的可能类型——疾病 A、疾病 B 和疾病 C——它们没有任何特定顺序的情况。 另一种逻辑回归是有序逻辑回归,它以有序的方式处理因变量。
在二元逻辑回归中,可能的输出通常定义为 0 或 1,因为这会导致对回归模型最直接的解释和理解。 如果任何因变量的特定结果是成功或值得注意的结果,则将其编码为 0,如果它不成功或失败,则将其编码为 0。
简单来说,二元逻辑回归可用于根据预测变量或自变量的值仔细准确地预测成为案例的几率。
二元逻辑回归的能力——它可以回答的问题类型
如上所述,二元逻辑回归非常适合输出可以属于两个类或组中的任何一个的场景。 因此,二元逻辑回归最适合回答以下性质的问题:
- 一个人超重每增加一公斤,患癌症的可能性就会改变吗?
- 每天抽的每包香烟的上述概率是否不同?
- 体重、脂肪摄入量、卡路里摄入量和年龄会影响心脏病发作的可能性吗?
如您所见,以上三个问题的答案可以是是或否,0 或 1。因此可以使用二元逻辑回归来精确回答这些问题。
二元逻辑回归的主要假设
与任何其他机器学习算法一样,二元逻辑回归也适用于一些假设。 以下是那些:
- 因变量是二分的。 也就是说,它要么存在要么不存在,但绝不会同时存在。
- 数据中不应存在异常值。
- 不同预测变量之间不应存在高度相关或多重共线性。 这可以使用不同预测变量之间的相关矩阵来评估。
综上所述
二元逻辑回归有助于跨越许多机器学习用例。 从找出贷款违约者到协助企业留住客户——二元逻辑回归可以扩展到解决更复杂的业务问题。 但是,您应该记住,这只是机器学习算法技术的海洋之一。 一旦你掌握了回归分析,你就可以处理更复杂和微妙的话题了。
但是,如果您仍在努力理解回归分析并开始您的机器学习之旅,我们向您推荐我们的机器学习课程列表。 在 upGrad,我们在 85 多个国家/地区拥有学习者基础,在全球拥有 40,000 多名付费学习者,我们的计划影响了超过 500,000 名在职专业人士。
我们与利物浦约翰摩尔斯大学合作开设的机器学习和人工智能理学硕士课程旨在帮助学习者从零开始,并获得足够的知识来从事现实生活中的项目。 我们的 360 度职业帮助将确保您充分准备好在行业中担任顶级职位。 所以今天就联系我们,体验同行学习和全球网络的力量!
贝叶斯统计模型基于数学程序并采用概率概念来解决统计问题。 它们为人们依赖新数据并根据模型参数进行预测提供了证据。 这是统计学中的一种有用技术,我们依靠新数据和信息来使用贝叶斯定理更新假设的概率。 贝叶斯模型的独特之处在于统计模型中的所有参数,无论它们是观察到的还是未观察到的,都被分配了一个联合概率分布。贝叶斯统计模型有什么用?
什么是贝叶斯推理?
贝叶斯模型是独一无二的吗?