协方差与相关性:[您需要知道的一切]

已发表: 2021-11-05

在机器学习和人工智能等技术的帮助下解释数据时,需要进行大量的排列组合。 它有助于预测不同情况下的不同结果。 这些排列和组合是在变量的帮助下广泛完成的。

变量是可以在数据集中测量的项目、数量或数字。 这个项目或数量不是固定的,可以通过内部或外部因素在不同情况下发生变化。 每当元素的确切值未知时,我们将其称为变量。 因此,变量通常被称为未知量的占位符。 变量被定义为一个可变值,它取决于计算机程序的命令或计算机和编程语言的输入。

例如,在包含客户购买的电子商务数据集中,客户偏好或未来订购特定产品的可能性是一个变量。 这取决于客户的需求、收入、年龄和其他因素。 让我们更多地了解变量如何发挥作用以及如何确定两个变量之间的关系。

目录

什么是协方差?

协方差衡量两个变量之间的关系或相互依赖关系。 它确定如果另一个变量更改相同的数据集,一个变量将向哪个方向移动。

协方差有两种类型——正的和负的。 当一个变量发生变化而第二个变量向同一方向移动时,称为正协方差。 如果第二个变量向相反方向移动,则称为负协方差。

较高的协方差值表示两个变量的相关性。 正协方差意味着变量成正比并且将朝相同方向移动。 负协方差值告诉我们,这两个随机变量是间接相关的,并且向相反的方向移动。 这意味着如果一个变量的数量增加,另一个变量的数量将减少。

什么是相关性?

在给定的情况或数据集中可以有多个变量。 这些变量可能完全相关,也可能彼此不相关。 在确定有利结果的同时,推导出两个变量之间的关系以保持准确性至关重要。 这被称为相关性,一种表示两个变量之间关系的统计量度。

相关性解释了两个变量之间的线性关系,并展示了一个变量在另一个变量变化时的移动。

如果有两个变量 X 和 Y,并且 X 发生了变化,则相关性将衡量由于 X 的变化而导致的 Y 的变化。它计算 Y 会随着 X 的变化而呈现正变化还是负变化.

与协方差类似,存在三种相关性——正相关、负相关和零相关。 在正相关中,当一个变量在图表上上升时,另一个变量也会上升。 在负相关中,如果一个变量上升,另一个变量下降。 在正负相关中,变量按比例或线性上升和下降。 如果相关性为零,则变量不相关,不存在线性图。

相关性是在皮尔逊系数的帮助下测量的。 相关系数的值在 -1 到 1 之间。

协方差和相关性有什么区别?

术语协方差和相关性通常可以互换使用。 但是,它们并不相同。 人们很难弄清楚两者之间的区别。 让我们详细了解协方差与相关性。

1. 它测量什么

协方差和相关性非常相似且令人困惑。 两者都是变量的度量。 然而,两者之间的一个显着区别是协方差衡量了变量之间的变化。 它说明了两个变量如何相互关联,以及它们是沿相同方向还是相反方向移动。 协方差不定义变量如何变化。 它只是确认变量是否相互关联。

另一方面,变量变化的程度或程度是在相关性的帮助下确定的。 它是协方差的函数。

2. 价值观

相关值的范围在 -1 到 1 之间。另一方面,协方差的值可以是任意数字。 它的值介于无穷大的负幂和正幂之间。 相关性具有标准化值,而协方差的重要性并不确定。 如果我们知道协方差系数,我们可以推导出相关值。

3.规模变化

这意味着当变量乘以一个常数值时,输出会发生变化。 尺度的变化不会影响相关性的值。 即使变量乘以常数,相关性也将保持不变。 但是,这不是协方差的情况。 它受规模变化的影响。 如果变量乘以一个常数,协方差会相应地改变。

协方差和相关在机器学习中的用途是什么?

机器学习中有各种变量——目标变量、独立变量、中等变量、混杂变量和控制变量。 这些变量执行不同的功能,并在 ML 算法和技术中发挥重要作用。 变量的主要工作是在算法中添加缺失值。 由于数据并不总是以结构化形式提供,因此可能会缺少元素。 算法不能在信息不完整的情况下运行。 因此,软件工程师或开发人员使用机器学习中的变量来填补缺失值。

机器学习的职业机会是什么?

机器学习和人工智能技术的关键组成部分之一是变量的依赖性或两个随机变量之间的关系。 ML 和 AI 算法通过识别两个变量之间的关系来提供结果。 因此,如果您想在机器学习方面建立职业生涯,您必须了解协方差和相关概念。

要深入了解机器学习和人工智能,您可以报名参加upGrad的机器学习和人工智能理学硕士课程

这是面向工程师、IT 和数据专业人员的在线课程,可帮助他们获得机器学习和 AI 知识。 该计划还为学习者提供利物浦约翰摩尔斯大学和班加罗尔国际信息技术学院的校友身份。

该课程允许您与来自 Flipkart 和 Zee5 的行业专家建立联系。 您还将有机会执行大量行业项目,以获得相关技能,例如深度学习和预测分析以及统计。

以下是机器学习和人工智能领域的两个最佳职业机会:

1. 数据科学家

2012 年,哈佛商业评论指出,随着对数据科学家的需求急剧增长,数据科学家是 21 世纪最性感的工作。 即使在今天,许多行业都缺乏数据科学家。 如果您发现数据很有趣,那么您就有一份理想的高薪工作在等着您。 印度数据科学家平均年薪接近 70 万卢比。 拥有多年专业知识的数据专​​业人员每年可赚取高达 170 万卢比的收入。

2. 人工智能架构师

另一个在业界引起轰动的工作是 AI 架构师。 就像建筑师为客户提供解决方案一样,AI 建筑师也为他们的客户提供 AI 解决方案。 他们了解客户的需求并建议正确的技术。 人工智能架构师平均年薪为 60 万卢比。

学习世界顶尖大学的数据科学在线课程获得行政 PG 课程、高级证书课程或硕士课程,以加快您的职业生涯。

结论

变量在机器学习和人工智能的数据分析和决策中起着至关重要的作用。 相关性和协方差有助于确定两个变量之间是否存在关系。 然后,公司可以预测预期的结果并做出相应的决策。 它是机器学习中最复杂但最重要的概念之一。 要获得有关机器学习和 AI 的专业知识,您可以攻读 upGrad 的 ML 和 AI 课程。

协方差和相关是一回事吗?

不,协方差和相关性不是同一个概念,尽管它们密切相关。 协方差决定了两个随机变量之间的线性关系,相关性衡量了两个变量之间的相关程度。

协方差和相关性在机器学习中是否相关?

是的,协方差和相关性在机器学习中是必不可少的,因为 ML 算法解释变量之间的关系并相应地提供输出。 因此,您必须了解协方差和相关性。

从事机器学习和人工智能职业需要哪些技能?

为了在 ML 或 AI 行业找到一份工作,您应该擅长数据分析、概率和统计、计算机编程、软件开发、线性回归、信号处理、自然语言处理等。