什么是数据科学中的线性规划:概述

已发表: 2022-09-21

数据科学已经成长为一个真正的跨学科领域,它借鉴了计算机科学、数学、数据分析、统计学等。它的进步帮助全球企业做出了更明智、有数据支持的决策。 因此,今天,公司意识到他们多年来获得的数据的重要性。

数据科学家使用先进的工具来使用现有数据评估当前的业务场景,推导出关系并找到有洞察力的模式。 这种方法称为描述性分析。 此外,数据科学家还研究影响及其原因,牢记各种因变量和自变量,称为预测分析。

由于预测分析通过识别因果关系来工作,因此有利于为未来做出有见地的决策。 然而,这并不像看起来那么简单。 任何企业都有很多变数需要处理——包括当前的见解、限制等等。

查看我们的数据科学认证以提升自己的技能。

要准确预测,您必须考虑这些变量并得出最佳解决方案。 这就是线性规划出现的地方。 线性规划是一种重要的算法,可以帮助数据科学家找到各种问题的最佳解决方案。 线性规划考虑了所有基本变量、等式和不等式来得出最终解决方案,从而确保预测是万无一失的。

在本文中,让我们看看什么是线性规划,线性规划的不同方法和一个示例线性规划问题!

目录

探索我们流行的数据科学学位

IIITB 数据科学高级管理研究生课程 商业决策数据科学专业证书课程 亚利桑那大学数据科学理学硕士
IIITB 数据科学高级证书课程 马里兰大学数据科学和商业分析专业证书课程 数据科学学位

预测分析中的线性规划

在开始讨论技术细节之前,重要的是要注意线性规划上下文中的编程并不指计算机或软件编程。 另一方面,线性规划本质上是一种优化技术(线性优化),有助于从数学模型中找到最佳结果。 要制定线性规划,了解线性规划的基本要素非常重要,包括:

  • 决策变量:这是指我们想要确定的变量,即未知数。
  • 目标函数:这是指表示需要最小化或最大化的数量的线性函数。
  • 约束:这是一组不等式或等式,代表对我们的决策变量的所有限制。
  • 非负限制:这是指一个基本的约束点,因为决策变量的值是非负的。

解决了基本术语后,现在让我们看看在解决线性规划问题时可以采用哪些方法。

2022 年需要学习的顶级基本数据科学技能

SL。 2022 年最值得学习的数据科学技能
1 数据分析认证 推论统计认证
2 假设检验认证 逻辑回归认证
3 线性回归认证 用于分析认证的线性代数

求解线性规划

我们可以按照以下四个步骤成功解决线性规划问题:

  • 识别决策变量
  • 开发目标函数
  • 指定约束
  • 说明非负性限制

稍后,当我们查看线性规划的已解决示例时,我们将更深入地研究这些步骤。 但在此之前,让我们看看解决线性规划问题的各种方法。 大致有四种方法可供选择:

  • 图解法:图解法是用于解决两个变量的线性规划问题的最基本方法。 它主要用于只有两个决策变量需要考虑的情况。 图解法涉及形成一组线性不等式并使它们受到相关条件或约束。 然后,将方程绘制在XY平面上,绘制所有线性方程形成的相交区域就是可行区域。 该区域指示模型的值并提供最佳解决方案。
  • 单纯形法:这是一种解决线性规划问题的强大方法,它遵循迭代过程以达到最优解。 在这种方法中,基本变量被修改,直到达到初始目标函数的最大值或最小值(根据需要)。
  • 西北角和最低成本法:这些是主要用于运输问题的特定类型的方法,以确定运输产品或货物的最佳方式。 因此,这是解决供需问题的便捷优化方法。 这种方法的假设是只有一种产品。 然而,对这种产品的需求来自各种来源,它们都累积起来构成了总供应量。 因此,这种方法旨在最大限度地降低运输成本。
  • 使用 R 求解: R 是数据科学和数据分析中使用最广泛的工具之一。 R 使得使用 IpSolve 包在几行代码中执行优化变得非常容易。
  • 使用开源工具解决:最后一种方法使用许多可用于优化问题的开源工具之一。 开源工具的一个示例是 OpenSolve,它是 Excel 的线性优化器,可无缝处理多达 100 个变量。 除此之外,CPLEX、MATLAB、Gurobi 等是其他一些有用的开源工具。

阅读我们热门的数据科学文章

数据科学职业道路:综合职业指南 数据科学职业发展:工作的未来就在这里 为什么数据科学很重要? 数据科学为企业带来价值的 8 种方式
数据科学对管理者的相关性 每个数据科学家都应该拥有的终极数据科学备忘单 成为数据科学家的 6 大理由
数据科学家生活中的一天:他们做什么? 神话破灭:数据科学不需要编码 商业智能与数据科学:有什么区别?

线性规划的示例图形求解

在每年的节日期间,公司会考虑两个因素——X 和 Y——来创建用户包。 总包装重量必须为 5 公斤——Y 不得超过 4 公斤,X 和 Y 至少为 2 公斤。X 和 Y 对整个利润的贡献如下——卢比。 X 为 5 / kg,Y 为 6 / kg。

让我们尝试解决这个线性规划问题,以达到为公司带来最高利润的最佳组合。

1. 使用我们的主要功能

我们问题的优化目标是利润最大化。 X 和 Y 的利润贡献在问题陈述中给出。 现在,

  • 让一公斤 X
  • 让 b kg 的 Y
  • 然后我们的目标函数变为 -> c = 5*a + 6*b,我们需要最大化 c。

我们有 a, b 作为决策变量,而 c 是我们需要的函数。

2. 从问题中发展约束

我们在问题中得到以下约束:

  • 礼包重量必须为5kg => a + b = 5
  • Y 小于 4kg,X 至少 2kg => x>=2; y<=4

3. 非负约束

X 和 Y 的数量应该是正数 => a, b>0

现在,让我们快速总结一下到目前为止我们已经提出的整个问题:

我们需要在以下两个条件下优化 c = 5a+6b:

  • a+b=5
  • a>=2
  • b<=4

我们正在使用图形方法来解决这个问题,所以让我们考虑一个带有 XY 轴的二维图,并尝试绘制方程和不等式。 我们将随身携带以下物品:

  • a + b = 5 是一条直线,在 (5,0) 处切割 x 轴,在 (0,5) 处切割 y 轴。 由于我们的表达式中有一个等号,我们确信我们的可行区域位于这些线的交点区域。
  • a >= 2 是将 x 轴切割为 (2,0) 的直线。 由于我们的表达式有一个大于约束,我们的可行区域落在我们线的 RHS 上。
  • b <= 4 是在 (0,4) 处切割 y 轴的直线。 由于我们有一个较小的约束,我们的可行区域是线以下的区域。
  • 最后,由于 a 和 b 都是正值,我们关注的区域是第一象限。

如果您在图表上绘制了这些线和约束,您将拥有满足所有必需条件的最终区域。 位于这条线最极端的两点是利润最大化的可能考虑因素。 这些是点 (2,3) 和 (5,0)。 为了找出这两者中哪一个能带来更好的利润,我们可以简单地将这些点放在我们的目标函数中,看看哪个产生最好的输出:

  • c = 5a + 6b ⬄ c = (5*2) +(6*3) = 28
  • c = 5a + 6b ⬄ z = (5*5) +(6*0) = 25

如您所见,我们为选项 A 获得了更高的利润值。因此,我们提供最佳利润的解决方案如下 => 2 公斤 X 因子和 3 公斤 Y 因子!

综上所述

优化问题永无止境——尤其是当我们在业务环境中交谈时。 企业比他们想要的更频繁地面临优化挑战。 结果,仅仅图形化的方法并不足以解决更多的技术优化问题。

您需要了解重要的工具或编程语言才能成功地对多变量问题执行线性优化。 但好消息是,掌握使用相关工具或编程语言的窍门并不难。 整个数据科学领域都非常受欢迎,这使得任何背景的人都更容易建立数据科学事业,如果他们有兴趣的话。

在 upGrad,我们指导了来自世界各地具有不同背景的学生,并帮助他们发展了在数据科学领域取得成功所需的相关理论知识和实践专业知识。 查看我们的数据科学高管研究生课程,了解有关我们的课程结构、教学大纲和 upGrad 优势的更多信息!

1. 线性规划与计算机编程有关吗?

不,线性规划是指在约束下执行优化。 它与传统意义上的计算机编程无关。

2. 什么时候最需要线性规划?

在各种约束下优化某些决策变量时,您需要线性规划。 它在预测分析期间派上用场,可帮助企业做出更好的预测。

3. 线性规划需要手动完成吗?

不,有各种工具——包括开源工具和其他工具——可以帮助您执行线性编程。