什麼是數據科學中的線性規劃:概述

已發表: 2022-09-21

數據科學已經成長為一個真正的跨學科領域,它藉鑑了計算機科學、數學、數據分析、統計學等。它的進步幫助全球企業做出了更明智、有數據支持的決策。 因此,今天,公司意識到他們多年來獲得的數據的重要性。

數據科學家使用先進的工具來使用現有數據評估當前的業務場景,推導出關係並找到有洞察力的模式。 這種方法稱為描述性分析。 此外,數據科學家還研究影響及其原因,牢記各種因變量和自變量,稱為預測分析。

由於預測分析通過識別因果關係來工作,因此有利於為未來做出有見地的決策。 然而,這並不像看起來那麼簡單。 任何企業都有很多變數需要處理——包括當前的見解、限制等等。

查看我們的數據科學認證以提升自己的技能。

要準確預測,您必須考慮這些變量並得出最佳解決方案。 這就是線性規劃出現的地方。 線性規劃是一種重要的算法,可以幫助數據科學家找到各種問題的最佳解決方案。 線性規劃考慮了所有基本變量、等式和不等式來得出最終解決方案,從而確保預測是萬無一失的。

在本文中,讓我們看看什麼是線性規劃,線性規劃的不同方法和一個示例線性規劃問題!

目錄

探索我們流行的數據科學學位

IIITB 數據科學高級管理研究生課程 商業決策數據科學專業證書課程 亞利桑那大學數據科學理學碩士
IIITB 數據科學高級證書課程 馬里蘭大學數據科學和商業分析專業證書課程 數據科學學位

預測分析中的線性規劃

在開始討論技術細節之前,重要的是要注意線性規劃上下文中的編程並不指計算機或軟件編程。 另一方面,線性規劃本質上是一種優化技術(線性優化),有助於從數學模型中找到最佳結果。 要製定線性規劃,了解線性規劃的基本要素非常重要,包括:

  • 決策變量:這是指我們想要確定的變量,即未知數。
  • 目標函數:這是指表示需要最小化或最大化的數量的線性函數。
  • 約束:這是一組不等式或等式,代表對我們的決策變量的所有限制。
  • 非負限制:這是指一個基本的約束點,因為決策變量的值是非負的。

解決了基本術語後,現在讓我們看看在解決線性規劃問題時可以採用哪些方法。

2022 年需要學習的頂級基本數據科學技能

SL。 2022 年最值得學習的數據科學技能
1 數據分析認證 推論統計認證
2 假設檢驗認證 邏輯回歸認證
3 線性回歸認證 用於分析認證的線性代數

求解線性規劃

我們可以按照以下四個步驟成功解決線性規劃問題:

  • 識別決策變量
  • 開發目標函數
  • 指定約束
  • 說明非負性限制

稍後,當我們查看線性規劃的已解決示例時,我們將更深入地研究這些步驟。 但在此之前,讓我們看看解決線性規劃問題的各種方法。 大致有四種方法可供選擇:

  • 圖解法:圖解法是用於解決兩個變量的線性規劃問題的最基本方法。 它主要用於只有兩個決策變量需要考慮的情況。 圖解法涉及形成一組線性不等式並使它們受到相關條件或約束。 然後,將方程繪製在XY平面上,繪製所有線性方程形成的相交區域就是可行區域。 該區域指示模型的值並提供最佳解決方案。
  • 單純形法:這是一種解決線性規劃問題的強大方法,它遵循迭代過程以達到最優解。 在這種方法中,基本變量被修改,直到達到初始目標函數的最大值或最小值(根據需要)。
  • 西北角和最低成本法:這些是主要用於運輸問題的特定類型的方法,以確定運輸產品或貨物的最佳方式。 因此,這是解決供需問題的便捷優化方法。 這種方法的假設是只有一種產品。 然而,對這種產品的需求來自各種來源,它們都累積起來構成了總供應量。 因此,這種方法旨在最大限度地降低運輸成本。
  • 使用 R 求解: R 是數據科學和數據分析中使用最廣泛的工具之一。 R 使得使用 IpSolve 包在幾行代碼中執行優化變得非常容易。
  • 使用開源工具解決:最後一種方法使用許多可用於優化問題的開源工具之一。 開源工具的一個示例是 OpenSolve,它是 Excel 的線性優化器,可無縫處理多達 100 個變量。 除此之外,CPLEX、MATLAB、Gurobi 等是其他一些有用的開源工具。

閱讀我們熱門的數據科學文章

數據科學職業道路:綜合職業指南 數據科學職業發展:工作的未來就在這裡 為什麼數據科學很重要? 數據科學為企業帶來價值的 8 種方式
數據科學對管理者的相關性 每個數據科學家都應該擁有的終極數據科學備忘單 成為數據科學家的 6 大理由
數據科學家生活中的一天:他們做什麼? 神話破滅:數據科學不需要編碼 商業智能與數據科學:有什麼區別?

線性規劃的示例圖形求解

在每年的節日期間,公司會考慮兩個因素——X 和 Y——來創建用戶包。 總包裝重量必須為 5 公斤——Y 不得超過 4 公斤,X 和 Y 至少為 2 公斤。X 和 Y 對整個利潤的貢獻如下——盧比。 X 為 5 / kg,Y 為 6 / kg。

讓我們嘗試解決這個線性規劃問題,以達到為公司帶來最高利潤的最佳組合。

1. 使用我們的主要功能

我們問題的優化目標是利潤最大化。 X 和 Y 的利潤貢獻在問題陳述中給出。 現在,

  • 讓一公斤 X
  • 讓 b kg 的 Y
  • 然後我們的目標函數變為 -> c = 5*a + 6*b,我們需要最大化 c。

我們有 a, b 作為決策變量,而 c 是我們需要的函數。

2. 從問題中發展約束

我們在問題中得到以下約束:

  • 禮包重量必須為5kg => a + b = 5
  • Y 小於 4kg,X 至少 2kg => x>=2; y<=4

3. 非負約束

X 和 Y 的數量應該是正數 => a, b>0

現在,讓我們快速總結一下到目前為止我們已經提出的整個問題:

我們需要在以下兩個條件下優化 c = 5a+6b:

  • a+b=5
  • a>=2
  • b<=4

我們正在使用圖形方法來解決這個問題,所以讓我們考慮一個帶有 XY 軸的二維圖,並嘗試繪製方程和不等式。 我們將隨身攜帶以下物品:

  • a + b = 5 是一條直線,在 (5,0) 處切割 x 軸,在 (0,5) 處切割 y 軸。 由於我們的表達式中有一個等號,我們確信我們的可行區域位於這些線的交點區域。
  • a >= 2 是將 x 軸切割為 (2,0) 的直線。 由於我們的表達式有一個大於約束,我們的可行區域落在我們線的 RHS 上。
  • b <= 4 是在 (0,4) 處切割 y 軸的直線。 由於我們有一個較小的約束,我們的可行區域是線以下的區域。
  • 最後,由於 a 和 b 都是正值,我們關注的區域是第一象限。

如果您在圖表上繪製了這些線和約束,您將擁有滿足所有必需條件的最終區域。 位於這條線最極端的兩點是利潤最大化的可能考慮因素。 這些是點 (2,3) 和 (5,0)。 為了找出這兩者中哪一個能帶來更好的利潤,我們可以簡單地將這些點放在我們的目標函數中,看看哪個產生最好的輸出:

  • c = 5a + 6b ⬄ c = (5*2) +(6*3) = 28
  • c = 5a + 6b ⬄ z = (5*5) +(6*0) = 25

如您所見,我們為選項 A 獲得了更高的利潤值。因此,我們提供最佳利潤的解決方案如下 => 2 公斤 X 因子和 3 公斤 Y 因子!

綜上所述

優化問題永無止境——尤其是當我們在業務環境中交談時。 企業比他們想要的更頻繁地面臨優化挑戰。 結果,僅僅圖形化的方法並不足以解決更多的技術優化問題。

您需要了解重要的工具或編程語言才能成功地對多變量問題執行線性優化。 但好消息是,掌握使用相關工具或編程語言的竅門並不難。 整個數據科學領域都非常受歡迎,這使得任何背景的人都更容易建立數據科學事業,如果他們有興趣的話。

在 upGrad,我們指導了來自世界各地具有不同背景的學生,並幫助他們發展了在數據科學領域取得成功所需的相關理論知識和實踐專業知識。 查看我們的數據科學高管研究生課程,了解有關我們的課程結構、教學大綱和 upGrad 優勢的更多信息!

1. 線性規劃與計算機編程有關嗎?

不,線性規劃是指在約束下執行優化。 它與傳統意義上的計算機編程無關。

2. 什麼時候最需要線性規劃?

在各種約束下優化某些決策變量時,您需要線性規劃。 它在預測分析期間派上用場,可幫助企業做出更好的預測。

3. 線性規劃需要手動完成嗎?

不,有各種工具——包括開源工具和其他工具——可以幫助您執行線性編程。