データ サイエンスにおける線形計画法とは: 概要
公開: 2022-09-21データ サイエンスは、コンピューター サイエンス、数学、データ分析、統計などから借用した、真に学際的な分野として成長しました。その進歩は、世界中の企業がより多くの情報に基づいたデータに裏付けられた意思決定を下すのに役立っています。 その結果、今日、企業は長年にわたって取得したデータの重要性を認識しています。
データ サイエンティストは高度なツールを使用して、既存のデータを使用して現在のビジネス シナリオを評価し、関係を導き出し、洞察に満ちたパターンを見つけます。 この方法は、記述的分析として知られています。 さらに、データ サイエンティストは、予測分析として知られるさまざまな従属変数と独立変数を念頭に置いて、効果とその原因も研究します。
予測分析は因果関係を特定することで機能するため、将来に向けて洞察に満ちた意思決定を行うのに役立ちます。 ただし、これは見かけほど簡単ではありません。 どのビジネスにも、現在の洞察、制約など、対処しなければならない多くの変数があります。
データ サイエンス認定資格をチェックして、スキルアップを図りましょう。
正確に予測するには、これらの変数を考慮して最適解にたどり着く必要があります。 ここで、線形計画法の出番です。 線形計画法は、アルゴリズム的に機能する重要な手法であり、データ サイエンティストがさまざまな問題に対して最適なソリューションを見つけるのに役立ちます。 線形計画法は、すべての重要な変数、等式、および不等式を考慮して最終的な解を導き出し、予測が確実に確実に行われるようにします。
この記事では、線形計画法とは何か、線形計画法のさまざまな方法、および線形計画法の問題の例を見てみましょう!
人気のあるデータ サイエンスの学位を調べる
IIITBのデータサイエンスのエグゼクティブポスト大学院プログラム | ビジネス上の意思決定のためのデータ サイエンスのプロフェッショナル認定プログラム | アリゾナ大学でデータ サイエンスの理学修士号を取得 |
IIITB のデータ サイエンスの高度な証明書プログラム | メリーランド大学のデータ サイエンスとビジネス分析のプロフェッショナル認定プログラム | データサイエンスの学位 |
予測分析における線形計画法
技術的なことを始める前に、線形計画法のコンテキストでのプログラミングは、コンピューターやソフトウェアのプログラミングを指すものではないことに注意することが重要です。 一方、線形計画法は本質的に、数学的モデルから最良の結果を見つけるのに役立つ最適化手法 (線形最適化) です。 線形計画法を定式化するには、次のような線形計画法の基本要素を理解することが重要です。
- 決定変数:これは、決定したい変数、つまり未知数を指します。
- 目的関数:これは、最小化または最大化する必要がある量を表す線形関数を指します。
- 制約:これは、決定変数に対するすべての制限を表す一連の不等式または等式です。
- 非負の制限:これは、決定変数の値が非負であるという制約の本質的な点を指します。
基本的な用語が決まったので、線形計画法の問題を解決する際にどのようなアプローチを取ることができるかを見てみましょう。
2022 年に学ぶべき重要なデータ サイエンス スキル
SL。 いいえ | 2022 年に学ぶべきトップ データ サイエンス スキル | |
1 | データ分析認定 | 推論統計学認定 |
2 | 仮説検定認定 | ロジスティック回帰の認定 |
3 | 線形回帰の認定 | 解析のための線形代数 |
線形計画法を解く
線形計画法の問題をうまく解決するには、次の 4 つの手順に従います。
- 決定変数の特定
- 目的関数の開発
- 制約の指定
- 非負の制限を述べる
これらの手順については、後で線形計画法の解決済みの例を参照するときに詳しく説明します。 しかしその前に、線形計画法の問題にアプローチできるさまざまな方法を見てみましょう。 大きく分けて 4 つのアプローチから選択できます。
- グラフィカルな方法:グラフィカルな方法は、2 つの変数で線形計画問題を解くために使用される最も基本的な方法です。 考慮すべき決定変数が 2 つしかない場合に主に使用されます。 グラフィカルな方法では、一連の線形不等式を形成し、それらに関連する条件または制約を適用します。 次に、方程式を XY 平面にプロットし、すべての 1 次方程式をプロットしてできる交点の領域を実行可能領域とします。 この領域は、モデルの値を示し、最適なソリューションを提供します。
- シンプレックス法:これは線形計画法の問題を解決するための強力な方法であり、反復手順に従って最適解に到達します。 このアプローチでは、初期目的関数の最大値または最小値 (必要に応じて) が達成されるまで、必須変数が変更されます。
- Northwest Corner and Least Cost Method:これらは、製品または商品を輸送するための最良の方法を決定するために輸送問題に本質的に使用される特定のタイプの方法です。 その結果、これは需要と供給の問題に対する便利な最適化方法です。 この方法の前提は、製品が 1 つだけであることです。 ただし、この製品の需要はさまざまなソースから発生し、それらがすべて累積して総供給を構成します。 したがって、この方法は輸送コストを最小限に抑えることを目的としています。
- R を使用した解決: R は、データ サイエンスとデータ分析で最も広く使用されているツールの 1 つです。 R では、IpSolve パッケージを使用して、わずか数行のコードで最適化を非常に簡単に実行できます。
- オープンソース ツールを使用して解決する:最後の方法では、最適化問題に使用できる多くのオープン ソース ツールの 1 つを使用します。 オープンソース ツールの一例は、Excel の線形オプティマイザーである OpenSolve で、最大 100 の変数に対してシームレスに機能します。 それとは別に、CPLEX、MATLAB、Gurobi など、その他の便利なオープンソース ツールがあります。
人気のデータ サイエンス記事を読む
データ サイエンスのキャリア パス: 包括的なキャリア ガイド | データ サイエンスのキャリア成長: 仕事の未来はここにあります | データ サイエンスが重要な理由データ サイエンスがビジネスに価値をもたらす 8 つの方法 |
マネージャーにとってのデータサイエンスの関連性 | すべてのデータ サイエンティストが持つべき究極のデータ サイエンス チート シート | データ サイエンティストになるべき 6 つの理由 |
データ サイエンティストの 1 日: 彼らは何をしているのか? | 神話の崩壊: データ サイエンスにコーディングは必要ない | ビジネス インテリジェンスとデータ サイエンスの違い: 違いは何ですか? |
線形計画法をグラフィカルに解くサンプル
毎年恒例のホリデー シーズン中、企業は X と Y の 2 つの要素を考慮してユーザー パックを作成します。 パッケージの総重量は 5kg でなければならず、Y は 4kg を超えてはならず、X は少なくとも 2kg を超えてはなりません。X と Y は、次のように全体の利益に貢献します。 X は 5 / kg、Y は 6 / kg です。
この線形計画法の問題を解決して、会社に最高の利益をもたらす最適な組み合わせにたどり着きましょう。
1. 主要な機能を使用する
私たちの問題の最適化の目標は、利益の最大化です。 X と Y の利益貢献は、問題ステートメントで示されます。 今、
- X の kg を
- Y を b kg とする
- 目的関数は -> c = 5*a + 6*b となり、c を最大化する必要があります。
決定変数として a、b がありますが、c は必要な関数です。
2. 問題から制約を導き出す
この問題では、次の制約が与えられます。
- ギフトパックの重量は 5kg でなければなりません => a + b = 5
- Y が 4kg 未満で、X が 2kg 以上 => x>=2; y<=4
3. 非負の制約
X と Y の量は正でなければなりません => a, b>0
ここまで説明してきたように、問題全体を簡単に要約してみましょう。
次の 2 つの条件の下で c = 5a+6b を最適化する必要があります。
- a+b=5
- a>=2
- b<=4
この問題を解決するためにグラフィカルな方法を使用しているので、XY 軸を持つ 2 次元グラフを考えて、方程式と不等式をプロットしてみましょう。 以下のものを用意します。
- a + b = 5 は、x 軸を (5,0) で、y 軸を点 (0,5) で結ぶ直線です。 式に等号があるので、実行可能領域はこれらの線の交点の領域にあると確信しています。
- a >= 2 は、x 軸を (2,0) として切断する直線です。 式にはより大きな制約があるため、実行可能領域は直線の右辺になります。
- b <= 4 は、y 軸を (0,4) で切断する直線です。 制約が少ないため、実行可能な領域は線の下の領域です。
- 最後に、a と b は両方とも正の値であるため、関心のある領域は第 1 象限です。
これらの線と制約をグラフ シートにプロットすると、必要なすべての条件を満たす最終領域が得られます。 この線の最も極端な点にある 2 つの点は、利益を最大化するための考えられる考慮事項です。 これらは点 (2,3) と (5,0) です。 これら 2 つのうちどちらがより良い利益をもたらすかを調べるには、単純にポイントを目的関数に入れ、どちらが最良の出力をもたらすかを確認します。
- c = 5a + 6b ⬄ c = (5*2) +(6*3) = 28
- c = 5a + 6b ⬄ z = (5*5) +(6*0) = 25
ご覧のとおり、オプション A の方がより高い利益値を得ることができます。したがって、最高の利益をもたらす解決策は次のとおりです => 2kg の因子 X と 3kg の因子 Y!
結論は
最適化の問題に終わりはありません。ビジネスの文脈で話す場合は特にそうです。 企業は、望んでいるよりも頻繁に最適化の課題に直面しています。 その結果、グラフィカルな方法だけでは、より技術的な最適化問題を解決するには不十分です。
多変数問題で線形最適化をうまく実行するには、重要なツールまたはプログラミング言語を理解する必要があります。 しかし、幸いなことに、関連するツールやプログラミング言語を操作するコツをつかむのはそれほど難しくありません。 データ サイエンスの分野全体は非常に歓迎されているため、興味があれば、バックグラウンドを問わず、データ サイエンスのキャリアを構築しやすくなっています。
upGrad では、さまざまなバックグラウンドを持つ世界中の学生を指導し、データ サイエンスで成功するために必要な関連する理論的知識と実践的な専門知識の開発を支援してきました。 コースの構造、シラバス、upGrad の利点の詳細については、データ サイエンスの上級大学院プログラムをご覧ください。
1. 線形計画法はコンピュータ プログラミングに関連していますか?
いいえ、線形計画法とは、制約の下で最適化を実行することを指します。 伝統的な意味でのコンピュータープログラミングとは関係ありません。
2. 線形計画法が最も必要とされるのはいつですか?
さまざまな制約の下でいくつかの決定変数を最適化する場合、線形計画法が必要です。 予測分析の際に役立ち、企業がより良い予測を行うのに役立ちます。
3. 線形計画法は手動で行う必要がありますか?
いいえ、線形計画法を実行するのに役立つさまざまなツール (オープンソースまたはその他のツール) があります。