Was ist lineare Programmierung in Data Science: Übersicht

Veröffentlicht: 2022-09-21

Data Science hat sich zu einem wahrhaft interdisziplinären Bereich entwickelt, der Anleihen bei Informatik, Mathematik, Datenanalyse, Statistik usw. macht. Seine Fortschritte haben Unternehmen auf der ganzen Welt dabei geholfen, viel fundiertere, datengestützte Entscheidungen zu treffen. Infolgedessen erkennen Unternehmen heute die Bedeutung der Daten, die sie im Laufe der Jahre gesammelt haben.

Datenwissenschaftler verwenden fortschrittliche Tools, um aktuelle Geschäftsszenarien anhand vorhandener Daten zu bewerten, Beziehungen abzuleiten und aufschlussreiche Muster zu finden. Diese Methode wird als Descriptive Analytics bezeichnet. Darüber hinaus untersuchen Datenwissenschaftler auch die Auswirkungen und ihre Ursachen, wobei sie verschiedene abhängige und unabhängige Variablen im Auge behalten, bekannt als Predictive Analytics.

Da Predictive Analytics durch die Identifizierung von Ursache-Wirkungs-Beziehungen funktioniert, ist es vorteilhaft, aufschlussreiche Entscheidungen für die Zukunft zu treffen. Dies ist jedoch nicht so einfach, wie es scheinen mag. Jedes Unternehmen muss sich mit vielen Variablen auseinandersetzen – einschließlich aktueller Erkenntnisse, Einschränkungen und mehr.

Sehen Sie sich unsere Data-Science-Zertifizierungen an, um sich weiterzubilden.

Um eine genaue Vorhersage zu treffen, müssen Sie diese Variablen berücksichtigen und zur optimalen Lösung gelangen. Hier kommt die lineare Programmierung ins Spiel. Lineare Programmierung ist eine wichtige Technik, die algorithmisch arbeitet und Datenwissenschaftlern hilft, die optimale Lösung für verschiedene Probleme zu finden. Die lineare Programmierung berücksichtigt alle wesentlichen Variablen, Gleichheiten und Ungleichungen, um zur endgültigen Lösung zu gelangen, wodurch sichergestellt wird, dass die Vorhersage narrensicher ist.

Schauen wir uns in diesem Artikel an, was lineare Programmierung ist, die verschiedenen Methoden der linearen Programmierung und ein Beispiel für ein Problem der linearen Programmierung!

Inhaltsverzeichnis

Entdecken Sie unsere beliebten Data Science-Abschlüsse

Executive Post Graduate Program in Data Science vom IIITB Professional Certificate Program in Data Science für die Entscheidungsfindung in Unternehmen Master of Science in Data Science von der University of Arizona
Advanced Certificate Program in Data Science vom IIITB Professional Certificate Program in Data Science und Business Analytics von der University of Maryland Data Science-Abschlüsse

Lineare Programmierung in Predictive Analytics

Bevor Sie mit den technischen Details beginnen, ist es wichtig zu beachten, dass sich das Programmieren im Kontext der linearen Programmierung nicht auf die Computer- oder Softwareprogrammierung bezieht. Andererseits ist die lineare Programmierung im Wesentlichen eine Optimierungstechnik (lineare Optimierung), die hilfreich ist, um die besten Ergebnisse aus mathematischen Modellen zu finden. Um ein lineares Programm zu formulieren, ist es wichtig, die grundlegenden Elemente der linearen Programmierung zu verstehen, darunter:

  • Entscheidungsvariablen: Damit sind die Variablen gemeint, die wir bestimmen möchten, die Unbekannten.
  • Zielfunktion : Dies bezieht sich auf die lineare Funktion, die die Größen darstellt, die minimiert oder maximiert werden müssen.
  • Einschränkungen: Dies ist eine Reihe von Ungleichheiten oder Gleichheiten, die alle Einschränkungen unserer Entscheidungsvariablen darstellen.
  • Nicht-negative Beschränkungen: Dies bezieht sich auf einen wesentlichen Beschränkungspunkt dahingehend, dass die Werte von Entscheidungsvariablen nicht-negativ sind.

Nachdem die Grundbegriffe geklärt sind, schauen wir uns nun an, welche Ansätze man bei der Lösung eines Problems der linearen Programmierung verfolgen kann.

Top Essential Data Science Skills zum Erlernen im Jahr 2022

SL. Nein Die besten datenwissenschaftlichen Fähigkeiten, die Sie 2022 lernen können
1 Datenanalyse-Zertifizierungen Inferenzstatistik-Zertifizierungen
2 Hypothesentest-Zertifizierungen Logistische Regressionszertifizierungen
3 Lineare Regressionszertifizierungen Lineare Algebra für Analysezertifizierungen

Lineare Programmierung lösen

Wir können diesen vier Schritten folgen, um ein Problem der linearen Programmierung erfolgreich zu lösen:

  • Entscheidungsvariablen identifizieren
  • Entwicklung der Zielfunktion
  • Festlegen der Einschränkungen
  • Angabe der Nicht-Negativitätsbeschränkungen

Wir werden später tiefer in diese Schritte eintauchen, wenn wir uns ein gelöstes Beispiel für lineare Programmierung ansehen. Aber vorher schauen wir uns die verschiedenen Möglichkeiten an, wie Sie ein Problem der linearen Programmierung angehen können. Es stehen grob vier Ansätze zur Auswahl:

  • Grafische Methode: Die grafische Methode ist die grundlegendste Methode, die verwendet wird, um ein Problem der linearen Programmierung in zwei Variablen zu lösen. Es wird meistens verwendet, wenn nur zwei Entscheidungsvariablen zu berücksichtigen sind. Bei der grafischen Methode wird ein Satz linearer Ungleichungen gebildet und den relevanten Bedingungen oder Einschränkungen unterworfen. Dann werden die Gleichungen auf der XY-Ebene aufgetragen, und der Schnittbereich, der durch Auftragen aller linearen Gleichungen gebildet wird, ist der zulässige Bereich. Dieser Bereich zeigt die Werte eines Modells an und bietet die optimale Lösung.
  • Simplex-Methode: Dies ist eine leistungsstarke Methode zur Lösung von Problemen der linearen Programmierung und folgt einem iterativen Verfahren, um zur optimalen Lösung zu gelangen. Bei diesem Ansatz werden die wesentlichen Variablen modifiziert, bis der maximale oder minimale Wert (wie erforderlich) für die anfängliche Zielfunktion erreicht ist.
  • Northwest Corner und Least Cost Method: Dies sind spezielle Arten von Methoden, die im Wesentlichen für Transportprobleme verwendet werden, um den besten Weg zum Transport von Produkten oder Gütern zu bestimmen. Daher ist dies eine praktische Optimierungsmethode für Angebots-Nachfrage-Probleme. Die Annahme für diese Methode ist, dass es nur ein Produkt gibt. Die Nachfrage nach diesem Produkt stammt jedoch aus verschiedenen Quellen, die alle kumulativ das Gesamtangebot ausmachen. Daher zielt diese Methode darauf ab, die Transportkosten zu minimieren.
  • Lösen mit R: R ist eines der am weitesten verbreiteten Tools für Data Science und Datenanalyse. R macht es sehr einfach, die Optimierung in nur wenigen Codezeilen mit dem IpSolve-Paket durchzuführen.
  • Lösung mit Open-Source-Tools: Die letzte Methode verwendet eines von vielen Open-Source-Tools, die für Optimierungsprobleme verfügbar sind. Ein Beispiel für ein Open-Source-Tool ist OpenSolve, ein linearer Optimierer für Excel, der nahtlos für bis zu 100 Variablen funktioniert. Abgesehen davon sind CPLEX, MATLAB, Gurobi usw. einige andere nützliche Open-Source-Tools.

Lesen Sie unsere beliebten Data Science-Artikel

Data Science Career Path: Ein umfassender Karriereleitfaden Data Science Karrierewachstum: Die Zukunft der Arbeit ist da Warum ist Data Science wichtig? 8 Wege, wie Data Science dem Unternehmen einen Mehrwert bringt
Relevanz von Data Science für Manager Der ultimative Data Science Spickzettel, den jeder Data Scientist haben sollte Die 6 wichtigsten Gründe, warum Sie Data Scientist werden sollten
Ein Tag im Leben von Data Scientists: Was machen sie? Mythos gesprengt: Data Science braucht keine Codierung Business Intelligence vs. Data Science: Was sind die Unterschiede?

Beispiel für eine grafische Lösung der linearen Programmierung

Während der jährlichen Festtage berücksichtigt ein Unternehmen zwei Faktoren – X und Y – um ein Benutzerpaket zu erstellen. Das Gewicht des Gesamtpakets muss 5 kg betragen – und es dürfen nicht mehr als 4 kg Y und mindestens 2 kg X enthalten sein. X und Y tragen wie folgt zum Gesamtgewinn bei – Rs. 5 / kg für X und 6 / kg für Y.

Lassen Sie uns versuchen, dieses Problem der linearen Programmierung zu lösen, um die beste Mischung zu finden, die zu den höchsten Gewinnen für das Unternehmen führt.

1. Arbeiten mit unserer primären Funktion

Das Optimierungsziel unseres Problems ist die Gewinnmaximierung. Der Gewinnbeitrag von X und Y wird uns in der Problemstellung gegeben. Jetzt,

  • Lassen Sie ein kg X
  • Sei b kg von Y
  • Unsere Zielfunktion wird dann zu -> c = 5*a + 6*b, und wir müssen c maximieren.

Wir haben a, b als Entscheidungsvariablen, während c unsere erforderliche Funktion ist.

2. Entwicklung der Einschränkungen aus dem Problem

Wir haben die folgenden Einschränkungen in dem Problem:

  • Das Gewicht der Geschenkpackung muss 5 kg betragen => a + b = 5
  • Weniger als 4 kg Y und mindestens 2 kg X => x>=2; y<=4

3. Nicht-negative Beschränkungen

Die Größen für X und Y sollen positiv sein => a, b>0

Lassen Sie uns nun das gesamte Problem, wie wir es bisher dargelegt haben, schnell zusammenfassen:

Wir müssen c = 5a+6b unter den folgenden zwei Bedingungen optimieren:

  • a+b=5
  • a>=2
  • b<=4

Wir verwenden die grafische Methode, um dieses Problem zu lösen, also betrachten wir einen zweidimensionalen Graphen mit der XY-Achse und versuchen, die Gleichungen und Ungleichungen zu zeichnen. Folgende Dinge werden wir dabei haben:

  • a + b = 5 ist eine gerade Linie, die die x-Achse im Punkt (5,0) und die y-Achse im Punkt (0,5) schneidet. Da wir in unserem Ausdruck ein Gleichheitszeichen haben, sind wir sicher, dass unser zulässiger Bereich im Bereich des Schnittpunkts dieser Geraden liegt.
  • a >= 2 ist eine gerade Linie, die die x-Achse als (2,0) schneidet. Da unser Ausdruck eine Größer-als-Einschränkung hat, fällt unser möglicher Bereich auf die rechte Seite unserer Linie.
  • b <= 4 ist eine gerade Linie, die die y-Achse bei (0,4) schneidet. Da wir eine geringere Einschränkung haben, ist unser zulässiger Bereich der Bereich unterhalb der Linie.
  • Da schließlich a und b positive Werte sind, ist unser Anliegen der erste Quadrant.

Wenn Sie diese Linien und Einschränkungen auf einem Diagrammblatt gezeichnet haben, haben Sie die endgültige Region, die alle erforderlichen Bedingungen erfüllt. Die beiden äußersten Punkte dieser Geraden sind mögliche Überlegungen zur Gewinnmaximierung. Dies sind die Punkte (2,3) und (5,0). Um herauszufinden, welche dieser beiden bessere Gewinne bringt, können wir einfach die Punkte in unsere Zielfunktion einsetzen und sehen, welche die beste Ausgabe liefert:

  • c = 5a + 6b ⬄ c = (5*2) + (6*3) = 28
  • c = 5a + 6b ⬄ z = (5*5) + (6*0) = 25

Wie Sie sehen können, erhalten wir einen höheren Gewinnwert für Option A. Unsere Lösung mit den besten Gewinnen lautet also wie folgt => 2 kg Faktor X und 3 kg Faktor Y!

Abschließend

Optimierungsprobleme kennen kein Ende – vor allem im geschäftlichen Kontext. Unternehmen stehen häufiger vor Optimierungsproblemen, als ihnen lieb ist. Infolgedessen reicht die grafische Methode allein nicht aus, um eher technische Optimierungsprobleme zu lösen.

Sie müssen wichtige Tools oder Programmiersprachen verstehen, um eine lineare Optimierung für multivariable Probleme erfolgreich durchzuführen. Aber die gute Nachricht ist, dass es gar nicht so schwer ist, sich mit entsprechenden Tools oder Programmiersprachen zurechtzufinden. Der gesamte Bereich der Datenwissenschaft ist sehr einladend, was es Menschen mit jedem Hintergrund erleichtert, eine Karriere in der Datenwissenschaft aufzubauen, wenn sie Interesse haben.

Bei upGrad haben wir Studenten aus der ganzen Welt mit unterschiedlichen Hintergründen angeleitet und ihnen geholfen, das relevante theoretische Wissen und praktische Fachwissen zu entwickeln, das für den Erfolg in der Datenwissenschaft erforderlich ist. Weitere Informationen zu unserer Kursstruktur, unserem Lehrplan und dem upGrad-Vorteil finden Sie in unserem Executive Post Graduate Program in Data Science !

1. Ist die lineare Programmierung mit der Computerprogrammierung verwandt?

Nein, lineare Programmierung bezieht sich auf die Durchführung von Optimierungen unter Einschränkungen. Es hat nichts mit Computerprogrammierung im herkömmlichen Sinne des Wortes zu tun.

2. Wann wird lineare Programmierung am meisten benötigt?

Sie benötigen eine lineare Programmierung, wenn Sie einige Entscheidungsvariablen unter verschiedenen Randbedingungen optimieren. Es ist praktisch bei Predictive Analytics und hilft Unternehmen, bessere Vorhersagen zu treffen.

3. Muss die lineare Programmierung manuell durchgeführt werden?

Nein, es gibt verschiedene Tools – sowohl Open Source als auch andere – die Ihnen bei der linearen Programmierung helfen können.