데이터 과학의 선형 계획법이란: 개요
게시 됨: 2022-09-21데이터 과학은 컴퓨터 과학, 수학, 데이터 분석, 통계 등을 차용하는 진정한 학제 간 분야로 성장했습니다. 데이터 과학의 발전은 전 세계 기업이 정보에 입각한 데이터 기반 의사 결정을 내리는 데 도움이 되었습니다. 그 결과 오늘날 기업들은 수년 동안 축적한 데이터의 중요성을 깨닫고 있습니다.
데이터 과학자는 고급 도구를 사용하여 기존 데이터를 사용하여 현재 비즈니스 시나리오를 평가하고 관계를 도출하며 통찰력 있는 패턴을 찾습니다. 이 방법을 기술 분석이라고 합니다. 또한 데이터 과학자는 예측 분석으로 알려진 다양한 종속 및 독립 변수를 염두에 두고 효과와 원인을 연구합니다.
Predictive Analytics는 원인과 결과 관계를 식별하여 작동하므로 미래에 대한 통찰력 있는 결정을 내리는 데 유용합니다. 그러나 이것은 보이는 것처럼 간단하지 않습니다. 모든 비즈니스에는 현재 통찰력, 제약 조건 등을 포함하여 처리해야 할 많은 변수가 있습니다.
데이터 과학 인증을 확인하여 기술을 향상시키십시오.
정확하게 예측하려면 이러한 변수를 고려하여 최적의 솔루션에 도달해야 합니다. 여기서 선형 계획법이 등장합니다. 선형 계획법은 알고리즘적으로 작동하고 데이터 과학자가 다양한 문제에 대한 최적의 솔루션을 찾는 데 도움이 되는 중요한 기술입니다. 선형 계획법은 모든 필수 변수, 등식 및 부등식을 최종 솔루션으로 간주하여 예측이 완벽하도록 보장합니다.
이 기사에서는 선형 계획법이 무엇인지, 선형 계획법의 다양한 방법과 샘플 선형 계획법 문제를 살펴보겠습니다!
인기 있는 데이터 과학 학위 살펴보기
IIITB의 데이터 과학 대학원 대학원 프로그램 | 비즈니스 의사 결정을 위한 데이터 과학 전문 인증 프로그램 | 애리조나 대학교 데이터 과학 석사 |
IIITB의 데이터 과학 고급 인증 프로그램 | 메릴랜드 대학교 데이터 과학 및 비즈니스 분석 전문 자격증 프로그램 | 데이터 과학 학위 |
예측 분석의 선형 계획법
기술을 시작하기 전에 선형 계획법의 맥락에서 프로그래밍은 컴퓨터 또는 소프트웨어 프로그래밍을 참조하지 않는다는 점에 유의하는 것이 중요합니다. 반면에 선형 계획법은 본질적으로 수학적 모델에서 최상의 결과를 찾는 데 도움이 되는 최적화 기법(선형 최적화)입니다. 선형 계획법을 공식화하려면 다음을 포함하는 선형 계획법의 기본 요소를 이해하는 것이 중요합니다.
- 결정 변수: 이것은 우리가 결정하고자 하는 변수, 즉 미지수를 나타냅니다.
- 목적 함수: 최소화하거나 최대화해야 하는 양을 나타내는 선형 함수를 나타냅니다.
- Constraints: 이것은 우리의 결정 변수에 대한 모든 제한을 나타내는 부등식 또는 평등의 집합입니다.
- 음이 아닌 제한: 결정 변수의 값이 음이 아닌 필수 제한점을 나타냅니다.
기본 용어가 정해지면 이제 선형 계획법 문제를 푸는 동안 어떤 접근 방식을 취할 수 있는지 살펴보겠습니다.
2022년에 배워야 할 최고의 필수 데이터 과학 기술
에스엘. 아니 | 2022년에 배워야 할 최고의 데이터 과학 기술 | |
1 | 데이터 분석 인증 | 추론 통계 인증 |
2 | 가설 테스트 인증 | 로지스틱 회귀 인증 |
삼 | 선형 회귀 인증 | 분석 인증을 위한 선형 대수학 |
선형 계획법 풀기
선형 계획법 문제를 성공적으로 해결하기 위해 다음 네 단계를 수행할 수 있습니다.
- 결정 변수 식별
- 목적 함수 개발
- 제약 조건 지정
- 음수가 아닌 제한 사항 명시
나중에 선형 계획법의 해결된 예를 볼 때 이러한 단계에 대해 더 자세히 알아볼 것입니다. 그러나 그 전에 선형 계획법 문제에 접근할 수 있는 다양한 방법을 살펴보겠습니다. 선택할 수 있는 접근 방식은 크게 4가지가 있습니다.
- 그래픽 방법: 그래픽 방법은 두 변수의 선형 계획법 문제를 해결하는 데 사용되는 가장 기본적인 방법입니다. 고려해야 할 결정 변수가 두 개뿐일 때 주로 사용됩니다. 그래픽 방법에는 선형 부등식 집합을 형성하고 관련 조건이나 제약 조건을 적용하는 것이 포함됩니다. 그런 다음 XY 평면에 방정식을 플롯하고 모든 선형 방정식을 플롯하여 형성되는 교차 영역이 실현 가능 영역입니다. 이 영역은 모델의 값을 나타내며 최적의 솔루션을 제공합니다.
- Simplex 방법: 선형 계획법 문제를 해결하기 위한 강력한 방법이며 반복 절차를 따라 최적의 솔루션에 도달합니다. 이 접근 방식에서 필수 변수는 초기 목적 함수에 대해 최대 또는 최소 값(필요에 따라)이 달성될 때까지 수정됩니다.
- 노스웨스트 코너 및 최소 비용 방법: 제품 또는 상품을 운송하는 가장 좋은 방법을 결정하기 위해 운송 문제에 본질적으로 사용되는 특정 유형의 방법입니다. 결과적으로 이것은 수요 공급 문제에 대한 편리한 최적화 방법입니다. 이 방법에 대한 가정은 하나의 제품만 있다는 것입니다. 그러나 이 제품에 대한 수요는 다양한 출처에서 비롯되며 모두 누적되어 총 공급을 구성합니다. 따라서 이 방법은 운송 비용을 최소화하는 것을 목표로 합니다.
- R을 사용하여 풀기: R은 데이터 과학 및 데이터 분석에 가장 널리 사용되는 도구 중 하나입니다. R을 사용하면 IpSolve 패키지를 사용하여 몇 줄의 코드로 최적화를 매우 쉽게 수행할 수 있습니다.
- 오픈 소스 도구를 사용하여 해결: 마지막 방법은 최적화 문제에 사용할 수 있는 많은 오픈 소스 도구 중 하나를 사용합니다. 오픈 소스 도구의 한 예로 Excel용 선형 최적화 프로그램인 OpenSolve가 있으며 최대 100개의 변수에 대해 원활하게 작동합니다. 그 외에도 CPLEX, MATLAB, Gurobi 등은 다른 유용한 오픈 소스 도구입니다.
인기 있는 데이터 과학 기사 읽기
데이터 과학 직업 경로: 종합 직업 가이드 | 데이터 과학 경력 성장: 작업의 미래가 여기에 있습니다 | 데이터 과학이 중요한 이유는 무엇입니까? 데이터 과학이 비즈니스에 가치를 가져다주는 8가지 방법 |
관리자를 위한 데이터 과학의 관련성 | 모든 데이터 과학자가 갖추어야 할 궁극의 데이터 과학 치트 시트 | 데이터 과학자가 되어야 하는 6가지 이유 |
데이터 과학자의 하루: 그들은 무엇을 합니까? | 잘못된 통념: 데이터 과학에는 코딩이 필요하지 않습니다 | 비즈니스 인텔리전스 대 데이터 과학: 차이점은 무엇입니까? |
선형 계획법의 샘플 그래픽 풀이
매년 축제 시즌 동안 회사는 X와 Y의 두 가지 요소를 고려하여 사용자 팩을 만듭니다. 총 패키지의 무게는 5kg이어야 하며, Y는 4kg, X는 2kg 이상이어야 합니다. X와 Y는 다음과 같이 전체 이익에 기여합니다. – Rs. X는 5/kg, Y는 6/kg입니다.
이 선형 계획법 문제를 해결하여 회사에 가장 높은 수익을 가져다주는 최상의 조합에 도달하도록 합시다.
1. 기본 기능으로 작업하기
우리 문제의 최적화 목표는 이익 극대화입니다. X와 Y의 이익 기여도는 문제 설명에서 우리에게 주어집니다. 지금,
- X의 kg을 보자
- b kg의 Y를 하자
- 그러면 목적 함수는 -> c = 5*a + 6*b가 되며 c를 최대화해야 합니다.
우리는 결정 변수로, b를 가지고 있는 반면, c는 우리의 필수 기능입니다.
2. 문제에서 제약 조건 개발
문제에서 다음과 같은 제약 조건이 주어집니다.
- 선물 팩의 무게는 5kg이어야 합니다 => a + b = 5
- 4kg 미만의 Y 및 2kg 이상의 X => x>=2; y<=4
3. 음이 아닌 제약 조건
X와 Y의 양은 양수여야 합니다 =>, b>0
이제 지금까지 설명한 대로 전체 문제를 빠르게 요약해 보겠습니다.
다음 두 조건에서 c = 5a+6b를 최적화해야 합니다.
- a+b=5
- a>=2
- b<=4
우리는 이 문제를 해결하기 위해 그래픽 방식을 사용하고 있으므로 XY 축이 있는 2차원 그래프를 고려하고 방정식과 부등식을 플롯해 보겠습니다. 우리는 다음과 같은 것들을 갖게 될 것입니다:
- a + b = 5는 (5,0)에서 x축을 자르고 점 (0,5)에서 y축을 자르는 직선입니다. 표현식에 등호 기호가 있으므로 실현 가능한 영역이 이 선의 교차 영역에 있다고 확신합니다.
- a >= 2는 x축을 (2,0)으로 자르는 직선입니다. 표현식이 제약 조건보다 크므로 실행 가능 영역은 라인의 RHS에 해당합니다.
- b <= 4는 (0,4)에서 y축을 자르는 직선입니다. 제약 조건이 적기 때문에 실현 가능한 영역은 선 아래 영역입니다.
- 마지막으로 및 b는 모두 양수 값이므로 관심 영역은 첫 번째 사분면입니다.
이러한 선과 제약 조건을 그래프 시트에 플로팅했다면 필요한 모든 조건을 충족하는 최종 영역을 갖게 됩니다. 이 선의 가장 극단에 있는 두 지점은 이윤 극대화를 위한 가능한 고려 사항입니다. 포인트 (2,3) 및 (5,0)입니다. 이 두 가지 중 어느 것이 더 나은 수익을 제공하는지 찾으려면 목적 함수에 포인트를 넣고 어떤 것이 가장 좋은 결과를 산출하는지 확인할 수 있습니다.
- c = 5a + 6b ⬄ c = (5*2) +(6*3) = 28
- c = 5a + 6b ⬄ z = (5*5) +(6*0) = 25
보시다시피, 우리는 옵션 A에 대해 더 높은 이익 가치를 얻습니다. 따라서 최상의 이익을 주는 우리의 솔루션은 다음과 같습니다 => 팩터 X 2kg 및 팩터 Y 3kg!
결론적으로
최적화 문제는 끝이 없습니다. 특히 비즈니스 맥락에서 이야기할 때 그렇습니다. 기업은 원하는 것보다 더 자주 최적화 문제에 직면합니다. 결과적으로 그래픽 방식만으로는 더 많은 기술 최적화 문제를 해결할 수 없습니다.
다변수 문제에 대한 선형 최적화를 성공적으로 수행하려면 중요한 도구 또는 프로그래밍 언어를 이해해야 합니다. 그러나 좋은 소식은 관련 도구나 프로그래밍 언어 작업에 익숙해지는 것이 그리 어렵지 않다는 것입니다. 데이터 과학의 전체 분야는 매우 환영하기 때문에 배경을 가진 사람들이 관심이 있는 경우 데이터 과학 경력을 쌓는 것이 더 쉽습니다.
upGrad에서 우리는 다양한 배경을 가진 전 세계의 학생들을 지도하고 그들이 데이터 과학에서 성공하는 데 필요한 관련 이론 지식과 실용적인 전문 지식을 개발하도록 도왔습니다. 과정 구조, 강의 계획서 및 upGrad 이점에 대한 자세한 내용 은 데이터 과학의 이그 제 큐 티브 포스트 대학원 프로그램을 확인하십시오 !
1. 선형 계획법은 컴퓨터 프로그래밍과 관련이 있습니까?
아니요, 선형 계획법은 제약 조건에서 최적화를 수행하는 것을 말합니다. 그것은 단어의 전통적인 의미에서 컴퓨터 프로그래밍과 관련이 없습니다.
2. 선형 계획법이 가장 필요한 때는 언제입니까?
다양한 제약 조건에서 일부 결정 변수를 최적화할 때 선형 계획법이 필요합니다. 예측 분석 중에 유용하며 기업이 더 나은 예측을 할 수 있도록 도와줍니다.
3. 선형 계획법을 수동으로 수행해야 합니까?
아니요, 선형 프로그래밍을 수행하는 데 도움이 되는 다양한 도구(오픈 소스 및 기타 도구)가 있습니다.