구조 방정식 모델링: 알아야 할 모든 것
게시 됨: 2021-02-05SEM(Structural Equation Modeling)은 단일 기술이 아니라 관련 방법의 누적입니다. 방법은 유연하며 프레임워크는 데이터 분석을 위한 것입니다.
연구원들은 단일 분석에서 여러 개의 상호 관련된 종속성을 추정할 수 있기 때문에 이러한 방법을 선호합니다. 구조 방정식 모델링은 내생 및 외생의 두 가지 유형의 변수를 사용합니다.
"권력에는 책임이 따른다"는 것은 잘 알려져 있으므로 강력한 구조 방정식 모델링을 신중하게 사용해야 합니다. 구조 방정식 모델링은 복잡하지만 동시에 빠르게 사용자 친화적인 소프트웨어를 사용하여 어색한 상황에 직면하는 것은 매우 쉽습니다.
목차
Structural Equation Modeling을 사용하기 위해 가장 필요한 것은 무엇입니까?
어느 조직에서나 마케팅은 매우 중요합니다. 그리고 마케팅에서 성공하려면 소비자에 대해 알아야 합니다. 그들은 자신의 태도, 의견, 성격 특성을 알아야 합니다. 그러나 이러한 특성은 잠재되어 있고 종종 추상적이기 때문에 쉽게 측정할 수 없습니다.
현재로서는 이를 측정하기 위해 조사를 수행하고 관찰 모델을 만드는 등의 작업을 수행할 수 있습니다. 그러나 이러한 과정은 측정과 관찰에 오류가 있다는 단점이 있기 때문에 그다지 효과적이지 못하다. 구조 방정식 모델링은 두 작업 모두에서 탁월합니다.
구조 방정식 모델링은 요인 분석과 다중 회귀 분석을 사용합니다. 이 두 가지 분석 방법을 개별적으로 사용하면 유연성을 놓치게 됩니다. 따라서 SEM은 유연성을 제공합니다. 그것은 인과 분석, 독립 변수를 상관시키는 다중 공선성에 적합합니다.

읽기: 기여 모델의 유형
측정 모델은 구조 방정식 모델링에서 유사한 요인 분석입니다. 구조 모델은 측정 모델의 구성 요소와 요소를 연결하는 매듭입니다. 구조 모델은 구성 요소와 요소를 함께 또는 다른 독립 변수와 관련시킵니다. 어떤 경우에는 변수가 경험적 근거로 결합됩니다.
결합 행위는 요인 분석 이전에 발생하며 측정 모델은 역할이 없습니다. 다른 경우에는 원시 변수에만 관심이 있을 때 관찰된 변수가 사용됩니다. 그리고 마지막으로 측정 모델이 없는 경우에는 구조 모델이 경로 분석을 따릅니다.
구조 방정식 모델링은 측량 데이터를 분석하는 데 사용됩니다. 하나의 데이터 소스에 얽매이지 않고 고객 거래, 경제, 소셜 미디어, 고객 거래 데이터와 함께 사용할 수 있습니다. 최근에는 fMRI 데이터를 위해 신경 과학에서 사용됩니다. 최신 형식에서는 모든 데이터 유형과 함께 사용할 수 있습니다. 모델은 비율, 간격, 순서, 명목 및 개수와 같은 데이터 유형을 사용합니다. 변수 간의 곡선 관계를 모델링하는 데 도움이 됩니다.
구조 방정식 모델링은 완전한 데이터 없이 작동할 수 있지만, 그렇다고 해서 모든 데이터를 모델에 제공하지 않으려는 유혹을 받아서는 안 됩니다. 이 모델은 세로, 혼합 및 계층 모델링에 널리 사용됩니다. Segmentation에서 사용할 수 있습니다. 이 모델은 Conjoint Analysis와 같은 여러 종속 변수를 수용합니다. 구조 방정식 모델링은 소비자 설문조사에서 응답 스타일 문제를 수정하는 데 사용됩니다.
구조 방정식 모델링을 사용하는 경우
귀하의 제품에 대한 구매 관심, 선호도와 같은 소비자 인식에 집중해야 하는 비즈니스 사례가 있을 수 있습니다. 이것은 복잡한 모델링 작업이지만 구조 방정식 모델링은 이러한 목적에 적합합니다. 구조 방정식 모델링은 소비자 조사와 같은 간단한 작업에 사용됩니다.
SEMM(Structural Equation Mixture Modeling)은 매우 많은 양의 데이터가 있는 숨겨진 소비자 세그먼트를 대상으로 하는 또 다른 유형의 방법입니다.
한 가지 유형의 모델이 모든 종류의 분석에 적합하다고 가정해서는 안 됩니다. 혼합물 모델링은 노력이 유능한 경우에만 작동하는 경우가 있습니다. 때로는 하나의 전체 모델이 단순히 잘 작동합니다.
구조 방정식 모델링은 좋은가, 나쁜가, 아니면 못생긴가?
산업 심리학이나 조직 심리학과 같이 비실험적 설계가 흔한 환경에서 작업할 때 구조 방정식 모델링이 필요합니다. 구조 방정식 모델링은 널리 사용되며 검토자가 데이터 분석에 사용하고 있습니다. 검토자들은 종종 어떻게 더 진행해야 하는지에 대해 무지합니다.
구조 방정식 모델링의 주요 장점은 이론적 명제를 테스트할 수 있다는 것입니다. 구조 방정식 모델링을 통해 정량적 예측을 평가할 수 있습니다.
전통적인 통계 방법과 SEM의 유사점
- 구조 방정식 모델링은 여러 방식으로 회귀, 상관 관계 및 분산과 같은 동일한 기존 방법을 따릅니다.
- 구조 방정식 모델링과 기존 방법은 모두 선형 통계 모델과 동일한 개념을 가지고 있습니다.
- 특정 가정에서는 통계적 테스트가 유효합니다. 구조 방정식 모델링은 다변량 정규성을 가정하고 기존 방법은 정규 분포를 가정합니다.
- 전통적 또는 구조적 방정식 모델링은 인과성 테스트를 제공하지 않습니다.
기존 방법과 SEM 방법의 차이점
기존 방법은 다음 영역에서 구조 방정식 모델링과 다릅니다.
- 구조 방정식 모델링은 포괄적이고 유연합니다. 구조 방정식 모델링은 자기 효능감, 우울증, 건강 동향, 경제 동향, 가족 역학 및 기타 현상에 적합합니다.
- 구조 방정식 모델링은 추정 및 테스트를 위한 공식 사양이 필요하지만 기존 방법은 기본 방법을 따릅니다. 구조 방정식 모델링은 기본 모델을 제공하지 않으며 관계 유형 지정에 대한 제한이 거의 없습니다. 구조 방정식 모델링은 이론으로 가설을 뒷받침할 연구자가 필요합니다.
- 구조 방정식 모델링은 관찰된 변수와 관찰되지 않은 변수를 모두 통합하는 다변량 기술인 반면 기존 방법은 측정된 변수만 분석합니다. 구조 방정식 모델링은 여러 관련 방정식을 동시에 풉니다. 이것은 구조 방정식 모델링으로 매개변수 추정치를 결정합니다.
- 구조 방정식 모델링을 통해 분석가는 측정에서 불완전성을 찾을 수 있습니다. 구조 방정식 모델링은 오류를 찾는 반면 기존 방법은 측정 오류가 없다고 가정합니다.
- 구조 방정식 모델링에는 어떤 모델이 가장 좋은지 결정하기 위한 간단한 테스트가 없지만 전통적인 방법 분석이 있으며 변수 간의 관계를 찾기 위한 간단한 테스트를 제공합니다.
- 구조 방정식 모델링은 해당 모델을 사용하여 Bentler-Bonett NNFI(Non-Normed Fit Index), 카이제곱, 비교 적합 지수(CFI), RMSEA(Root Mean Squared Error of Approximation)와 같은 여러 테스트를 검사합니다.
- 구조 방정식 모델링은 다중 공선성 문제를 해결합니다. 구조 방정식 모델링은 여러 측정값을 사용하여 관찰되지 않은 변수를 설명합니다. 관찰되지 않은 변수는 별개의 잠재 구성이므로 다중 공선성이 발생하지 않습니다.
- 구조 방정식 모델링은 그래픽 언어를 사용하여 복잡한 관계를 강력한 방식으로 표현합니다. 구조 방정식 모델링 사양은 변수 집합을 기반으로 합니다. 모델의 그래픽 또는 그림 표현은 방정식 세트로 변환됩니다. 방정식 세트는 여러 테스트를 풀고 매개변수를 추정하는 데 도움이 됩니다.
더 읽어보기: 기계 학습의 회귀 모델

구조 방정식 모델링의 사용은 다음에 의해 영향을 받습니다.
- 테스트 및 연구 중인 가설.
- 요구사항의 표본 크기: 평균적으로 모델 매개변수의 수에 대한 주제 수의 비율은 20:1이어야 합니다. 그러나 대부분 10:1이 더 정확합니다. 비율이 5:1보다 작으면 추정치가 불안정합니다.
- 측정 도구.
- 다변량 정규성.
- 매개변수 식별.
- 이상치 해결.
- 데이터가 없습니다.
- 모델 적합 지수의 해석.
구조방정식 모델링 과정
구조방정식 모델링 해석은 다음과 같은 방법으로 진행됩니다.
- 관련 이론을 연구하다
- 모델 사양을 지원하는 문헌 검토
- 다이어그램 및 방정식과 같은 모델 지정
- 고유 값을 찾기 위해 매개변수를 추정하기 위해 자유도 및 모델 식별의 수를 결정합니다.
- 모델에 표시된 변수에 대한 측정 방법 선택
- 데이터 수집
- 결측 데이터, 스케일링 및 공선성 문제와 같은 예비 기술 통계 분석 수행
- 모델 매개변수 추정
- 모형 적합도 추정
- 의미있는 모드 지정
- 결과 해석
- 현재 결과
구조 방정식 모델링 특정 소프트웨어
- LISREL은 1970년대에 적합한 구조 방정식 모델 소프트웨어였습니다.
- OpenMx R 패키지는 Mx 애플리케이션의 오픈 소스 및 업데이트된 버전을 제공하는 R 오픈 소스입니다.
구조 방정식 모델링의 목표는 변수 집합 간의 상관 패턴을 이해하고 가능한 한 분산을 설명하는 것입니다.
구조 방정식 모델링의 고급 사용
- 측정 불변
- 각각 다른 하위 그룹을 가진 여러 모델의 공동 추정을 허용하는 기술입니다. 문화, 성별 등과 같은 그룹 간의 차이점 및 행동 유전학 분석을 포함하는 응용 프로그램.
- 잠재 성장 모델링
- 계층적/다단계 모델
- 혼합물 모델(잠재 클래스) Structural Equation Modeling
- 대체 추정 및 테스트 기술.
- 강력한 추론
- 설문조사 샘플링 분석
- 다중 방법
- 다중 특성 모델
- 구조 방정식 모델 트리
마지막 생각들
데이터를 분석할 때 유사한 모델링 기술을 제공한다고 주장할 수 있는 많은 모델이 있지만 의사 결정을 위해 매우 다른 행동 과정을 따릅니다. 구조 방정식 모델링에서 하는 실수인 과적합된 모델을 선택하지 않도록 해야 합니다. 통계적 모델링 기법을 선택할 때 인적 요소가 있으며 이를 고려할 수 있습니다.
마케팅 연구의 핵심 영역은 정성적 연구와 하드, 정량적 연구 사이에 있으며 구조 방정식 모델링은 이러한 회색 공간을 다루기에 적합하지 않습니다.
upGrad는 설계 및 제공되는 업계 관련 프로그램을 제공하는 고등 교육용 온라인 포털입니다. 열정이 있고 인공 지능에 대해 배우고 싶다면 400시간 이상의 학습, 실습 세션, 직업 지원 등을 제공하는 IIIT-B & upGrad의 기계 학습 및 AI PG 디플로마를 들을 수 있습니다.
세계 최고의 대학에서 ML 과정 을 배우십시오 . 석사, 이그 제 큐 티브 PGP 또는 고급 인증 프로그램을 획득하여 경력을 빠르게 추적하십시오.

자주 묻는 질문
- 가장 좋은 표본 크기는 얼마입니까?
설문 조사 및 관찰에 따르면 변수당 최소 200개의 케이스와 최소 20개의 케이스가 있어야 합니다. 예를 들어, 모델에 50개의 속성 등급이 있는 경우 500명의 응답자가 있어야 합니다.
- 빅 데이터란 무엇입니까?
구조 방정식 모델링은 교육, 심리학 및 사회학으로 천천히 마이그레이션되고 있습니다. 데이터 과학자들은 구조 방정식 모델링에 익숙해지고 있습니다. 오늘날의 빠르게 변화하는 기술로 인해 모델은 이제 많은 변수가 있는 상당히 큰 샘플에서 잘 작동합니다. 따라서 "큰"은 상대적입니다! 몇 가지 경우에는 예측을 위해 LogitBoost와 같은 표준 기계 학습 도구를 사용할 수 있습니다.
- 어떤 통계적 가정이 필요합니까?
이는 구조 방정식 모델링의 유형에 따라 다릅니다. 따라서 대부분의 통계 절차와 마찬가지로 구조 방정식 모델링은 가정 및 오류 위반에 대해 강력합니다.
- 구조 방정식 모델링은 가설을 테스트합니까?
이것은 통계에 대한 오해입니다. 데이터와 그 분석은 허공에서 일어나지 않으며 관찰을 기반으로 합니다. 그것이 인간의 본성이기 때문에 우리는 사물을 관찰하고 그것이 어떻게 일어나고 있는지 추측하는 경향이 있습니다. 이것은 자체적으로 높은 위험이 있는 탐색적 분석입니다.
- 어떤 모델이 가장 좋습니까?
CFI(비교 적합 지수) 및 RMSEA(근사 평균 제곱근)와 같이 이를 측정하는 몇 가지 지수가 가장 일반적입니다. 가장 잘 알려진 것은 R 제곱입니다. 상식과 의사결정 능력을 바탕으로 어떤 것이 가장 좋은 모델인지 결정해야 합니다.
구조방정식 모델링의 목적은 무엇입니까?
구조 방정식 모델링은 양적 사회 과학에 포함된 매우 인기 있는 접근 방식입니다. 주로 선형 및 횡단면인 통계 모델링 기법입니다. 전문가들은 구조 방정식 모델링이 탐색적 접근보다는 확인적인 접근 방식에 가깝기 때문에 적합한 모델을 찾는 대신 모델을 검증하는 데 효율적이라고 말합니다. 이 기법의 특수한 경우에는 회귀, 경로 분석 및 요인 분석이 있습니다. 구조 방정식 모델링은 숨겨진 구성 간의 연관성에 대한 편견 없는 평가를 결정하기 위해 주로 구체적인 변수 대신 숨겨진 구성에 중점을 둡니다. 기본적으로 정교한 통계 이론을 사용하는 데 주로 사용됩니다.
통계 모델링이란 무엇입니까?
데이터 세트에 통계 분석을 구현하는 데이터 과학 기술을 통계 모델링이라고 합니다. 통계 모델은 본질적으로 하나 이상의 변수 간의 수학적 연관입니다. 변수는 무작위 또는 비임의일 수 있습니다. 통계 모델의 세 가지 주요 유형은 모수, 비모수 및 반모수입니다. 시계열, 로지스틱 회귀, 의사 결정 트리 및 클러스터링은 가장 잘 알려진 통계 모델 중 일부입니다. 통계 모델링 기술은 지도 학습 기술 또는 비지도 학습 기술입니다. 분류 및 회귀 모델은 감독되지만 강화 학습 및 K-평균 클러스터링은 감독되지 않은 학습 알고리즘입니다. 통계 모델은 유연하고 확장 가능하므로 기계 학습 및 AI와의 통합에 더 적합합니다.
기계 학습은 통계 모델링과 어떻게 다릅니까?
통계 모델링은 결과를 예측할 목적으로 하나 또는 여러 변수 간의 관계를 추적하는 데 사용되는 수학의 하위 집합입니다. 통계 모델링은 계수 추정을 기반으로 하며 일반적으로 제한된 수의 속성을 가진 더 작은 데이터 세트에 적용됩니다. 반면에 머신 러닝은 데이터로부터 학습하고 인간의 간섭 없이 특정 작업을 실행하도록 기계를 가르치는 인공 지능의 하위 분야입니다. 기계 학습 기술의 예측력은 매우 강력하며 대규모 데이터 세트에서 잘 수행됩니다.