結構方程建模：您需要知道的一切

已發表: 2021-02-05

結構方程建模 (SEM) 是相關方法的累積，而不是單一技術。方法靈活，框架用於數據分析。

研究人員更喜歡這些方法，因為它使他們能夠在一次分析中估計多個相互關聯的依賴關係。結構方程建模使用兩種類型的變量，內生和外生。

眾所周知，“有力量就有責任”，因此必須明智地使用強大的結構方程模型。結構方程建模很複雜，但同時我們也很容易遇到使用快速友好的軟件的尷尬情況。

使用結構方程建模的主要需求是什麼？

在任何組織中，營銷都是非常重要的。要想在營銷上取得成功，就必須了解消費者。他們必須了解自己的態度、觀點和個性特徵。但這些特徵是潛在的，不容易衡量，因為它們通常是抽象的。

到目前為止，為了測量它們，我們可以進行調查、創建觀察模型等等。但這些過程並沒有那麼富有成效，因為測量和觀察存在誤差的缺點。結構方程建模擅長這兩項任務。

結構方程建模使用因子分析和多元回歸分析。如果我們單獨使用這兩種分析方法，就會失去靈活性。因此，SEM 為我們提供了靈活性。它適用於因果分析、多重共線性，即關聯自變量。

閱讀：歸因建模的類型

測量模型是結構方程建模中的類比因子分析。結構模型是連接測量模型的組件和元素的紐帶。結構模型將組件和元素聯繫在一起或與其他自變量相關聯。在某些情況下，變量是根據經驗結合起來的。

合併行為發生在因子分析之前，測量模型沒有任何作用。在其他情況下，當我們只關心原始變量時，會使用觀察到的變量。最後，當沒有測量模型時，結構模型遵循路徑分析。

結構方程模型用於分析調查數據。它不受單一數據源的約束，可用於客戶交易、經濟、社交媒體、客戶交易數據。最近，它在神經科學中用於 fMRI 數據。在其現代形式中，它可以與任何數據類型一起使用——該模型使用諸如比率、區間、序數、名義和計數等數據類型。它們有助於對變量之間的曲線關係進行建模。

結構方程建模可以在沒有完整數據的情況下工作，但這不應誘使我們不將所有數據都提供給模型。該模型廣泛用於縱向、混合和分層建模。它可以用於分段。該模型包含多個因變量，例如聯合分析。結構方程建模用於解決消費者調查中的響應風格問題。

何時使用結構方程建模

可能有一個商業案例需要您關註消費者對產品的看法，例如購買興趣、喜好。儘管這是一項複雜的建模任務，但結構方程建模適合這些目標。結構方程建模用於更簡單的工作，例如消費者調查。

結構方程混合建模 (SEMM) 是另一種針對具有大量數據的消費者隱藏部分的方法。

絕不能假設一種模型適用於任何類型的分析。混合建模有時只有在充分努力時才有效。有時一個整體模型工作得很好。

結構方程建模是好是壞還是醜陋？

當您在非實驗性設計很常見的環境中工作時，例如工業或組織心理學，則需要結構方程建模。結構方程建模被廣泛使用，並被審閱者用於數據分析。審稿人通常不知道如何進一步進行。

結構方程建模的主要優點是它允許對理論命題進行測試。結構方程建模使您能夠評估定量預測。

傳統統計方法與 SEM 的相似之處

結構方程建模以多種方式遵循相同的傳統方法，例如回歸、相關和方差。
結構方程建模和傳統方法都具有與線性統計模型相同的概念。
在某些假設下，統計檢驗是有效的。結構方程建模假設多元正態性，而傳統方法假設正態分佈。
傳統的和結構方程模型都不能提供因果關係的檢驗。

傳統方法和 SEM 方法之間的差異

傳統方法在以下方面不同於結構方程建模：

結構方程建模全面而靈活。結構方程建模適用於自我效能、抑鬱、健康趨勢、經濟趨勢、家庭動態等現象。
結構方程建模需要正式的估計和測試規範，而傳統方法遵循默認方法。結構方程建模不提供默認模型，並且在指定關係類型方面幾乎沒有限制。結構方程建模需要研究人員用理論來支持假設。
結構方程建模是一種多變量技術，它結合了觀察到的和未觀察到的變量，而傳統方法只分析測量的變量。結構方程建模同時求解多個相關方程。這通過結構方程建模確定參數估計。
結構方程建模允許分析人員發現他們測量的缺陷。結構方程建模發現錯誤，而傳統方法假設沒有測量錯誤。
結構方程建模沒有直接的測試來確定哪個模型是最好的，但是傳統的方法分析並提供了直接的測試來發現變量之間的關係。
結構方程建模使用其模型來檢查多個測試，例如 Bentler-Bonett 非範數擬合指數 (NNFI)、卡方、比較擬合指數 (CFI)、近似均方根誤差 (RMSEA)。
結構方程建模解決了多重共線性問題。結構方程建模使用多種度量來描述未觀察到的變量。多重共線性不會發生，因為未觀察到的變量是不同的潛在結構。
結構方程建模使用圖形語言以強大的方式呈現複雜的關係。結構方程建模規範基於一組變量。模型的圖形或圖形表示轉換為一組方程。這組方程有助於解決多個測試和估計參數。

另請閱讀：機器學習中的回歸模型

結構方程建模的使用受到以下因素的影響

正在測試和研究的假設。
要求的樣本量：平均而言，受試者數量與模型參數數量的比例必須為20：1。但大多數情況下 10:1 更準確。當比率小於 5:1 時，估計值不穩定。
測量儀器。
多元正態性。
參數識別。
處理異常值。
缺失數據。
模型擬合指數的解釋。

結構方程建模過程

結構方程建模分析通過以下方法進行：

研究相關理論
審查文獻以支持模型規範
指定模型，例如圖表和方程式
確定自由度數和模型識別以估計參數以找到唯一值
為模型中表示的變量選擇測量方法
收集數據
執行初步的描述性統計分析，例如缺失數據、縮放和共線性問題
估計模型參數
估計模型擬合
指定有意義的模式
解釋結果
目前的結果

結構方程建模專用軟件

LISREL 是 1970 年代的擬合結構方程模型軟件。
OpenMx R 包是一個 R 開源軟件，它提供了 Mx 應用程序的開源和更新版本。

結構方程建模的目標是了解一組變量之間的相關模式並儘可能地解釋方差。

結構方程建模的高級用途

測量不變性
該技術允許對多個模型進行聯合估計，每個模型都有不同的子組。應用程序包括分析群體之間的差異，例如文化、性別等以及行為遺傳學。
潛在增長模型
分層/多級模型
混合模型（潛在類）結構方程建模
替代估計和測試技術。
魯棒推理
調查抽樣分析
多方法
多特徵模型
結構方程模型樹

最後的想法

有許多模型可能聲稱在分析數據時提供了類似的建模技術，但它們遵循非常不同的決策過程。我們需要確保我們不會選擇過度擬合的模型，這是結構方程建模的錯誤。當我們選擇統計建模技術時，有一個人為因素，可以考慮到這一點。

營銷研究的一個關鍵領域介於定性研究和硬性定量研究之間，結構方程模型不適合處理這個灰色空間。

upGrad 是一個高等教育在線門戶網站，提供設計和交付的行業相關課程。如果您對人工智能充滿熱情並想學習人工智能，您可以參加 IIIT-B 和 upGrad 的機器學習和人工智能 PG 文憑，該文憑提供 400 多個小時的學習、實踐課程、工作幫助等等。

從世界頂級大學學習ML 課程。獲得碩士、Executive PGP 或高級證書課程以加快您的職業生涯。

常見問題

最佳樣本量是多少？

根據調查和觀察，我們必須至少有 200 個案例，每個變量至少有 20 個案例。例如，如果模型中有 50 個屬性評級，我們必須有 500 個受訪者。

什麼是大數據？

結構方程建模正在慢慢遷移到教育、心理學和社會學。數據科學家正在熟悉結構方程建模。隨著當今技術的迅速變化，該模型現在可以很好地處理具有許多變量的大樣本。所以“大”是相對的！在少數情況下，我們可以使用 LogitBoost 等標準機器學習工具進行預測。

需要哪些統計假設？

這取決於結構方程建模的類型。與大多數統計程序一樣，結構方程建模因此對於違反假設和錯誤具有魯棒性。

結構方程模型是否檢驗假設？

這是對統計的誤解。數據及其分析不是憑空發生的，而是基於觀察。由於這是人類的天性，我們觀察事物，他們傾向於猜測這是如何發生的；這是一個探索性的分析，有其自身的高風險。

哪種型號最好？

有幾個指標可以衡量這一點，例如比較擬合指數 (CFI) 和近似均方根誤差 (RMSEA) 是一些最常見的指標。最著名的是 R 平方。您必鬚根據常識和決策能力來決定哪個是最佳模型。

結構方程建模的目的是什麼？

結構方程建模是定量社會科學中非常流行的一類方法。它是一種主要是線性和橫截面的統計建模技術。專家表示，結構方程建模與其說是一種探索性方法，不如說是一種驗證性方法，這使得它可以有效地驗證模型，而不是尋找合適的模型。這種技術的一些特殊情況是回歸、路徑分析和因子分析。結構方程建模主要關注隱藏結構而不是具體變量，以確定對隱藏結構之間關聯的無偏評估。它主要因其基礎複雜的統計理論而廣受歡迎。

什麼是統計建模？

對數據集實施統計分析的數據科學技術稱為統計建模。統計模型本質上是一個或多個變量之間的數學關聯。變量可以是隨機的或非隨機的。三種主要的統計模型是參數、非參數和半參數。時間序列、邏輯回歸、決策樹和聚類是一些最著名的統計模型。統計建模技術要么是監督學習技術，要么是無監督學習技術。雖然分類和回歸模型是有監督的，但強化學習和 K-means 聚類是無監督學習算法。統計模型靈活且可擴展，使其更適合與機器學習和 AI 集成。

機器學習與統計建模有何不同？

統計建模是數學的一個子集，用於追踪一個或多個變量之間的關係，以預測結果。統計建模基於對係數的估計，通常應用於屬性數量有限的較小數據集。另一方面，機器學習是人工智能的一個子領域，它涉及教機器從數據中學習並在沒有人為乾預的情況下執行特定任務。機器學習技術的預測能力非常強，並且在大型數據集上表現良好。