Modelowanie równań strukturalnych: wszystko, co musisz wiedzieć

Opublikowany: 2021-02-05

Modelowanie równań strukturalnych (SEM) to kumulacja powiązanych metod, a nie pojedyncza technika. Metody są elastyczne, a ramy służą do analizy danych.

Badacze preferują te metody, ponieważ umożliwiają oszacowanie wielu powiązanych ze sobą zależności w ramach jednej analizy. Modelowanie równań strukturalnych wykorzystuje dwa typy zmiennych, endogeniczne i egzogeniczne.

Powszechnie wiadomo, że „z władzą wiąże się odpowiedzialność”, więc potężne modelowanie równań strukturalnych musi być stosowane rozważnie. Modelowanie równań strukturalnych jest złożone, ale jednocześnie bardzo łatwo jest nam napotkać niezręczne sytuacje dzięki szybko przyjaznemu dla użytkownika oprogramowaniu.

Spis treści

Jaka jest główna potrzeba korzystania z modelowania równań strukturalnych?
Kiedy używać modelowania równań strukturalnych?
Czy modelowanie równań strukturalnych jest dobre, złe czy brzydkie?
Podobieństwa między tradycyjnymi metodami statystycznymi a SEM
Różnice między metodami tradycyjnymi i SEM
Wpływ na wykorzystanie modelowania równań strukturalnych ma
Proces modelowania równań strukturalnych
Oprogramowanie do modelowania równań strukturalnych
Zaawansowane zastosowania modelowania równań strukturalnych
Końcowe przemyślenia
Często zadawane pytania
Jaki jest cel modelowania równań strukturalnych?
Co to jest modelowanie statystyczne?
Czym różni się uczenie maszynowe od modelowania statystycznego?

Jaka jest główna potrzeba korzystania z modelowania równań strukturalnych?

W każdej organizacji marketing jest bardzo ważny. A żeby odnieść sukces w marketingu, trzeba wiedzieć o konsumentach. Muszą znać swoje nastawienie, opinie i cechy osobowości. Ale te cechy są ukryte i nie można ich łatwo zmierzyć, ponieważ często są abstrakcyjne.

Na razie, aby je zmierzyć, możemy przeprowadzać ankiety, tworzyć model obserwacyjny i tak dalej. Ale procesy te nie są aż tak owocne, ponieważ pomiary i obserwacje mają wadę błędów. Modelowanie równań strukturalnych doskonale sprawdza się w obu zadaniach.

Modelowanie równań strukturalnych wykorzystuje analizę czynnikową i analizę regresji wielokrotnej. Jeśli stosujemy obie te metody analityczne indywidualnie, tracimy elastyczność. Tak więc SEM zapewnia nam elastyczność. Nadaje się do analizy przyczynowej, wielokolinearności, czyli korelowania zmiennych niezależnych.

Przeczytaj: Rodzaje modelowania atrybucji

Model pomiarowy jest analogiczną analizą czynnikową w modelowaniu równań strukturalnych. Model struktury to węzeł łączący komponenty i elementy modelu pomiarowego. Modele strukturalne wiążą komponenty i elementy razem lub z innymi zmiennymi niezależnymi. W niektórych przypadkach zmienne są łączone na gruncie empirycznym.

Akt łączenia ma miejsce przed analizą czynnikową, a model pomiaru nie odgrywa żadnej roli. W innych przypadkach, gdy zajmujemy się tylko zmiennymi surowymi, używane są zmienne obserwowane. I wreszcie, gdy nie ma modelu pomiarowego, model konstrukcji podąża za analizą ścieżki.

Modelowanie równań strukturalnych służy do analizy danych pomiarowych. Nie jest powiązany z jednym źródłem danych i może być używany z danymi transakcji klientów, danymi ekonomicznymi, mediami społecznościowymi, danymi transakcji klientów. Ostatnio jest używany w neuronauce do danych fMRI. W nowoczesnych formach może być używany z dowolnym typem danych – model wykorzystuje typy danych, takie jak stosunek, przedział, liczba porządkowa, nominalna i licznik. Pomagają w modelowaniu krzywoliniowych relacji między zmiennymi.

Modelowanie równań strukturalnych może działać bez pełnych danych, ale nie powinno nas to kusić, aby nie wprowadzać do modelu wszystkich danych. Model jest szeroko stosowany do modelowania podłużnego, mieszanego i hierarchicznego. Może być używany w segmentacji. Model uwzględnia wiele zmiennych zależnych, takich jak analiza połączona. Modelowanie równań strukturalnych służy do rozwiązywania problemów ze stylem odpowiedzi w ankietach konsumenckich.

Kiedy używać modelowania równań strukturalnych?

Może istnieć przypadek biznesowy, który wymaga skupienia się na postrzeganiu przez konsumentów, takim jak zainteresowanie zakupem, upodobanie do produktu. Chociaż jest to złożone zadanie modelowania, modelowanie równań strukturalnych nadaje się do tych celów. Modelowanie równań strukturalnych jest używane do prostszych zadań, takich jak ankieta konsumencka.

Modelowanie mieszanek równań strukturalnych (SEMM) to kolejny rodzaj metody docierania do ukrytych segmentów konsumentów z bardzo dużą ilością danych.

Nie należy zakładać, że jeden typ modelu nadaje się do jakiejkolwiek analizy. Modelowanie mieszane czasami działa tylko wtedy, gdy wysiłek jest podjęty kompetentnie. Czasami jeden ogólny model działa po prostu dobrze.

Czy modelowanie równań strukturalnych jest dobre, złe czy brzydkie?

Kiedy pracujesz w środowisku, w którym nieeksperymentalne projekty były powszechne, takim jak psychologia przemysłowa lub organizacyjna, wymagane jest modelowanie równań strukturalnych. Modelowanie równań strukturalnych jest szeroko stosowane i wykorzystywane przez recenzentów do analizy danych. Recenzenci często nie mają pojęcia, jak postępować dalej.

Główną zaletą modelowania równań strukturalnych jest to, że umożliwia testowanie twierdzeń teoretycznych. Modelowanie równań strukturalnych umożliwia ocenę prognoz ilościowych.

Podobieństwa między tradycyjnymi metodami statystycznymi a SEM

Modelowanie równań strukturalnych wykorzystuje na wiele sposobów te same tradycyjne metody, takie jak regresja, korelacja i wariancja.
Zarówno modelowanie równań strukturalnych, jak i metody tradycyjne mają tę samą koncepcję, co liniowe modele statystyczne.
Przy pewnych założeniach testy statystyczne są ważne. Modelowanie równań strukturalnych zakłada wielowymiarową normalność, a tradycyjne metody zakładają rozkład normalny.
Ani tradycyjne, ani strukturalne modelowanie równań nie oferuje testu na przyczynowość.

Różnice między metodami tradycyjnymi i SEM

Tradycyjne metody różnią się od modelowania równań strukturalnych w następujących obszarach:

Modelowanie równań strukturalnych jest wszechstronne i elastyczne. Modelowanie równań strukturalnych jest odpowiednie dla poczucia własnej skuteczności, depresji, trendów zdrowotnych, trendów ekonomicznych, dynamiki rodziny i innych zjawisk.
Modelowanie równań strukturalnych wymaga formalnej specyfikacji estymacji i testowania, podczas gdy tradycyjna metoda opiera się na metodach domyślnych. Modelowanie równań strukturalnych nie oferuje modelu domyślnego i ma niewiele ograniczeń w określaniu typów relacji. Modelowanie równań strukturalnych wymaga od badaczy poparcia hipotez za pomocą teorii.
Modelowanie równań strukturalnych jest techniką wielowymiarową, która obejmuje zarówno zmienne obserwowane, jak i nieobserwowane, podczas gdy tradycyjne metody analizują tylko zmienne, które są mierzone. Modelowanie równań strukturalnych rozwiązuje wiele powiązanych równań jednocześnie. To określa oszacowania parametrów za pomocą modelowania równań strukturalnych.
Modelowanie równań strukturalnych umożliwia analitykom znajdowanie niedoskonałości ich miar. Modelowanie równań strukturalnych znajduje błąd, podczas gdy tradycyjne metody zakładają brak błędów pomiarowych.
Modelowanie równań strukturalnych nie ma prostych testów do określenia, który model jest najlepszy, ale analizy metodami tradycyjnymi, i zapewnia proste testy, aby znaleźć relacje między zmiennymi.
Modelowanie równań strukturalnych wykorzystuje swój model do badania wielu testów, takich jak nienormalny wskaźnik dopasowania Bentlera-Bonetta (NNFI), chi-kwadrat, porównawczy wskaźnik dopasowania (CFI), pierwiastek średniokwadratowego błędu aproksymacji (RMSEA)).
Modelowanie równań strukturalnych rozwiązuje problemy z wielowspółliniowością. Modelowanie równań strukturalnych wykorzystuje wiele miar do opisania nieobserwowanej zmiennej. Wielokoliniowość nie występuje, ponieważ nieobserwowane zmienne są odrębnymi konstruktami ukrytymi.
Modelowanie równań strukturalnych wykorzystuje język graficzny do przedstawiania złożonych relacji w skuteczny sposób. Specyfikacja modelowania równań strukturalnych opiera się na zestawie zmiennych. Graficzne lub obrazowe przedstawienie modelu przekształca się w zestaw równań. Zestaw równań pomaga rozwiązać wiele testów i oszacować parametry.

Przeczytaj także: Modele regresji w uczeniu maszynowym

Wpływ na wykorzystanie modelowania równań strukturalnych ma

Testowana i badana hipoteza.
Wielkość próby wymagania: Stosunek liczby badanych do liczby parametrów modelu musi wynosić średnio 20:1. Ale przeważnie 10:1 jest dokładniejsze. Gdy stosunek jest mniejszy niż 5:1, szacunki są niestabilne.
Instrumenty pomiarowe.
Wielowymiarowa normalność.
Identyfikacja parametrów.
Adresowanie odstających.
Brakujące dane.
Interpretacja wskaźników dopasowania modelu.

Proces modelowania równań strukturalnych

Analiza modelowania równań strukturalnych przebiega następującymi metodami:

zbadać odpowiednią teorię
przegląd literatury w celu wsparcia specyfikacji modelu
określa model, taki jak diagram i równania
określa liczbę stopni swobody i identyfikację modelu w celu oszacowania parametrów w celu znalezienia unikalnych wartości
dobór metod pomiaru dla zmiennych reprezentowanych w modelu
zbierać dane
wykonać wstępną opisową analizę statystyczną, taką jak brakujące dane, skalowanie i problemy ze współliniowością
oszacować parametry modelu
oszacowanie dopasowania modelu
określić sensowny tryb
zinterpretuj wyniki
obecne wyniki

Oprogramowanie do modelowania równań strukturalnych

LISREL był oprogramowaniem dopasowującym modele równań strukturalnych w latach 70-tych.
Pakiet OpenMx R to open-source R, który zapewnia open-source i zaktualizowaną wersję aplikacji Mx.

Celem modelowania równań strukturalnych jest zrozumienie skorelowanych wzorców między zbiorem zmiennych i jak najdokładniejsze wyjaśnienie wariancji.

Zaawansowane zastosowania modelowania równań strukturalnych

Niezmienność pomiaru
Jest to technika, która umożliwia wspólne oszacowanie wielu modeli, każdy z różnymi podgrupami. Aplikacje, które obejmują analizę różnic między grupami, takimi jak kultura, płeć itd. oraz genetyka zachowania.
Modelowanie utajonego wzrostu
Modele hierarchiczne/wielopoziomowe
Model mieszaniny (klasa utajona) Modelowanie równań strukturalnych
Alternatywne techniki szacowania i testowania.
Solidne wnioskowanie
Analizy próbkowania ankiet
Wiele metod
Modele wielocechowe
Modele równań strukturalnych

Końcowe przemyślenia

Istnieje wiele modeli, które mogą twierdzić, że zapewniają podobne techniki modelowania podczas analizy danych, ale przy podejmowaniu decyzji stosują bardzo różne sposoby działania. Musimy upewnić się, że nie wybieramy przesadnie dopasowanego modelu, co jest błędem popełnianym przy modelowaniu równań strukturalnych. W doborze technik modelowania statystycznego jest element ludzki, który można wziąć pod uwagę.

Kluczowy obszar badań marketingowych leży pomiędzy badaniami jakościowymi a twardymi badaniami ilościowymi, a modelowanie równań strukturalnych nie jest odpowiednie do radzenia sobie w tej szarej przestrzeni.

upGrad to portal internetowy dla szkolnictwa wyższego, który zapewnia zaprojektowane i dostarczone programy odpowiednie dla branży. Jeśli masz pasję i chcesz poznać sztuczną inteligencję, możesz przejść dyplom PG IIIT-B i upGrad z uczenia maszynowego i sztucznej inteligencji, który oferuje ponad 400 godzin nauki, sesje praktyczne, pomoc w pracy i wiele więcej.

Ucz się kursu ML z najlepszych światowych uniwersytetów. Zdobywaj programy Masters, Executive PGP lub Advanced Certificate Programy, aby przyspieszyć swoją karierę.

Często zadawane pytania

Jaka jest najlepsza wielkość próbki?

Zgodnie z ankietami i obserwacjami musimy mieć co najmniej 200 przypadków i co najmniej 20 przypadków na zmienną. Na przykład musimy mieć 500 respondentów, jeśli w modelu jest 50 ocen atrybutów.

Czym są duże zbiory danych?

Modelowanie równań strukturalnych powoli migruje do edukacji, psychologii i socjologii. Naukowcy zajmujący się danymi zapoznają się z modelowaniem równań strukturalnych. Przy dzisiejszej szybko zmieniającej się technologii model działa teraz dobrze na dość dużych próbkach z wieloma zmiennymi. Dlatego „duży” jest względny! W kilku przypadkach do prognoz możemy użyć standardowego narzędzia do uczenia maszynowego, takiego jak LogitBoost.

Jakie założenia statystyczne są wymagane?

Zależy to od rodzaju modelowania równań strukturalnych. Modelowanie równań strukturalnych, podobnie jak większość procedur statystycznych, jest zatem odporne na naruszenia założeń i błędy.

Czy modelowanie równań strukturalnych sprawdza hipotezy?

To błędne wyobrażenie o statystykach. Dane i ich analiza nie biorą się z powietrza i opierają się na obserwacjach. Ponieważ taka jest ludzka natura, obserwujemy rzeczy, a oni mają tendencję do odgadywania, jak to się dzieje; jest to analiza eksploracyjna, która wiąże się z wysokim ryzykiem.

Który model jest najlepszy?

Istnieje kilka wskaźników do pomiaru tego, na przykład porównawczy wskaźnik dopasowania (CFI) i pierwiastek średniokwadratowy błąd przybliżenia (RMSEA). Najbardziej znanym jest R do kwadratu. Musisz zdecydować, który model jest najlepszy, bazując na zdrowym rozsądku i zdolnościach decyzyjnych.

Jaki jest cel modelowania równań strukturalnych?

Modelowanie równań strukturalnych jest niezwykle popularną klasą podejść zawartych w ilościowych naukach społecznych. Jest to technika modelowania statystycznego, która ma głównie charakter liniowy i przekrojowy. Eksperci twierdzą, że modelowanie równań strukturalnych jest bardziej podejściem potwierdzającym niż eksploracyjnym, co czyni je skutecznym w walidacji modeli zamiast znajdowania odpowiedniego. Niektóre ze szczególnych przypadków tej techniki to regresja, analiza ścieżki i analiza czynnikowa. Modelowanie równań strukturalnych koncentruje się głównie na ukrytych konstrukcjach, a nie na konkretnych zmiennych, aby określić obiektywne oceny powiązań między ukrytymi konstrukcjami. Jest popularny przede wszystkim ze względu na leżącą u jego podstaw wyrafinowaną teorię statystyczną.

Co to jest modelowanie statystyczne?

Technika analizy danych polegająca na wdrażaniu analiz statystycznych do zbiorów danych jest znana jako modelowanie statystyczne. Model statystyczny jest zasadniczo matematycznym powiązaniem między jedną lub większą liczbą zmiennych; zmienne mogą być losowe lub nielosowe. Trzy główne rodzaje modeli statystycznych to parametryczne, nieparametryczne i półparametryczne. Szeregi czasowe, regresja logistyczna, drzewa decyzyjne i grupowanie to jedne z najbardziej znanych modeli statystycznych. Techniki modelowania statystycznego to albo techniki uczenia nadzorowanego, albo techniki uczenia się nienadzorowanego. Podczas gdy modele klasyfikacji i regresji są nadzorowane, uczenie się ze wzmocnieniem i grupowanie K-średnich są algorytmami uczenia nienadzorowanego. Modele statystyczne są elastyczne i skalowalne, dzięki czemu lepiej nadają się do integracji z uczeniem maszynowym i sztuczną inteligencją.

Czym różni się uczenie maszynowe od modelowania statystycznego?

Modelowanie statystyczne to podzbiór matematyki używany do śledzenia relacji między jedną lub wieloma zmiennymi w celu przewidzenia wyniku. Modelowanie statystyczne opiera się na szacowaniu współczynników i jest zwykle stosowane do mniejszych zbiorów danych o ograniczonej liczbie atrybutów. Z drugiej strony uczenie maszynowe to poddziedzina sztucznej inteligencji, która zajmuje się uczeniem maszyn uczenia się na podstawie danych i wykonywania określonych zadań bez ingerencji człowieka. Moc predykcyjna w technikach uczenia maszynowego jest bardzo silna i dobrze sprawdza się w przypadku dużych zestawów danych.