结构方程建模：您需要知道的一切

已发表: 2021-02-05

结构方程建模 (SEM) 是相关方法的累积，而不是单一技术。方法灵活，框架用于数据分析。

研究人员更喜欢这些方法，因为它使他们能够在一次分析中估计多个相互关联的依赖关系。结构方程建模使用两种类型的变量，内生和外生。

众所周知，“有力量就有责任”，因此必须明智地使用强大的结构方程模型。结构方程建模很复杂，但同时我们也很容易遇到使用快速友好的软件的尴尬情况。

使用结构方程建模的主要需求是什么？

在任何组织中，营销都是非常重要的。要想在营销上取得成功，就必须了解消费者。他们必须了解自己的态度、观点和个性特征。但这些特征是潜在的，不容易衡量，因为它们通常是抽象的。

到目前为止，为了测量它们，我们可以进行调查、创建观察模型等等。但这些过程并没有那么富有成效，因为测量和观察存在误差的缺点。结构方程建模擅长这两项任务。

结构方程建模使用因子分析和多元回归分析。如果我们单独使用这两种分析方法，就会失去灵活性。因此，SEM 为我们提供了灵活性。它适用于因果分析、多重共线性，即关联自变量。

阅读：归因建模的类型

测量模型是结构方程建模中的类比因子分析。结构模型是连接测量模型的组件和元素的纽带。结构模型将组件和元素联系在一起或与其他自变量相关联。在某些情况下，变量是根据经验结合起来的。

合并行为发生在因子分析之前，测量模型没有任何作用。在其他情况下，当我们只关心原始变量时，会使用观察到的变量。最后，当没有测量模型时，结构模型遵循路径分析。

结构方程模型用于分析调查数据。它不受单一数据源的约束，可用于客户交易、经济、社交媒体、客户交易数据。最近，它在神经科学中用于 fMRI 数据。在其现代形式中，它可以与任何数据类型一起使用——该模型使用诸如比率、区间、序数、名义和计数等数据类型。它们有助于对变量之间的曲线关系进行建模。

结构方程建模可以在没有完整数据的情况下工作，但这不应诱使我们不将所有数据都提供给模型。该模型广泛用于纵向、混合和分层建模。它可以用于分段。该模型包含多个因变量，例如联合分析。结构方程建模用于解决消费者调查中的响应风格问题。

何时使用结构方程建模

可能有一个商业案例需要您关注消费者对产品的看法，例如购买兴趣、喜好。尽管这是一项复杂的建模任务，但结构方程建模适合这些目标。结构方程建模用于更简单的工作，例如消费者调查。

结构方程混合建模 (SEMM) 是另一种针对具有大量数据的消费者隐藏部分的方法。

绝不能假设一种模型适用于任何类型的分析。混合建模有时只有在充分努力时才有效。有时一个整体模型工作得很好。

结构方程建模是好是坏还是丑陋？

当您在非实验性设计很常见的环境中工作时，例如工业或组织心理学，则需要结构方程建模。结构方程建模被广泛使用，并被审阅者用于数据分析。审稿人通常不知道如何进一步进行。

结构方程建模的主要优点是它允许对理论命题进行测试。结构方程建模使您能够评估定量预测。

传统统计方法与 SEM 的相似之处

结构方程建模以多种方式遵循相同的传统方法，例如回归、相关和方差。
结构方程建模和传统方法都具有与线性统计模型相同的概念。
在某些假设下，统计检验是有效的。结构方程建模假设多元正态性，而传统方法假设正态分布。
传统的和结构方程模型都不能提供因果关系的检验。

传统方法和 SEM 方法之间的差异

传统方法在以下方面不同于结构方程建模：

结构方程建模全面而灵活。结构方程建模适用于自我效能、抑郁、健康趋势、经济趋势、家庭动态等现象。
结构方程建模需要正式的估计和测试规范，而传统方法遵循默认方法。结构方程建模不提供默认模型，并且在指定关系类型方面几乎没有限制。结构方程建模需要研究人员用理论来支持假设。
结构方程建模是一种多变量技术，它结合了观察到的和未观察到的变量，而传统方法只分析测量的变量。结构方程建模同时求解多个相关方程。这通过结构方程建模确定参数估计。
结构方程建模允许分析人员发现他们测量的缺陷。结构方程建模发现错误，而传统方法假设没有测量错误。
结构方程建模没有直接的测试来确定哪个模型是最好的，但是传统的方法分析并提供了直接的测试来发现变量之间的关系。
结构方程建模使用其模型来检查多个测试，例如 Bentler-Bonett 非范数拟合指数 (NNFI)、卡方、比较拟合指数 (CFI)、近似均方根误差 (RMSEA)。
结构方程建模解决了多重共线性问题。结构方程建模使用多种度量来描述未观察到的变量。多重共线性不会发生，因为未观察到的变量是不同的潜在结构。
结构方程建模使用图形语言以强大的方式呈现复杂的关系。结构方程建模规范基于一组变量。模型的图形或图形表示转换为一组方程。这组方程有助于解决多个测试和估计参数。

另请阅读：机器学习中的回归模型

结构方程建模的使用受到以下因素的影响

正在测试和研究的假设。
要求的样本量：平均而言，受试者数量与模型参数数量的比例必须为20：1。但大多数情况下 10:1 更准确。当比率小于 5:1 时，估计值不稳定。
测量仪器。
多元正态性。
参数识别。
处理异常值。
缺失数据。
模型拟合指数的解释。

结构方程建模过程

结构方程建模分析通过以下方法进行：

研究相关理论
审查文献以支持模型规范
指定模型，例如图表和方程式
确定自由度数和模型识别以估计参数以找到唯一值
为模型中表示的变量选择测量方法
收集数据
执行初步的描述性统计分析，例如缺失数据、缩放和共线性问题
估计模型参数
估计模型拟合
指定有意义的模式
解释结果
目前的结果

结构方程建模专用软件

LISREL 是 1970 年代的拟合结构方程模型软件。
OpenMx R 包是一个 R 开源软件，它提供了 Mx 应用程序的开源和更新版本。

结构方程建模的目标是了解一组变量之间的相关模式并尽可能地解释方差。

结构方程建模的高级用途

测量不变性
该技术允许对多个模型进行联合估计，每个模型都有不同的子组。应用程序包括分析群体之间的差异，例如文化、性别等以及行为遗传学。
潜在增长模型
分层/多级模型
混合模型（潜在类）结构方程建模
替代估计和测试技术。
鲁棒推理
调查抽样分析
多方法
多特征模型
结构方程模型树

最后的想法

有许多模型可能声称在分析数据时提供了类似的建模技术，但它们遵循非常不同的决策过程。我们需要确保我们不会选择过度拟合的模型，这是结构方程建模的错误。当我们选择统计建模技术时，有一个人为因素，可以考虑到这一点。

营销研究的一个关键领域介于定性研究和硬性定量研究之间，结构方程模型不适合处理这个灰色空间。

upGrad 是一个高等教育在线门户网站，提供设计和交付的行业相关课程。如果您有热情并想学习人工智能，您可以参加 IIIT-B 和 upGrad 的机器学习和人工智能 PG 文凭，该文凭提供 400 多个小时的学习、实践课程、工作帮助等等。

从世界顶级大学学习ML 课程。获得硕士、Executive PGP 或高级证书课程以加快您的职业生涯。

常见问题

最佳样本量是多少？

根据调查和观察，我们必须至少有 200 个案例，每个变量至少有 20 个案例。例如，如果模型中有 50 个属性评级，我们必须有 500 个受访者。

什么是大数据？

结构方程建模正在慢慢迁移到教育、心理学和社会学。数据科学家正在熟悉结构方程建模。随着当今技术的迅速变化，该模型现在可以很好地处理具有许多变量的大样本。所以“大”是相对的！在少数情况下，我们可以使用 LogitBoost 等标准机器学习工具进行预测。

需要哪些统计假设？

这取决于结构方程建模的类型。与大多数统计程序一样，结构方程建模因此对于违反假设和错误具有鲁棒性。

结构方程模型是否检验假设？

这是对统计的误解。数据及其分析不是凭空发生的，而是基于观察。由于这是人类的天性，我们观察事物，他们倾向于猜测这是如何发生的；这是一个探索性的分析，有其自身的高风险。

哪种型号最好？

有几个指标可以衡量这一点，例如比较拟合指数 (CFI) 和近似均方根误差 (RMSEA) 是一些最常见的指标。最著名的是 R 平方。您必须根据常识和决策能力来决定哪个是最佳模型。

结构方程建模的目的是什么？

结构方程建模是定量社会科学中非常流行的一类方法。它是一种主要是线性和横截面的统计建模技术。专家表示，结构方程建模与其说是一种探索性方法，不如说是一种验证性方法，这使得它可以有效地验证模型，而不是寻找合适的模型。这种技术的一些特殊情况是回归、路径分析和因子分析。结构方程建模主要关注隐藏结构而不是具体变量，以确定对隐藏结构之间关联的无偏评估。它主要因其基础复杂的统计理论而广受欢迎。

什么是统计建模？

对数据集实施统计分析的数据科学技术称为统计建模。统计模型本质上是一个或多个变量之间的数学关联。变量可以是随机的或非随机的。三种主要的统计模型是参数、非参数和半参数。时间序列、逻辑回归、决策树和聚类是一些最著名的统计模型。统计建模技术要么是监督学习技术，要么是无监督学习技术。虽然分类和回归模型是有监督的，但强化学习和 K-means 聚类是无监督学习算法。统计模型灵活且可扩展，使其更适合与机器学习和 AI 集成。

机器学习与统计建模有何不同？

统计建模是数学的一个子集，用于追踪一个或多个变量之间的关系，以预测结果。统计建模基于对系数的估计，通常应用于属性数量有限的较小数据集。另一方面，机器学习是人工智能的一个子领域，它涉及教机器从数据中学习并在没有人为干预的情况下执行特定任务。机器学习技术的预测能力非常强，并且在大型数据集上表现良好。