数据分析中的分段条组:完整指南

已发表: 2021-08-14

分段条形图是数据分析中熟悉的概念。 但是你了解它的基本原理吗?

图表是表示数据之间关系的最常用方式之一,尤其是那些在有限的空间和时间内过于复杂和数量众多而无法方便说明的图表。 随着通过数据分析收集和处理的大量信息,有必要有一种方法来呈现这些数据以进行准确的解释和推理。 数据可视化通过图表和图形赋予信息以视觉形式,让我们清楚地了解信息的含义。 因此,数据变得更容易被人类理解,他们可以快速识别大型数据集中的模式、趋势和异常。 如果您是数据分析和数据科学的初学者,upGrad 的数据科学认证绝对可以帮助您深入了解数据和分析的世界。

通过数据可视化提出令人信服的论点的能力是熟练的数据科学专业人士的杰出品质之一。 虽然有几个图形和图表选项

可以选择在不同场景中说明数据,分段条形图或分段条形图在数据分析师中颇受关注。

本文将引导您了解分段条形图的基础知识、使用原因、使用地点以及可帮助您掌握成为成功数据分析师所需技能upGrad 数据科学课程

但首先,让我们回顾一下条形图。

目录

条形图

在最常用的图形/图表类型中,条形图或条形图由一系列条形图组成,描绘了不同类别数据之间的比较。 条形图是最常见的图表类型之一,由于熟悉,通常很容易理解。

尽管条形图很简单,但它们的用途有限。 在用条形图说明数据之前,评估数据的性质和添加到图表中的变量数量至关重要。 理想情况下,当我们想要跟踪一个或两个变量随时间的发展时,条形图是一个很好的选择。 我们确实可以使用它们以簇状条形图的形式比较几个变量。 然而,这样的比较可能会导致混乱的表示,从而导致混乱。

下面给出了两个插图 - 第一个是简单的条形图(使用一个变量),第二个示例显示了一个集群条形图(使用两个变量)。 两个插图都显示了公司收入在给定时期内的发展情况——条形图在公司场景中的典型应用。 第二个例子显示了两家公司在特定时间范围内的收入比较。


图一图片来源


图2 图片来源

堆积条形图

与并排显示条形的聚集条形图不同,堆叠条形图将条形分成多个部分。 堆积条形图用于显示较大的类别如何分割成较小的类别以及每个部分如何影响总量。 堆叠条形图中的条形按堆叠顺序分类,代表不同的值。 一个轴显示离散值,另一个轴表示按堆叠顺序的变量条。 不同的颜色用于显示整个酒吧的独特部分。

下面给出了一个描述堆积条形图的插图: 图片来源

堆积条形图和分段条形图

堆叠条形图有两种类型:简单堆叠条形图和 100% 堆叠条形图。

  • 简单的堆叠条形图中,段的每个值都放在前一个值之后。 因此,条形的总值是所有段值的总和。 因此,简单的堆叠条形图非常适合将总量与每个组/分段条进行比较。
  • 100% 堆叠条形图分段条形图是堆叠条形图,其中分段条加起来为 100%。 换句话说,堆积条显示多个数据系列的相对百分比,每个堆积条的总和始终为 100%。 因此,在构建分段条形图时,必须确保每个条形代表 100%。 否则,它将变成一个简单的堆积条形图。

堆积条形图显示了部分与整体的关系,甚至可以显示部分如何随时间变化。 下面是一个分段条形图的简单说明,显示了产品的市场份额每年如何变化。 这种分段条形图的一个显着缺点是,虽然很容易比较第一个数据系列(在下图中的垂直轴旁边),但后续的比较难以比较,因为它们没有与共同的基线对齐。

图片来源

从世界顶级大学在线获得数据科学认证获得行政 PG 课程、高级证书课程或硕士课程,以加快您的职业生涯。

下图将进一步阐明简单堆叠条形图和分段条形图之间的解剖差异:

图片来源

构建分段条形图时要记住的要点

  • 堆积条形图和分段条形图都具有带有两个轴的二维表示 - 一个轴显示类别,另一个显示数值。 表示类别的轴没有标度来表明它指的是互斥的组(例如,公司、年份等)。 但是带有数值的轴有一个带有相应测量单位的刻度。
  • 条可以垂直或水平定向。 每个主要类别被划分为段,其中每个段代表第二个类别变量的子类别。
  • 矩形段的高度或长度显示每个子类别的数量,并垂直或水平端到端堆叠。
  • 每个条形的最终长度或高度代表每个主要类别的总量(在分段条形图中为 100%)。
  • 等效的子类别应该用相同的颜色表示。
  • 必须在主要类别的条之间留一些空间以表明它们代表离散的组。

分段条形图的优缺点

分段条形图是一种方便的数据可视化工具。 它具有条形图固有的简单性,但在许多数据分析操作中都有应用。 但是,它确实有几个缺点,这限制了它在数据分析的特定场景中的使用。

以下是分段条形图的优缺点:

优点:

  • 很容易理解分类数据的组成。
  • 它们描绘了随着时间的推移部分到整体的变化。
  • 它们可以在紧凑的空间中表示多个类别和数据系列。

缺点:

  • 随着每条中的段数的增加,阅读变得更加困难。
  • 由于它们没有与共同的基线对齐,因此将段相互比较变得困难。
  • 由于堆叠条被标准化为 100%,因此丢失了绝对值维度。

前进的道路:与 upGrad 一起为您的职业生涯提供未来保障

upGrad 是首屈一指的在线高等教育平台,提供与行业相关的项目和课程。 upGrad 将最新技术与教育实践相结合,在 85 个国家/地区拥有超过 40,000 名付费学习者,已帮助超过 500,000 名在职专业人士在各自领域工作。

以下是upGrad为学习者提供的优势:

  • 灵活的学习和行业相关课程,提供个性化的行业指导、实用的行业实践项目以及与教师和专家的现场会议。
  • 点对点网络、疑难解答论坛和交流机会。
  • 来自一流大学和公司的教师
  • 专门的导师团队
  • 结果驱动的方法
  • 360 度职业协助

upGrad 的数据科学执行 PG 认证和数据科学硕士学位两个结构良好的课程,可帮助您牢牢掌握在数据科学职业中蓬勃发展所需的技能和知识。 每个项目都有其优势,但两者都旨在提供符合最新行业标准的引人入胜的学习体验。 凭借大量与行业相关的实践项目,证书持有者可以放心,他们将准备好面对需要不断提高专业技能的充满挑战和竞争激烈的就业市场。 更重要的是,这些计划是与所有行业的数据科学专业人士建立联系的独特机会。

数据科学 PG 认证项目亮点:

  • 完全在线格式的七个月课程。
  • 专为工作专业人士设计。
  • IIIT班加罗尔的研究生证书。
  • 涵盖编程语言和工具,例如 Excel、Python、Tableau 和 MySQL。
  • 300 多个小时的内容,包括 7 个以上的案例研究和项目、20 多个现场会议和六个编码作业。

德国国际应用科技大学数据科学硕士

节目亮点:

  • 24 个月的课程时间(第一年在线和第二年在德国校园内)。
  • 双重认证(IIIT-B 的执行 PG 计划和德国 IU 的硕士学位)和 NASSCOM 证书。
  • upGrad学习者不需要雅思。
  • 全面覆盖 14 多种工具和软件。
  • 超过 500 小时的内容,包含 60 多个案例研究和项目、20 多个现场会议以及 25 个行业专家的 1:8 辅导课程。

综上所述

了解如何构建分段条形图对于数据分析来说是必须的,特别是如果您是初学者并且刚刚开始使用数据可视化技术。 此类图表可以在 Excel 中轻松构建,并且不需要任何复杂工具和软件的高级知识。 然而,首先,清楚地了解您正在使用的数据以及它是否适合分段条形图表示是至关重要的。

随着大数据和商业分析的潜在全球市场显示出未来的有希望的趋势,可以肯定的是,数据科学的职业充满了可能性。 所以,注册 upGrad 并开始学习最好的!

图表和图表有什么区别?

图表是数据的一种可视化表示形式,可以采用图表、图片或图形的形式。 在图表中,类别可能相互关联,也可能不相互关联。 另一方面,图表是数据的数字表示,显示一个数字或变量的变化如何影响另一个。 换句话说,图表是一种图表,专注于原始数据并描绘这些数据随时间变化的趋势。

什么是直方图与条形图?

条形图使用垂直或水平条来表示分类数据,其中每个条的长度与它们所代表的数据值成正比。 另一方面,直方图是数据的图形表示,其中数据被组织成连续的数字范围。 在直方图中,每个垂直条对应一个范围。

如何在 MS Excel 中创建分段条形图?

以下是在 MS Excel 中创建分段条形图的步骤:
第 1 步:在 Excel 中清晰标记的列中输入您的数据。
第 2 步:突出显示数据。
第 3 步:单击“插入”选项卡。 然后,单击图表部分下的插入柱形图或条形图。
第 4 步:单击选项 100% Stacked Column。
Excel 将自动生成分段条形图。