數據分析中的分段條組:完整指南

已發表: 2021-08-14

分段條形圖是數據分析中熟悉的概念。 但是你了解它的基本原理嗎?

圖表是表示數據之間關係的最常用方式之一,尤其是那些在有限的空間和時間內過於復雜和數量眾多而無法方便說明的圖表。 隨著通過數據分析收集和處理的大量信息,有必要有一種方法來呈現這些數據以進行準確的解釋和推理。 數據可視化通過圖表和圖形賦予信息以視覺形式,讓我們清楚地了解信息的含義。 因此,數據變得更容易被人類理解,他們可以快速識別大型數據集中的模式、趨勢和異常。 如果您是數據分析和數據科學的初學者,upGrad 的數據科學認證絕對可以幫助您深入了解數據和分析的世界。

通過數據可視化提出令人信服的論點的能力是熟練的數據科學專業人士的傑出品質之一。 雖然有幾個圖形和圖表選項

可以選擇在不同場景中說明數據,分段條形圖或分段條形圖在數據分析師中頗受關注。

本文將引導您了解分段條形圖的基礎知識、使用原因、使用地點以及可幫助您掌握成為成功數據分析師所需技能upGrad 數據科學課程

但首先,讓我們回顧一下條形圖。

目錄

條形圖

在最常用的圖形/圖表類型中,條形圖或條形圖由一系列條形圖組成,描繪了不同類別數據之間的比較。 條形圖是最常見的圖表類型之一,由於熟悉,通常很容易理解。

儘管條形圖很簡單,但它們的用途有限。 在用條形圖說明數據之前,評估數據的性質和添加到圖表中的變量數量至關重要。 理想情況下,當我們想要跟踪一個或兩個變量隨時間的發展時,條形圖是一個很好的選擇。 我們確實可以使用它們以簇狀條形圖的形式比較幾個變量。 然而,這樣的比較可能會導致混亂的表示,從而導致混亂。

下面給出了兩個插圖 - 第一個是簡單的條形圖(使​​用一個變量),第二個示例顯示了一個集群條形圖(使​​用兩個變量)。 兩個插圖都顯示了公司收入在給定時期內的發展情況——條形圖在公司場景中的典型應用。 第二個例子顯示了兩家公司在特定時間範圍內的收入比較。


圖一圖片來源


圖2 圖片來源

堆積條形圖

與並排顯示條形的聚集條形圖不同,堆疊條形圖將條形分成多個部分。 堆積條形圖用於顯示較大的類別如何分割成較小的類別以及每個部分如何影響總量。 堆疊條形圖中的條形按堆疊順序分類,代表不同的值。 一個軸顯示離散值,另一個軸表示按堆疊順序的變量條。 不同的顏色用於顯示整個酒吧的獨特部分。

下面給出了一個描述堆積條形圖的插圖: 圖片來源

堆積條形圖和分段條形圖

堆疊條形圖有兩種類型:簡單堆疊條形圖和 100% 堆疊條形圖。

  • 簡單的堆疊條形圖中,段的每個值都放在前一個值之後。 因此,條形的總值是所有段值的總和。 因此,簡單的堆疊條形圖非常適合將總量與每個組/分段條進行比較。
  • 100% 堆疊條形圖分段條形圖是堆疊條形圖,其中分段條加起來為 100%。 換句話說,堆積條顯示多個數據系列的相對百分比,每個堆積條的總和始終為 100%。 因此,在構建分段條形圖時,必須確保每個條形代表 100%。 否則,它將變成一個簡單的堆積條形圖。

堆積條形圖顯示了部分與整體的關係,甚至可以顯示部分如何隨時間變化。 下面是一個分段條形圖的簡單說明,顯示了產品的市場份額每年如何變化。 這種分段條形圖的一個顯著缺點是,雖然很容易比較第一個數據系列(在下圖中的垂直軸旁邊),但後續的比較難以比較,因為它們沒有與共同的基線對齊。

圖片來源

從世界頂級大學在線獲得數據科學認證獲得行政 PG 課程、高級證書課程或碩士課程,以加快您的職業生涯。

下圖將進一步闡明簡單堆疊條形圖和分段條形圖之間的解剖差異:

圖片來源

構建分段條形圖時要記住的要點

  • 堆積條形圖和分段條形圖都具有帶有兩個軸的二維表示 - 一個軸顯示類別,另一個顯示數值。 表示類別的軸沒有標度來表明它指的是互斥的組(例如,公司、年份等)。 但是帶有數值的軸有一個帶有相應測量單位的刻度。
  • 條可以垂直或水平定向。 每個主要類別被劃分為段,其中每個段代表第二個類別變量的子類別。
  • 矩形段的高度或長度顯示每個子類別的數量,並垂直或水平端到端堆疊。
  • 每個條形的最終長度或高度代表每個主要類別的總量(在分段條形圖中為 100%)。
  • 等效的子類別應該用相同的顏色表示。
  • 必須在主要類別的條之間留一些空間以表明它們代表離散的組。

分段條形圖的優缺點

分段條形圖是一種方便的數據可視化工具。 它具有條形圖固有的簡單性,但在許多數據分析操作中都有應用。 但是,它確實有幾個缺點,這限制了它在數據分析的特定場景中的使用。

以下是分段條形圖的優缺點:

優點:

  • 很容易理解分類數據的組成。
  • 它們描繪了隨著時間的推移部分到整體的變化。
  • 它們可以在緊湊的空間中表示多個類別和數據系列。

缺點:

  • 隨著每條中的段數的增加,閱讀變得更加困難。
  • 由於它們沒有與共同的基線對齊,因此將段相互比較變得困難。
  • 由於堆疊條被標準化為 100%,因此丟失了絕對值維度。

前進的道路:與 upGrad 一起為您的職業生涯提供未來保障

upGrad 是首屈一指的在線高等教育平台,提供與行業相關的項目和課程。 upGrad 將最新技術與教育實踐相結合,在 85 個國家/地區擁有超過 40,000 名付費學習者,已幫助超過 500,000 名在職專業人士在各自領域工作。

以下是upGrad為學習者提供的優勢:

  • 靈活的學習和行業相關課程,提供個性化的行業指導、實用的行業實踐項目以及與教師和專家的現場會議。
  • 點對點網絡、疑難解答論壇和交流機會。
  • 來自一流大學和公司的教師
  • 專門的導師團隊
  • 結果驅動的方法
  • 360 度職業協助

upGrad 的數據科學執行 PG 認證和數據科學碩士學位兩個結構良好的課程,可幫助您牢牢掌握在數據科學職業中蓬勃發展所需的技能和知識。 每個項目都有其優勢,但兩者都旨在提供符合最新行業標準的引人入勝的學習體驗。 憑藉大量與行業相關的實踐項目,證書持有者可以放心,他們將準備好面對需要不斷提高專業技能的充滿挑戰和競爭激烈的就業市場。 更重要的是,這些計劃是與所有行業的數據科學專業人士建立聯繫的獨特機會。

數據科學 PG 認證項目亮點:

  • 完全在線格式的七個月課程。
  • 專為工作專業人士設計。
  • IIIT班加羅爾的研究生證書。
  • 涵蓋編程語言和工具,例如 Excel、Python、Tableau 和 MySQL。
  • 300 多個小時的內容,包括 7 個以上的案例研究和項目、20 多個現場會議和六個編碼作業。

德國國際應用科技大學數據科學碩士

節目亮點:

  • 24 個月的課程時間(第一年在線和第二年在德國校園內)。
  • 雙重認證(IIIT-B 的執行 PG 計劃和德國 IU 的碩士學位)和 NASSCOM 證書。
  • upGrad學習者不需要雅思。
  • 全面覆蓋 14 多種工具和軟件。
  • 超過 500 小時的內容,包含 60 多個案例研究和項目、20 多個現場會議以及 25 個行業專家的 1:8 輔導課程。

綜上所述

了解如何構建分段條形圖對於數據分析來說是必須的,特別是如果您是初學者並且剛剛開始使用數據可視化技術。 此類圖表可以在 Excel 中輕鬆構建,並且不需要任何復雜工具和軟件的高級知識。 然而,首先,清楚地了解您正在使用的數據以及它是否適合分段條形圖表示是至關重要的。

隨著大數據和商業分析的潛在全球市場顯示出未來的有希望的趨勢,可以肯定的是,數據科學的職業充滿了可能性。 所以,註冊 upGrad 並開始學習最好的!

圖表和圖表有什麼區別?

圖表是數據的一種可視化表示形式,可以採用圖表、圖片或圖形的形式。 在圖表中,類別可能相互關聯,也可能不相互關聯。 另一方面,圖表是數據的數字表示,顯示一個數字或變量的變化如何影響另一個。 換句話說,圖表是一種圖表,專注於原始數據並描繪這些數據隨時間變化的趨勢。

什麼是直方圖與條形圖?

條形圖使用垂直或水平條來表示分類數據,其中每個條的長度與它們所代表的數據值成正比。 另一方面,直方圖是數據的圖形表示,其中數據被組織成連續的數字範圍。 在直方圖中,每個垂直條對應一個範圍。

如何在 MS Excel 中創建分段條形圖?

以下是在 MS Excel 中創建分段條形圖的步驟:
第 1 步:在 Excel 中清晰標記的列中輸入您的數據。
第 2 步:突出顯示數據。
第 3 步:單擊“插入”選項卡。 然後,單擊圖表部分下的插入柱形圖或條形圖。
第 4 步:單擊選項 100% Stacked Column。
Excel 將自動生成分段條形圖。