什麼是描述性統計? 定義,類型解釋

已發表: 2021-08-13

描述性統計是數據集的組織和總結特徵。 從整個人口或樣本中收集的觀察結果稱為數據集。 收集數據後的第一步是描述特徵的響應,例如一個變量的平均值或兩個變量之間的關係。 例如,找到年齡和創造力之間的聯繫給了我們統計分析。

下一步是找到推理統計數據,它表明您的數據是反駁還是證實了假設。 它還有助於我們確定廣義人口是否會影響它。 如今,研究人員非常重視數據科學和大數據,對這些數據進行嚴格審查。 這就是描述性統計發揮作用的地方。

分析描述性統計的基本步驟之一是它提供描述,建設性地顯示數據點,並提供有洞察力的數據信息。 它進一步為您提供數據分佈的結論,幫助您檢測異常值,並使您能夠識別變量之間的相似性。

目錄

描述性統計的類型

  • 頻率分佈

頻率分佈顯示樣本或數據集中不同結果的計數或頻率。 它用於定性和定量數據,通常以圖形或表格格式呈現。 圖形或表格中的每個條目都伴隨著值在範圍、間隔或特定組中出現的頻率或計數。

為了清楚起見,它是基於專有類別分類的分組數據的摘要或表示。 它還顯示了每個相應類別中的出現次數。 因此,它表明了一種更有條理和結構化的方式來呈現原始數據。

頻率分佈數據的一些示例是用於頻率表示的圖形或圖表。 此外,餅圖、條形圖、折線圖和直方圖也是頻率分佈的指標。

  • 集中趨勢

集中趨勢一般是指描述性的數據集匯總,使用反映數據分佈中心的單個值。 因此,集中趨勢的度量通常被稱為中心位置的度量。 集中趨勢的三個核心方面是:

    • 意思是

均值被認為是最流行的集中趨勢。 它是數據集的平均值或最常見的值。 要定義均值,它是兩個或多個數字的最簡單的數學平均值。 平均值由數據中的一組數字給出,可以通過多種方式計算。 平均有兩種類型——算術平均和幾何平均。

例如,求以下一組數據的均值; 2,3,4,5,6。 然後,通過簡單地將數據集相加並將其除以數據集中值的數量,該數據的平均值為 4。

    • 中位數

中位數是任何數據集按升序或降序排列的中間分數。 因此,數字列表在數據集中比平均值更具描述性。

例如奇數數據集為{3, 13, 2, 34, 11, 26,47},首先需要排列數據{2,3,11,13,26,34,47 },這裡的中位數是 13,因為系列的兩邊都有相等的數字。 另一方面,如果偶數數據集是 {3, 13, 2, 34, 11, 17, 27, 47},則需要先將數據按 {2,3,11,13, 17,26,34,47},這裡的中位數將是系列中間的兩位數之和除以 2。因此,中位數將是 13+17/2,等於 15。

    • 模式

眾數是指數據中出現頻率最高的分數值。 數據集可能有一種模式,一種以上的模式,甚至根本沒有模式。

例如數據集有數字{3,5,6,6,6,8,9},眾數為6,如果數據集沒有相同的數字,則認為該數據沒有眾數.

  • 變化性

變異性是反映樣本分散程度的匯總統計量的度量。 它還測量確定數據點與中心相距多遠的可變性。

散佈、分散和可變性是指數據中分佈值的寬度和範圍。 標準差、方差和範圍用於描述價差的不同方面和組成部分。

值集中的範圍描述了數據中最低值和最高值之間的離散程度或理想距離。 標準差用於確定一組數據的平均方差。 它還提供了對數據集中值之間的差異或距離的洞察。 它也描述了數據的平均值。 最後,它反映了傳播的程度。

描述性統計的重要性

  • 警惕數據

為描述性統計收集的數據必須具有高度的客觀性。 因此,需要格外警惕,因為如果統計數據顯示提取的數據具有不同的特徵,並且與趨勢不符,那將毫無用處。

  • 更廣泛的方法

描述性統計被測量為比定量方法更廣泛。 它旨在提供更廣泛的現像或事件圖景。 這可以使用單個數量的變量或任意數量的變量來進行研究。

  • 自然關係

這種統計數據被認為是收集信息的更好方法,因為它是自然的,並且展示了世界的存在。 它研究數據的真實行為,以確保提取趨勢的準確性。

  • 靈活的

描述性統計為研究提供了一種學習事物的新方法。 例如,研究人員可以使用相關性和定性的案例研究來描述描述性統計的現象。 人們可以使用案例研究來描述事件、人物和機構。 這將使研究人員能夠了解數據模式和行為。

從世界頂級大學在線獲得數據科學認證獲得行政 PG 課程、高級證書課程或碩士課程,以加快您的職業生涯。

  • 識別變量和假設

描述性統計數據在確定可以通過實驗和推理研究進一步分析的新假設和變量時派上用場。 此外,它非常有用,因為誤差幅度相對較小,並且趨勢直接來自數據屬性。

總結

描述性統計對於數據可視化至關重要,因為它使數據專家能夠有意義地展示他們的發現,以便技術和非技術利益相關者都能理解它們。 通過恰當的圖形表示來總結複雜的定量數據,描述性統計簡化了數據解釋過程,使企業更容易做出基於數據的決策。

如果您有興趣了解有關數據科學中使用的不同統計概念和方法的更多信息,請務必查看upGrad 的數據科學執行 PG 課程 這些課程由來自國內外頂尖大學的教師授課,將為您提供與行業相關的技能和知識。

為未來的職業做準備

從 IIIT 開始您的數據科學職業生涯 - 班加羅爾
申請數據科學高級證書課程