Apa itu Statistik Deskriptif? Definisi, Jenis Dijelaskan

Diterbitkan: 2021-08-13

Statistik deskriptif adalah karakteristik yang terorganisir dan diringkas dari kumpulan data. Kumpulan pengamatan dari seluruh populasi atau sampel dikenal sebagai kumpulan data. Langkah pertama setelah mengumpulkan data adalah mendeskripsikan tanggapan dari karakteristik seperti rata-rata satu variabel atau hubungan antara dua variabel. Misalnya, menemukan hubungan antara usia dan kreativitas memberi kita analisis statistik.

Langkah selanjutnya adalah menemukan statistik inferensial, yang menunjukkan apakah data Anda menyangkal atau mengkonfirmasi hipotesis. Ini juga membantu kita untuk memutuskan apakah populasi umum mempengaruhinya. Saat ini, para peneliti sangat mementingkan ilmu data dan data besar, membuat data ini diproses dengan sangat teliti. Di sinilah statistik deskriptif dimulai.

Salah satu langkah penting untuk menganalisis statistik deskriptif adalah memberikan deskripsi, menunjukkan poin data secara konstruktif, dan memberikan informasi data yang mendalam. Ini lebih lanjut memberi Anda kesimpulan tentang distribusi data, membantu Anda mendeteksi outlier, dan memungkinkan Anda untuk mengidentifikasi kesamaan di antara variabel.

Daftar isi

Jenis Statistik Deskriptif

  • Distribusi Frekuensi

Distribusi frekuensi menunjukkan jumlah atau frekuensi hasil yang berbeda dalam sampel atau kumpulan data. Ini digunakan untuk data kualitatif dan kuantitatif dan biasanya disajikan dalam format grafik atau tabel. Setiap entri dalam grafik atau tabel disertai dengan frekuensi atau jumlah kemunculan nilai dalam rentang, interval, atau grup tertentu.

Untuk memperjelasnya, itu adalah ringkasan atau penyajian data yang dikelompokkan yang dikategorikan berdasarkan kelas eksklusif. Ini juga menyajikan jumlah kejadian di masing-masing kategori. Dengan demikian, ini menunjukkan cara yang lebih terorganisir dan terstruktur untuk menyajikan data mentah.

Beberapa contoh data distribusi frekuensi adalah grafik atau bagan yang digunakan dalam penyajian frekuensi. Selain itu, diagram lingkaran, diagram batang, diagram garis, dan histogram juga merupakan indikator distribusi frekuensi.

  • Tendensi Sentral

Tendensi sentral umumnya mengacu pada ringkasan kumpulan data deskriptif, menggunakan nilai tunggal yang mencerminkan pusat distribusi data. Dengan demikian, ukuran tendensi sentral dikenal sebagai ukuran lokasi sentral. Tiga aspek inti dari tendensi sentral adalah:

    • Berarti

Mean dianggap sebagai tendensi sentral yang paling populer. Ini adalah nilai rata-rata atau paling umum dari kumpulan data. Untuk mendefinisikan mean, itu adalah rata-rata matematika paling sederhana dari dua angka atau lebih. Mean diberikan oleh kumpulan angka dalam data, yang dapat dihitung dengan lebih dari satu cara. Ada dua jenis mean – mean aritmatika dan mean geometrik.

Misalnya, untuk mencari rata-rata dari kumpulan data berikut; 2,3,4,5,6. Kemudian, rata-rata dari data ini adalah empat dengan hanya menambahkan kumpulan data dan membaginya dengan jumlah nilai dalam kumpulan data.

    • median

Median adalah skor tengah dari setiap kumpulan data dalam urutan menaik atau menurun. Dengan demikian, daftar angka lebih deskriptif dalam kumpulan data daripada rata-rata.

Misalnya, dalam kasus kumpulan data ganjil yaitu {3, 13, 2, 34, 11, 26,47}, Anda perlu menyusun datanya terlebih dahulu {2,3,11,13,26,34,47 }, di sini Median adalah 13 karena ada angka yang sama di kedua sisi seri. Sebaliknya, untuk himpunan data genap yaitu {3, 13, 2, 34, 11, 17, 27, 47}, data tersebut harus diurutkan terlebih dahulu {2,3,11,13, 17,26,34,47}, di sini Median adalah jumlah dari dua angka yang berada di tengah deret tersebut dibagi 2. Oleh karena itu, Median adalah 13+17/2, yang sama dengan 15.

    • Mode

Modus mengacu pada nilai skor yang paling sering dalam data. Kumpulan data mungkin memiliki satu mode, lebih dari satu mode, dan tidak ada mode sama sekali.

Misal suatu kumpulan data mempunyai bilangan {3,5,6,6,6,8,9}, modusnya adalah 6, dan jika kumpulan data tersebut tidak mempunyai bilangan yang sama, maka data tersebut dianggap tidak mempunyai modus. .

  • Variabilitas

Variabilitas adalah ukuran statistik ringkasan yang mencerminkan tingkat dispersi dalam sampel. Ini juga mengukur variabilitas yang menentukan seberapa jauh titik data muncul dari pusat.

Spread, dispersi, dan variability mengacu pada lebar dan rentang nilai distribusi dalam suatu data. Standar deviasi, varians, dan range digunakan untuk menggambarkan berbagai aspek dan komponen spread.

Rentang dalam himpunan nilai menggambarkan derajat dispersi atau jarak ideal antara nilai terendah dan tertinggi dalam suatu data. Standar deviasi digunakan untuk menetapkan varians rata-rata dalam satu set data. Ini juga memberikan wawasan tentang perbedaan atau jarak antara nilai dalam kumpulan data. Ini menggambarkan nilai rata-rata data juga. Akhirnya, itu mencerminkan tingkat penyebaran.

Pentingnya Statistik Deskriptif

  • Data waspada

Data yang dikumpulkan untuk statistik deskriptif harus memiliki tingkat objektivitas yang tinggi. Oleh karena itu, seseorang perlu ekstra waspada karena jika statistik menunjukkan karakteristik yang berbeda dari data yang diekstraksi dan tidak sesuai dengan tren, itu tidak akan ada gunanya.

  • Pendekatan yang Lebih Luas

Statistik deskriptif diukur lebih luas daripada metode kuantitatif. Hal ini bertujuan untuk memberikan gambaran yang lebih luas tentang fenomena atau peristiwa. Ini dapat menggunakan sejumlah variabel tunggal atau sejumlah variabel untuk melakukan penelitian.

  • Hubungan Alami

Data statistik ini dianggap sebagai metode yang lebih baik untuk mengumpulkan informasi karena alami dan menunjukkan dunia sebagaimana adanya. Ini meneliti perilaku kehidupan nyata dari data untuk memastikan keakuratan tren yang diekstraksi.

  • Fleksibel

Statistik deskriptif memberikan studi cara baru untuk mempelajari sesuatu. Misalnya, peneliti dapat menggunakan studi kasus yang bersifat korelasional dan kualitatif untuk menggambarkan fenomena statistik deskriptif. Seseorang dapat menggunakan studi kasus untuk menggambarkan peristiwa, orang, dan institusi. Ini akan memungkinkan peneliti untuk memahami pola dan perilaku data.

Dapatkan sertifikasi ilmu data online dari Universitas top dunia. Dapatkan Program PG Eksekutif, Program Sertifikat Tingkat Lanjut, atau Program Magister untuk mempercepat karier Anda.

  • Identifikasi variabel dan hipotesis

Statistik deskriptif berguna saat mengidentifikasi hipotesis dan variabel baru yang dapat dianalisis lebih lanjut melalui studi eksperimental dan inferensial. Selain itu, ini sangat berguna karena margin kesalahannya relatif kecil, dan tren bersumber langsung dari properti data.

Untuk menyimpulkan

Statistik deskriptif sangat penting untuk visualisasi data karena memungkinkan pakar data untuk mempresentasikan temuan mereka secara bermakna sehingga pemangku kepentingan teknis dan non-teknis dapat memahaminya. Dengan meringkas data kuantitatif yang kompleks melalui representasi grafis yang tepat, statistik deskriptif menyederhanakan proses interpretasi data, sehingga memudahkan bisnis untuk membuat keputusan berbasis data.

Jika Anda tertarik untuk mengetahui lebih lanjut tentang berbagai konsep dan metode statistik yang digunakan dalam ilmu data, pastikan untuk memeriksa Program PG Eksekutif upGrad dalam kursus Ilmu Data . Diajarkan oleh anggota fakultas dari universitas nasional dan asing terkemuka, kursus ini akan membekali Anda dengan keterampilan dan pengetahuan yang relevan dengan industri.

Persiapkan Karir Masa Depan

Mulai Karir Ilmu Data Anda Dengan IIIT - Bangalore
Terapkan untuk Program Sertifikat Tingkat Lanjut dalam Ilmu Data