¿Qué es la Estadística Descriptiva? Definición, tipos explicados
Publicado: 2021-08-13Las estadísticas descriptivas son características organizadas y resumidas del conjunto de datos. La colección de observaciones de toda la población o muestra se conoce como conjunto de datos. El primer paso después de recopilar datos es describir las respuestas de las características, como el promedio de una variable o la relación entre dos variables. Por ejemplo, encontrar una conexión entre la edad y la creatividad nos brinda un análisis estadístico.
El siguiente paso es encontrar estadísticas inferenciales, que indican si sus datos refuta o confirma la hipótesis. También nos ayuda a decidir si una población generalizada influye en ella. En estos días, los investigadores le dan mucha importancia a la ciencia de datos y al big data, haciendo que estos datos se procesen con el mayor escrutinio. Aquí es donde entra en juego la estadística descriptiva.
Uno de los pasos esenciales para analizar estadísticas descriptivas es que proporciona descripciones, muestra puntos de datos de manera constructiva y proporciona información de datos perspicaces. Además, le brinda una conclusión de la distribución de datos, lo ayuda a detectar valores atípicos y le permite identificar similitudes entre las variables.
Tabla de contenido
Tipos de estadísticas descriptivas
Distribución de frecuencias
Una distribución de frecuencia muestra el recuento o la frecuencia de los diferentes resultados en una muestra o conjunto de datos. Se utiliza tanto para datos cualitativos como cuantitativos y normalmente se presenta en forma de gráfico o tabla. Cada entrada en el gráfico o tabla está acompañada por la frecuencia o el recuento de las ocurrencias de los valores en un rango, intervalo o grupo específico.
Para que quede claro, es un resumen o presentación de datos agrupados categorizados en base a clases exclusivas. También presenta el número de ocurrencias en cada categoría respectiva. Por lo tanto, indica una forma más organizada y estructurada de presentar datos en bruto.
Algunos de los ejemplos de datos de distribución de frecuencias son gráficos o tablas que se utilizan en la presentación de frecuencias. Además, los gráficos circulares, gráficos de barras, gráficos de líneas e histogramas también son un indicador de la distribución de frecuencias.
Tendencia central
La tendencia central generalmente se refiere al resumen del conjunto de datos descriptivos, utilizando un valor único que refleja el centro de distribución de datos. Así, las medidas de tendencia central se conocen popularmente como medidas de ubicación central. Los tres aspectos centrales de la tendencia central son:
Significar
La media se considera la tendencia central más popular. Es un valor promedio o más común del conjunto de datos. Para definir la media, es el promedio matemático más simple de dos o más números. La media está dada por el conjunto de números en los datos, que se pueden calcular de más de una manera. Hay dos tipos de medias: la media aritmética y la media geométrica.
Por ejemplo, para encontrar la media del siguiente conjunto de datos; 2,3,4,5,6. Entonces, la media de estos datos es cuatro simplemente sumando el conjunto de datos y dividiéndolo por el número de valores en el conjunto de datos.
Mediana
La mediana es la puntuación media de cualquier conjunto de datos en orden ascendente o descendente. Por lo tanto, la lista de números es más descriptiva en el conjunto de datos que el promedio.
Por ejemplo, en el caso de un conjunto de datos impar que es {3, 13, 2, 34, 11, 26,47}, primero debe organizar los datos {2,3,11,13,26,34,47 }, aquí la mediana es 13 porque hay números iguales a ambos lados de la serie. Por otro lado, en el caso de un conjunto de datos pares que sea {3, 13, 2, 34, 11, 17, 27, 47}, primero debe organizar los datos en un orden {2,3,11,13, 17,26,34,47}, aquí la Mediana sería la suma de dos dígitos que están en el medio de la serie dividida por 2. Por lo tanto, la Mediana sería 13+17/2, que es igual a 15.
Modo
La moda se refiere al valor de puntuación que es más frecuente en los datos. El conjunto de datos puede tener una moda, más de una moda y ninguna moda.
Por ejemplo, el conjunto de datos que tiene los números {3,5,6,6,6,8,9}, la moda sería 6, y en caso de que el conjunto de datos no tenga los mismos números, se considera que esos datos no tienen moda. .
Variabilidad
La variabilidad es una medida de resumen estadístico que refleja el grado de dispersión en una muestra. También mide la variabilidad que determina qué tan separados aparecen los puntos de datos del centro.
La propagación, la dispersión y la variabilidad se refieren al ancho y rango de los valores de distribución en los datos. La desviación estándar, la varianza y el rango se utilizan para representar diferentes aspectos y componentes del diferencial.
El rango en el conjunto de valores representa el grado de dispersión o una distancia ideal entre los valores más bajo y más alto dentro de los datos. La desviación estándar se utiliza para establecer la varianza promedio en un conjunto de datos. También proporciona una idea de la diferencia o distancia entre los valores en el conjunto de datos. También representa el valor medio de los datos. Finalmente, refleja el grado de propagación.
Importancia de las estadísticas descriptivas
Datos vigilantes
Los datos recopilados para las estadísticas descriptivas deben poseer un alto grado de objetividad. Por lo tanto, uno debe estar más atento porque si las estadísticas muestran diferentes características de los datos extraídos y no coinciden con las tendencias, no servirá de nada.
Enfoque más amplio
La estadística descriptiva se mide para ser más amplia que el método cuantitativo. Su objetivo es proporcionar una imagen más amplia del fenómeno o evento. Esto puede usar un solo número de variables o cualquier número de variables para hacer la investigación.
Relación natural
Estos datos estadísticos se consideran un mejor método para recopilar información porque son naturales y muestran el mundo tal como existe. Investiga el comportamiento real de los datos para garantizar la precisión de las tendencias extraídas.
Flexible
La estadística descriptiva le da al estudio una nueva forma de aprender cosas. Por ejemplo, los investigadores pueden usar un estudio de caso que sea tanto de correlación como cualitativo para describir los fenómenos de la estadística descriptiva. Uno puede usar estudios de casos para describir eventos, personas e instituciones. Esto permitirá a los investigadores comprender los patrones y el comportamiento de los datos.
Obtenga la certificación de ciencia de datos en línea de las mejores universidades del mundo. Obtenga programas Executive PG, programas de certificados avanzados o programas de maestría para acelerar su carrera.
Identificar variables e hipótesis
Las estadísticas descriptivas son útiles para identificar nuevas hipótesis y variables que pueden analizarse más a fondo a través de estudios experimentales e inferenciales. Además, es muy útil ya que el margen de error es relativamente pequeño y las tendencias se obtienen directamente de las propiedades de los datos.
Para concluir
Las estadísticas descriptivas son cruciales para la visualización de datos, ya que permiten a los expertos en datos presentar sus hallazgos de manera significativa para que las partes interesadas tanto técnicas como no técnicas puedan entenderlos. Al resumir datos cuantitativos complejos a través de representaciones gráficas adecuadas, las estadísticas descriptivas simplifican el proceso de interpretación de datos, lo que facilita que las empresas tomen decisiones basadas en datos.
Si está interesado en obtener más información sobre los diferentes conceptos y métodos estadísticos utilizados en la ciencia de datos, asegúrese de consultar los cursos del Programa ejecutivo PG de upGrad en ciencia de datos . Impartidos por miembros de la facultad de las mejores universidades nacionales y extranjeras, estos cursos lo equiparán con habilidades y conocimientos relevantes para la industria.