Universitario → Probabilidad y estadística → Figuras ↓
Estadísticas descriptivas
La estadística descriptiva es una rama de la estadística que tiene como objetivo resumir un conjunto de datos. Proporciona resúmenes simples sobre muestras y medidas. Dichos resúmenes pueden ser cuantitativos, utilizando cálculos numéricos, o visuales, a través de varios gráficos y gráficos. Las estadísticas descriptivas ayudan a simplificar grandes cantidades de datos de una manera comprensible. Cada estadística descriptiva reduce una gran cantidad de datos a un resumen simple.
Tipos de estadísticas descriptivas
Las estadísticas descriptivas se dividen en medidas de tendencia central y medidas de variabilidad o dispersión.
Medidas de tendencia central
Las medidas de tendencia central describen el punto central de un conjunto de datos. Hay tres medidas principales:
- Media
- Mediana
- Moda
Media
La media es el promedio del conjunto de datos. Se calcula sumando todos los números y dividiendo por la cantidad de números.
Media = (Suma de todos los puntos de datos) / (Número de puntos de datos)
Ejemplo:
Datos: 2, 3, 5, 7, 11
Media = (2 + 3 + 5 + 7 + 11) / 5 = 5.6
Mediana
La mediana es el valor medio de un conjunto de datos ordenado. Si el número de puntos de datos es impar, la mediana es el número del medio. Si es par, es el promedio de los dos números del medio.
Ejemplo de número impar de puntos de datos:
Datos: 3, 5, 7, 9, 11
Mediana = 7
Ejemplo de número par de puntos de datos:
Datos: 3, 5, 7, 9
Mediana = (5 + 7)/2 = 6
Moda
La moda es el número que aparece con más frecuencia en un conjunto de datos. Un conjunto de datos puede tener una moda, más de una moda o no tener moda.
Ejemplo:
Datos: 4, 4, 6, 8, 2, 4, 10
Moda = 4
Medidas de variabilidad
Las medidas de variabilidad describen la dispersión de los datos dentro de un conjunto de datos. Las mediciones clave incluyen:
- Rango
- Varianza
- Desviación estándar
Rango
El rango es la diferencia entre los valores más altos y más bajos en un conjunto de datos.
Rango = (Valor máximo) - (Valor mínimo)
Ejemplo:
Datos: 3, 7, 8, 15, 20
Rango = 20 – 3 = 17
Varianza
La varianza mide cuán lejos está cada número en el conjunto de la media y, por lo tanto, cuán lejos está de cada otro número en el conjunto. Se calcula tomando el promedio de las desviaciones cuadradas de la media.
Varianza = (Σ (xi - Media)^2) / N
Ejemplo:
Datos: 3, 7, 7, 19
Media = (3 + 7 + 7 + 19) / 4 = 9
Varianza = [(3-9)^2 + (7-9)^2 + (7-9)^2 + (19-9)^2] / 4 = 30
Desviación estándar
La desviación estándar es la raíz cuadrada de la varianza y proporciona una medida de la distancia promedio de la media.
Desviación estándar = √Varianza
Ejemplo:
Datos: 3, 7, 7, 19
Varianza = 30
Desviación estándar = √30 ≈ 5.48
Visualización de estadísticas descriptivas
Las estadísticas descriptivas se pueden representar utilizando una variedad de técnicas gráficas. Estos incluyen histogramas, gráficos de barras, gráficos circulares, diagramas de caja y diagramas de dispersión.
Gráfico de barras
Los gráficos de barras se utilizan para mostrar datos categóricos, con barras rectangulares que indican la frecuencia de cada categoría. La longitud de las barras es proporcional al número de casos en cada categoría.
Histograma
Los histogramas se utilizan para mostrar datos continuos y muestran la distribución de frecuencia de un conjunto de puntos de datos continuos.
Diagrama de caja
Los diagramas de caja se utilizan para mostrar la distribución de datos según un resumen de cinco puntos: mínimo, primer cuartil, mediana, tercer cuartil y máximo.
Gráfico circular
Los gráficos circulares muestran datos proporcionales y cada sector representa una parte del todo. Es especialmente efectivo para mostrar relaciones de parte a todo.
Diagrama de dispersión
Los diagramas de dispersión se utilizan para determinar la relación entre dos variables. Los datos se representan como una colección de puntos, cada uno de los cuales tiene el valor de una variable que determina la posición en el eje horizontal y el valor de la otra variable que determina la posición en el eje vertical.
Importancia de las estadísticas descriptivas
Las estadísticas descriptivas son increíblemente útiles porque proporcionan un resumen simple de las muestras y mediciones, ofreciendo una descripción general rápida de un conjunto de datos. También proporcionan la base para un análisis estadístico más profundo, incluidas las estadísticas inferenciales, que ayudan a asegurar resultados de investigación precisos y fiables.
Los ejemplos visuales, como gráficos y diagramas, no solo hacen que los datos sean comprensibles de un vistazo, sino que también proporcionan herramientas informativas que pueden resaltar características importantes de un conjunto de datos, como tendencias, fluctuaciones y relaciones entre variables.
En la práctica, estas herramientas son invaluables en diversos campos como la ciencia, las finanzas, el análisis empresarial y la economía, donde tener un resumen y una buena comprensión de los conjuntos de datos puede guiar importantes procesos de toma de decisiones.
Esta completa investigación de estadísticas descriptivas destaca su papel fundamental en la simplificación y comunicación de datos complejos de manera comprensible y procesable. Al traducir grandes cantidades de números en ideas digeribles, las estadísticas descriptivas proporcionan la lente a través de la cual podemos ver, comprender y analizar el mundo a través de los datos.