Posgrado → Probabilidad y estadística → Inferencia estadística ↓
Pruebas de hipótesis
Las pruebas de hipótesis son un concepto fundamental en estadística, utilizado para emitir juicios sobre las características de una población. Es un método que nos permite utilizar datos de muestra para decidir entre dos hipótesis en competencia sobre un parámetro de población.
Introducción a las pruebas de hipótesis
Básicamente, las pruebas de hipótesis son un proceso mediante el cual verificamos si una afirmación (hipótesis) sobre un parámetro de población es plausible con base en los datos de muestra que tenemos. Los elementos principales de las pruebas de hipótesis son la hipótesis nula, la hipótesis alternativa, el estadístico de prueba, la región de rechazo y la conclusión.
Hipótesis nula y alternativa
La hipótesis nula (denotada como H 0
) es una declaración sobre el parámetro de población que queremos probar. Generalmente, es una declaración de no efecto o no diferencia. En contraste, la hipótesis alternativa (denotada como H 1
o H a
) es lo que asumimos que es cierto si se rechaza la hipótesis nula. Representa un efecto o una diferencia.
Hipótesis Nula (H 0 ): μ = μ 0 Hipótesis Alternativa (H a ): μ ≠ μ 0 (dos colas) Hipótesis Alternativa (H a ): μ > μ 0 (cola derecha) Hipótesis Alternativa (H a ): μ < μ 0 (cola izquierda)
Estadístico de prueba
Un estadístico de prueba es un valor calculado a partir de datos de muestra que se utiliza para evaluar la probabilidad de la hipótesis nula. La elección del estadístico de prueba depende del tipo de datos y de la hipótesis que se está probando. Ejemplos comunes incluyen el valor-z, valor-t y estadístico F.
Por ejemplo, si queremos probar una hipótesis sobre una media, podemos calcular el valor-z
para la media de la muestra:
z = (x̄ - μ 0 ) / (σ/√n)
Zona de rechazo
La región de rechazo está determinada por el nivel de significancia, denotado por α
, que es la probabilidad de rechazar la hipótesis nula cuando en realidad es verdadera. Las opciones comunes para α
son 0.05, 0.01 y 0.10.
Si el estadístico de prueba cae en la región de rechazo, rechazamos la hipótesis nula a favor de la hipótesis alternativa.
Conclusión
Con base en el estadístico de prueba y la región de rechazo, sacamos conclusiones. Si el estadístico de prueba cae en la región de rechazo, rechazamos la hipótesis nula, sugiriendo que hay suficiente evidencia para apoyar la hipótesis alternativa. Si no cae en la región de rechazo, no rechazamos la hipótesis nula.
Tipos de pruebas de hipótesis
Las pruebas de hipótesis pueden clasificarse en varios tipos según los parámetros de población de interés y los datos disponibles.
Prueba z para una muestra
La prueba z para una muestra se usa cuando queremos comparar una media de muestra con una media de población conocida. Esta prueba asume que la población está normalmente distribuida y la varianza de la población es conocida.
Prueba t para una muestra
Si la varianza de la población es desconocida, usamos una prueba t para una muestra en lugar de una prueba z. Es apropiada cuando el tamaño de la muestra es pequeño y se asume que la población está normalmente distribuida.
Prueba t para dos muestras
La prueba t para dos muestras compara las medias de dos muestras independientes. Prueba si las medias de dos grupos son iguales. Esta prueba utiliza la desviación estándar agrupada cuando se asume que las varianzas son iguales o utiliza las varianzas individuales cuando las varianzas son desiguales.
Ejemplo: prueba de hipótesis para la media
Supongamos que una empresa fabrica bombillas con una vida media de 1000 horas. Un investigador cree que la vida media real es menor a 1000 horas y quiere probar esta hipótesis usando una muestra aleatoria de 30 bombillas.
Definamos nuestras hipótesis:
H 0 : μ = 1000 H a : μ < 1000
Nivel de significancia: α = 0.05
.
Suponiendo que la desviación estándar de la población es 100, el estadístico de prueba se puede calcular de la siguiente manera:
z = (x̄ - μ 0 ) / (σ/√n) x̄ = media de la muestra n = tamaño de la muestra σ = desviación estándar de la población μ 0 = media de la población bajo H 0
Si el valor z
calculado cae a la izquierda de nuestro valor crítico en la curva de distribución normal (encontrado en tablas-z), rechazaremos la hipótesis nula.
Aplicaciones en la vida real de las pruebas de hipótesis
- Investigación médica: Comparar la efectividad de un nuevo fármaco con un placebo.
- Manufactura: Comparar las medias de diferentes procesos de producción para determinar qué proceso es más eficiente.
- Marketing: Evaluar el impacto de una nueva campaña en las ventas de clientes o el compromiso en comparación con una estrategia antigua.
- Educación: Determinar si un nuevo método de enseñanza funciona mejor que el método tradicional.
Errores comunes en las pruebas de hipótesis
Errores de Tipo I y Tipo II
Dos errores comunes en las pruebas de hipótesis son los errores de Tipo I y Tipo II:
- Error de Tipo I: rechazar la hipótesis nula cuando es verdadera. La probabilidad de que ocurra un error de Tipo I es el nivel de significancia
α
. - Error de Tipo II: no rechazar la hipótesis nula cuando la hipótesis alternativa es verdadera. La probabilidad de cometer un error de Tipo II se denota como
β
.
Ejemplo de errores en las pruebas de hipótesis: pruebas médicas
En una prueba médica para una enfermedad, la hipótesis nula podría ser que la persona no tiene la enfermedad (H 0
: la persona no tiene la enfermedad). La hipótesis alternativa podría ser que la persona sí tiene la enfermedad (H a
: la persona sí tiene la enfermedad).
- Error de Tipo I: La prueba muestra que la persona tiene la enfermedad cuando en realidad no la tiene. Esto puede causar estrés y tratamiento innecesarios.
- Error de Tipo II: La prueba no logra identificar una enfermedad cuando una persona realmente la tiene. Esto resulta en que la enfermedad no sea tratada.
El poder de la prueba
El poder de una prueba es la probabilidad de que rechace correctamente una hipótesis nula falsa (1 - β
). Un mayor poder significa una mayor probabilidad de detectar un efecto cuando hay un efecto, reduciendo así los errores de tipo II.
El poder se puede aumentar de las siguientes formas:
- Aumentando el tamaño de la muestra.
- Seleccionando un nivel de significancia mayor (lo que aumenta la probabilidad de un error de Tipo I).
- Esto es el aumento en el tamaño del efecto que esperamos encontrar.
Valores críticos y valores p
Valores críticos
Los valores críticos son los valores umbral que definen los límites de la(s) región(es) de rechazo. Para una prueba z, los valores críticos corresponden a los puntajes z
en los que las cola(s) de la distribución normal más allá del valor crítico caen dentro de un nivel de significancia predefinido (α
).
Valor p
El valor p es la probabilidad de alcanzar un pico al menos igual al estadístico de prueba observado, asumiendo que la hipótesis nula es verdadera. Un valor p pequeño (típicamente ≤ 0.05) indica una fuerte evidencia en contra de la hipótesis nula, por lo que rechazamos H 0
. Un valor p grande (> 0.05) indica una débil evidencia en contra de H 0
, por lo que no la rechazamos.
Ejemplo de uso del valor p
En un estudio sobre horas de sueño promedio entre estudiantes, la hipótesis nula establece que los estudiantes duermen un promedio de 7 horas por noche. Los datos de muestra proporcionan un promedio de 6.6 horas con un valor p
calculado de 0.03
.
Conclusión: Dado que 0.03 < 0.05
, rechazamos la hipótesis nula y concluimos que el tiempo promedio de sueño es diferente de 7 horas.
Conclusión
Las pruebas de hipótesis proporcionan una manera sistemática de tomar decisiones utilizando datos. Aunque no proporciona evidencia definitiva, nos ayuda a evaluar la evidencia contra declaraciones probabilísticas sobre una población. Entender el proceso, tipos, errores y cómo aplicar eficazmente estos conceptos puede impactar significativamente los resultados en campos como la medicina, los negocios y las ciencias sociales.
Materiales y referencias para lectura adicional
- Using and Interpreting Statistics in the Social, Behavioral, and Health Sciences, de William R. Nugent
- Statistics for Experimenters: Design, Innovation, and Discovery, de George E. P. Box, J. Stuart Hunter, y William G. Hunter
- Principles of Statistics, de M.G. Bulmer