Grado 12

Grado 12Probabilidad y estadísticaFiguras


Comprendiendo la prueba de hipótesis en estadística


La prueba de hipótesis es un concepto fundamental e importante en estadística, particularmente en el campo de la estadística inferencial. Proporciona un método para hacer juicios sobre una población basándose en datos de muestra.

¿Qué es la prueba de hipótesis?

En resumen, la prueba de hipótesis es un proceso que te permite hacer una estimación o suposición fundamentada sobre un parámetro de la población. Involucra la formación de una hipótesis, la recopilación de datos muestrales y luego la determinación de si los datos respaldan la hipótesis. Aquí hay una descripción de los términos clave en la prueba de hipótesis:

  • Hipótesis nula (H0): Esta es una afirmación de que no hay efecto o diferencia, y se asume que es verdadera a menos que la evidencia indique lo contrario.
  • Hipótesis alternativa (H1 o Ha): Esta es una afirmación de que hay un efecto o diferencia, y es la que deseas respaldar con tus datos.
  • Nivel de significancia (α): Este es el umbral para decidir si rechazar la hipótesis nula. Los niveles comunes de significancia son 0.05, 0.01 y 0.10.
  • Valor p: Esta es la probabilidad de obtener el resultado observado, o uno más extremo, asumiendo que la hipótesis nula es verdadera. Un valor p pequeño indica fuerte evidencia en contra de la hipótesis nula.

Procedimiento de prueba de hipótesis

El proceso de prueba de hipótesis involucra varios pasos:

  1. Establecer las hipótesis nula y alternativa.
  2. Determinar el nivel de significancia (α).
  3. Recopilar datos muestrales y calcular estadísticos de prueba.
  4. Calcular el valor p o usar el valor crítico para tomar una decisión.
  5. Sacar una conclusión: rechazar o no rechazar la hipótesis nula.

Ejemplos de prueba de hipótesis

Ejemplo 1: Lanzamiento de una moneda

Supongamos que tienes una moneda y quieres probar si es justa o no. En estadística, una moneda justa significa que siempre que la lances, tiene un 50% de probabilidad de caer en cara y un 50% de probabilidad de caer en cruz. Tus hipótesis podrían ser:

    H0: p = 0.5 (La moneda es justa) 
H1: p ≠ 0.5 (La moneda no es justa)

Lanzas una moneda 100 veces y obtienes cara 45 veces. Tu proporción muestral de caras es 0.45.

Nivel de significancia: Usemos α = 0.05.

Calcular la estadística de prueba:

    Estadístico de prueba (z) = (p̂ - p) / sqrt((p * (1 - p)) / n) 
donde p̂ = proporción muestral, p = proporción bajo la hipótesis nula, n = número de pruebas 
z = (0.45 - 0.5) / sqrt((0.5 * (0.5)) / 100) 
z ≈ -1.0

Decisión: Compara el valor p con tu nivel de significancia o usa tablas z para buscar el valor crítico. Generalmente, si el valor p es menor que 0.05, rechaza H0.

En este ejemplo, el puntaje z de -1.0 no cae en la región crítica, por lo que "no rechazas" H0, lo que indica que no hay suficiente evidencia para decir que la moneda no es justa al nivel de significancia de 0.05.

Ejemplo 2: Efectividad de un medicamento

Supongamos que un nuevo medicamento afirma bajar la presión arterial. El nivel promedio conocido de presión arterial es 120 mmHg. Tienes las siguientes hipótesis:

    H0: μ = 120 (El medicamento no afecta la presión arterial) 
H1: μ ≠ 120 (El medicamento afecta la presión arterial)

Datos de muestra: Realizas un experimento con 30 pacientes y encuentras una presión arterial media de 115 mmHg con una desviación estándar de 10 mmHg.

Nivel de significancia: α = 0.05.

Calcular la estadística de prueba:

    Estadístico de prueba (t) = (x̄ - μ) / (s / sqrt(n)) 
donde x̄ = media muestral, μ = media poblacional, s = desviación estándar, n = tamaño de muestra 
t = (115 - 120) / (10 / sqrt(30)) 
t ≈ -2.74

Decisión: Si el puntaje t cae en la región significativa de la tabla t o el valor p es menor que 0.05, rechaza H0.

Aquí, el puntaje t de -2.74 está fuera del rango significativo (alrededor de ±2.045 para una prueba de dos colas con gl=29), por lo que rechazas H0, lo que indica que el medicamento baja significativamente la presión arterial al nivel de 0.05.

Visualización de la prueba de hipótesis

En la prueba de hipótesis, la visualización a menudo involucra trazar la distribución de estadísticos de prueba bajo la hipótesis nula. Normalmente, las curvas en forma de campana (normales) representan regiones de significancia.

α/2 α/2 Áreas Importantes ← → Áreas Importantes

La curva arriba muestra la distribución del estadístico de prueba asumiendo que la hipótesis nula es verdadera. Las regiones sombreadas son las “regiones críticas”, donde, si el estadístico de prueba cae dentro de estas, rechazas la hipótesis nula, lo que significa que cualquier resultado aquí es estadísticamente significativo al nivel de significancia elegido.

Factores que afectan la prueba de hipótesis

Varios factores pueden afectar el resultado de una prueba de hipótesis:

  • Tamaño de la muestra: Tamaños de muestra más grandes usualmente arrojan resultados más confiables, ya que proporcionan una estimación más precisa del parámetro poblacional.
  • Variabilidad: Datos con baja variabilidad (baja desviación estándar) pueden llevar a pruebas más concluyentes.
  • Nivel de significancia (α): Un nivel de significancia bajo (por ejemplo, 0.01) significa que necesitas evidencia fuerte para rechazar la hipótesis nula.
  • Error Tipo I y Tipo II:
    • Error Tipo I (α): rechazar la hipótesis nula cuando es verdadera.
    • Error Tipo II (β): no rechazar la hipótesis nula cuando la hipótesis alternativa es verdadera.

Equilibrando errores

Un desafío común en la prueba de hipótesis es equilibrar la probabilidad de errores Tipo I y Tipo II. Reducir uno a menudo incrementa el otro. La selección cuidadosa del nivel de significancia y el tamaño de la muestra puede ayudar a manejar estos riesgos.

El poder de la prueba

El poder de una prueba estadística es la probabilidad de que rechace correctamente la hipótesis nula cuando la hipótesis alternativa es verdadera. Una prueba con alto poder es buena porque significa que hay más posibilidades de detectar un efecto si realmente existe.

Conclusión

La prueba de hipótesis es un componente central del análisis estadístico, que es importante en muchas disciplinas como la ciencia, los negocios, la ingeniería y las ciencias de la salud. Proporciona una manera sistemática de utilizar datos de muestra para hacer inferencias o sacar conclusiones sobre una población. Es un equilibrio de riesgos, donde comprender los principios subyacentes ayuda a los investigadores y analistas a tomar decisiones informadas basadas en los datos.

Al comprender los conceptos de hipótesis nula y alternativa, niveles de significancia, estadísticos de prueba y errores probables, uno puede realizar pruebas de hipótesis de manera efectiva. Aunque se cubre aquí con ejemplos relativamente simples, estos mismos conceptos son aplicables a análisis más complejos y conjuntos de datos más grandes, destacando la naturaleza importante de la prueba de hipótesis en métodos estadísticos.


Grado 12 → 3.2.4


U
username
0%
completado en Grado 12


Comentarios