Класс 12

Класс 12Вероятность и статистикаФигуры


Понимание проверки гипотез в статистике


Проверка гипотез - это фундаментальное и важное понятие в статистике, особенно в области выводной статистики. Это метод, позволяющий делать выводы о популяции на основе данных выборки.

Что такое проверка гипотез?

Короче говоря, проверка гипотез - это процесс, который позволяет вам сделать оценку или обоснованное предположение о параметре популяции. Это включает в себя формирование гипотезы, сбор данных выборки и затем определение, поддерживают ли данные гипотезу. Вот описание ключевых терминов в проверке гипотез:

  • Нулевая гипотеза (H0): Это утверждение о том, что нет эффекта или разницы, и оно считается истинным, если доказательства не указывают на обратное.
  • Альтернативная гипотеза (H1 или Ha): Это утверждение о том, что есть эффект или разница, и именно его вы хотите подтвердить своими данными.
  • Уровень значимости (α): Это порог для принятия решения об отказе от нулевой гипотезы. Обычные уровни значимости: 0.05, 0.01 и 0.10.
  • P-значение: Это вероятность получения наблюдаемого результата или более экстремального, если считать нулевую гипотезу верной. Малое p-значение указывает на сильные доказательства против нулевой гипотезы.

Процедура проверки гипотез

Процесс проверки гипотез включает несколько шагов:

  1. Формулирование нулевой и альтернативной гипотез.
  2. Определение уровня значимости (α).
  3. Сбор данных выборки и расчет тестовой статистики.
  4. Расчет p-значения или использование критического значения для принятия решения.
  5. Вывод: отклонить или не отклонять нулевую гипотезу.

Примеры проверки гипотез

Пример 1: Подбрасывание монеты

Предположим, у вас есть монета, и вы хотите проверить, честная ли она. В статистике честная монета означает, что при подбрасывании у нее есть 50% шанс выпасть орлом и 50% шанс выпасть решкой. Ваша гипотеза может быть такой:

    H0: p = 0.5 (Монета честная) 
H1: p ≠ 0.5 (Монета нечестная)

Вы подбрасываете монету 100 раз и получаете орла 45 раз. Ваша выборочная доля орлов составляет 0.45.

Уровень значимости: Пусть α = 0.05.

Рассчитайте тестовую статистику:

    Тестовая статистика (z) = (p̂ - p) / sqrt((p * (1 - p)) / n) 
где p̂ = выборочная доля, p = доля по нулевой гипотезе, n = число испытаний 
z = (0.45 - 0.5) / sqrt((0.5 * (0.5)) / 100) 
z ≈ -1.0

Решение: Сравните p-значение с уровнем значимости или используйте z-таблицы для поиска критического значения. Обычно, если p-значение меньше 0.05, отклоните H0.

В этом примере z-оценка -1.0 не попадает в критическую область, поэтому вы "не отклоняете" H0, что указывает на недостаточность доказательств, чтобы сказать, что монета несправедливая на уровне значимости 0.05.

Пример 2: Эффективность лекарства

Предположим, что новое лекарство утверждает, что снижает кровяное давление. Известно, что средний уровень кровяного давления составляет 120 мм рт. ст. У вас есть следующие гипотезы:

    H0: μ = 120 (Лекарство не влияет на кровяное давление) 
H1: μ ≠ 120 (Лекарство влияет на кровяное давление)

Данные выборки: Вы проводите эксперимент с 30 пациентами и находите среднее кровяное давление 115 мм рт. ст. со стандартным отклонением 10 мм рт. ст.

Уровень значимости: α = 0.05.

Рассчитайте тестовую статистику:

    Тестовая статистика (t) = (x̄ - μ) / (s / sqrt(n)) 
где x̄ = выборочное среднее, μ = среднее по популяции, s = стандартное отклонение, n = размер выборки 
t = (115 - 120) / (10 / sqrt(30)) 
t ≈ -2.74

Решение: Если t-оценка попадает в значимую область по t-таблице или p-значение меньше 0.05, отклоните H0.

Здесь t-оценка -2.74 находится за пределами значимого диапазона (около ±2.045 для двухстороннего теста с df=29), поэтому вы отклоняете H0, что указывает на то, что лекарство значительно снижает кровяное давление на уровне 0.05.

Визуализация проверки гипотез

При проверке гипотез визуализация часто включает построение распределения тестовой статистики по нулевой гипотезе. Обычно нормальные кривые в форме колокола изображают значимые области.

α/2 α/2 Важные области ← → Важные области

На графике выше показано распределение тестовой статистики, предполагая истину нулевой гипотезы. Заштрихованные области - это "критические области", где, если статистика теста попадает в них, вы отклоняете нулевую гипотезу, что означает, что любой результат здесь является статистически значимым на выбранном уровне значимости.

Факторы, влияющие на проверку гипотез

На результат проверки гипотез могут повлиять несколько факторов:

  • Размер выборки: Большие выборки обычно дают более надежные результаты, так как они предоставляют более точную оценку параметра популяции.
  • Изменчивость: Данные с низкой изменчивостью (низким стандартным отклонением) могут привести к более убедительным тестам.
  • Уровень значимости (α): Низкий уровень значимости (например, 0.01) означает, что вам нужны сильные доказательства для отклонения нулевой гипотезы.
  • Ошибки I и II типов:
    • Ошибка I типа (α): отклонение нулевой гипотезы, когда она верна.
    • Ошибка II типа (β): неспособность отклонить нулевую гипотезу, когда альтернативная гипотеза верна.

Балансировка ошибок

Одной из общих задач проверки гипотез является балансировка вероятности ошибок I и II типов. Снижение одной часто увеличивает другую. Внимательный выбор уровня значимости и размера выборки может помочь управлять этими рисками.

Мощность теста

Мощность статистического теста - это вероятность того, что он правильно отклоняет нулевую гипотезу, когда альтернативная гипотеза верна. Тест с высокой мощностью хорош тем, что он увеличивает шанс обнаружить эффект, если он действительно существует.

Заключение

Проверка гипотез - это важный компонент статистического анализа, который важен во многих дисциплинах, таких как наука, бизнес, инженерное дело и здравоохранение. Она предоставляет систематический способ использования данных выборки для выводов или заключений о популяции. Это балансировка рисков, где понимание основных принципов помогает исследователям и аналитикам принимать обоснованные решения на основе данных.

Понимание концепций нулевой и альтернативной гипотез, уровней значимости, тестовой статистики и понимание вероятных ошибок помогает эффективно проводить проверку гипотез. Хотя здесь это рассмотрено с относительно простыми примерами, эти же концепции применимы к более сложным анализам и большим наборам данных, подчеркивая важность проверки гипотез в статистических методах.


Класс 12 → 3.2.4


U
username
0%
завершено в Класс 12


комментарии