Докторантура

ДокторантураВероятность и статистикаСтатистическое заключение


Тестирование гипотез


В научных исследованиях, независимо от того, идет ли речь о биологии, медицине или социальных науках, мы часто хотим делать выводы о параметрах совокупности на основе данных выборки. Здесь становятся важными статистические методы, такие как тестирование гипотез. Тестирование гипотез — это структурированный метод, используемый в статистике для определения того, достаточно ли доказательств в выборке данных, чтобы указать на существование особого эффекта или явления для всей совокупности.

Введение в тестирование гипотез

В основе тестирования гипотез лежит сравнение двух гипотез: нулевой гипотезы и альтернативной гипотезы. Нулевая гипотеза (обозначается как H0) — это утверждение о том, что эффекта или различия нет, и именно эту гипотезу исследователи обычно хотят проверить. Альтернативная гипотеза (обозначается как Ha или H1) предполагает существование эффекта или различия.

Пример:

Предположим, вы хотите узнать, снижает ли новое лекарство кровяное давление больше, чем существующее лекарство. Ваши гипотезы могут быть:

H0: Новое лекарство не снижает давление более эффективно, чем существующее лекарство.
HA: Новое лекарство снижает давление более эффективно, чем существующее лекарство.

Процедура тестирования гипотез

Процесс тестирования гипотез можно разделить на несколько основных этапов:

  1. Определение гипотез: Формулирование нулевой и альтернативной гипотез на основе исследовательского вопроса.
  2. Выбор уровня значимости: Уровень значимости (α) — это вероятность отклонения нулевой гипотезы, когда она истинна. Общие значения α — 0.05, 0.01 и 0.10.
  3. Выбор соответствующего теста: Выбор статистического теста на основе типа данных и исследовательского вопроса. Примеры включают t-тест, тест хи-квадрат, ANOVA и т.д.
  4. Вычисление статистики теста: Вычисление соответствующей статистики теста, используя данные выборки.
  5. Принятие решения: Сравнение вычисленной статистики теста с критическим значением или использование p-значения для принятия решения об отклонении нулевой гипотезы.
  6. Формулировка выводов: Интерпретация результатов в контексте исследовательского вопроса.

Виды тестирования гипотез

Тестирование гипотез можно классифицировать в зависимости от характера исследования и типа данных. Некоторые распространенные виды тестирования гипотез следующие:

1. Z-тест

Тест z используется, когда размер выборки велик (обычно n > 30), и дисперсия совокупности известна. Он используется для определения, является ли значительным различие между средними значениями выборки и совокупности.

Пример: Предположим, вы знаете, что средний рост взрослых мужчин в городе составляет 170 см со стандартным отклонением 10 см. Если вы соберете выборку из 50 взрослых мужчин и обнаружите, что средний рост составляет 172 см, вы можете использовать z-тест, чтобы определить, является ли это различие значимым.

2. T-тест

T-тест используется, когда размер выборки мал (n ≤ 30) или дисперсия совокупности неизвестна. Существуют различные виды t-тестов, включая:

  • Одновыборочный t-тест: Сравнивает среднее выборки с известным средним совокупности.
  • Независимый двухвыборочный t-тест: Сравнивает средние значения двух разных групп.
  • Парный выборочный t-тест: Сравнивает среднее одной и той же группы в разные моменты времени.

Пример: Исследователь хочет узнать, лучше ли студенты сдают тест после определенного учебного занятия. Они сравнивают баллы за тест до и после занятия, используя парный выборочный t-тест.

3. Тест хи-квадрат

Тест хи-квадрат используется для сравнения категориальных данных. Он часто применяется для проверки наличия связи между двумя категориальными переменными.

Пример: Исследование изучает наличие связи между полом (мужчина/женщина) и предпочтением (да/нет) определенного продукта. Тест хи-квадрат может определить, является ли предпочтение независимым от пола.

4. ANOVA (Анализ дисперсии)

ANOVA используется для сравнения средних значений среди трех или более групп. Основная гипотеза заключается в том, что среднее хотя бы одной группы отличается от других.

Пример: Учитель хочет сравнить результаты теста студентов из трех различных методов обучения. ANOVA помогает определить, оказывает ли метод обучения значительное влияние на оценки.

Уровень значимости и p-значение

Уровень значимости (α) — это установленный исследователем порог, который определяет максимальную допустимую вероятность совершения ошибки первого рода (отклонение истинной нулевой гипотезы). С другой стороны, p-значение — это вероятность наблюдения статистики теста или чего-то более экстремального при условии, что нулевая гипотеза верна.

Если p-значение меньше или равно α, мы отвергаем нулевую гипотезу. Если больше, мы не отвергаем нулевую гипотезу.

Пример визуализации:

,
,
| Критическая область (область отвержения, если p 

Докторантура → 8.3.1


U
username
0%
завершено в Докторантура


комментарии