Докторантура → Вероятность и статистика → Статистическое заключение ↓
Тестирование гипотез
В научных исследованиях, независимо от того, идет ли речь о биологии, медицине или социальных науках, мы часто хотим делать выводы о параметрах совокупности на основе данных выборки. Здесь становятся важными статистические методы, такие как тестирование гипотез. Тестирование гипотез — это структурированный метод, используемый в статистике для определения того, достаточно ли доказательств в выборке данных, чтобы указать на существование особого эффекта или явления для всей совокупности.
Введение в тестирование гипотез
В основе тестирования гипотез лежит сравнение двух гипотез: нулевой гипотезы и альтернативной гипотезы. Нулевая гипотеза (обозначается как H0
) — это утверждение о том, что эффекта или различия нет, и именно эту гипотезу исследователи обычно хотят проверить. Альтернативная гипотеза (обозначается как Ha
или H1
) предполагает существование эффекта или различия.
Пример:
Предположим, вы хотите узнать, снижает ли новое лекарство кровяное давление больше, чем существующее лекарство. Ваши гипотезы могут быть:
H0: Новое лекарство не снижает давление более эффективно, чем существующее лекарство. HA: Новое лекарство снижает давление более эффективно, чем существующее лекарство.
Процедура тестирования гипотез
Процесс тестирования гипотез можно разделить на несколько основных этапов:
- Определение гипотез: Формулирование нулевой и альтернативной гипотез на основе исследовательского вопроса.
- Выбор уровня значимости: Уровень значимости (
α
) — это вероятность отклонения нулевой гипотезы, когда она истинна. Общие значенияα
— 0.05, 0.01 и 0.10. - Выбор соответствующего теста: Выбор статистического теста на основе типа данных и исследовательского вопроса. Примеры включают t-тест, тест хи-квадрат, ANOVA и т.д.
- Вычисление статистики теста: Вычисление соответствующей статистики теста, используя данные выборки.
- Принятие решения: Сравнение вычисленной статистики теста с критическим значением или использование p-значения для принятия решения об отклонении нулевой гипотезы.
- Формулировка выводов: Интерпретация результатов в контексте исследовательского вопроса.
Виды тестирования гипотез
Тестирование гипотез можно классифицировать в зависимости от характера исследования и типа данных. Некоторые распространенные виды тестирования гипотез следующие:
1. Z-тест
Тест z используется, когда размер выборки велик (обычно n > 30), и дисперсия совокупности известна. Он используется для определения, является ли значительным различие между средними значениями выборки и совокупности.
Пример: Предположим, вы знаете, что средний рост взрослых мужчин в городе составляет 170 см со стандартным отклонением 10 см. Если вы соберете выборку из 50 взрослых мужчин и обнаружите, что средний рост составляет 172 см, вы можете использовать z-тест, чтобы определить, является ли это различие значимым.
2. T-тест
T-тест используется, когда размер выборки мал (n ≤ 30) или дисперсия совокупности неизвестна. Существуют различные виды t-тестов, включая:
- Одновыборочный t-тест: Сравнивает среднее выборки с известным средним совокупности.
- Независимый двухвыборочный t-тест: Сравнивает средние значения двух разных групп.
- Парный выборочный t-тест: Сравнивает среднее одной и той же группы в разные моменты времени.
Пример: Исследователь хочет узнать, лучше ли студенты сдают тест после определенного учебного занятия. Они сравнивают баллы за тест до и после занятия, используя парный выборочный t-тест.
3. Тест хи-квадрат
Тест хи-квадрат используется для сравнения категориальных данных. Он часто применяется для проверки наличия связи между двумя категориальными переменными.
Пример: Исследование изучает наличие связи между полом (мужчина/женщина) и предпочтением (да/нет) определенного продукта. Тест хи-квадрат может определить, является ли предпочтение независимым от пола.
4. ANOVA (Анализ дисперсии)
ANOVA используется для сравнения средних значений среди трех или более групп. Основная гипотеза заключается в том, что среднее хотя бы одной группы отличается от других.
Пример: Учитель хочет сравнить результаты теста студентов из трех различных методов обучения. ANOVA помогает определить, оказывает ли метод обучения значительное влияние на оценки.
Уровень значимости и p-значение
Уровень значимости (α
) — это установленный исследователем порог, который определяет максимальную допустимую вероятность совершения ошибки первого рода (отклонение истинной нулевой гипотезы). С другой стороны, p-значение — это вероятность наблюдения статистики теста или чего-то более экстремального при условии, что нулевая гипотеза верна.
Если p-значение меньше или равно α
, мы отвергаем нулевую гипотезу. Если больше, мы не отвергаем нулевую гипотезу.
Пример визуализации:
, , | Критическая область (область отвержения, если p