Магистратура → Теория вероятностей и статистика → Статистическое вывод ↓
Проверка гипотез
Проверка гипотез — это фундаментальная концепция в статистике, используемая для вынесения суждений о характеристиках генеральной совокупности. Это метод, который позволяет использовать выборочные данные для принятия решения между двумя конкурирующими гипотезами о параметре генеральной совокупности.
Введение в проверку гипотез
По сути, проверка гипотез — это процесс, с помощью которого мы проверяем, является ли допустимым утверждение (гипотеза) о параметре генеральной совокупности на основе имеющихся у нас выборочных данных. Основными элементами проверки гипотез являются нулевая гипотеза, альтернативная гипотеза, статистика теста, область отклонения и заключение.
Нулевая и альтернативная гипотезы
Нулевая гипотеза (обозначается как H 0
) представляет собой утверждение о параметре генеральной совокупности, которое мы хотим проверить. Это обычно утверждение об отсутствии эффекта или различий. В отличие от нее, альтернативная гипотеза (обозначается как H 1
или H a
) — это то, что мы предполагаем истинным, если нулевая гипотеза отвергается. Она представляет собой эффект или различие.
Нулевая гипотеза (H 0 ): μ = μ 0 Альтернативная гипотеза (H a ): μ ≠ μ 0 (двусторонняя) Альтернативная гипотеза (H a ): μ > μ 0 (правосторонняя) Альтернативная гипотеза (H a ): μ < μ 0 (левосторонняя)
Статистика теста
Статистика теста — это значение, вычисленное из выборочных данных, которое используется для оценки вероятности нулевой гипотезы. Выбор статистики теста зависит от типа данных и проверяемой гипотезы. Общие примеры включают z-оценку, t-оценку и F-статистику.
Например, если мы хотим проверить гипотезу о среднем значении, мы можем рассчитать z-оценку
для выборочного среднего:
z = (x̄ - μ 0 ) / (σ/√n)
Область отклонения
Область отклонения определяется уровнем значимости, обозначаемым α
, что является вероятностью отклонения нулевой гипотезы, когда она на самом деле истинна. Общие значения α
— 0.05, 0.01 и 0.10.
Если статистика теста попадает в область отклонения, мы отвергаем нулевую гипотезу в пользу альтернативной гипотезы.
Заключение
На основе статистики теста и области отклонения мы делаем выводы. Если статистика теста попадает в область отклонения, мы отвергаем нулевую гипотезу, предполагая, что есть достаточно доказательств, чтобы поддержать альтернативную гипотезу. Если она не попадает в область отклонения, мы не отвергаем нулевую гипотезу.
Типы проверки гипотез
Проверки гипотез можно классифицировать на несколько типов в зависимости от параметров генеральной совокупности, представляющих интерес, и доступных данных.
Одновыборочный z-тест
Одновыборочный z-тест используется, когда мы хотим сравнить выборочное среднее с известным генеральным средним. Этот тест предполагает, что генеральная совокупность имеет нормальное распределение, а дисперсия генеральной совокупности известна.
Одновыборочный t-тест
Если дисперсия генеральной совокупности неизвестна, мы используем одновыборочный t-тест вместо z-теста. Он уместен, когда размер выборки мал, а генеральная совокупность предполагается нормально распределенной.
Двухвыборочный t-тест
Двухвыборочный t-тест сравнивает средние двух независимых выборок. Он проверяет, равны ли средние значения двух групп. Этот тест использует общую стандартную ошибку, когда предполагается, что дисперсии равны, или использует индивидуальные дисперсии, когда дисперсии неравны.
Пример: проверка гипотезы для среднего значения
Предположим, что компания производит лампочки со средним сроком службы 1000 часов. Исследователь считает, что истинный средний срок службы меньше 1000 часов и хочет проверить эту гипотезу, используя случайную выборку из 30 лампочек.
Определим наши гипотезы:
H 0 : μ = 1000 H a : μ < 1000
Уровень значимости: α = 0.05
.
Предполагая, что стандартное отклонение генеральной совокупности равно 100, статистика теста может быть рассчитана следующим образом:
z = (x̄ - μ 0 ) / (σ/√n) x̄ = выборочное среднее n = размер выборки σ = стандартное отклонение генеральной совокупности μ 0 = генеральное среднее в соответствии с H 0
Если рассчитанное значение z
падает влево от нашего критического значения на нормальной распределительной кривой (найденного в z-таблице), мы отвергнем нулевую гипотезу.
Примеры применения проверки гипотез в реальной жизни
- Медицинские исследования: сравнение эффективности нового лекарства с плацебо.
- Производство: сравнение средних значений различных производственных процессов для определения, какой процесс более эффективный.
- Маркетинг: оценка влияния новой кампании на продажи или вовлеченность клиентов по сравнению со старой стратегией.
- Образование: определение эффективности новой методики обучения по сравнению с традиционным методом.
Распространенные ошибки при проверке гипотез
Ошибки типа I и типа II
Две распространенные ошибки при проверке гипотез — это ошибки типа I и типа II:
- Ошибка типа I: отклонение нулевой гипотезы, когда она истинна. Вероятность возникновения ошибки типа I равна уровню значимости
α
. - Ошибка типа II: Неотклонение нулевой гипотезы, когда альтернативная гипотеза истинна. Вероятность совершения ошибки типа II обозначается как
β
.
Пример ошибок в проверке гипотез: медицинские тесты
В медицинском тесте на наличие заболевания нулевая гипотеза может заключаться в том, что человек не имеет заболевания (H 0
: человек не имеет заболевания). Альтернативная гипотеза может заключаться в том, что человек действительно имеет заболевание (H a
: человек имеет заболевание).
- Ошибка типа I: Тест показывает, что у человека есть заболевание, хотя на самом деле его нет. Это может вызвать ненужный стресс и лечение.
- Ошибка типа II: Тест не выявляет заболевание, когда оно у человека действительно есть. Это приводит к тому, что заболевание не лечится.
Мощность теста
Мощность теста — это вероятность правильного отклонения ложной нулевой гипотезы (1 - β
). Более высокая мощность означает большую вероятность обнаружения эффекта, когда он существует, тем самым снижая ошибки типа II.
Мощность теста можно увеличить следующим образом:
- Увеличение размера выборки.
- Выбор более высокого уровня значимости (что увеличивает вероятность ошибки типа I).
- Это увеличение ожидаемого эффекта, который мы ожидаем обнаружить.
Критические значения и p-значения
Критические значения
Критические значения — это пороговые значения, определяющие границы области отклонения(ий). Для z-теста критические значения соответствуют z
оценкам, при которых хвосты нормального распределения за пределами критического значения попадают в заранее определенный уровень значимости (α
).
P-значение
P-значение — это вероятность достижения пика не менее равного наблюдаемой статистике теста, при условии, что нулевая гипотеза верна. Небольшое p-значение (обычно ≤ 0.05) указывает на сильные доказательства против нулевой гипотезы, поэтому мы отвергаем H 0
. Большое p-значение (> 0.05) указывает на слабые доказательства против H 0
, поэтому мы не отвергаем его.
Пример использования p-значения
В исследовании о среднем числе часов сна среди студентов нулевая гипотеза утверждает, что студенты спят в среднем 7 часов в сутки. Данные выборки показывают в среднем 6,6 часов при рассчитанном p-значении
равном 0.03
.
Заключение: Поскольку 0.03 < 0.05
, мы отвергаем нулевую гипотезу и заключаем, что среднее время сна отличается от 7 часов.
Заключение
Проверка гипотез предоставляет систематический способ принятия решений с использованием данных. Хотя она не предоставляет окончательных доказательств, она помогает нам оценить доказательства против значений вероятности о популяции. Понимание процесса, типов, ошибок и того, как эффективно применять эти концепции, может значительно повлиять на результаты в таких областях, как медицина, бизнес и социальные науки.
Материалы и ссылки для дальнейшего чтения
- Using and Interpreting Statistics in the Social, Behavioral, and Health Sciences, автор: William R. Nugent
- Statistics for Experimenters: Design, Innovation, and Discovery, авторы: George E. P. Box, J. Stuart Hunter и William G. Hunter
- Principles of Statistics, автор: M.G. Bulmer