Pós-graduação → Probabilidade e estatística → Inferência estatística ↓
Teste de hipótese
O teste de hipótese é um conceito fundamental em estatística, utilizado para fazer julgamentos sobre as características de uma população. É um método que nos permite usar dados amostrais para decidir entre duas hipóteses concorrentes sobre um parâmetro populacional.
Introdução ao teste de hipótese
Básicamente, o teste de hipótese é um processo pelo qual verificamos se uma afirmação (hipótese) sobre um parâmetro populacional é plausível com base nos dados amostrais que temos. Os principais elementos do teste de hipótese são a hipótese nula, hipótese alternativa, estatística de teste, região de rejeição e conclusão.
Hipóteses nula e alternativa
A hipótese nula (denotada como H 0
) é uma afirmação sobre o parâmetro populacional que queremos testar. Geralmente, é uma afirmação de nenhum efeito ou nenhuma diferença. Em contraste, a hipótese alternativa (denotada como H 1
ou H a
) é o que assumimos ser verdadeiro se a hipótese nula for rejeitada. Representa um efeito ou uma diferença.
Hipótese Nula (H 0 ): μ = μ 0 Hipótese Alternativa (H a ): μ ≠ μ 0 (bilateral) Hipótese Alternativa (H a ): μ > μ 0 (unilateral à direita) Hipótese Alternativa (H a ): μ < μ 0 (unilateral à esquerda)
Estatística de teste
Uma estatística de teste é um valor calculado a partir de dados amostrais que é usado para avaliar a probabilidade da hipótese nula. A escolha da estatística de teste depende do tipo de dados e da hipótese que está sendo testada. Exemplos comuns incluem o escore z, escore t e estatística F.
Por exemplo, se quisermos testar uma hipótese sobre uma média, podemos calcular escore z
para a média amostral:
z = (x̄ - μ 0 ) / (σ/√n)
Zona de rejeição
A região de rejeição é determinada pelo nível de significância, denotado por α
, que é a probabilidade de rejeitar a hipótese nula quando ela é realmente verdadeira. Escolhas comuns para α
são 0.05, 0.01 e 0.10.
Se a estatística de teste cair na região de rejeição, rejeitamos a hipótese nula em favor da hipótese alternativa.
Conclusão
Com base na estatística de teste e na região de rejeição, tiramos conclusões. Se a estatística de teste cair na região de rejeição, rejeitamos a hipótese nula, sugerindo que há evidências suficientes para apoiar a hipótese alternativa. Se não cair na região de rejeição, não rejeitamos a hipótese nula.
Tipos de teste de hipótese
Os testes de hipóteses podem ser classificados em vários tipos, dependendo dos parâmetros populacionais de interesse e dos dados disponíveis.
Teste-z de uma amostra
O teste-z de uma amostra é usado quando queremos comparar uma média amostral com uma média populacional conhecida. Esse teste assume que a população é normalmente distribuída e que a variância populacional é conhecida.
Teste-t de uma amostra
Se a variância populacional for desconhecida, usamos um teste-t de uma amostra em vez de um teste-z. É apropriado quando o tamanho da amostra é pequeno, e a população é assumida como normalmente distribuída.
Teste-t de duas amostras
O teste-t de duas amostras compara as médias de duas amostras independentes. Ele testa se as médias de dois grupos são iguais. Este teste usa a desvio padrão combinado quando se assume que as variâncias são iguais ou usa as variâncias individuais quando as variâncias são desiguais.
Exemplo: teste de hipótese para a média
Suponha que uma empresa fabrica lâmpadas com uma vida média de 1000 horas. Um pesquisador acredita que a verdadeira vida média é inferior a 1000 horas e deseja testar essa hipótese usando uma amostra aleatória de 30 lâmpadas.
Vamos definir nossas hipóteses:
H 0 : μ = 1000 H a : μ < 1000
Nível de significância: α = 0.05
.
Assumindo que o desvio padrão da população é 100, a estatística de teste pode ser calculada da seguinte forma:
z = (x̄ - μ 0 ) / (σ/√n) x̄ = média da amostra n = tamanho da amostra σ = desvio padrão da população μ 0 = média populacional sob H 0
Se o valor calculado de z
estiver à esquerda do nosso valor crítico na curva de distribuição normal (encontrado em tabelas-z), rejeitaremos a hipótese nula.
Aplicações reais do teste de hipótese
- Pesquisa médica: Comparando a eficácia de um novo medicamento com um placebo.
- Fabricação: Comparando as médias de diferentes processos de produção para determinar qual processo é mais eficiente.
- Marketing: Avaliando o impacto de uma nova campanha sobre as vendas ou o engajamento dos clientes em comparação com uma estratégia antiga.
- Educação: Determinando se um novo método de ensino funciona melhor do que o método tradicional.
Erros comuns no teste de hipótese
Erros do Tipo I e Tipo II
Dois erros comuns no teste de hipótese são os erros do Tipo I e Tipo II:
- Erro do Tipo I: rejeitar a hipótese nula quando ela é verdadeira. A probabilidade de um erro do Tipo I ocorrer é o nível de significância
α
. - Erro do Tipo II: Falhar em rejeitar a hipótese nula quando a hipótese alternativa é verdadeira. A probabilidade de cometer um erro do Tipo II é denotada como
β
.
Exemplo de erros no teste de hipótese: testes médicos
Em um teste médico para uma doença, a hipótese nula pode ser que a pessoa não tenha a doença (H 0
: a pessoa não tem a doença). A hipótese alternativa pode ser que a pessoa tem a doença (H a
: a pessoa tem a doença).
- Erro do Tipo I: O teste mostra que a pessoa tem a doença quando, na verdade, ela não tem. Isso pode causar estresse desnecessário e tratamento.
- Erro do Tipo II: O teste falha em identificar uma doença quando uma pessoa realmente a tem. Isso resulta na doença não sendo tratada.
O poder do teste
O poder de um teste é a probabilidade de que ele rejeite corretamente a hipótese nula falsa (1 - β
). Maior poder significa uma maior probabilidade de detectar um efeito quando há um efeito, reduzindo assim erros do tipo II.
O poder pode ser aumentado da seguinte forma:
- Aumentando o tamanho da amostra.
- Selecionando um nível de significância mais alto (o que aumenta a probabilidade de um erro do Tipo I).
- Isso é o aumento no tamanho do efeito que esperamos encontrar.
Valores críticos e p-valores
Valores críticos
Valores críticos são os valores de limite que definem as fronteiras da(s) região(ões) de rejeição. Para um teste-z, os valores críticos correspondem aos escores z
nos quais a(s) cauda(s) da distribuição normal além do valor crítico caem dentro de um nível de significância predefinido (α
).
P-valor
O p-valor é a probabilidade de atingir um pico pelo menos igual à estatística de teste observada, assumindo que a hipótese nula é verdadeira. Um p-valor pequeno (normalmente ≤ 0.05) indica forte evidência contra a hipótese nula, portanto, rejeitamos H 0
. Um p-valor grande (> 0.05) indica evidência fraca contra H 0
, portanto, não conseguimos rejeitá-la.
Exemplo de uso de p-valor
Em um estudo sobre as horas médias de sono entre estudantes, a hipótese nula afirma que os estudantes dormem uma média de 7 horas por noite. Os dados da amostra fornecem uma média de 6,6 horas com um p-valor
calculado de 0.03
.
Conclusão: Como 0.03 < 0.05
, rejeitamos a hipótese nula e concluímos que o tempo médio de sono é diferente de 7 horas.
Conclusão
O teste de hipótese fornece uma maneira sistemática de tomar decisões usando dados. Embora não forneça evidências definitivas, ajuda-nos a avaliar evidências contra afirmações de probabilidade sobre uma população. Entender o processo, os tipos, os erros e como aplicar esses conceitos efetivamente pode impactar significativamente nos resultados em áreas como medicina, negócios e ciências sociais.
Materiais e referências para leitura adicional
- Using and Interpreting Statistics in the Social, Behavioral, and Health Sciences, por William R. Nugent
- Statistics for Experimenters: Design, Innovation, and Discovery, por George E. P. Box, J. Stuart Hunter, e William G. Hunter
- Principles of Statistics, por M.G. Bulmer