Pós-graduação → Probabilidade e estatística → Teoria da probabilidade ↓
Teorema Central do Limite
O Teorema Central do Limite (TCL) é um dos conceitos fundamentais na teoria das probabilidades e estatísticas. Ele explica por que muitas distribuições se aproximam da distribuição normal e serve como base para muitos procedimentos estatísticos. Nesta explicação abrangente, exploraremos o que é o Teorema Central do Limite, por que é importante e como funciona com vários exemplos e visualizações.
Compreendendo o teorema central do limite
No seu núcleo, o teorema central do limite afirma que a distribuição da soma (ou média) de um grande número de variáveis aleatórias independentes e identicamente distribuídas (iid) é aproximadamente normal, independentemente da distribuição original de onde essas variáveis são extraídas, desde que a distribuição original tenha uma variância finita. Este é um resultado profundo porque implica que, mesmo que você comece com uma distribuição assimétrica ou uniforme, se você fizer um número suficiente de amostras e encontrar sua média, a distribuição dessas médias tenderá a uma distribuição normal.
P(X_1, X_2, ..., X_n) to N(mu, sigma^2/n)
Aqui, X_1, X_2, ..., X_n
são amostras da população, mu
é a média da população e sigma^2
é a variância. N
denota a distribuição normal.
Por que o teorema central do limite é importante?
O teorema central do limite é importante porque justifica o uso da distribuição normal em muitos cenários onde outros modelos são mais complexos ou menos compreendidos. Algumas das principais áreas onde o TCL é importante incluem:
- Inferência estatística: Isso permite o uso de intervalos de confiança e testes de hipóteses que assumem dados normalmente distribuídos, mesmo que a distribuição de dados subjacente não seja normal.
- Ciência de dados e aprendizado de máquina: Muitos algoritmos assumem normalidade devido ao TCL, tornando os modelos mais robustos.
- Controle de qualidade: O TCL é útil em processos de controle de qualidade onde as médias amostrais são monitoradas.
Ilustrando o teorema central do limite através de exemplos
Exemplo 1: Lançando um dado
Considere lançar um dado justo de seis lados. O resultado de lançar um dado é uma distribuição uniforme discreta de 1 a 6. Cada valor inteiro de 1 a 6 tem uma probabilidade igual de 1/6. Esta distribuição certamente não é normal.
Agora, imagine jogar dois dados 1000 vezes e calcular a média dos dois dados cada vez. Cada lançamento dos dois dados será independente, e teremos 1000 médias. Quando você plota essas médias, verá que a forma da distribuição delas começa a se assemelhar a uma curva em forma de sino. Agora, se você aumentar o número de dados para 3, 4 e além, a distribuição dessas médias continuará a se assemelhar melhor a uma distribuição normal.
Exemplo 2: Simulando um lançamento de moeda
Pegue 100 moedas e jogue-as. Cada lançamento de moeda pode ser visto como um ensaio de Bernoulli com uma probabilidade de 0,5 para caras e 0,5 para coroas. Assuma '1' para caras e '0' para coroas.
Se realizarmos este experimento e medirmos o número de caras (sucessos), podemos tratar cada lançamento como uma variável independente. O teorema central do limite mostra que, se repetirmos este lançamento de 100 moedas muitas vezes e plotarmos o número de caras cada vez, a distribuição dessas contagens se aproximará de uma distribuição normal.
Prova matemática do teorema central do limite
Vamos dar uma olhada na matemática que prova rigorosamente o Teorema Central do Limite. O teorema foi desenvolvido independentemente por vários matemáticos, incluindo Abraham de Moivre, Pierre-Simon Laplace e Carl Friedrich Gauss. Aqui, apresentamos uma versão simplificada da prova:
Seja X_1, X_2, ..., X_n
variáveis aleatórias iid com média mu
e variância sigma^2
. A expectativa é dada por
E[X_i] = mu
e a variância é
Var(X_i) = sigma^2
Defina a média amostral como
bar{X} = frac{X_1 + X_2 + ... + X_n}{n}
A expectativa da média amostral é
E[bar{X}] = Eleft[frac{X_1 + X_2 + ... + X_n}{n}right] = mu
e sua variância é
Var(bar{X}) = frac{1}{n^2}(Var(X_1) + Var(X_2) + ... + Var(X_n)) = frac{sigma^2}{n}
De acordo com o teorema central do limite padrão, se n
for suficientemente grande, a média amostral padronizada é aproximadamente distribuída normalmente, com média 0 e variância 1:
Z = frac{bar{X} - mu}{sigma/sqrt{n}} to N(0,1)
Conclusão
O teorema central do limite é um princípio estatístico poderoso que faz a ponte entre diferentes tipos de distribuições e a distribuição normal. Sua versatilidade e confiabilidade o tornam uma ferramenta importante para a inferência estatística, justificando muitos métodos e teorias tanto em estatísticas teóricas quanto aplicadas.
Seja jogando dados, lançando moedas ou fazendo medições no mundo real, este teorema nos permite fazer análises estatísticas informadas e previsões. Compreendendo o TCL, você está melhor equipado para enfrentar uma variedade de desafios estatísticos em uma variedade de disciplinas.