Pós-graduação → Probabilidade e estatística → Teoria da probabilidade ↓

Teorema Central do Limite

O Teorema Central do Limite (TCL) é um dos conceitos fundamentais na teoria das probabilidades e estatísticas. Ele explica por que muitas distribuições se aproximam da distribuição normal e serve como base para muitos procedimentos estatísticos. Nesta explicação abrangente, exploraremos o que é o Teorema Central do Limite, por que é importante e como funciona com vários exemplos e visualizações.

Compreendendo o teorema central do limite

No seu núcleo, o teorema central do limite afirma que a distribuição da soma (ou média) de um grande número de variáveis aleatórias independentes e identicamente distribuídas (iid) é aproximadamente normal, independentemente da distribuição original de onde essas variáveis são extraídas, desde que a distribuição original tenha uma variância finita. Este é um resultado profundo porque implica que, mesmo que você comece com uma distribuição assimétrica ou uniforme, se você fizer um número suficiente de amostras e encontrar sua média, a distribuição dessas médias tenderá a uma distribuição normal.

P(X_1, X_2, ..., X_n) to N(mu, sigma^2/n)

Aqui, X_1, X_2, ..., X_n são amostras da população, mu é a média da população e sigma^2 é a variância. N denota a distribuição normal.

Por que o teorema central do limite é importante?

O teorema central do limite é importante porque justifica o uso da distribuição normal em muitos cenários onde outros modelos são mais complexos ou menos compreendidos. Algumas das principais áreas onde o TCL é importante incluem:

Inferência estatística: Isso permite o uso de intervalos de confiança e testes de hipóteses que assumem dados normalmente distribuídos, mesmo que a distribuição de dados subjacente não seja normal.
Ciência de dados e aprendizado de máquina: Muitos algoritmos assumem normalidade devido ao TCL, tornando os modelos mais robustos.
Controle de qualidade: O TCL é útil em processos de controle de qualidade onde as médias amostrais são monitoradas.

Ilustrando o teorema central do limite através de exemplos

Exemplo 1: Lançando um dado

Considere lançar um dado justo de seis lados. O resultado de lançar um dado é uma distribuição uniforme discreta de 1 a 6. Cada valor inteiro de 1 a 6 tem uma probabilidade igual de 1/6. Esta distribuição certamente não é normal.

Agora, imagine jogar dois dados 1000 vezes e calcular a média dos dois dados cada vez. Cada lançamento dos dois dados será independente, e teremos 1000 médias. Quando você plota essas médias, verá que a forma da distribuição delas começa a se assemelhar a uma curva em forma de sino. Agora, se você aumentar o número de dados para 3, 4 e além, a distribuição dessas médias continuará a se assemelhar melhor a uma distribuição normal.

Exemplo 2: Simulando um lançamento de moeda

Pegue 100 moedas e jogue-as. Cada lançamento de moeda pode ser visto como um ensaio de Bernoulli com uma probabilidade de 0,5 para caras e 0,5 para coroas. Assuma '1' para caras e '0' para coroas.

Se realizarmos este experimento e medirmos o número de caras (sucessos), podemos tratar cada lançamento como uma variável independente. O teorema central do limite mostra que, se repetirmos este lançamento de 100 moedas muitas vezes e plotarmos o número de caras cada vez, a distribuição dessas contagens se aproximará de uma distribuição normal.

Prova matemática do teorema central do limite

Vamos dar uma olhada na matemática que prova rigorosamente o Teorema Central do Limite. O teorema foi desenvolvido independentemente por vários matemáticos, incluindo Abraham de Moivre, Pierre-Simon Laplace e Carl Friedrich Gauss. Aqui, apresentamos uma versão simplificada da prova:

Seja X_1, X_2, ..., X_n variáveis aleatórias iid com média mu e variância sigma^2. A expectativa é dada por

E[X_i] = mu

e a variância é

Var(X_i) = sigma^2

Defina a média amostral como

bar{X} = frac{X_1 + X_2 + ... + X_n}{n}

A expectativa da média amostral é

E[bar{X}] = Eleft[frac{X_1 + X_2 + ... + X_n}{n}right] = mu

e sua variância é

Var(bar{X}) = frac{1}{n^2}(Var(X_1) + Var(X_2) + ... + Var(X_n)) = frac{sigma^2}{n}

De acordo com o teorema central do limite padrão, se n for suficientemente grande, a média amostral padronizada é aproximadamente distribuída normalmente, com média 0 e variância 1:

Z = frac{bar{X} - mu}{sigma/sqrt{n}} to N(0,1)

Conclusão

O teorema central do limite é um princípio estatístico poderoso que faz a ponte entre diferentes tipos de distribuições e a distribuição normal. Sua versatilidade e confiabilidade o tornam uma ferramenta importante para a inferência estatística, justificando muitos métodos e teorias tanto em estatísticas teóricas quanto aplicadas.

Seja jogando dados, lançando moedas ou fazendo medições no mundo real, este teorema nos permite fazer análises estatísticas informadas e previsões. Compreendendo o TCL, você está melhor equipado para enfrentar uma variedade de desafios estatísticos em uma variedade de disciplinas.

Marcar como lido

Pós-graduação → 5.1.4

username

concluído em Pós-graduação

← Anterior (5.1.3)

Lei dos grandes números

Próximo (5.2) →

Inferência estatística