O Teorema Central do Limite é, provavelmente, o resultado mais importante para a inferência estatística. Mas antes de apresentar tal resultado devemos considerar algumas definições.
Estatística
Uma estatística é qualquer função das observações em uma amostra aleatória. Se X1, X2,..., Xn é uma amostra aleatória de tamanho n, a média amostral , a variância amostral e o desvio padrão amostral são estatísticas.
Uma função de uma variável aleatória é também uma variável aleatória. Sendo uma estatística uma variável aleatória, possui uma distribuição de probabilidade. A distribuição de probabilidade de uma estatística é denominada distribuição amostral. Por exemplo, a distribuição de probabilidade da média amostral é chamada distribuição amostral da média.
Funções Lineares de Variáveis Aleatórias
Dadas variáveis aleatórias X1, X2,..., Xp e constantes c1, c2,..., cp
é uma combinação linear de X1, X2,..., Xp. E
Se X1, X2,..., Xp são independentes,
Média e variância de uma média amostral
Se
com E(Xi) = µ para i = 1, 2,..., p
Se X1, X2,..., Xp também são independentes com V(Xi) = σ² para i = 1, 2,..., p
Ambos os resultados para média e variância de uma média amostral podem ser obtidos utilizando as expressões da seção anterior. Sendo a média amostral uma combinação linear das variáveis aleatórias X1, X2,..., Xp é fácil perceber que ci = 1/p. Substituindo esta expressão nas expressões para valor esperado e variância para combinações lineares têm-se estes resultados. Isto será melhor ilustrado a seguir.
O Teorema Central do Limite
A distribuição amostral de uma estatística depende da distribuição da população, do tamanho da amostra e do método de amostragem.
Considere a determinação da distribuição amostral de uma média amostral. Suponha que a amostra aleatória de tamanho n é retirada de uma população normal com média µ e variância σ². Agora cada observação nesta amostra, digamos, X1, X2,..., Xn é uma variável aleatória normalmente e independentemente distribuida com média µ e variância σ². Portanto devido ao fato que funções lineares de variáveis aleatórias normalmente e independentemente distribuídas são também normalmente distribuídas, nós concluímos que a média amostral
tem uma distribuição normal com média
e variância
Se a média amostral é uma variável aleaória que possui distribuição normal, podemos padronizar esta variável. Temos, portanto
Este resultado é importante porque aparece no enunciado do Teorema Central do Limite.
Se estamos amostrando de uma população que tem uma distribuição de probabilidade desconhecida, a distribuição amostral da média amostral será aproximadamente normal com média µ e variância σ²/n, se o tamanho da amostra n é grande. Este é um dos mais úteis teoremas na estatística, denominado Teorema do Limite Central. É enunciado como se segue.
Enunciado
Se X1, X2,...,Xn é uma amostra aleatória de tamanho n retirada de uma população (finita ou infinita) com média µ e variância σ², e se
é a média amostral, a forma limitante da distribuição de
conforme n tende ao infinito, é a distribuição normal padrão.
Considerações
A prova do Teorema Central do Limite envolve alguns tópicos avançados tais como funções características e convergência de variáveis aleatórias. Não me aterei a estes assuntos neste tópico devido à sua complexidade. Todavia o Portal Action fornece a prova deste teorema, bem como os tópicos necessários para sua compreensão.
A aproximação normal para a média amostral depende do tamanho da amostra. O Teorema Central do Limite funciona bem para amostras pequenas (n = 4, 5) na maior parte das situações, particularmente onde a população é contínua, unimodal e simétrica. Porém amostras maiores serão necessárias em algumas situações, dependendo da forma da população. Em muitos casos de interesse prático, se n ≥ 30, a aproximação normal será satisfatória independentemente da forma da população. Se n < 30, o Teorema Central do Limite funcionará se a distribuição da população não é muito "não-normal".
Referências
Portal Action. Teorema Cenral do Limite. Disponível em: <http://www.portalaction.com.br/probabilidades/732-teorema-central-do-limite>. Acesso em: 06 de junho de 2015.
MONTGOMERY, D. C.; RUNGER, G. C. Applied Statistics and Probability for Engineers. 4th edition. John Wiley & Sons, 2007.