ESTATÍSTICA: Teorema Central do Limite

Suponha que uma amostra de tamanho 'n' seja obtida de uma população de distribuição de probabilidades desconhecida. A distribuição das médias amostrais será aproximadamente normal, com média μ e variância σ2/n, se a amostra apresentar um grande número de elementos (n elevado).
Este é Teorema Central do Limite, um dos mais úteis teoremas em Estatística. Uma vez considerado, o cálculo da estatística z é realizado de acordo com a equação abaixo:



Para provar a influência do tamanho da amostra, considere a distribuição das frequências de resultados de lançamentos de dados para um único dado:



A probabilidade de cada um dos números do dado sair é igual a 1/6, por isso o histograma mostra barras com a mesma altura. Mas, se jogarmos o dado duas vezes e considerarmos a distribuição das médias entre os valores dos dois conjuntos, a distribuição das frequências de resultados muda, como observado abaixo:



Note que a distribuição se aproxima um pouco da normalidade. Considere agora três lançamentos:



Mais semelhante a uma distribuição normal, não é? Pois bem, se continuarmos aumentando o número de lançamentos de dados e montando o histograma de frequências das médias amostrais iremos chegar em uma distribuição normal das médias amostrais.
Mas, qual deve ser o valor de n para que a amostra seja grande o suficiente para que sua distribuição das médias amostrais seja normal? Na prática, independente da distribuição de frequência dos dados de uma variável aleatória, a amostra deve apresentar tamanho maior ou igual a 30. Caso a distribuição de frequências seja naturalmente próxima de uma distribuição normal, valores menores que 30 podem ser satisfatórios.

Veja um exemplo de aplicação do teorema central do limite:

--------------------------------------------------------------------------------------------------------------------------
Exemplo 1 - Uma indústria produz detergentes com um teor médio de tensoativos igual a 7% (m v-1) e desvio-padrão igual a 1% (m v-1). Qual a probabilidade de uma caixa de detergentes, com 36 unidades, ter um teor médio menor que 6%?



Como observado, a probabilidade é próxima de zero. Considerando a distribuição das médias amostrais, caixas de 36 unidades raramente apresentarão um teor médio de tensoativos menor que 6% (m v-1).
--------------------------------------------------------------------------------------------------------------------------

No software R podemos calcular a probabilidade acumulada P(Z<z) de uma forma muito simples. Basta usar o seguinte comando:

pnorm(valor da estatística z, 0, 1).

Veja como foi feito o cálculo do exemplo 1:

> pnorm(-5.88, 0, 1)
2.051332e-09 (ou seja, 0.00000000205 ~ zero)