ESTATÍSTICA: Teste t

O teste t é um teste de hipóteses de comparação de médias que só pode ser aplicado em dados provenientes de distribuições normais (teste paramétrico). Além disso, difere do teste z por não usar o desvio-padrão populacional (σ) no cálculo da estatística teste, mas o desvio-padrão amostral (s).

Considerando as condições acima, pode-se usar o teste t nas seguintes situações práticas:
a) Comparar duas amostras independentes;
b) Comparar duas amostras pareadas;
c) Comparar uma amostra com um valor de referência.

Vale salientar que a distribuição t é simétrica, com média igual a zero e sua dispersão é determinada pelo número de graus de liberdade (g.l.). OBS: se g.l. for muito elevado, a distribuição t tende a uma distribuição normal.


1) COMPARAÇÃO DE UMA AMOSTRA COM UM VALOR DE REFERÊNCIA
Suponha que uma amostra de um medicamento tenha os seguintes teores (% m m-1) de princípio ativo: 12, 10, 15, 12, 11, 13, 15, 14, 14 e 13. E que seja necessário avaliar se o teor de princípio ativo do medicamento é igual a 10% (m m-1) com 95% de confiança.

α = 1 - 0,95 (95% de confiança) = 0,05

- Definição das hipóteses:
H0: µ = 10
Ha: µ ≠ 10 (teste bilateral)

- Cálculo da estatística teste (tcalc):

Onde: X̄ = média amostral, µ0 = média populacional de referência; s = desvio-padrão amostral e n = tamanho da amostra.
tcalc = (12,9 - 10)/(1,66/3,16) = 5,52

- Determinação dos tc (valores críticos):
Cálculo do g.l.: n - 1 = 10 - 1 = 9
Usar a tabela da distribuição t ( download ) para encontrar os valores de tc: -2,262 e 2,262.
OBS: como o teste é bicaudal, deve-se obter o -tc com nível de significância α/2 e +tc com nível de significância 1 - α/2. No caso, 0,025 e 0,975, respectivamente.

Ou usar o software R:
> qt(0.025, 9) #gera o valor de -tc
[1] -2.262157
> qt(0.975, 9) #gera o valor de +tc
[1] 2.262157

Assim sendo, as regiões críticas são determinadas por valores menores que -2,262 e maiores que 2,262.

- Avaliação das hipóteses:
Como tcalc está contido em uma das regiões críticas, rejeita-se H0. Em outras palavras, a média amostral do teor de princípio ativo no medicamento é significativamente diferente (α = 0,05) do valor de referência (10).

O software R disponibiliza um comando simples que avalia as hipóteses com base no p-valor:

> dados = c(12, 10, 15, 12, 11, 13, 15, 14, 14, 13) #cria o vetor de dados para avaliação
> t.test(dados, mu = 10) #comando do teste t para uma amostra (teste bicaudal)

One Sample t-test

data: dados
t = 5.5134, df = 9, p-value = 0.0003737
alternative hypothesis: true mean is not equal to 10
95 percent confidence interval:
11.71013 14.08987
sample estimates:
mean of dados
12.9


Como o p-valor (p-value) foi menor que o nível de significância do teste (0,05), rejeita-se H0.


2) COMPARAÇÃO DE DUAS AMOSTRAS INDEPENDENTES COM VARIÂNCIAS POPULACIONAIS IGUAIS
Suponha que a partir de um lote de detergentes líquidos foi extraída uma amostra de 6 frascos, sendo os teores de tensoativo (% m m-1) apresentados a seguir: 7, 6, 6, 5, 6 e 5. Uma semana depois outro lote de detergentes foi fabricado e uma nova amostra de 6 frascos foi extraída. Os teores (% m m-1) de tensoativo foram os seguintes: 5, 6, 5, 6, 5 e 5. Verifique se a média dos teores de tensoativo dos dois lotes é igual, com 95% de confiança.

α = 1 - 0,95 (95% de confiança) = 0,05

- Definição das hipóteses:
H0: µ1 - µ2 = 0
Ha: µ1 - µ2 ≠ 0 (teste bilateral)

- Cálculo da estatística teste (tcalc):

Onde: X̄1 = média da amostra 1, X̄2 = média da amostra 2, µ1 - µ2 = 0, n1 = tamanho da amostra 1, n2 = tamanho da amostra 2, s21 = variância da amostra 1 e s22 = variância da amostra 2.
tcalc = (5,83 - 5,53)/(√(5*(0,57)+5*(0,27)/(6+6-2))*(√((1/6)+(1/6)))) = 1,33

- Determinação dos tc (valores críticos):
Cálculo do g.l.: n1 + n2 - 2 = 12 - 2 = 10
Usar a tabela da distribuição t ( download ) para encontrar os valores de tc: -2,228 e 2,228.
OBS: como o teste é bicaudal, deve-se obter o -tc com nível de significância α/2 e +tc com nível de significância 1 - α/2. No caso, 0,025 e 0,975, respectivamente.

Ou usar o software R:
> qt(0.025, 10) #gera o valor de -tc
[1] -2.228139
> qt(0.975, 10) #gera o valor de +tc
[1] 2.228139

Assim sendo, as regiões críticas são determinadas por valores menores que -2,228 e maiores que 2,228.

- Avaliação das hipóteses:
Como tcalc não está contido em uma das regiões críticas, não há evidências suficientes para rejeitar H0. Em outras palavras, não há evidências para rejeitar que a subtração das médias dos teores de tensoativo das duas amostras seja igual a zero (α = 0,05) (médias iguais).

O software R disponibiliza um comando simples que avalia as hipóteses com base no p-valor:

> x1 = c(7, 6, 6, 5, 6, 5) #cria o vetor de dados da amostra 1 para avaliação
> x2 = c(5, 6, 5, 6, 5, 5) #cria o vetor de dados da amostra 2 para avaliação
> t.test(x1, x2, equal.var = TRUE) #comando do teste t para duas amostras independentes (variâncias populacionais iguais e teste bicaudal)

Welch Two Sample t-test

data: x1 and x2
t = 1.3416, df = 8.8527, p-value = 0.2131
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.3451995 1.3451995
sample estimates:
mean of x mean of y
5.833333 5.333333


OBS: o número de g.l. e o intervalo de confiança é levemente diferente do calculado por outros softwares devido à uma correção adicional realizada pelo software R (correção de Welch).

Como o p-valor (p-value) foi maior ou igual ao nível de significância do teste (0,05), não há evidências suficientes para rejeitar H0.


3) COMPARAÇÃO DE DUAS AMOSTRAS INDEPENDENTES COM VARIÂNCIAS POPULACIONAIS DIFERENTES
Suponha que 12 alíquotas de gasolina comum (tipo C) foram retiradas de bombas de combustível em um posto de gasolina. Em seguida, o teor de etanol (% v v-1) foi medido em todas as alíquotas formando a amostra 1: 25, 25, 27, 26, 25, 25, 27, 28, 26, 25, 28 e 28. Em outro posto de gasolina realizou-se o mesmo procedimento (amostra 2): 18, 20, 25, 28, 22, 19, 20, 24, 28, 25, 21 e 19. Verifique se a média dos teores de etanol das duas amostras é igual, com 95% de confiança.

α = 1 - 0,95 (95% de confiança) = 0,05

- Definição das hipóteses:
H0: µ1 - µ2 = 0
Ha: µ1 - µ2 ≠ 0 (teste bilateral)

- Cálculo da estatística teste (tcalc):

Onde: X̄1 = média da amostra 1, X̄2 = média da amostra 2, µ1 - µ2 = 0, n1 = tamanho da amostra 1, n2 = tamanho da amostra 2, s21 = variância da amostra 1 e s22 = variância da amostra 2.
tcalc = (26.25 - 22.42)/(√((1.66/12)+(12.26/12))) = 3,55

- Determinação dos tc (valores críticos):
Cálculo do número de g.l. (ν):

Onde: n1 = tamanho da amostra 1, n2 = tamanho da amostra 2, s21 = variância da amostra 1 e s22 = variância da amostra 2.

ν = 1,346/(0,002 + 0,095) = 13.88
Usar a tabela da distribuição t ( download ) para encontrar os valores de tc: -2,145 e 2,145.
OBS: como o teste é bicaudal, deve-se obter o -tc com nível de significância α/2 e +tc com nível de significância 1 - α/2. No caso, 0,025 e 0,975, respectivamente.

Ou usar o software R:
> qt(0.025, 13.88) #gera o valor de -tc
[1] -2.146528
> qt(0.975, 13.88) #gera o valor de +tc
[1] 2.146528

Assim sendo, as regiões críticas são determinadas por valores menores que -2,146 e maiores que 2,146.

- Avaliação das hipóteses:
Como tcalc está contido em uma das regiões críticas, rejeita-se H0. Em outras palavras, a subtração entre as médias de teor de etanol (% v v-1) é significativamente diferente de zero (α = 0,05) (médias distintas).

O software R disponibiliza um comando simples que avalia as hipóteses com base no p-valor:

> x1 = c(25, 25, 27, 26, 25, 25, 27, 28, 26, 25, 28, 28) #cria o vetor de dados da amostra 1 para avaliação
> x2 = c(18, 20, 25, 28, 22, 19, 20, 24, 28, 25, 21, 19) #cria o vetor de dados da amostra 2 para avaliação
> t.test(x1, x2, equal.var = FALSE) #comando do teste t para duas amostras independentes (variâncias populacionais diferentes e teste bicaudal)

Welch Two Sample t-test

data: x1 and x2
t = 3.5586, df = 13.922, p-value = 0.003171
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
1.521767 6.144899
sample estimates:
mean of x mean of y
26.25000 22.41667

OBS: o número de g.l. e o intervalo de confiança é levemente diferente do calculado por outros softwares devido à uma correção adicional realizada pelo software R (correção de Welch).

Como o p-valor (p-value) foi menor que o nível de significância do teste (0,05), rejeita-se H0.


4) COMPARAÇÃO DE DUAS AMOSTRAS PAREADAS
Sete funcionários (F) de uma empresa responderam um questionário de satisfação em seu trabalho. Todos preencheram o formulário de forma que a nota 1 fosse o grau de maior insatisfação e a nota 9 o maior grau de satisfação, sendo os resultados apresentados a seguir: (F1) 6, (F2) 8, (F3) 9, (F4) 6, (F5) 6, (F6) 8 e (F7) 7. Os mesmos funcionários preencheram o formulário após 6 meses, sendo a ordem dos resultados igual à do primeiro formulário: (F1) 6, (F2) 9, (F3) 9, (F4) 7, (F5) 7, (F6) 7 e (F7) 6. Verifique se a média dos resultados dos dois formulários é igual, com 95% de confiança.

α = 1 - 0,95 (95% de confiança) = 0,05

No caso das amostras pareadas realiza-se a seguinte subtração:
F1: 6 - 6 = 0
F2: 8 - 9 = -1
F3: 9 - 9 = 0
F4: 6 - 7 = -1
F5: 6 - 7 = -1
F6: 8 - 7 = 1
F7: 7 - 6 = 1

OBS: a média dos valores das diferenças pareadas é denominada D.

- Definição das hipóteses:
H0: µD = 0
Ha: µD ≠ 0 (teste bilateral)

- Cálculo da estatística teste (tcalc):

Onde: D = média das diferenças pareadas, µD = 0, Di = i-ésima diferença pareada e n = quantidade de elementos do conjunto de diferenças.
tcalc = (-0.143)/(√(4,857/42)) = - 0.42

- Determinação dos tc (valores críticos):
Cálculo do número de g.l. = n - 1 = 6.

Usar a tabela da distribuição t ( download ) para encontrar os valores de tc: -2,447 e 2,447.
OBS: como o teste é bicaudal, deve-se obter o -tc com nível de significância α/2 e +tc com nível de significância 1 - α/2. No caso, 0,025 e 0,975, respectivamente.

Ou usar o software R:
> qt(0.025, 6) #gera o valor de -tc
[1] -2.446912
> qt(0.975, 6) #gera o valor de +tc
[1] 2.446912

Assim sendo, as regiões críticas são determinadas por valores menores que -2,447 e maiores que 2,447.

- Avaliação das hipóteses:
Como tcalc não está contido em uma das regiões críticas, não há evidências suficientes para rejeitar H0. Em outras palavras, não há evidências suficientes que rejeitar que a média das diferenças pareadas é igual a zero (α = 0,05) (média igual a zero).

O software R disponibiliza um comando simples que avalia as hipóteses com base no p-valor:

> x1 = c(6, 8, 9, 6, 6, 8, 7) #cria o vetor de dados da amostra 1 para avaliação
> x2 = c(6, 9, 9, 7, 7, 7, 6) #cria o vetor de dados da amostra 2 para avaliação
> t.test(x1, x2, paired = TRUE) #comando do teste t para duas amostras pareadas (teste bicaudal)

Paired t-test

data: x1 and x2
t = -0.42008, df = 6, p-value = 0.6891
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-0.9749736 0.6892593
sample estimates:
mean of the differences
-0.1428571

Como o p-valor (p-value) foi maior ou igual que o nível de significância do teste (0,05), não há evidências suficientes para rejeitar H0.


Referências:
PORTAL ACTION. Disponível em: <www.portalaction.com.br/anova/tabela-da-distribuicao-t-student>. Acesso em: 10 dez. 2016a.
PORTAL ACTION. Disponível em: <www.portalaction.com.br/inferencia/571-1o-caso-variancias-iguais-porem-desconhecidas >. Acesso em: 10 dez. 2016b.
PORTAL ACTION. Disponível em: <www.portalaction.com.br/inferencia/58-teste-t-pareado>. Acesso em: 10 dez. 2016c.
TESTE t-STUDENT. Disponível em: <sistemas.eeferp.usp.br/myron/arquivos/2540410/e8fc3b72347400901a2750cb214bf4e0.pdf>. Acesso em: 10 dez. 2016.