ESTATÍSTICA: Coeficiente de Determinação

O coeficiente de determinação (R2) ou coeficiente de explicação é uma medida da qualidade do ajuste da reta de regressão, sendo calculado por meio da seguinte equação matemática:



O R2 fornece uma medida da proporção da variação explicada pela equação de regressão em relação à variação total das respostas. Para efeito de explicação dos resultados, o R2 pode ser dado em porcentagem, multiplicando o valor obtido por 100.

O software R tem um comando simples para o cálculo direto de R2: cor(conjunto1, conjunto2)^2.


Exemplo:



Com o software R bastaria os seguintes comandos:
> x = c(1, 2, 3, 4, 5, 6) #criou-se o vetor 'x'
> y = c(10, 19, 33, 40, 53, 64) #criou-se o vetor 'y'
> cor(x, y)^2
[1] 0.9953986


Ou seja, a regressão linear explica 99,5% da variação total das respostas (Y).

Se quiser fazer os cálculos por etapas, pode-se seguir o seguinte conjunto de passos:

Passo 1: Obter os coeficientes da equação de regressão linear dos dados

> reg = lm(y~x) #criou-se a regressão linear
> reg #evidencia-se os coeficientes linear (intercepto) e angular da reta de regressão


Call:

lm(formula = y ~ x)

Coefficients:
(Intercept) --- x
-1.40 ------- 10.83


Equação da reta de regressão linear: y = 10.83*x - 1.40

Passo 2: Calcular os valores de ŷ

Utilize a equação da reta da regressão linear para calcular todos os valores de ŷ. A tabela abaixo apresenta todos os valores calculados, sendo ŷ = yr.



E faça os cálculos finais:

> numerador = sum((yr - mean(y))^2) #calcula-se o valor do numerador da equação
> denominador = sum((y - mean(y)^2) #calcula-se o valor do denominador da equação
> r2 = numerador/denominador #calcula-se R2
> r2
[1] 0.9956614

Fonte: adaptado de RODRIGUES, M. I.; IEMMA, A. F. Planejamento de experimentos & otimização de processos. 2. ed. Campinas, 2009.