////
Search

R-Square(결정계수)

1. 결정계수(R-Square)의 의미

결정계수(R-Square)회귀 모델에서 독립변수가 종속변수를 얼마만큼 설명해 주는지를 가리키는 지표이다. 설명력이라고도 부른다. 다만, 단순히 독립변수의 수가 증가하면 증가하기 때문에 결정계수만으로 회귀 모델의 유용성을 판단하는 것에는 문제가 있다.

2. 결정계수 계산 방법

R2=SSESST=1SSRSSTR^2 = \frac{SSE}{SST} = 1-\frac{SSR}{SST}

1) SST(Total Sum of Squares)

SST=i=1n(yiyˉ)2SST = \sum^n_{i=1}(y_i-\bar{y})^2
SST는 관측값에서 관측값의 평균을 뺀 결과의 총합이다.

2) SSE(Explained Sum of Squares)

SSE=i=1n(yi^yˉ)2SSE = \sum^n_{i=1}(\hat{y_i}-\bar{y})^2
SSE는 추정값에서 관측값의 평균을 뺀 결과의 총합이다.

3) SSR(Residual Sum of Squares)

SSR=i=1n(yiyi^)2SSR = \sum^n_{i=1}(y_i-\hat{y_i})^2
SSR은 관측값에서 추정값을 뺀 잔차(Residual)의 총합이다.

3. 조정된 결정계수(Adjusted R-Square)

조정된 결정계수는 독립변수의 수가 증가하더라도 결정계수가 일방적으로 증가하는 것을 방지한다.
Adjusted  R2=1SSR/(nk1)SST/(n1)Adjusted \; R^2 = 1-\frac{SSR/(n-k-1)}{SST/(n-1)}