출처:
1. 정의
다중공선성(Multicollinearity)은 회귀분석 시 독립변수들 간에 강한 상관관계가 나타나는 문제이다. 다중공선성이 있는 경우 분석 결과가 부정확할 수 있기 때문에 변수 선택 등 적절한 방법을 통해 문제를 해결해야 한다.
2. 다중공선성 확인
•
산점도(Correlation Plot) 확인
•
VIF(Variance Inflation Factor) 확인. 10을 넘는 경우 문제가 있다고 보통 판단.
3. 다중공선성 해결
•
상관관계가 높은 독립변수중 하나 혹은 일부를 제거한다.
•
PCA 등 차원을 축소를 통해 문제를 해결할 수 있다.