프로젝트 주제
20년도에 진행했던 프로젝트를 시공간 데이터 분석 기법을 활용하여 다시 분석해보았다.
데이터
모델 및 성능
SGLMMs(Spatial Generalized Linear Mixed Models)과 ICAR(Intrinsic Auto-Regressive Model) 등 다양한 공간 모형 등이 사용되었다.
성능 지표는 Mean Poisson Deviance(MPD)를 사용하였으며, 각 모델들의 성능은 다음과 같다.
•
SGLMMs: 0.53906
•
ICAR: 0.5692878
•
BYM: 0.5695867
결론
•
공간자기상관성(Spatial Autocorrelation)이 존재함에 따라 비공간적인 모형보다 공간모형이 성능이 더 좋다는 것을 확인할 수 있었다.
•
Spatial Cross Validation을 적용한다면 과적합을 방지할 수 있었겠으나, 공간 데이터 중간 지역 곳곳이 비어있었고, 따라서 지역간 격차가 커서 적용하기가 어려웠다. 따라서 추후에 적합한 방법으로 Spatial Cross Validation 등을 적용한다면, 더 활용성이 높은 예측 모형을 만들 수 있을 것으로 기대한다.
Table
Search