프로젝트 주제
Hierarchical Dirichlet Process Latent Position Cluster Model(HDP-LPCM) 모델을 활용하여 시간의 흐름에 따라 각국의 동맹세력이 어떻게 변화했는지를 알아보았다.
데이터
•
1950년부터 1979년까지 5년 단위의 각국 군사 동맹 Network Data (총 6개의 network data, 총 180개국)
•
원본 데이터는 1816년부터 각국의 군사 동맹에 관한 데이터. 해당 데이터는 상호방위협정이나 불가침 조약 등 공식적인 동맹을 맺는 경우 edge가 발생함. 모든 공식적 동맹이 포함되므로 해당 년도에 같은 국가끼리 두 개 이상의 edge가 생길 수 있다. 그리고 이 데이터를 냉전 시대 초기인 1950년부터 1979년까지 5년 단위로 합쳐서 총 6개의 undirected weighted network data를 만듦.
•
생성된 network data
◦
network_1950: Node 개수 : 180 개 , Edge 개수 420 개 , 1950~1954 년까지의 군사동맹 network
◦
network_1955: Node 개수 : 180 개 , Edge 개수 465 개 , 1955~1959 년까지의 군사동맹 network
◦
network_1960: Node 개수 : 180 개 , Edge 개수 648 개 , 1960~1964 년까지의 군사동맹 network
◦
network_1965: Node 개수 : 180 개 , Edge 개수 540 개 , 1965~1969 년까지의 군사동맹 network
◦
network_1970: Node 개수 : 180 개 , Edge 개수 638 개 , 1970~1974 년까지의 군사동맹 network
◦
network_1975: Node 개수 : 180 개 , Edge 개수 876 개 , 1975~1979 년까지의 군사동맹 network
모델 및 결과
•
사용 모델은 Hierarchical Dirichlet Process Latent Position Cluster Model(HDP-LPCM) 모델이며 결과는 다음과 같다.
•
Alluvial Plot (시간의 흐름에 따라 clustering이 어떻게 분화 또는 결합되었는지를 나타내는 plot)
→ 7번 cluster는 isolated된 node를 모아두는 cluster.
→ 처음에는 군사동맹이 없었으나, 시간이 지나면서 동맹이 형성되어 다른 cluster들로 들어가는 모습을 볼 수 있다.
→ 9번 cluster와 같이 구성이 계속 일정한 cluster도 있는 반면, 7과 같이 분화하거나 4와 같이 합쳐지는 cluster도 존재한다.
→ 5와 1의 경우처럼 처음에는 존재하지 않았지만 시간이 지나면서 새롭게 형성된 cluster도 존재.
•
Latent Space Clustering (1950-194 & 1975-1979)
결론
•
Latent Space 모형이 Visualization이 좋다는 점에서 HDP-LPCM 모델은 Network analysis에서 시간의 흐름에 따른 Clustering의 변화를 표현하기에 적합하다.
•
다만, Computation 시간이 오래 걸리며, node나 edge의 attribution 등이 존재할 때 이것들을 활용할 수 없다는 점에서 한계가 있다.
Table
Search