🚸

오산시 어린이 교통사고 위험지역 도출 (입선)

날짜

2021/02/17

분석기법

지도학습

모델

Geographically Weighted Regression

RandomForest

속성

python

URL

https://github.com/esj205/Osansi

분석인원

팀프로젝트

프로젝트 주제

여러 데이터를 활용하여 오산시 내 각 지역들의 어린이 교통사고 위험도 지수를 산출하고 이를 바탕으로 어린이 교통사고 위험지역을 도출하였다.

데이터

•

Processing 이후 최종 격자 수: 1587개

•

Target Variable: 격자 내 어린이 교통사고 수.

•

Predictor Variable: 오산시 차량등록현황 등 오산시 관련 데이터. → Processing 후 20개 사용.

모델 및 성능

Random Forest와 GWR(Geographically Weighted Regression)을 결합하여 교통사고 위험도 지수를 생성하였다.

Random Forest의 RMSE는

•

어린이 보호구역 외: 0.632

•

어린이 보호구역 내: 0.730

으로 나타났다.

GWR은 위험도 지수를 생성할 때 변수의 부호를 판별하기 위하여 사용하였음.

결론

의의

•

결과적 유의성: 어린이 보호구역과 어린이 보호구역 외의 위험도 지수가 높은 지역을 살펴본 결과 일반적으로 생각하는 교통사고 위험 요인(추정 교통량, 유동인구)들 또한 높은 것을 확인할 수 있었고 배경지식에서 예상했던 바와 같이 중앙동과 대원동 근처에 위험지역이 많은 것을 확인할 수 있었다.

•

독창성: 통계 모델을 사용하여 오산시 만의 특성을 반영할 수 있는 위험도 지수를 산출하였다.

•

시각적 활용: 지도를 제작하였기 때문에 한눈에 위험 지역을 파악할 수 있었다. 또한 검색 기능을 이용하여 해당 격자를 찾을 수 있도록 하였다.

•

경제성 및 공공성: 모든 자료는 기본 제공 자료와 공공자료, 오픈 소스들을 활용하였으며, 데이터 추가를 제외하면 모델을 발전시키는 데에 비용이 들지 않았다.

•

추후 발전 가능성: 추후 데이터를 추가하여 모델에 반영하면 더 정확한 위험도 지수를 산출할 수 있다.

한계

•

데이터의 부족 및 불완전성: 필요한 곳의 데이터가 없거나 불완전한 경우들이 있었다. 예를 들어 도로가 있음에도 도로 정보가 없는 지역이 존재하였다.

•

적은 어린이 보호구역 수: 어린이 보호구역의 경우 원래 숫자가 적기 때문에 어린이 보호구역 외에 비해 비교적 분석의 정확도가 떨어졌다.

제언 및 활용방안 제시

•

데이터 보완: 정기적으로 데이터를 갱신 또는 추가하는 경우 더욱 정확한 분석 결과를 얻을 수 있을 것.

•

오산 시 외의 데이터와 결합하여 분석: 오산시와 비슷한 특징을 가진 도시와의 데이터와 결합하여 분석을 진행한다면 충분한 수의 어린이 보호구역 데이터 수를 얻을 수 있을 것.

•

활용방안: 위험지역으로 표시된 곳에 안전시설물이 부족한 경우 안전시설물 설치 우선지역으로 선정할 수 있으며, 이를 통해 어린이 교통사고를 방지할 수 있을 것으로 기대.

Table

Project PPT

이름

파일

오산시 어린이교통사고 위험지역 도출 PPT

Open

오산시_어린이교통사고_위험지역_도출 Project.pdf

Github

Ohsansi

esj205

오산시 어린이 교통사고 위험지역 도출 (입선)

프로젝트 주제

데이터

모델 및 성능

결론

의의

한계

제언 및 활용방안 제시

Project 일부