프로젝트 주제
NBA 루키들의 첫 시즌 성적을 통해 향후 5년 동안 선수 커리어를 이어나갈 수 있을지를 예측하는 모델을 세워보았다.
데이터
데이터 출처: Data.World
•
관측치: 1340 개
•
Response Variable: NBA 루키가 선수 생활을 5년 이상 이어나갔는지 여부 (Binary)
•
Predictor Variable: NBA 루키들의 첫 시즌 성적과 관련된 변수들. ex) GP(게임수), OREB(공격 리바운드) 등.
모델 및 성능
최종적으로 사용된 모델은 KNN과 Neural Net이었다. KNN은 Accuracy와 Specificity에서 강점을 보였고, Neural Net은 Sensitivity에서 강점을 보였다.
Test Set에서의 KNN성능
•
Accuracy: 0.69
•
Specificity: 0.78
Test Set에서의 Neural Net의 성능
•
Sensitivity: 0.64
결론
KNN 모델은 Accuracy와 Specificity가 높기 때문에 루키의 성공 확률을 잘 잡아낸다고 볼 수 있다. 즉, 영입해야 할 선수를 찾는 데에 적합하다. 반대로 Neural Net의 경우 Sensitivity가 높기 때문에 루키가 실패할 확률을 잘 잡아낸다. 따라서 영입하면 안 될 선수를 찾아내는 데에 적합한다.
Table
Search