프로젝트 주제
잡케어는 일자리를 탐색하는 구직자에게 구직자의 이력서를 인공지능 기술로 직무역량을 자동 분석하여 훈련, 자격, 일자리 상담에 활용할 수 있도록 지원하는 시스템이다.
본 경진대회는 사람들이 잡케어에서 콘텐츠를 열람한 경우에, 해당 콘텐츠를 사용했는지 여부를 예측하는 것이 목표였다.
데이터
•
열람한 컨텐츠의 속성과 열람한 사람의 정보에 관한 데이터가 주어졌다. 다만, 컨텐츠의 속성과 열람한 사람의 정보는 전부 비식별이다. 예를 들어, “contents attribute A”와 같이 변수명이 주어짐.
•
Train 501951개 → 컨텐츠 사용 여부(Target Variable) 포함 데이터
•
Test 46404개 → 컨텐츠 사용 여부(Target Variable) 미포함 데이터
•
Target Variable
◦
컨텐츠 사용 여부(Binary)
•
Predictor Variables
◦
열람한 컨텐츠의 속성 및 열람한 사람의 정보 (총 34개)
모델 및 성능
•
Catboost를 최종 모델로 선정하였으며 Hyperparameter Tuning을 위해 Optuna Package를 사용하였다.
◦
Public Test F1-Score: 0.70318
◦
Private Test F1-Score: 0.70491