Search
👍

데이콘 잡케어 추천 알고리즘 경진대회(상위 10%)

날짜
2022/01/28
분석기법
지도학습
모델
LightGBM
XGBoost
CatBoost
Stacking
속성
python
URL
분석인원
팀프로젝트

프로젝트 주제

잡케어는 일자리를 탐색하는 구직자에게 구직자의 이력서를 인공지능 기술로 직무역량을 자동 분석하여 훈련, 자격, 일자리 상담에 활용할 수 있도록 지원하는 시스템이다.
본 경진대회는 사람들이 잡케어에서 콘텐츠를 열람한 경우에, 해당 콘텐츠를 사용했는지 여부를 예측하는 것이 목표였다.

데이터

열람한 컨텐츠의 속성과 열람한 사람의 정보에 관한 데이터가 주어졌다. 다만, 컨텐츠의 속성과 열람한 사람의 정보는 전부 비식별이다. 예를 들어, “contents attribute A”와 같이 변수명이 주어짐.
Train 501951개 → 컨텐츠 사용 여부(Target Variable) 포함 데이터
Test 46404개 → 컨텐츠 사용 여부(Target Variable) 미포함 데이터
Target Variable
컨텐츠 사용 여부(Binary)
Predictor Variables
열람한 컨텐츠의 속성 및 열람한 사람의 정보 (총 34개)

모델 및 성능

Catboost를 최종 모델로 선정하였으며 Hyperparameter Tuning을 위해 Optuna Package를 사용하였다.
Public Test F1-Score: 0.70318
Private Test F1-Score: 0.70491