청와대 청원 분류 경진대회 - 소개
2022. 9. 16. 13:27
청와대 청원 분류 경진대회는 데이콘에서 교육용으로 제공하는 무료 프로젝트이다.
주어진 청와대 청원 데이터를 카테고리별로 분류하는 것이 목표가 된다.
학습용 데이터로 주어지는 train.csv파일의 내용이다.
40000개의 로우데이터가 주어진다.
category열은 말그대로 청원 데이터의 카테고리를 뜻하는데
각각
0: 인권/성평등
1: 문화/예술/체육/언론
2: 육아/교육
을 뜻한다.
test.csv파일이다.
위 데이터의 카테고리를 예측해서 제출한다.
자연어 처리를 이용한 분류 문제이고,
나는 BERT를 사용하여 문제를 풀어보겠다.
'데이콘 > 청와대 청원 분류 경진대회' 카테고리의 다른 글
청와대 청원 분류 경진대회 - 데이터 전처리 (0) | 2022.09.16 |
---|---|
청와대 청원 분류 경진대회 - 데이터 EDA (0) | 2022.09.16 |