Skip to content

Latest commit

 

History

History
11 lines (9 loc) · 417 Bytes

File metadata and controls

11 lines (9 loc) · 417 Bytes

Code Jupyter Notebooks Archive

1. Naver Webtoon NLP Analysis

Kaggle의 데이터를 활용하여 한글 데이터 분석

  • EDA
  • Wordcloud
  • konlpy & Gensim.FastText로 토큰화
  • SVM으로 카테고리 Classification (분류), KNN으로 카테고리 예측
  • HuggingFace의 Pre-Trained Model RoBERTa by KLUE 이용한 Classification.
  • Topic Modeling으로 Unsupervised aspect에서 장르 클러스터링