[project] 음식명 기반 카테고리 분류 모델


[project] 음식명 기반 카테고리 분류 모델

음식명 기반으로 상세 분류를 진행해주는 카테고리 분류 모델을 만들어보려고 한다. 항상 나는 개인적으로 꿀을 빠는걸 좋아하기 때문에 관련 모델이나 자료가 있는지 열심히 찾아보았다. 그러나.... 영화, 쇼핑 상품 등의 카테고리는 관련 논문도 있고 기업 사례가 다양했지만 음식 자체 관련해서는 자료를 찾아볼 수 없었다. 결국은 난 스스로 직접 자연어처리를 하고 다중 클래스 분류 모델을 만들자고 계획했다. 내가 사용한 데이터는 통합식품영양성분 DB로 AI HUB에서 제공하는 데이터와 따로 제공 받은 데이터를 통합한 데이터였다. AI HUB 데이터를 보면 컬럼에 DB군이 있는데 거기서 음식인 데이터들만 통합해서 진행했다. 우선은 여러 우여곡절이 있었고 결국은 엄청난 성능을 뽑아냈다. 내가 최종적으로 사용하게 된 모델은 KOBERT 기반의 모델로 솔직히 내가 크게 고친 부분은 없고 간단한 데이터 전처리를 진행했다. 이번 게시글에서는 해당 코드를 설명해보려고 한다. KoBERT를 사용할 때 제일...


#KoBERT #NLP #다중클래스분류 #딥러닝 #자연어처리

원문링크 : [project] 음식명 기반 카테고리 분류 모델