클레임 예측하기(1) : Pipeline, ARIMA 등..


클레임 예측하기(1) : Pipeline, ARIMA 등..

입사 2년차가 되었다. 이제 정말 제대로 된(?) 빅데이터 분석을 할 시간이었다. 회사 내 다양한 팀들(생산, R&D, 구매, 품질, 인사...)과 과제 도출을 위한 미팅을 진행했고 그 중 품질 팀과 과제를 진행하게 되었다. 과제는 '클레임 발생 예측'이었다. 과거에 클레임 데이터를 다뤄보기도 했고 정량적으로 수치가 잘 표현되기 때문이었다. 사실 회사에 클레임 예측 시스템이 없는 것은 아니었다. 회사에는 기존 시스템 중에 클레임 발생 예측이 있긴 했지만 클레임이 정규분포를 따라 발생한다는 가정으로 기존 클레임의 평균과 표준편차를 구한 뒤 예측하는, 단순한 수학계산을 통해 예측하는 시스템이었다. 정규분포 그래프 품질 팀에서는 이제는 단순 수학계산보다 통계적 지식에 기반한, 좀더 설명력이 높고 신뢰할 수 있는 클레임 예측 시스템을 만들고 싶어했다. 이 과정에서 내가 프로젝트를 맡게 되었고 나는 시계열 방법론을 적용해 클레임을 예측해보기로 했다. 아, 그리고 처음으로 Python을 이용해...


#ARIMA #Python #SARIMA #SQL #시계열 #예측

원문링크 : 클레임 예측하기(1) : Pipeline, ARIMA 등..