회사 클러스터링 : 회계 데이터를 기반으로 [2]

회사 클러스터링 : 회계 데이터를 기반으로 [1] 약 2달 정도 했던 프로젝트. 회사들의 결제 및 회계 데이터를 기반으로 클러스터링을 시도해서 기존에 없던... blog.naver.com 1편에 이어서... K-Means, GMM(Gaussian Mixture Model), DTW 클러스터링을 위한 알고리즘은 크게 3가지를 사용했다. K-Means, GMM(Gaussian Mixture Model), DTW 알고리즘이다. K-Means는 Euclidean 거리를 기반으로 k개의 중심점(Centroid)를 옮기며 클러스터링을 진행하는 알고리즘이다. 나는 Elbow Method를 통해 추천된 k값에 ±2~3정도의 값을 주면서 최적의 k 및 클러스터링 결과를 구했다. GMM은 Gaussian Mixture Model의 준말로 데이터가 하나의 복잡한 확률분포로 구성되어 있고 이를 여러개의 정규분포(Gaussian)으로 나눌 수 있으며 이 정규분포가 Cluster가 되는 이론이다. 나도 이 ...

#Clustering #GMM #KMeans #Python #클러스터링 #파이썬

원문링크 : 회사 클러스터링 : 회계 데이터를 기반으로 [2]