[필기] Clustering_머신러닝


[필기] Clustering_머신러닝

Clustering(군집화)의 정의 유사한 속성을 갖는 데이터들을 묶어 전체 데이터를 몇 개의 군집으로 나누는 것으로 계층적 군집화와 비계층적 군집화가 있다. Classification Clustering Supervised Learning Unsupervised Learning 소속 집단의 정보를 알고 있는 상태 소속 집단의 정보를 모르고 있는 상태 Label이 있는 데이터를 나누는 방법 Label이 없는 데이터를 나누는 방법 계층적 군집화 계층적(Hierarchical) 군집화란? 개체들을 가까운 집단부터 묶어 나가는 방식으로 유사한 개체들이 결합되는 dendrogram을 생성한다. Cluster들은 sub-cluster를 갖고 있다는 특성이 있다. 가까운 거리를 판단하는 종류 유클리드 거리 맨해튼 거리 표준하 거리 민콥스키 거리 계층적 군집의 종류 최단 연결법 최장 연결법 평균 연결법 중심 연결법 출처 : https://codedragon.tistory.com/9829 EX) ...


#Clustering #DBSCAN #Dunn #Kmeans #Shilhouette

원문링크 : [필기] Clustering_머신러닝