군집분석 개요


군집분석 개요

1. 군집분석의 개요 2. 유사도와 비유사도 척도 - 명목 속성의 유사도 측정(단순 매칭, 분할표) - 수치형 속성의 유사도 측정(민코브스키 거리, 유클리드 거리, 맨해탄 거리, 마할라노비스 거리, 상관계수) - 서열 속성의 유사도 측정(직접적 방법, 연속형 변환) - 혼합 유형의 유사도 측정(개별 합, 혼합속성접근법) - 코사인 유사도 측정(타니모토 계수) 군집분석은 유사한 속성을 갖는 객체들을 묶어 전체의 객체들을 몇 개의 그룹 또는 군집(Cluster)으로 나누는 방법이다. 예를 들어, 기업의 고객 데이터에서 구매 행태에 따라 비슷한 고객을 그룹핑하는 전략이 있다. 매장 주인은 비슷한 고객 군을 찾아 마케팅에 활용해 매출을 늘리고 싶을 것이다. 분류 분석은 이전의 데이터를 가지고 새로운 객체가 어느 범주에 속할지를 물었다면, 군집분석은 '이전의 데이터'가 없는 상황에서 집단만 만들어내는 것이다. 어느 범주에 객체를 넣을까를 고민하는 것이 아니라, 성격을 얼마나 정확히 구별할 수...


#군집분석 #민코브스키 #비유사도 #유사도 #유클리드 #코사인유사도

원문링크 : 군집분석 개요