분류분석 개요


분류분석 개요

Classification Analysis는 다수의 속성 또는 변수를 갖는 객체를 미리 정해진 그룹 또는 범주중 하나에 할당하는 것이다. 쉽게 말해서 이미 수많은 시도로 정답이 알려져있는 데이터에 대해 새로운 데이터가 어디에 속할지를 판단하는 것이다. 군집분석과 헷갈리지 말자. 따라서 이 기법에서 핵심은 각각의 데이터를 수집한 후 효율적인 분류규칙(Classification Rule)을 만드는 것이다. [분류문제 및 분류기법] 위에서 설명했듯, 분류문제는 새로운 객체를 수많은 범주 중 하나로 분류하기 위해, 학습표본을 바탕으로 규칙을 만드는 것이다. 그리고 이 규칙은 변수의 함수형태로 도출되므로 어떤 함수 r(x)라고 생각해보자. r(x)는 분류기(Classifier)라고 부르기도 한다. 그러나 수많은 전공서적에서 알려주는 이론 하나하나가 세상을 모두 설명해주지는 못하듯, 분류기 하나를 만들었다고 해서 모든 데이터를 올바르게 분류해내기를 바라는건 무리다. 그래서 발생하는 실제범주와 ...


#나이브베이지안 #분류분석 #오분류율 #인접객체

원문링크 : 분류분석 개요