아웃라이어 탐색 -2-


아웃라이어 탐색   -2-

1. 아웃라이어 탐색방법(지도/준지도/비지도, 통계/인접성/클러스터링) 2. 통계적 아웃라이어 탐색법 - 파라미터 방식 - 단변수(MLE, Grubb's test) - 다변수(마할라노비스 거리, 카이제곱 통계량) - 혼합분포(EM 알고리즘) - 비파라미터 방식(히스토그램, 커널 밀도 추정법) 이론적, 시질적으로 다양한 아웃라이어 탐색 방법이 있다. 쉽게 나누자면, 전문가가 데이터에 매긴 라벨을 바탕으로 아웃라이어 탐색을 하는 모델, 가설에 따라 그룹핑하는 모델 2가지가 있다. [지도/준지도/비지도 방법] 전문가가 라벨을 매긴 데이터가 있으면, 주어진 데이터를 이용해 탐색 모델을 만들 수 있다. 그 대표적인 예시가 지도/준지도/비지도 탐색법이다. 지도 방식은 전문가의 견해에 따라 정상과 비정상의 모델을 만들고 분류 기법을 활용해 학습한다. 사실상 분류 문제와 비슷하다. 그러나 문제는 '보통'과 '아웃라이어'의 2개 클래스의 균형을 찾기 힘들다는 점이다. 샘플이 부족하면 아웃라이어가 발...


#아웃라이어 #이상치 #이상치분석 #통계적아웃라이어

원문링크 : 아웃라이어 탐색 -2-