[Data Mining] 데이터마이닝 프로세스 개요


[Data Mining] 데이터마이닝 프로세스 개요

1. 데이터 모델링 과정 목적결정 > 데이터 수집 > 데이터탐색 및 정제 > 데이터마이닝 방법 결정 > 최종모델 결정 > 성능평가 > 적용 2. 데이터 마이닝의 핵심 아이디어 분류 : 예측 : 예측하고자 하는 변수가 범주형으로 표현된 클래스 > 분류문제 예측하고자 하는 변수가 숫자로 표현된 연속형 변수 > 예측문제연관규칙 : 연관규칙을 이용해 다양한 추천시스템 운영예측분석 : 분류, 예측 그리고 연관성 분석들을 예측분석이라 한다.데이터 축소 : 대용량의 데이터를 필요한 만큼의 데이터로 축소데이터 탐색 : 서로 상관관계가 큰 변수들의 켤합을 통해 적은 수의 변수들로 축소하고 관측지들도 서로 비슷한 성질을 갖고 있는 것 끼리 통합시각화 : 데이터를 잘 이해하기 위한 방법 중 한가지 히스토그램, 상자도표, 막..


원문링크 : [Data Mining] 데이터마이닝 프로세스 개요