R을 이용한 의사결정 나무


R을 이용한 의사결정 나무

이번에는 IRIS데이터를 이용하여 의사결정나무를 그려보자. 의사결정나무는 일종의 classification을 시행하는 것이다. 데이터 전처리 우선 iris데이터를 읽어주고, iris의 열의 이름을 간단하게 바꿔준다. party패키지 설치 party패키지를 설치하여 ctree()함수를 불러온다. 의사결정나무 그리기 위 의사결정 나무는 3개의 노드를 가지며 4개의 잎을 가진다. y값이 결과값이라고 볼 수 있는데, 이것을 해석하기 위해서는 먼저 unique(iris$sp)를 시행해보자. 그러면 y=(a,b,c)의 값중 a,b,c는 각각 setosa, versicolor, virginica를 의미함을 알 수 있게된다. 아니면 type을 extended로 해서 위와 같은 결과를 얻을 수 있게 된다. 결과를 보면 pl이 1.9이하인 경우 무조건 setosa이며, pl이 1.9보다 크고 pw가 1.7보다 큰 경우 (7번 leave) 0.978정도의 확률로 virginica가 된다....


#decision #making #R #tree #의사결정나무 #통계

원문링크 : R을 이용한 의사결정 나무