IRIS classification in R


IRIS classification in R

IRIS에는 붓꽃의 종류가 있는데 R에서 붓꽃의 종류를 classification해보자. 사전 준비 필요한 데이터 패키지 및 iris 데이터를 불러오자. 데이터를 두가지로 나누었다. creatDataPartition은 caret패키지의 함수로, 주어진 비율(p)에 따라 데이터를 분할한다. list=FALSE이기 때문에 결과값은 벡터가 된다. 이후 test에는 data.split에 들어가지 않은 20%의 데이터를, dataset에는 80%의 데이터를 넣었다. dataset은 120*5의 행렬로 되어있다. sapply함수는 각 열에 대해서 특정 함수를 넣는 것이다. 예측하고자 하는 Species는 세가지이다. dataset에 적절하게 33.3%씩 각 Species가 들어가 있음을 볼 수 있다. 데이터 형성 x에는 1부터 4열 까지, y에는 5열을 넣었다. 이렇게 한 이유는 1부터 4열 까지는 numeric varibales로 independent variables기 때문이다. 반면 5번...


#CART #코딩 #붓꽃 #분류 #머신러닝 #기계학습 #SVM #Rstudio #RF #resampling #R #LDA #KNN #iris #cv #classification #통계학

원문링크 : IRIS classification in R