안녕하세요. SW 개발자 쪼맹 입니다. 오늘도 제가 알고 있는 소박한 지식을 공유 해보고자 합니다. 이번에는 결정트리 (Decision Tree) 내용 중에 CART 에 대해서 알아보고자 합니다. [CART] : Classification And Regression Tree (분류와 예측에 사용) : 지니지수가 작아지는 방향으로 모든 예측 변수를 (Feature) 사용하여 트리를 만들어가는 방법 입니다. scikit-learn은 CART 알고리즘을 통해 이진 트리를 만듭니다. (이진트리는 자식 노드가 두 개) 지니지수는 불순도를 나타내는 인덱스로 지니지수가 작아지는 형태로 Tree가 만들어진다고 볼 수 있습니다. 즉, 지니지수를 가장 작게 하는 예측 변수를 중요하다고 보고 해당 변수를 이용하여 정확도가 가장 높은 Tree를 만들어 나갑니다. 즉, A 라는 예측 변수를 이용했을 때는 지니지수가 0.5 인데 B라는 예측 변수를 이용하니 0.1 이 된다면 B라는 예측 변수를 이용하여 Tr...
#AI
#선형회귀식
#선형회귀직선
#설명변수
#예측값
#정답데이터
#종속변수
#지니지수
#지도학습알고리즘
#최소제곱법
#추정값
#프로젝트
#학습데이터
#선형회귀
#반응변수
#CART
#DeepLearning
#GINIINDEX
#LinearRegression
#MachineLearning
#MSE
#SSE
#SSR
#SST
#독립변수
#딥러닝
#머신러닝
#회귀직선
원문링크 : AI 머신러닝 결정나무 모형 CART 알고리즘, 지니지수 (GINI Index)