[ML] 정보 이득, 지니 계수


[ML] 정보 이득, 지니 계수

결정 트리 알고리즘에서는 어떤 기준으로 해서 가장 효율적인 분류가 될 것인지가 알고리즘 성능을 좌우한다. 이를 위해서는 어떻게 트리를 분할할 것인가가 중요한데 최대한 균일한 데이터 세트를 구성할 수 있도록 분할하는 것이 필요하다. 데이터 세트의 균일도는 데이터를 구분하는 데 필요한 정보의 양에 영향을 미친다. 결정 트리의 결정 노드는 정보 균일도가 높은 데이터 세트를 먼저 선택할 수 있도록 규칙 조건을 만든다. 이런 정보의 균일도를 측정하는 방법은 엔트로피를 이용한 정보 이득 지수와 지니 계수가 있다. 정보 이득 정보 이득은 엔트로피 개념을 기반으로 한다. 엔트로피는 주어진 데이터 집합의 혼잡도를 의미하는데 서..........

[ML] 정보 이득, 지니 계수에 대한 요약내용입니다.

자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.



원문링크 : [ML] 정보 이득, 지니 계수