[ML] 특성 자동 선택


[ML] 특성 자동 선택

파이썬 라이브러리를 활용한 머신러닝 책을 보고 정리한 내용입니다. 특성이 추가되면 모델은 더 복잡해지고 과대적합될 가능성도 높아진다. 새로운 특성을 추가할 때나 고차원 데이터셋을 사용할 때 가장 유용한 특성만 선택하고 나머지는 무시해서 특성의 수를 줄이는 것이 좋다. 특성이 좋은지 확인하는 방법은 일변량 통계, 모델 기반 선택, 반복적 선택이 있다. 이 방법들은 모두 지도 학습 방법이기에 최적값을 찾으려면 타깃 값이 필요하고 데이터를 훈련 세트와 테스트 세트로 나눈 다음 훈련 데이터만 특성 선택에 사용한다. 일변량 통계 일변량 통계에서는 개개의 특성과 타깃 사이에 중요한 통계적 관계가 있는지를 계산한다. 그다음..........

[ML] 특성 자동 선택에 대한 요약내용입니다.

자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.



원문링크 : [ML] 특성 자동 선택