머신러닝 기초 3 - 다중공선성


머신러닝 기초 3 - 다중공선성

저번 시간 마지막에 변수가 증가할수록 F-검정과 R-squared값을 신뢰할 수 없어진다고 하였습니다.이것을 이해하려면 다중공선성이 무엇인지 알아야 하죠.이번시간에 다중공선성에 대해 알아보겠습니다.다중공선성아래 그림을 보시면 y의 변동성은 정해져 있는데, y를 설명하는 x들의 변동성은 제곱합 형태라 변수가 추가될수록 변동성이 증가합니다.즉 제곱합 형태로 검정하는 F검정의 특성상 변수가 추가되면 자연스레 기각하기 쉬워지고, R-squared도 커집니다.변수가 증가할수록 F검정과 R-squared값을 신뢰할 수 없게 됩니다.다중공선성이란 독립변수들이 강한 선형관계를 가지고 있는 상태를 말합니다.아래 그림을 보시면 변수가 하나일..........

머신러닝 기초 3 - 다중공선성에 대한 요약내용입니다.

자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.



원문링크 : 머신러닝 기초 3 - 다중공선성