[빅데이터 분석] 결측치 처리(Missing Value) 가이드 by 빅재미


[빅데이터 분석] 결측치 처리(Missing Value) 가이드 by 빅재미

< 결측치처리 > 결측치(Missing Value)는 말 그대로 '비어있는 값'을 뜻하며,줄여서 'NA'라고 표현하기도 합니다.결측치는 데이터를 분석하는데에 있어서 매우 방해가 되는 존재로, 다음과 같은 문제를 야기합니다.통계 함수의 적용이 어려워진다.데이터 분석 결과에 왜곡을 줄 수 있다.그렇기에 결측치는 데이터 전처리 과정에서 반드시 처리해야 합니다. 결측치를 처리하는 방법에는 ① 대체하기(Imputation)② 제거하기(Delete) 이렇게 2가지가 있습니다.** 결측치를 모두 제거한다면 데이터의 막대한 손실을 줄 수 있고,다른 값으로 잘못 대체한다면 데이터에 편향이 생길 수 있으니 주의해야합니다.[..........

[빅데이터 분석] 결측치 처리(Missing Value) 가이드 by 빅재미에 대한 요약내용입니다.

자세한 내용은 아래에 원문링크를 확인해주시기 바랍니다.



원문링크 : [빅데이터 분석] 결측치 처리(Missing Value) 가이드 by 빅재미