결측치, 결측값 의미와 해결 방법 (Python)


결측치, 결측값 의미와 해결 방법 (Python)

이번 시간은 데이터 분석을 진행할 때 필연적으로 겪게 되는 결측치에 대해 알아보겠습니다. 결측치의 의미와 해결 필요성 결칙치(Missing Value)란 값이 없는 데이터를 말합니다. 결측치의 표시는 NA, null, NaN, N/A, #N/A와 같이 다양한 형태로 표현됩니다. 결측값은 데이터 분석을 할 때 아주 흔하게 생기는 문제로 이 부분이 해결되지 않으면 정상적인 분석이 이루어지지 않습니다. 데이터 분석에서 데이터 전처리는 상당한 비중을 차지합니다. 현실 세계에서의 많은 데이터들은 기록 누락, 미응답, 수집 오류 등 많은 사유들로 결측값이 포함되어 있습니다. 따라서 데이터가 비어있는 부분 없이 완벽하게 채워져 있는 경우는 드물게 됩니다. 결측치를 단순하게 제거한다면 많은 양의 정보가 손실될 뿐 아니라 분석 결과에 편향(bias)가 발생될 수 있어 경우에 따라 결측값을 해결하는 방법을 달리해야 합니다. 결측치(Missing Value) 확인 방법 아래와 같이 이름과 수학 성적, ...


#dropna #fillna #N #결측치 #데이터분석 #데이터분석결측치 #파이썬

원문링크 : 결측치, 결측값 의미와 해결 방법 (Python)