[AI] 데이터 전처리 - 결측치 처리 (Missing Value) / dropna, fillna, isnull, SimpleImputer


[AI] 데이터 전처리 - 결측치 처리 (Missing Value) / dropna, fillna, isnull, SimpleImputer

안녕하세요. SW 개발자 쪼맹 입니다. 오늘도 제가 알고 있는 소박한 지식을 공유 해보고자 합니다. 데이터 전처리 할 때 결측치 처리는 가장 중요한 부분 입니다. 결측치는 Missing Value 로 값이 없는 데이터를 뜻 합니다. 파이썬에서 결측치는 None / Numpy 는 np.nan 으로 표현되며 Pandas 에서는 NaN 으로 출력 됩니다. 통계적 기법에서는 결측치는 보통 제외, 무시하고 처리 한다고 합니다. 결측치 처리 방법은 보통 아래 키워드가 대표 됩니다. 결측치 제외 혹은 특정 값으로 대체 결측치 처리하는 대표적 함수를 살펴 보겠습니다. isnull : 누락된 데이터를 True, 정상적인 데이터는 False 로 반환 :df.isnull() notnull : 정상적인 데이터는 True, 누락된 데이터는 False 반환, isnull과 반대 : df.notnull() dropna : 누락된 데이터가 있을 때 해당 칼럼 혹은 로우를 삭제 fillna : 누락 된 데이터를 ...


#AI #sklearn #결측치 #데이터전처리 #딥러닝 #머신러닝 #머신러닝쪼렙 #왕초보AI #왕초보코딩 #전처리 #simpleimputer #notnull #NaN #AI기초 #DeepLearning #dropna #fillna #isnull #MachineLearning #mean #median #missingvalue #프로젝트

원문링크 : [AI] 데이터 전처리 - 결측치 처리 (Missing Value) / dropna, fillna, isnull, SimpleImputer