파이썬 결측값, 중복값 처리 방법을 공유합니다 (Pandas, Numpy, isnull, fillna, 정규화)


파이썬 결측값, 중복값 처리 방법을 공유합니다 (Pandas, Numpy, isnull, fillna, 정규화)

안녕하세요 우물 안 개구리 풍대리 입니다 자 료 수 집 을 할 때 . . . 생각보다 문제가 많아요 1. 결측값 문제 2. 중복값 문제 3. 단위 통일 문제 4. 구간나누기 (A,B,C) . . . 위의 문제들을 정제 정제해야 깨끗한 데이터가 됩니다 . . . 좀 귀찮은 여정이지만 . . . . 이 단계가 매우 중요합니다 . . . . 출발 ! 1. 결측값 결측값 : 비어있는 값 결측값이 골치아픈 문제예요 비어있는 값이 정보를 왜곡시키거든요 . . . . 그래서 예쁘게 손질해야합니다 . . . . 결측값을 정리하는 방법은 1. 결측값을 모두 지운다 2. 평균값으로 채운다 어떤 것으로 할지 고민이 필요해요 (경험이 중요합니다) . . . 현실에서 1개의 데이터도 정말 소중해서 . . . 버릴 수가 없답니다 . . . 그래서 풍대리는 2번 평균값, 중앙값으로 채우길 좋아해요 (상황보고 판단필요) . . . 방향을 정하면 결측값을 찾고 채우면 되는데 . . . . 그 런 데 . . . 일...



원문링크 : 파이썬 결측값, 중복값 처리 방법을 공유합니다 (Pandas, Numpy, isnull, fillna, 정규화)