[개념편] 결측치 처리, 이것만 알고가자! - 무작위 결측, NA, NaN, NULL, 데이터 전처리, 노코드 분석


[개념편] 결측치 처리, 이것만 알고가자! - 무작위 결측, NA, NaN, NULL, 데이터 전처리, 노코드 분석

안녕하세요, BigZami입니다:) 오늘은 데이터 전처리를 할 때 가장 많이 사용하는 기능인 데이터 결측치 처리에 대해 알려드리려고 합니다ㅎㅎ 어떤 분석방법을 사용하느냐도 물론 중요하지만, 데이터를 어떻게 전처리하는가에 따라서 최종 분석 결과에 크게 영향을 미칩니다 그러면 함께 결측치가 무엇이고 처리방법에는 무엇이 있을지 알아보도록 할게요~ 1. 결측치란? 결측치란 누락된 데이터 즉, 값이 표기되지 않은 값을 뜻합니다. 주로, NA, NaN, NULL로 표기되는데요. Python의 경우 "정해지지 않은 값"이란 의미로 함께 사용하지만, R의 경우에는 각각 의미가 다르게 사용되고 있습니다. ① NA (Not Available) : 결측값 ② NaN (Not a Number) : 0/0처럼 수학적으로 정의가 되지 않는 값 ③ NULL : 값이 존재하지 않음 NA와 NaN는 하나의 "값"으로 인식하는 반면, NULL은 값 자체가 없다고 생각하면 됩니다. 2. 결측치 종류 결측치는 아래의 ...


#bigdata #빅데이터 #무작위결측 #데이터전처리 #데이터분석솔루션 #데이터분석 #노코드분석 #결측치처리 #결측치 #Null #nocode #NaN #Na #MNAR #MCAR #MAR #dx #BigZami #빅재미

원문링크 : [개념편] 결측치 처리, 이것만 알고가자! - 무작위 결측, NA, NaN, NULL, 데이터 전처리, 노코드 분석