빅데이터분석기사 필기 공부 day-14


빅데이터분석기사 필기 공부 day-14

* 분석 변수 처리 (1) 변수 선택 - 통계적 분석 결과의 신뢰성을 위해 데이터와 변수는 많으면 좋지만, 필요 이상의 많은 데이터를 요구할 수 있다. 예를 들어... 회귀분석의 사례 : 회귀모형에 의한 분석시 결과 도출을 위해 사용된 독립변수 m개의 설명력이 R2=89% 일 때, 더 작은 n개만 사용해도 동일 설명력이 나온다면 변수의 효율적 선택 필요성이 증가한다. 변수별 모형의 분류 ① 전체 모형(FM) : 모든 독립변수를 사용한 모형 ② 축소 모형(RM) : 전체 모형에서 변수의 개수를 줄여서 얻은 모형 ③ 영 모형(NM) : 독립변수가 하나도 없는 모형 변수의 선택 방법 ① 전진 선택법 : 영 모형에서 시작하여 모든 독립변수 중 종속변수와 단순상관계수의 절대값이 가장 큰 변수를 분석모형에 포함시키는 것. 부분 F 검정(F test)을 통해 유의성 검증 시행하는데, 가장 큰 F 통계량을 가지는 모형을 선택하고 유의하지 않은 경우는 변수 선택 없이 과정 중단. 한번 추가된 ...


#단계적선택법 #요약변수 #요인분석 #전진선택법 #정규화 #주성분분석 #차원축소 #파생변수 #후진선택법 #오버샘플링 #역수변환 #로그변환 #분석변수 #빅데이터 #빅데이터분석기사 #빅데이터자격증 #빅분기 #빅분기필기 #언더샘플링 #후진소거법

원문링크 : 빅데이터분석기사 필기 공부 day-14