* 분석 변수 처리 (1) 변수 선택 - 통계적 분석 결과의 신뢰성을 위해 데이터와 변수는 많으면 좋지만, 필요 이상의 많은 데이터를 요구할 수 있다. 예를 들어... 회귀분석의 사례 : 회귀모형에 의한 분석시 결과 도출을 위해 사용된 독립변수 m개의 설명력이 R2=89% 일 때, 더 작은 n개만 사용해도 동일 설명력이 나온다면 변수의 효율적 선택 필요성이 증가한다. 변수별 모형의 분류 ① 전체 모형(FM) : 모든 독립변수를 사용한 모형 ② 축소 모형(RM) : 전체 모형에서 변수의 개수를 줄여서 얻은 모형 ③ 영 모형(NM) : 독립변수가 하나도 없는 모형 변수의 선택 방법 ① 전진 선택법 : 영 모형에서 시작하여 모든 독립변수 중 종속변수와 단순상관계수의 절대값이 가장 큰 변수를 분석모형에 포함시키는 것. 부분 F 검정(F test)을 통해 유의성 검증 시행하는데, 가장 큰 F 통계량을 가지는 모형을 선택하고 유의하지 않은 경우는 변수 선택 없이 과정 중단. 한번 추가된 ...
#단계적선택법
#요약변수
#요인분석
#전진선택법
#정규화
#주성분분석
#차원축소
#파생변수
#후진선택법
#오버샘플링
#역수변환
#로그변환
#분석변수
#빅데이터
#빅데이터분석기사
#빅데이터자격증
#빅분기
#빅분기필기
#언더샘플링
#후진소거법
원문링크 : 빅데이터분석기사 필기 공부 day-14