[파이썬 데이터 분석] 분산 분석의 정의와 유형(이론)


[파이썬 데이터 분석] 분산 분석의 정의와 유형(이론)

이번에는 분산 분석에 대해 알아보는데 여기서는 이론만 다루고 실습은 다음 포스팅에서 다뤄보자. 분산 분석(Analysis of Variance; ANOVA)은 독립 변수가 범주형, 종속 변수가 수치형일 때 사용하는 분석 방법론이다. 이전에 학습했던 독립 변수가 2개일 때 사용하는 t-검정은 분산 분석의 일종이다. 분산 분석의 정의 및 유형 분산 분석의 전체적인 흐름 분산 분석은 연속형 반응 변수와 범주형 설명 변수를 갖는 데이터를 분석하는 방법 중 하나이다. 분산 분석은 범주형 설명 변수의 집단(수준, 그룹)에 따라 연속형 반응 변수의 평균 차이가 있는지 통계학적으로 검정하는 방법인데, 이전에 살펴본 t-검정의 확장으로 설명 변수의 집단이 3개 이상인 경우에 이용할 수 있다. 공정 (설명 변수) A(집단 1) B(집단 2) C(집단 3) 불량률 (반응 변수) 반복 수 1 2.05 1.92 3.15 2 1.95 1.31 3.12 3 2.27 1.54 3.25 4 1.93 1.57 2....


#ANOVA #정규모집단 #일원분산분석 #연속형반응변수 #분산분석 #범주형반응변수 #데이터분석 #공변량 #검정통계량 #TSS #SST #SSE #MST #MSE #정규분포

원문링크 : [파이썬 데이터 분석] 분산 분석의 정의와 유형(이론)