[파이썬 데이터 분석] 분산 분석의 정의와 유형(실전)


[파이썬 데이터 분석] 분산 분석의 정의와 유형(실전)

이전 포스팅에서 분산 분석의 정의와 유형의 이론에 대해서 다뤘는데 이번에는 실전으로 넘어가 보자. 예시를 들어서 최고 반도체는 최근 새로운 기계 도입을 위해 4개 업체를 선정했다.

실험적으로 각 공정의 일부 라인에 4가지 종류의 새로운 기계를 도입했다. 최고 반도체는 도입 결과로 얻어진 데이터를 이용해 어떤 업체의 제품을 이용하는 것이 품질 관리에 더 효과적인지 확인하여 공급 업체를 선정하고자 한다.

가설 H0 : 각 설비에 따른 불량률의 차이가 없다. H : 각 설비에 따른 불량률의 차이가 있다.

각 업체 기기별 불량률의 유의미한 차이가 있는지 확인한다. 즉, 4개 업체의 집단 간에 불량률(수치)의 차이를 검정하는 것이 일원 분산 분석이다. numpy와 pandas를 비롯해서 꽤 여러 개의 모듈을 import 한다. import numpy as np import pandas as pd from scipy import stats import statsmodels.api as sm ...


#p_value #데이터분석 #반도체공정 #분산분석 #불량률 #일원분산분석 #파이썬

원문링크 : [파이썬 데이터 분석] 분산 분석의 정의와 유형(실전)