상관 관계 (피어슨, 스피어만)


상관 관계 (피어슨, 스피어만)

DataFrame.corr()로 특정 상관계수를 지정하지 않으면 default는 피어슨 상관 관계를 말한다 피어슨 상관 계수는 독립 변수와 종속 변수 간의 선형 관계 분석, 스피어만 상관 계수는 독립 변수와 종속 변수 간의 단조적 관계 (선형/비선형 관계 공존)를 분석 하는데 사용한다 [피어슨 상관관계 - 수치적 데이터의 상관관계 분석 ] Pcorr = np.corrcoef(x, y)[0, 1] 상관 계수 (Pcorr) = cov/np.sqrt (x_devsqsum * y_devsqsum) cov = np.sum( (x-np.mean(x)) * (y-np.mean(y))) x_devsqsum = np.sum( (x-np.mean(x))**2 ) y_devsqsum = np.sum( (y-np.mean(y))**2 ) - cov - x와 y의 공분산 (두 변수간의 관계를 나타내는 지표, 양의 상관관계/음의 상관관계) - x_devsqsum : x 변수의 편차 제곱의 합 - x_devs...



원문링크 : 상관 관계 (피어슨, 스피어만)