[파이썬 데이터 분석] 상관 계수의 유형 및 공분산


[파이썬 데이터 분석] 상관 계수의 유형 및 공분산

상관 분석(correlation analysis)은 수치형인 두 변수 간의 관계를 분석하는 방법론이다. T-검정, 분산 분석, 선형 회귀분석이 모두 독립 변수와 종속 변수를 가정하는 반면에 상관 분석에서는 독립 변수, 종속 변수를 구별하지 않는다. 상관 분석은 다양한 데이터 분석을 실시하기에 앞서 데이터 간의 관계를 살펴보기 위해서 많이 활용된다. 상관 분석은 두 연속형 변수의 선형 상관관계를 분석하는 방법이다. 따라서 반응 변수의 설명 변수를 구분하는 것은 의미가 없다. 두 연속형 변수 간의 상관관계는 상관계수(correlation coefficient)를 통해 알 수 있다. 상관계수의 유형 위의 그림과 같이 X, Y 두 연속형 변수가 관찰되었다고 가정하자. 이때 두 변수가 선형 관계인지 파악하기 위해서는 각 변수의 평균선(-청색 실선, -적색 실선)을 기준으로 좌측 하단과 우측 상단에 점이 분포해 있는지 확인한다. 이를 위해서 좌측 하단과 우측 상단에 분포한 점들에는 '+'를 그...


#T분포 #표준편차 #스피어만상관계수 #상관분석 #상관계수 #모상관계수 #데이터분석 #귀무가설 #공분산 #검정통계량 #피어슨상관계수

원문링크 : [파이썬 데이터 분석] 상관 계수의 유형 및 공분산