두 변수의 관계분석


두 변수의 관계분석

데이터는 쉽게 나누면 범주형 데이터와 수량형 데이터로 나뉜다. 범주형 데이터 간의 관계, 수량형 데이터 간의 관계, 그리고 범주형과 수량형 데이터의 관계를 분석할 때 사용해야 하는 방식이 다르다. 이번에는 어떠한 상황에서 어떠한 방식을 사용하는지에 대해 알아보도록 하겠다. 범주형 데이터의 관계 분석 범주형 데이터는 분할표를 이용하여 관계를 분석해야 한다. 범주가 r*c개 있을 때, 서로 겹치는 부분의 빈도수를 따져볼 수 있다. 가장 대표적인 예시가 바로 위의 상황이다. 결혼 상태와 성별, 그리고 지역에 따라서 범주형 데이터를 나누었다. R에서는 저렇게 하기 어렵다. 때문에 xtabs 명령어를 사용한다. 하나하나 해석해보자. 먼저 빈도수를 순서대로 작성했다. 결혼 여부와 성별 여부에 따라서 총 2*2개의 표가 생기기 때문에 rep()을 사용하여 총 4번 반복을 해주었다. 결혼 여부에서는 결혼했는가에 따라서 빈도수를 6개씩 가지며, 성별에서는 3,3 쌍이 2개 필요하다. 이후 margi...


#ggpairs #통계자료분석 #통계 #수량형 #산점도 #범주형데이터 #범주형 #데이터 #R #mosaic #ggplot #통계학

원문링크 : 두 변수의 관계분석