분포의 특성과 요약


분포의 특성과 요약

분포는 중심, 산포, 상관성 등의 특징을 가진다. 중심을 요약하기 위해서, 쉽게 표현하면 쉽게 표현하고, 가시적으로 표현하기 위해서 평균, 중앙값 ,최빈수 등을 사용한다. 산포, 퍼진 정도를 설명하기 위해서 최댓값에서 최솟값을 빼는 범위, 75백분위수와 25백분위수의 차를 의미하는 IQR, 그리고 표준편차를 사용한다. 상관성을 표현하기 위해서 공분산과 상관계수를 사용하고, 이외의 특징으로 왜도와 첨도도 존재한다. 물론 표본과 모집단의 차이가 있기에 표현도 다르다 다음 표는 그것을 요약한 것이다. 앞서 언급한 최빈수, 중위수, 평균에 대해 먼저 설명하겠다. 최빈수는 분포가정이 어렵고, 한번의 결정으로 평가가 결정될 때 사용한다. 수학적으로 표현하면 다음과 같다. 한편 중위수는 말그대로 분포 전체에서 가장 중간에 있는 수를 뜻한다. 수학적으로 표현하면 다음과 같다. 마지막으로 표본 평균은 확률과 변수의 곱으로 표현되는 값이다. 가장 우리에게 친숙한 단어이다. 수학적으로는 다음 포스팅을 ...


#IQR #이상치 #주식 #중위수 #첨도 #최빈수 #편차 #평균 #평균vs중위수 #왜도 #어떤값 #상관계수 #공분산 #모집단 #모평균 #범위 #부동산 #분산 #분포 #사분위수범위 #표본

원문링크 : 분포의 특성과 요약