변이 통계량 - 퍼짐 정도


변이 통계량 - 퍼짐 정도

변이 통계량 변이 통계량은 데이터의 분포가 얼마나 퍼져있는지를 나타내는 통계량으로, 대표적으로 분산(variance), 표준편차(standard deviation), 범위(range), 사분위간 범위(interquartile range), 변동계수(coefficient of variation) 등이 있다. 1. 분산(variance)과 표준편차(standard deviation) 분산은 각 데이터와 평균값의 차이를 제곱한 값을 모두 더한 후 데이터의 개수로 나눈 값이다. 즉, 데이터가 평균값 에서 얼마나 멀리 떨어져 있는지를 나타내는 지표이다. 분산은 제곱의 형태이기 때문에 실제 데이터와 차이가 크게 나는 이상치(outlier)에 민감하게 반응한다. 이러한 문제를 해결하기 위해 표준편차를 사용하는데, 이는 분산값의 제곱근이다. 즉, 분산값에 루트를 씌워서 계산하는 것이다. 표준편차는 분산과 달리 실제 데이터와 더 가까이 위치하며, 이상치에 대한 영향을 덜 받는다. 2. 범위(rang...


#범위 #변동계수 #변이통계량 #통계학 #표준편차

원문링크 : 변이 통계량 - 퍼짐 정도