분산과 표준편차의 통계적 의의/차이

사실 분산과 표준편차는 중학교때부터 용어는 들어왔지만, 왜 데이터 사이언스에서 이 2개의 개념이 빠지지 않는지 어떤 의미를 가지고 있는지 살펴보려합니다. 변이추정을 위한 분산/표준편차 데이터를 2차원으로 표현하면 하나의 점으로 표현되는데요. 이처럼 데이터의 위치는 데이터에 대한 주요한 정보를 가지고 있습니다. 이때 데이터가 얼마나 퍼져 있는지 산포도(dispersion= spread = scatter), 즉 데이터의 변이(variability) 추정을 위한 값이 '분산'과 '표준편차'입니다. 데이터가 얼마나 퍼져 있는지를 알려면 무엇을 기준으로 얼마나 퍼져있는지에 대한 개념이 필요합니다. 여기서 등장하는 개념이 '편차'입니다. 여기서 이 2개의 개념 역시 { 추정값 - 관측값 } = 편차를 근간으로 ..

원문링크 : 분산과 표준편차의 통계적 의의/차이

분산과 표준편차의 통계적 의의/차이

등록된 다른 글

Leetcode 65. Valid Number (조건검색, 정규표현식)

[Pandas] Groupby / Count / Value_counts 차이점 정리

캐글 GPU 아끼는 방법! (코드 첨부)

일상을 완전히 뒤바꿀 Microsoft Copilot의 등장(기능 정리)

빠르고 간편한 Pytorch Lightning 개념 정리

Nginx와 Apache 알아보기

Leetcode 207. Course Schedule 풀이 (Topological Sorting, BFS, DFS)

결정계수 R-squared 개념 및 응용 정리

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티