[파이썬] 판다스로 Z-score(표준점수) 계산하고 히스토그램으로 분포 확인보기, sub(), mean(), div(), std(), abs() 함수 활용


[파이썬] 판다스로 Z-score(표준점수) 계산하고 히스토그램으로 분포 확인보기, sub(), mean(), div(), std(), abs() 함수 활용

판다스 함수를 활용하여 Z-score를 아주 간단하게 계산할 수 있다. (Z-score, 즉 표준점수에 관련한 이론은 제작년에 티스토리에 포스팅해 놓았음) [데이터전처리] Outlier(이상치/이상값/특이값/특이치 등) 탐지 방법(detection method) : 2. Z-score 방식 with 이상치 탐지 두번째 시간은 Z-score 방식에 대해서 알아본다. Z-score는 통계에서 중요한 개념이고, 다른 이름으로 Standard-score라고도 한다. 이 방법은 변수에 가우스 분포가 취하고 있다는 가정으로 시작하고.. claryk.tistory.com 티스토리에는 코드블록에 파이썬으로 Z-score 공식대로 진짜 계산하는 것으로 올려놨는데;; 판다스로 다시 간편 버전의 코드를 살펴보자. 오늘의 예제 데이터는 타이타닉!! 중에서도 수치 데이터인 'age' 컬럼이다. 분포도 확인해보자. df = sns.load_dataset('titanic') sns.displot(df["age...


#python #파이썬 #assign #데이터분석 #데이터분포 #데이터프레임 #이상값확인 #판다스 #표준점수계산 #zscore #sub #std #pandas #mean #div #Distribution #DataFrame #DataAnalysis #표준편차

원문링크 : [파이썬] 판다스로 Z-score(표준점수) 계산하고 히스토그램으로 분포 확인보기, sub(), mean(), div(), std(), abs() 함수 활용