판다스 함수를 활용하여 Z-score를 아주 간단하게 계산할 수 있다. (Z-score, 즉 표준점수에 관련한 이론은 제작년에 티스토리에 포스팅해 놓았음) [데이터전처리] Outlier(이상치/이상값/특이값/특이치 등) 탐지 방법(detection method) : 2. Z-score 방식 with 이상치 탐지 두번째 시간은 Z-score 방식에 대해서 알아본다. Z-score는 통계에서 중요한 개념이고, 다른 이름으로 Standard-score라고도 한다. 이 방법은 변수에 가우스 분포가 취하고 있다는 가정으로 시작하고.. claryk.tistory.com 티스토리에는 코드블록에 파이썬으로 Z-score 공식대로 진짜 계산하는 것으로 올려놨는데;; 판다스로 다시 간편 버전의 코드를 살펴보자. 오늘의 예제 데이터는 타이타닉!! 중에서도 수치 데이터인 'age' 컬럼이다. 분포도 확인해보자. df = sns.load_dataset('titanic') sns.displot(df["age...
#python
#파이썬
#assign
#데이터분석
#데이터분포
#데이터프레임
#이상값확인
#판다스
#표준점수계산
#zscore
#sub
#std
#pandas
#mean
#div
#Distribution
#DataFrame
#DataAnalysis
#표준편차
원문링크 : [파이썬] 판다스로 Z-score(표준점수) 계산하고 히스토그램으로 분포 확인보기, sub(), mean(), div(), std(), abs() 함수 활용