'데이터 분석의 힘' 독서 후기 - 1


'데이터 분석의 힘' 독서 후기 - 1

데이터 분석을 위해 #pandas 와 #spark 등을 공부했는데 , 이런 툴을 이용해서 제대로 된 분석을 할 수 있는 기초가 부족하여 #데이터분석의힘 이라는 책을 읽고 후기를 남기려 한다. 책 줄거리만 적는게 아니라, 내용에 대한 나의 의견도 적는 것임을 밝힌다. 1. 데이터의 상관관계는 인과관계가 아니다. #데이터분석의 힘 신문 기사를 읽어보면 xx 회사는 올해 매출이 xx 만큼 올랐다. 참고로 작년에 xx 사장을 영입했다.. 와 같이 매출증가를 사장 영입의 결과. 즉 서로 인과관계라는 뉘앙스로 적힌 기사들을 많이 본다. 이런걸 볼 때마다 객관적이지 않은 기사라고 생각이 들었다. 매출 증가의 원인이 엄청 많을 것인데 왜 xx 사장 영입이 주요 원인인것처럼 적는걸까? 이 기자는 요인들을 다 분석하고나 이런 글을 적은걸까? 이런 나의 생각과 일치하는 문구인것 같다. "데이터의 상관관계는 인과관계가 아니다".. 이 책에서는 예로 "광고를 했더니 아이스크림 매출이 올랐다', 전기요금을 ...


#pandas #spark #데이터분석의힘 #AB테스트 #블록무작위배정 #분석 #무작위비교시행 #무작위대조시험 #랜덤화비교시험 #데이터 #data #충화무작위배정

원문링크 : '데이터 분석의 힘' 독서 후기 - 1