교통 데이터 분석#3


교통 데이터 분석#3

여러 가지 분석을 하다 보면 Ensemble이나 Neural Net 같은 computational cost 가 많이 들어가는 복잡한 모델 대신, 단순한 regression 을 이용하더라도 Feature selection에 신경을 많이 쓰는 것이 매우 중요하다고 느낀다. 실제로 통계 작업을 하면서 교수님에게 굳이 non-linearity를 강제로 도입하려고 하지 말고 (화려한 모델링) 간과하고 지나갔을법한 변수들을 찾아내는 데 많은 신경을 쓰라는 소리를 듣는다. garbage in, garbage out이라는 아주 뻔하지만 정석인 소리답게 좋은 데이터를 찾기 위해 노력을 매우 매우 많이 해야 한다. 그래서 오늘은 교통 관련해서 데이터가 찾기 너무 어려워ㅠㅠ 하는 분들을 위해 글을 쓴다. 1. 한국도로공사 로드플러스 ROAD PLUS 교통속보 경로검색 혼잡구간 노선별교통정보 사고 정체 작업 기타 교통속보 전체보기 1 경부선 (서울방향) 정체 양재부근(415K)-반포(420K) 차량증가/...


#교통 #교통데이터 #교통데이터분석 #국가교통정보센터 #로드플러스 #운행기록분석시스템

원문링크 : 교통 데이터 분석#3