EDA(Explosive Data Analysis) 흐름 정리


EDA(Explosive Data Analysis) 흐름 정리

최근 몇 일간 빅데이터 분석에 관해 공부를 시작했다. 혼자서 이곳저곳 기웃거리면서 여러가지 개념들을 접했다. 방대한 양의 지식들이 있었고, 전문성을 요하는 수준까지의 깊이도 필요했다. 따라서 먼저 크게 흐름을 잡아보는 것을 목표로 공부해보았다. EDA란 탐색적 정보 분석이다. 주어진 정보에 대한 보편적이고 절대적인 규칙, 성질, 논리 같은 것이 있을 수 없다고 가정한다. 따라서, 말 그대로, 특성이라고 할 만한 것들을 탐색해가는 행위를 말한다. 수학적 전제들과, 기법들이 많지만 이 글에서는 큰 흐름만을 정리해두고, 차후에 조금씩 분석해볼 예정이다. 파이썬에서는 데이터 분석을 위한 여러가지 좋은 패키지를 제공한다. 패키지 정리는 나중에 여건이 되면 하기로..! - numpy : 행렬 연산을 빠르게 처리하기..


원문링크 : EDA(Explosive Data Analysis) 흐름 정리