[빅데이터] 하둡(Hadoop)에 Spark 설치하기


[빅데이터] 하둡(Hadoop)에 Spark 설치하기

아파치 스파크(Apache Spark) 마태 자하리아가 UC 버클리에서 박사 과정 논문의 일부로 개발한 강력한 오픈소스 분산 쿼리 및 처리 엔진. 다양한 종류의 데이터 관련 문제, 예를 들어 반구조(semi-structured), 구조, 스트리밍 또는 머신 러닝/데이터 과학 관련 문제를 해결하기 위해 쉽고 빠르게 쓸 수 있는 프레임워크이다. 스파크는 데이터를 읽고, 변형하고, 합계를 낼 수 있으며, 복잡한 통계 모델들을 쉽게 학습하고 배포할 수 있다. 파이썬 pandas 라이브러리와 R의 data.frames 또는 data.tables를 이용하는 데이터 분석가, 데이터 과학자 또는 연구우너들에게 적합한 여러 라이브러리를 제공한다. 설치하기 1. dn01의 root 계정에서 [root@dn01 ~]# cd..


원문링크 : [빅데이터] 하둡(Hadoop)에 Spark 설치하기