[빅데이터] 하둡(Hadoop)에 Spark 설치하기

아파치 스파크(Apache Spark) 마태 자하리아가 UC 버클리에서 박사 과정 논문의 일부로 개발한 강력한 오픈소스 분산 쿼리 및 처리 엔진. 다양한 종류의 데이터 관련 문제, 예를 들어 반구조(semi-structured), 구조, 스트리밍 또는 머신 러닝/데이터 과학 관련 문제를 해결하기 위해 쉽고 빠르게 쓸 수 있는 프레임워크이다. 스파크는 데이터를 읽고, 변형하고, 합계를 낼 수 있으며, 복잡한 통계 모델들을 쉽게 학습하고 배포할 수 있다. 파이썬 pandas 라이브러리와 R의 data.frames 또는 data.tables를 이용하는 데이터 분석가, 데이터 과학자 또는 연구우너들에게 적합한 여러 라이브러리를 제공한다. 설치하기 1. dn01의 root 계정에서 [root@dn01 ~]# cd..

원문링크 : [빅데이터] 하둡(Hadoop)에 Spark 설치하기

등록된 다른 글

HttpServletRequest 과 HttpServletResponse 메소드 정리

[빅데이터] 하둡(Hadoop)에 Spark 설치하기

등록된 다른 글

HttpServletRequest 과 HttpServletResponse 메소드 정리

[Array 객체] 문자열 길이 또는 리스트 갯수 체크 : length 속성

[RPA] 기능(1) - 조건문 / 로그인 기능 만들기 / 데이터 스크래핑

[sts4] spring 에러 - The superclass

전자정부프레임워크 3.10 초기 설정하기

java.lang.IllegalStateException: Ambiguous mapping. Cannot map 'Controller' method

[React] You are running `create-react-app` 4.0.3, which is behind the latest release (5.0.1).

[RPA] Ui Path - 메일송수신 / 데이터 스크래핑 고급 / DB 연결

키자드 로그인

키자드

네이버 블로그

티스토리

커뮤니티