dplyr


dplyr

excel, google sheet등 다양한 소프트 웨어가 데이터를 위해 존재한다. SQL, Oracle, excel 등은 데이터를 저장하는 용도로 주로 사용한다. 반면, SAS, R, Python은 데이터를 가공하고, 분석하는 데에 초점을 둔다. dplyr은 R에서 데이터 저장을 용이하게 하기 위해 만든 것이다. 이번엔 이에 대해 알아보겠다. 파이프: %>% %>%은 ctrl + shift + m을 누르면 나오는 기호이다. %>%는 주로 다음과 같은 형태로 사용한다. 이 경우 두번째 줄의 식은 log(x)와 동일하다. 이렇게 사용하는 이유는 가독성 때문이다. 아래 두가지 예시를 보자. 두 예시는 동일한 값을 출력한다. 하지만 아래가 더 읽기 쉽다. x를 평균 때리고 그것의 제곱근을 취한 것이다. 따라서, %>%은 가독성을 위해 사용하는 것이라 할 수 있다. dplyr의 기본 함수 SQL등에서 실시하는 데이터 저장을 유사하게 하기 위해 dplyr에는 기본 함수들이 내장되어 있다. s...


#dataset #파이프라인 #파이프 #통계학 #summarise #Rstudio #R #mutate #mtcars #grouping #groupby #dplyr #함수

원문링크 : dplyr