1. Any suggestions ? - Any ideas? - Any regrets? -> r발음 - Any massages? - Any progress? -> 주문 받을때 - Any painful gas? 2. Ok. Jim, studies have shown green tea can help reduce the overgrowth of..
1. Well it couldn't have been worse. - It could not have been more than 60. - It could not have been nicer to her. - It couldn't have done it without you buddy. -> 어떤일을 처리했는데 혼자서는 못했..
1. Ok, what is it about me ? 2. Do I not look fun enough ? Is there something repellent about me ? 3. So, how was the party ? - How was the day ? - How was the day? - How was the audition? - How was..
1. Milion's of people suffer from the embarrasing condition of dandruff. 2. We got this E-mail from Jim who is looking for a natural remedy. 3. Hey Dr. Manny, I want to try green tea for my dandruff..
1. Hello, welcome to ask Dr. Manny - Welcome aboard! - Welcome to our conuntry. - Welcome to America - Welcome to our tropical Christmas party. - Welcome to the show. - Welcome to Amazing Discoverie..
/ɑ/ 입술을 벌린다. ex) 아파트 (x) - 입을 옆으로가 아닌 위아래로 벌린다. /ɔ/ 입술을 위아래로 타원형 송편 모양처럼 입을 옆으로가 아닌 위아래로 벌린다. ex) 로스쿨, 비코즈 (x) 을러 스쿨 /ɛ/ 에와..
빅데이터 그리고 데이터 사이언스의 미래 [ 빅데이터의 시대 ] - 디지털 환경의 발전과 함께 엄청난 '빅'데이터가 생성되고 있으며, 다양한 측면에서 활용되고 있다. - 빅데이터는 광고 모델 선정, 선거 예측,..
전략 인사이트 도출을 위한 필요 역량 [ 데이터 사이언스의 의미와 역할 ] - 데이터 사이언스란 데이터로부터 의미 있는 정보를 추출해내는 학문 - 데이터 사이언스는 정형 또는 비정형을 막론하고 인터넷, 휴..
빅데이터 분석과 전략 인사이트 [ 빅데이터 회의론의 원인 및 진단 ] - 투자 효과를 거두지 못했던 부정적 학습효과 -> 과거의 고객관계관리 (CRM) - 과거의 CRM의 부정적 학습효과 → 공포 마케팅이 잘 통..
미래의 빅데이터 [빅데이터의 활용 3요소] 1. 데이터 - 모든 것의 데이터화 - 모든 것을 데이터화 하는 현 추세로 특정 목적없이 축적된 데이터를 통한 창의적인 분석이 가능해져, 새로운 가치로 부상 2. 기술..
위기 요인과 통제 방안 [ 위기 요인 ] 1. 사생활 침해 - 개인정보가 포함된 데이터를 목적 외에 활용할 경우 사생활 침해를 넘어 사회, 경제적 위협으로 변형 - 예) 여행 사실을 트윗한 사람의 집을 강도가 노..
비즈니스 모델 [ 빅데이터 활용 사례 ] - 구글은 사용자의 로그 데이터를 활용하면서 검색 결과를 개선 - 월마트는 고객의 구매 패턴을 분석해 상품 진열에 활용 - 정부는 실시간 교통정보 수집, 기후 정보, 각종..
빅데이터의 가치와 영향 [ 빅데이터의 가치 산정이 어려운 이유 ] - 데이터 활용방식 : 데이터 활용 방식에서는 재사용이나 재조합, 다목적용 데이터 개발 등이 일반화되면서 특정 데이터를 언제, 어디서, 누가 활..
빅데이터의 이해 [ 빅데이터의 정의 ] - McKinsey : 빅데이터는 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터 - IDC : 빅데이터는 다양한 종류의 대규모 데..
덤벨프레스 (5x10) , - 무릎위에 올려놓고 일자로 누움 - 다리로 올려서 받혀주면서 하면됨. - 덤벨의 모양은 약간 ㅅ 자 모양 - 봉이 있다고 생각하고 명치 쪽에 내려놓아 준다. - 플라이처럼하는게 아니고 팔을..
[ 기업내부 데이터베이스 ] # 약어의 의미를 잘못 설명한 보기를 찾는 문제가 출제되니 기본적 내용을 숙지하자. ① 1980년대 OLTP (On-Line Transaction Processing) - 호스트 컴퓨터와 온라인으로 접속된 여러..
로우바스쿼트 (5x6) - 어깨가동범위가 허락하는 한 최대한 좁게 바를 잡는다. - 가슴을 열면서 등을 수축시키면서 들어가 상부승무근위에 바를 얹는다. - 가슴을 펴고 등을 견고하게 만든다. - 발은 어깨넓이 - 복..
벤치프레스 ( GVT 10x10) 1. 바벨을 잡는 그립의 너비 - 어깨의 1.5배 정도 - 그립 너비가 좁으면 가슴근육이 제대로 힘 쓸수 없다. - 손목 부상과 팔꿈치 부상을 당할 수 도 있다. 2. 바벨 잡기 - 손목이 꺽이지..
월-하체 (근력) 로우바스쿼트 (5x6) 스모데드리프트 (3x5) 스티프데드 (4x15) 레그컬 (4x15) 케이블크런치 + 행잉레그레이즈(묶어서3셋) 화-상체 (근비대1) 덤벨프레스 (5x10) , 풀업 (미해병대루틴 21주차) , 인..
대시보드 만들기 - 대시보드는 하나 혹은 그 이상의 '뷰'를 나타냄. - 대시보드의 뷰는 워크시트를 보여주는 창이라 이해하면 된다. - 서로 다른 뷰를 한 화면에 통합하여 보여주는 것은 물론 사용된 필터와 범례..
데이터 원본 확인하기 상하위 표시 - 필터를 사용하여 매출의 상위 10개만 보자 결과 두개를 동시에 보기 - 행에 추가하면 위 아래로 보여준다. 추세선 나타내기 추세선 그래프 그리기 - 추세선 -> 추세선 편..
서식 설정 막대그래프의 수치 및 색상 레이블 표시하기 - 레이블의 글꼴이나 텍스트도 바꿀 수 있다. 시트와 행렬에 대한 서식 변경 그래프 주석 추가 마크 추가 - 우클릭 -> 주석추가 -> 마크 색상을 이용하..
이미지 추출하기 - 우클릭 -> 복사 -> 이미지 데이터 값 복사하기 - 우클릭 -> 복사 -> 데이터값 PDF 파일형식으로 젖아 - 메뉴 -> 파일 ->PDF로 인쇄 데이터 보기를 통하여 데이터 내보내기(엑셀파일) - 우클릭..
필터 - 원하는 지역의 값만 선택 하겠다 . - 우클릭 -> 필터 표시 오른쪽에 범례가 나타난다. 퀵 필터 _ 필터 제목 - 퀵필터 메뉴의 목록, 드롭다운, 슬라이더 방식을 선택 - 필터 제목을 변경 가능하다. 퀵 필..
개별값 확인을 위한 메뉴 - 메뉴 -> 분석 -> 측정값 집계 체크 해지하기 유지와 제외하기 - 원하는 막대그래프를 클릭후 Ctrl 을 누르면 유지나 제외하기 기능을 사용가능하다.
데이터 시각화 - 데이터 시각화 : 데이터 분석 결과를 쉽게 이해할 수 있도록 시각적으로 표현하고 전달하는 과정 - 데이터 시각화의 목적 : 그래프라는 수단을 통해 정보를 명확하고 효과적으로 전달. 정렬 - 내..
표현 방식 사용하기 - 누적 막대바 그래프로 바꿔 보자. 크로스 탭을 위한 인터페이스 - 열 : Order Date (연도 -> 분기 -> 월 까지 확장 ), 행 : Category, Sales - 연도를 색상에 넣고 월만 남기고 다 삭제 -..
데이터 불러오기 - 지정된 데이터 원본 -> Sample_Superstore 불러오기 그래프 그리기 - 행에 Region , Quantity 드래그 - 열에 Category, Segment 드래그 막대 그래프에 색깔 넣기 - 마크 하단에 위치한 색상..
테블로 설치와 활용 - 연결 패널 : 태블로와 연동하여 쓸 수 있는 데이터의 종류를 보여줌. 데이터베이스, 온라인 데이터소스 ,텍스트파일, 엑셀파일 등, 여러개의 엑셀 파일은 조인하여 사용 가능. - 열기 패널..
데이터 분리¶ 데이터 분리 관련 함수¶ 데이터를 특정 구간별로 나누는 방법에 대하여 알아본다. 특히 sample(), split(), ifelse() 함수가 이에 해당된다. sample()¶ 데이터에서 임의로 샘플을 추..
데이터 프레임 처리 2¶ 데이터 확인¶ setwd("C:/khu") d<- read.csv("test.csv") d item price sales 풍선 100 200 펌프 3000 5 테이프 300 20 플래카드 20000 1 색종이 150 100 d[,-2] # 특정 컬럼..
데이터 프레임 처리¶ 데이터 프레임 생성 1 : 파일에서 fileEncoding = "euc-kr" setwd("C:/Users/KIIXXI/Documents/khu") read.csv("test.csv") A data.frame: 5 × 3 item price sales <fct> <int>..
Feature Engineering¶ 데이터 다듬기¶ 전처리는 데이터를 분석하기에 적합한 형태로 만드는 것을 말한다. 수집된 데이터에서 필요한 속성을 선택해 데이터를 재구성, 결측값 및 이상치 처리, 변수를 조..
집단 차이 분석¶ 추론 통계와 집단 차이 분석¶ 추론통계는 표본을 통해 모집단의 특성을 분석한다. 추론통계 함수를 이용하여 모집단과 표본 또는 두 집단 사이의 차이를 분석하는 방법을 살펴보자. 일..
상관분석¶ 상관계수¶ 상관분석은 두 변수 사이의 관련성을 파악하는 방법이다. 대표적으로는 피어슨 상관 계수로 상관 분석을 한다. 피어슨 상관계수는 한 변수가 커질때 다른 변수가 함께 커지는 공분..
가설검정¶ 독립성 검정¶ chisq.test(xtabs (~x + y, data) 두변수 사이에 상관관계가 있는지 살펴본다. 성별과 운동략의 차이를 기록한 MASS::survey 데이터를 본다. library(MASS) data("survey") head..
표본 추출¶ 단순임의추출 1¶ - sample(x,n) - 동일한 확률로 표본을 추출한다. x <- c(1:10) sample(x,5) sample(x,5, replace= TRUE) # 얘는 중복도 가능한 복원추출 7 6 3 5 10 8 8 1 5 3 단순..
가설설정¶ 추론통계의 의의¶ 통계 조사에서 조사대상이 되는 전체 집단을 모집단이라고 한다. 모집단에서 뽑은 일부 자료를 표본이라고 한다. 이 표본으로부터 모수와 관련된 통계량들의 값을 계산하고..
분포의 대칭성¶ 비대칭도 구하기¶ 왜도와 첨도¶ 왜도는 평균을 중심으로 한 분포의 비대칭 정도를 나타낸다. 기울어진 방향과 정도를 나타내는 양을 나타낸다. S > 0 면 오른쪽 방향으로 꼬리가 긴..
데이터 요약¶ plot¶ 데이터를 요약하지 않고, 그래프로 그리면 다음과 같다. 데이터의 퍼짐의 정도를 시각적으로 확인할 수 있다. 하지만 특징을 한마디로 말하기는 어렵다. x <- c(6.5,4.0,7.1,8.3,5.4..
데이터의 위치¶ 구간별 데이터 파악¶ 사분위수(quantile)¶ 사분위수란 자료를 크기 순으로 배열하고, 누적 백분율을 4등분한 각 '점'에 해당하는 값을 말한다. 0%, 25%(1사분위) , 50%(2사분위), 7..
자료의 분산¶ 분산¶ 분산이란 자료가 얼마나 퍼져 있는지를 의미한다. 측정방법 : 범위, 분산, 표준편차 범위(range)¶ 범위란 데이터 값들 중에서 최대 데이터와 최소 데이터의 차이를 말한다. wei..
중심위치 측정¶ 기술통계 의의¶ 빅데이터 분석을 위해서는 기존 사실에 대한 객관적인 수치를 찾아내려는 기술 통계를 기초로 한다. 이를 통해서 데이터의 특징이 수량화되어 정리 된다. 분석자는 데이..
R 데이터 파일 관리¶ R 프로그램 설정 경로 확인¶ getwd() 'C:/Users/KIIXXI' getwd() : 현재 작업중인 파일 경로(디렉토리) 확인 setwd("C:/Users/KIIXXI/Documents/khu") setwd() : 특정위치를..
R 데이터 구조¶ 벡터 (Vector) 행렬(Matrix) 리스트 (List) 배열 (Array) 데이터 프레임 (Data Frame) 데이터 테이블 (Data Table) 벡터 (Vector)¶ x<-c(1,2,3,4,5) # 벡터 생성 x[2] # 벡터의 2번째..
R 프로그래밍 기초¶ Hello World 출력¶ print("Hello World!") [1] "Hello World!" 패키지 사용.¶ randomForest를 로드해서 사용해 봅시다. install.packages("randomForest") # ""안에 넣어야..
[용어의 연혁] - 1950년대 : 미국 군대의 군비 상황을 집중하기 위하여 컴퓨터 도서관을 설립. '데이터의 기지' 라는 뜻의 데이터 베이스 탄생 - 1963년 초 : 미국 'SDC'가 개최한 심포지엄에서 데이터베이스라는..
[ 데이터의 정의와 특성 ] # 정성적 데이터와 정량적 데이터의 차이점을 묻는 문제 1. 데이터의 정의 - 데이터라는 용어는 1646년 영국 문헌에 처음 등장. - 라틴어인 dare(주다)의 과거 분사형 ' 주어진 것 ' 이..