키자드에 등록된 changeangel의 네이버 블로그 포스트 목록

changeangel의 등록된 링크

changeangel로 등록된 네이버 블로그 포스트 수는 97건입니다.

2023년 첫 기부 (네이버 해피빈 기부) [내부링크]

매년 작게나마 기부활동을 이어왔지만 2022년에는 제대로 된 기부를 하지 못한 것 같아 마음의 짐을 느꼈습니다. 제가 가진 것은 온전히 저의 것이 아닌 조금은 나눠야 하는 것이라 생각하며 살고 있습니다. 지금의 삶에 대한 사회와 세상에 대한 부채감과 우리 가족 건강하고 별 탈 없이 잘 지내는 것에 감사한 마음에 늘 기부해야겠다는 생각을 하고 살지만 가끔 모른 척 넘어간 것에 마음이 쓰입니다. 사람들과 만날 때 밥값은 제가 낸다든지 누군가를 대접할 때는 조금 과하게 사는 등 지갑에서 돈 나가는 것에 너무 박하지 않으려 노력하고 있습니다. 물론 지금의 환경에서 아이 둘을 키우며 4가족의 가장으로 산다는 것이 만만치 않은 탓에 가족의 생활비와 아이들의 교육비를 내고 나면 풍족한 생활은 뒤로 미뤄야 합니다. 하지만 감사하게도 1월이 되어 여러 가지 명목으로 회사에서 약간의 보너스가 지급되어 용기 내어 약간의 돈을 기부했습니다. 약자를 위한다거나 정의로운 사회를 위한다는 거창함보다는 그저 제

반도체 취업 필수 통계 프로그램 (삼성, LG, 하이닉스) [내부링크]

안녕하세요. 16년 차 데이터 분석가 플래워드입니다. 오늘은 삼성과 LG, 하이닉스를 비롯한 국내 대기업뿐 아니라 세계적인 기업인 인텔과 애플, AMD에서 사용하는 통계 프로그램을 알려드리겠습니다. JMP JMP라는 프로그램이 생소하신 분들이 많을 거라 생각합니다. 학교나 일반적인 기업에서는 비용과 라이선스 문제로 잘 사용하지 않지만 국내/외 반도체를 비롯한 다양한 제조업체에서는 필수적으로 사용하는 프로그램입니다. https://www.jmp.com/ Redirecting ... www.jmp.com JMP 사이트에 들어가면 JMP에 대한 다양한 자료들이 준비되어 있고, 평가판도 다운로드할 수 있습니다. 반도체 제조업 필수 통계 프로그램 삼성과 LG, 하이닉스를 비롯한 국내 유수의 기업에서는 JMP를 사용하여 데이터를 분석하고 통계분석을 진행하고 있습니다. 편리한 인터페이스와 시각적으로 우수한 그래프로 인해 사용하는 업체가 점점 늘어나고 있습니다. 하지만 무엇보다 중요한 것은 글로벌

엑셀 화살표 동작하지 않을 때 조치 방법 [내부링크]

엑셀을 사용할 때 셀 이동은 필수적으로 수행해야 합니다. 이럴 때 대부분 키보드 화살표를 이용하여 셀 이동을 하는데요. 가끔 화살표를 아무리 눌러도 셀이 이동되지 않을 때가 있습니다. 화살표로 이동되지 않을 때 조치할 수 있는 방법들에 대해 설명드리겠습니다. 화살표가 동작하지 않는 이유 화살표가 동작하지 않는 이유 중 가장 흔한 것은 키보드에 Scroll Lock이 설정된 경우입니다. 아래 엑셀의 아랫부분을 확인하면 'Scroll Lock'으로 표시됩니다. 엑셀에 Scroll Lock 여부를 알기 위해서는 엑셀 아래 붉은 박스로 표시한 곳을 선택한 후 오른쪽 마우스를 클릭합니다. 그러면 상태 표시줄 사용자 지정이 나타납니다. 아래로 내려보면 'Scroll Lock'을 선택할 수 있는데 이것을 선택하면 'Scroll Lock' 여부가 상태 표시줄에 표시됩니다. ScrLk 버튼 누르기 키보드 자체의 기계적인 결함이 아닌 경우 ScrLk 버튼을 누르면 화살표가 제대로 동작합니다. 일부 노

결측치, 결측값 의미와 해결 방법 (Python) [내부링크]

이번 시간은 데이터 분석을 진행할 때 필연적으로 겪게 되는 결측치에 대해 알아보겠습니다. 결측치의 의미와 해결 필요성 결칙치(Missing Value)란 값이 없는 데이터를 말합니다. 결측치의 표시는 NA, null, NaN, N/A, #N/A와 같이 다양한 형태로 표현됩니다. 결측값은 데이터 분석을 할 때 아주 흔하게 생기는 문제로 이 부분이 해결되지 않으면 정상적인 분석이 이루어지지 않습니다. 데이터 분석에서 데이터 전처리는 상당한 비중을 차지합니다. 현실 세계에서의 많은 데이터들은 기록 누락, 미응답, 수집 오류 등 많은 사유들로 결측값이 포함되어 있습니다. 따라서 데이터가 비어있는 부분 없이 완벽하게 채워져 있는 경우는 드물게 됩니다. 결측치를 단순하게 제거한다면 많은 양의 정보가 손실될 뿐 아니라 분석 결과에 편향(bias)가 발생될 수 있어 경우에 따라 결측값을 해결하는 방법을 달리해야 합니다. 결측치(Missing Value) 확인 방법 아래와 같이 이름과 수학 성적,

표본오차와 비표본오차 의미 [내부링크]

이번 시간은 통계에서 말하는 오차 (error)에 대한 개념과 표본오차와 비표본 오차에 대해 알아보겠습니다. firmbee, 출처 Unsplash 오차(error)는 추정값과 참값의 차이입니다. 통계 및 데이터 분석에서는 이 오차가 작을수록 효과적인 데이터 분석이라고 할 수 있습니다. 이 오차를 다시 표본오차와 비표본오차로 분해할 수 있는데 각각의 의미에 대해 자세하게 알아보겠습니다. 오차는 표본오차와 비표본오차로 나눌 수 있습니다. 표본오차 표본오차는 자료 전체가 아닌 일부의 표본만 뽑아 조사했기 때문에 발생하는 오차입니다. 이런 표본오차는 과학이든 사람이든 모든 상황에서 필연적으로 나타납니다. 예를 들면 상자의 사과를 꺼내는 경우를 들 수 있습니다. 사과 10개 꺼내어 무게 평균을 확인하니 395g이고 상자의 모든 사과의 평균이 400g이라면 표본오차는 5g이 됩니다. 표본오차는 표본을 뽑는 방식이나 실험 회차마다 매번 달라질 수 있지만 대체로 표본의 크기에 반비례합니다. 표본

중앙값 (median) 의미, 활용 [내부링크]

통계와 데이터 분석을 쉽게 알려드리는 플래워드입니다. 오늘은 대푯값을 나타내는 통계값 중 중앙값(median)에 대해 알려드리겠습니다. 중앙값(median) 데이터를 일렬로 정렬했을 때, 한가운데 위치한 값 데이터를 알기 위해 주로 평균을 확인합니다. 하지만 데이터에 편향(bias), 또는 이상치(outlier)가 존재할 경우 평균만으로는 데이터의 성질을 정확히 알기 어렵습니다. 데이터의 편향에 따른 평균과 중앙값 아래는 국세청_근로소득 백분위(천 분위) 자료로 만든 소득의 평균과 중앙값의 비교 데이터입니다. 상위 50%는 소득구간 50%에 해당하는 인구와 총 수입금액이며, 전체는 근로소득 인구와 총 수입금액입니다. 수입 금액을 인원으로 나누면 인당 소득이 나오는데 50% 구간의 평균 소득과 전체 평균 소득의 차이가 발생되는 것을 알 수 있습니다. 이 그래프를 평균과 중앙값으로 구분하면 아래와 같습니다. 중앙값과 평균의 소득 차이가 약 천만 원 차이가 발생되는 것을 알 수 있습니다.

엑셀 셀고정, 행고정 쉽게 알려드립니다. [내부링크]

안녕하세요. 엑셀을 쉽게 알려드리는 플래워드입니다. 오늘은 엑셀을 쉽고 편하게 사용하기 위한 틀고정 방법에 대해 알아보겠습니다. 틀고정 방법은 행고정, 열고정, 셀고정으로 나누어집니다. 행고정 열고정 셀고정 엑셀에 입력된 데이터에 따라 고정 방법을 달리한다면 여러분의 편안한 엑셀 생활이 보장된다고 할 수 있습니다. 이렇게 사소한 작은 것들이 모여 엑셀의 실력과 업무 효율, 그리고 퇴근 시간을 결정하기 때문입니다. 엑셀의 열과 행의 개념 고정을 하기 앞서 행과 열에 대해 알아보겠습니다. 행과 열의 개념을 한 번만 익혀두시면 파이썬과 기타 통계 프로그램을 사용할 때도 유용하게 쓰일 거라 생각합니다. 행 (Row) : 세로의 값입니다. 엑셀의 행은 숫자로 표시됩니다. 열 (Column) : 가로의 값입니다. 엑셀의 열은 알파벳으로 표시됩니다. 첫 행고정 엑셀에서 첫 행을 고정할 때 보기 > 틀고정 > '첫 행 고정'을 선택하면 됩니다. 일반적으로 행고정을 하는 이유는 행의 길이가 길어서

기술 통계량(Dricriptive Statistics) 의미 [내부링크]

통계와 데이터 분석을 쉽게 알려드리는 플래워드입니다. 오늘은 데이터 분석의 가장 기초적이고 기본적인 기술 통계량의 의미에 대해 알려드리겠습니다. 저와 함께하신다면 여러분도 데이터 분석과 통계 전문가가 되실 거라 자신합니다. 기술 통계량(Dricriptive Statistics) 기술 통계량이란 데이터 세트의 속성을 전반적으로 파악하는 데이터 요약 방법입니다. 일반적으로 통계나 데이터 분석을 할 때 데이터양은 눈으로 확인하기 어려울 정도로 많은 경우가 많습니다. 엄청난 양의 데이터를 사람이 눈으로 확인해서 특징을 파악하기는 불가능에 가깝습니다. 기술 통계랑은 이런 데이터를 이해하고 표시하기 위해 간단한 통계량과 그래프를 사용합니다. 방대한 데이터의 속성을 값(통계량)과 그림(차트)으로 간단명료하게 요약함으로써 데이터의 속성을 쉽게 이해할 수 있게 도와줍니다. 통계량의 종류 데이터를 요약하는 기술 통계량은 크게 4가지로 분류됩니다. 중심경향성 (Central Tendency) : 데이터

탐색적 데이터 분석 (EDA)이란? [내부링크]

이번 시간은 데이터 분석에서 빠질 수 없는 단계인 탐색적 데이터 분석에 대해 알아보겠습니다. campaign_creators, 출처 Unsplash 탐색적 데이터 분석 (EDA, Exploratory Data Analysis) 탐색적 데이터 분석은 1977년 John W, Tukey가 창안한 자료 분석 방법론입니다. 통계 분석을 할 때 가설 검정 또는 추론 통계에 매몰되어 자료가 가진 의미를 확인하기 어려운 것을 해결하기 위한 방법입니다. 탐색적 데이터 분석이란 이렇듯 통계적 가설이나 모형 없이 데이터를 있는 그대로 관찰하는 기법을 말합니다. 다시 말하면 데이터를 호기심을 가지고 다양한 방법과 접근법으로 분석하는 것입니다. 데이터를 수집한 후 다양한 방법으로 관찰하면 데이터의 본질에 접근할 수 있고 숨어있는 잠재적인 문제가 드러나기도 합니다. 3844328, 출처 Pixabay 탐색적 데이터 분석을 통해 알 수 있는 것 탐색적 데이터 분석은 데이터 분석 과정에서 반드시 거쳐야 하

올해 제일 잘한 일 _ 품질관리기술사 취득 [내부링크]

From, 블로그씨 2023년을 앞둔 오늘, 내가 올해 제일 잘한 일을 사진과 함께 소개해 주세요! 품질관리기술사가 되었습니다. 직장인이라면 기술사 자격증에 대해 들어본 적 있을 겁니다. 저는 기술사를 취득했을 때 얻을 수 있는 유, 무형의 이익에 대해 잘 알고 있었지만 높은 벽 앞에 늘 외면했습니다. 과연 내가 할 수 있을까 하는 두려움에 도전조차 하지 않고 망설였습니다. 몇 년 동안 노력해도 합격하지 못한 분도 계시고, 4~7년 만에 합격한 경우도 있었기 때문입니다. 기술사를 따야겠다는 결심을 했습니다. 1월 12일 아무런 준비 없이 독서실로 향한 뒤 시험 날인 4월 16일까지의 주별, 일별 계획을 짰습니다. 새벽 5시에 일어나 밤 12시에 잠드는 생활의 반복 저는 직장인입니다. 공부할 수 있는 절대적인 시간이 부족합니다. 그래서 새벽 5시에 일어나 동영상 강의를 들으며 출근하고, 퇴근 후 저녁은 빵이나 김밥으로 간단히 때우며 11시 30분까지 집중적으로 공부했습니다. 1월 12

엑셀 개수 세기 (COUNTA, COUNT, COUNTBLANK, COUNTIF) [내부링크]

엑셀은 여러 가지 유형의 데이터가 포함된 셀의 개수를 세는 함수를 제공합니다. 마이크로소프트(Microsoft) 공식 문서 COUNTA : 비어있지 않는 셀을 계산합니다. COUNT : 숫자가 포함된 셀을 계산합니다. COUNTBLANK : 비어있는 셀을 계산합니다. COUNTIF : 조건을 충족하는 셀의 계산합니다. 마이크로소프트 공식 문서에서 알려주는 4가지 함수를 활용하여 개수 세기를 해보겠습니다. 함수별 개수 세기 활용 COUNTA : 문자와 숫자 관계없이 값이 있는 셀의 개수를 알 수 있습니다. COUNT : 숫자가 있는 셀의 개수를 알 수 있습니다. COUNTBLANK : 빈 셀의 개수를 알 수 있습니다. COUNTIF : 조건에 해당하는 셀의 개수를 알 수 있습니다. 아래는 TITANIC PASSENGER 데이터로 제목을 제외하고 1,309개의 열을 가지고 있습니다. 다양한 함수를 활용하여 오른쪽 테이블에 값을 채워보겠습니다. COUNTA 실습 COUNTA를 이용하여 값

엑셀 조건부서식 색 (다중 조건 필터) [내부링크]

엑셀은 정형화된 업무를 할 때 유용한 많은 기능들을 제공합니다. 그런 기능 중 압도적으로 유익한 기능이 조건부 서식이라고 생각합니다. 오늘은 엑셀 조건부 서식의 색을 적용하는 방법에 대해 자세하게 알려드리겠습니다. 이번 포스팅의 기능만 잘 활용해도 여러분의 퇴근 시간을 앞당길 수 있을 거라 자신합니다. 예제로 사용할 Data는 'Titanic Passenger'입니다. 빈 셀에 대한 색깔 표시 '조건부 서식 색'을 적용하기 위해 우선 영역을 선택해 줍니다. 아래 Data에서 적용할 영역은 빈칸의 존재로 데이터가 연결되지 않습니다. 일일이 영역을 지정하는 경우 복잡하기 때문에 'E'열을 전체 선택해 줍니다. 홈 > 조건부서식 > '새 규칙'을 선택합니다. '새 서식 규칙'을 선택해 줍니다. 조건부 서식을 지원하는 다양한 규칙들이 있는데 원하는 규칙을 선택합니다. 저는 '빈 셀'을 표시하기 위해 '다음을 포함하는 셀만 서식 지정'을 선택하고, '빈 셀'을 선택하였습니다. '서식'을 눌러

파이썬 다운로드, 설치 방법 [내부링크]

데이터 분석과 통계를 위해 파이썬(Python)을 사용하는 경우가 많습니다. 빅데이터 분석의 경우는 파이썬(Python)의 활용 빈도가 점차 늘어나고 있는 상황입니다. 오늘은 이런 파이썬의 다운로드 및 설치 방법에 대해 차근차근히 알아보겠습니다. 파이썬(Python)의 장점 파이썬은 지난 수십 년에 걸쳐 대용량 분석과 시각화를 비롯한 Data Science (데이터 과학)을 위한 최고의 도구로 활용 방대하고 활발한 서드파티 생태계 (다양한 라이브러리 지원) 머신러닝, 딥러닝 분석 가능 무료로 사용 사용이 상대적으로 쉽다. (C, C++에 비해) 상대적으로 자료가 방대하여 필요한 기능 구현을 위한 코드를 쉽게 구할 수 있다. 파이썬(Python)의 단점 파이썬 자체의 속도는 느리다. (C 언어로 작성된 라이브러리 동작 시 빠를 수 있음) 코드가 상대적으로 쉽지만 그래도 시간이 필요하다. 파이썬 설치하기 (파이썬 단독 설치) 파이썬은 오픈 소스지만 지속적으로 업데이트가 되고 있습니다.

엑셀 취소선 적용 (단축키, 빠른 실행 도구) [내부링크]

통계와 엑셀, 데이터 분석을 알려드리는 플래워드입니다. To-Do List를 작성하거나 업무의 완료를 표시할 때 취소선을 사용하면 눈에 인식이 쉽게 됩니다. 오늘은 엑셀로 취소선을 표시하는 방법에 대해 알아보겠습니다. 파워포인트나 워드의 경우 홈에서 직관적으로 알 수 있으며, 바로 적용이 가능합니다. 마이크로소프트 워드 하지만 엑셀에는 홈이나 기타 메뉴에 없기 때문에 빠른 적용이 힘듭니다. 마이크로소프트 엑셀 하지만 엑셀에도 취소선을 표시할 수 있는 다양한 방법이 있습니다. 셀 서식 단축키 빠른 실행 도구 모음 적용 방법에 대해 자세하게 설명드리겠습니다. 셀 서식 적용 1~5까지 할 일을 작성했습니다. 표시할 셀을 선택해줍니다. 셀을 선택하면 초록색 네모로 표시됩니다. 셀이 선택된 상태에서 오른쪽 마우스를 우클릭합니다. '셀 서식'을 선택해줍니다. 셀 서식 > 글꼴 > '취소선'을 선택합니다. '확인'을 눌러줍니다. 취소선이 표시되면 업무가 완료된 것을 인식할 수 있고, 약간의 성취

엑셀 랜덤함수 (rand, randbetween) [내부링크]

이번 시간은 엑셀의 랜덤함수에 대해 알려드리겠습니다. 엑셀에서 임의의 값이 필요할 때 rand와 randbetween 함수를 활용할 수 있습니다. rand() : 0~1 사이의 실수 난수 randbetween(bottom, top) : bottom과 top 사이의 정수 난수 엑셀 랜덤함수 마이크로소프트 공식 홈페이지에 rand와 randbetween에 대한 기술문서가 있습니다. rand 함수 엑셀의 rand 함수 사용법은 아래와 같으며 별도의 인수가 필요 없습니다. =rand() 엑셀에 rand()를 입력한 뒤 나머지 셀에 복사해 주는 실습을 해보겠습니다. rand()를 입력하면 자동으로 0~1사이의 실숫값이 출력됩니다. 엑셀에 변경이 있을 때마다 모든 엑셀 랜덤 값들이 변경됩니다. randbetween 함수 엑셀의 randbetween 함수 사용법은 아래와 같습니다. =randbetween(bottom, top) randbetween 함수는 두 가지 인수가 필요합니다. bottom

엑셀 파이 기호 입력 방법 (원주율) [내부링크]

이번 시간은 엑셀에서 그리스 문자 파이를 입력하는 방법을 알려드리겠습니다. 우리가 알고 있는 파이는 두 가지 문자가 있습니다. Φ 파이 π 파이 같은 파이라고 하지만 두 문자는 발음도 약간 다르고 별개의 문자입니다. 대문자와 소문자를 동시에 나타내고 발음 기호도 붙여봤습니다. Φ φ 화이 (Phi) Π π 파이 (Pi) 오늘은 우리에게 조금 더 익숙한 두 번째 파이에 대해 알아보겠습니다. Π π 파이 (Pi) 의미 16번째 그리스 문자입니다. 원주율로 사용됩니다. π ≒ 3.1415.... 엑셀 π 표시-1 아래와 같은 표에 파이와 원주율을 입력하려고 합니다. 우선 파이를 입력할 셀을 선택합니다. 삽입 > '기호'를 클릭합니다. 기호 테이블이 나오면 하위 집합의 화살표를 내려 필요한 부분을 선택합니다. '그리스어 및 콥트어'를 선택합니다. 파이를 선택한 후 '선택'을 입력합니다. 파이가 입력되었습니다. 엑셀 π 표시-2 파이를 입력할 셀을 선택 후 'ㅎ'을 입력하고 한자 키를 누릅니

엑셀 루트 (제곱근 표현, 계산, unichar) [내부링크]

이번 시간은 엑셀로 제곱근을 계산하는 방법과 unichar함수를 활용하여 제곱근과 엑셀에서 다양한 기호를 표현하는 방법을 알아보겠습니다. 엑셀 루트 (제곱근) 계산 엑셀에서 루트를 계산하는 방법은 다양합니다. POWER 함수 사용 SQRT 함수 사용 '^' 사용 각각의 방법을 활용해 계산해 보겠습니다. data를 엑셀의 표에 나타냈습니다. POWER 함수 사용 루트 계산을 위해 power 함수를 사용할 수 있습니다. 계산하고자 하는 셀주소를 넣고 1/2을 입력하면 됩니다. 만약 3승근을 계산하려고 하면 1/3을 입력하고 마찬가지로 제곱을 계산하려면 2를 입력합니다. = POWER(셀주소, 1/2) 루트(제곱근)가 계산되었습니다. 계산된 셀을 선택하고 오른쪽 아래 녹색점을 클릭한 후 아래로 드래그하면 수식이 복사됩니다. 드래그를 마치면 자동 채우기 옵션을 선택할 수 있습니다. '서식 없이 채우기'를 선택합니다. 루트(제곱근)의 계산이 정상적으로 이루어진 것을 알 수 있습니다. SQRT

엑셀 줄바꾸기 다양한 방법 (자동 줄바꿈, 셀 서식, alt + enter) [내부링크]

이번 시간은 엑셀에서 줄바꾸기 적용하는 방법에 대해 알아보겠습니다. 엑셀은 줄바꿈을 위한 다양한 방법들이 존재하는데요. 용도에 맞게 사용하면 업무 효율과 시인성을 높일 수 있습니다. 엑셀 줄바꾸기 방법 홈 > 자동 줄 바꿈 셀 서식 > 자동 줄 바꿈 셀 서식 > 셀에 맞춤 alt + anter 홈 > 자동 줄 바꿈 엑셀에 애국가 1, 2절을 입력했습니다. 셀을 선택한 후 홈 > 자동 줄 바꿈을 클릭합니다. 셀 너비에 맞게 자동 줄바꿈이 적용되었습니다. 셀 너비를 조절하면 그에 따라 자동으로 줄바꿈이 변경됩니다. 셀 서식 > 자동 줄 바꿈 줄바꾸기를 실행할 셀을 선택한 후 오른쪽 클릭, 셀 서식을 선택합니다. 셀 서식에서 맞춤 > 텍스트 조정에서 원하는 옵션을 선택합니다. '자동 줄 바꿈'을 선택하면 동일한 결과를 홈 > '자동 줄 바꿈'과 동일한 결과를 얻을 수 있습니다. 셀 서식 > 셀에 맞춤 '셀에 맞춤'을 선택하면 셀 너비에 맞게 글자 크기가 변경됩니다. alt + enter

도수분포표 엑셀로 1분 만에 만들기 [내부링크]

이번 시간은 전반적인 분포를 알아보는 도수분포표에 대해 알아보겠습니다. 도수분포표를 만들면 히스토그램을 그릴 수 있으니 업무에 참고 바랍니다. 도수분포표 (Frequency Distribution Table) 데이터의 구간에 해당하는 수치 데이터 값들의 빈도를 나타낸 표(Table) 도수분포표 작성 방법 ① n(데이터의 수)을 구한다. ② R을 구한다. ③ 급의 수 (k)를 결정한다. 급의 수는 홀수로 계산하는 것이 편리하다. ④ 급의 폭 (h)를 구한다. ⑤ 도수를 구한 후 도수분포표에 기입한다. 위와 같이 도수분포표를 구하기 위해서는 상대적으로 고려하거나 계산해야 하는 것이 많습니다. 또한 값을 일일이 분류해야 하기 때문에 수작업으로 구하기는 무리가 있습니다. 엑셀 도수분포표 만들기 엑셀의 '데이터 분석'을 활용하면 아주 간단하게 도수분포표와 히스토그램을 만들 수 있습니다. 아래는 Titanic Passenger 데이터입니다. 총 1043개의 데이터로 나이(age)에 대한 도수분

산점도, 상관계수 공식 (엑셀 데이터 분석) [내부링크]

두 연속형 변수의 시각적인 관계를 알기 위해서는 산점도를 그리고, 관계를 나타내기 위해 상관분석을 진행합니다. 상관분석의 결과를 정량적으로 알기 위해 상관계수를 계산하여 두 변수의 관계의 정도와 방향을 알 수 있습니다. 이번 시간은 두 개의 연속형 데이터의 관계를 알기 위한 방법을 알아보겠습니다. 엑셀 산점도 그리기 아래와 같이 x에 대응되는 y의 값이 있고 이 값이 연속형 변수일 때 산점도를 그릴 수 있습니다. x에 대응되는 y, y2, y3의 산점도를 그려보겠습니다. 산점도를 그릴 영역을 선택하고 삽입 > 추천 차트의 '분산형'을 선택합니다. 산점도가 출력됩니다. 동일한 방법으로 y2, y3의 산점도를 그릴 수 있습니다. 상관계수 공식 상관계수는 공분산(Covariance(x, y))를 x의 분산과 y 분산의 곱을 제곱근으로 나눈 값입니다. 모공분산과 표본공분산은 아래의 수식을 따릅니다. 표본공분산은 모공분산과 달리 1/(n-1)로 나누는 것이 차이가 있는데 자유도를 반영한 결과

기각역 의미, 설정방법 (1종 오류, 2종 오류) [내부링크]

앞선 포스팅에서 통계적 가설 검정의 절차에 대해 알아봤습니다. 오늘은 통계적 가설검정에서 기각역의 의미와 설정 방법에 대해 알아보겠습니다. 통계적 가설검정의 절차 통계적 가설검정의 절차는 아래와 같습니다. 1) 귀무가설(H0)과 대립가설(H1) 설정 2) 유의수준(α)과 검정력(1-β) 설정 1종오류 : 귀무가설이 성립되고 있음에도 불구하고 이것을 기각하는 과오 (α) 2종오류 : 귀무가설이 성립되지 않음에도 불구하고 이것을 채택하는 과오 (β) 3)검정통계량을 계산 4) 기각역 (Critical Region)을 설정 5) 검정통계량과 기각역의 비교를 통해 유의성을 판정 검정통계량의 계산된 값이 기각역에 위치하면 H0를 기각, 채택역에 위치하면 H0 채택 기각역(Critical Region) 의미, 설정 방법 기각역 : H0를 기각할 수 있는 영역 1. 모평균에 관한 검정 (σ를 알 때) ① 귀무가설 μ = μ0 일 때 기각역: ② 귀무가설 μ ≥ μ0 일 때 기각역: ③ 귀무가설

엑셀 줄간격 조절 방법 [내부링크]

안녕하세요. 통계와 엑셀을 알려주는 플래워드입니다. 이번 시간은 엑셀의 줄간격을 조절하는 방법에 대해 알아보겠습니다. 엑셀에 데이터를 보면 줄간격이 맞는 경우가 거의 없어서 항상 조절해야 하는데요. 이때 쉽게 할 수 있는 방법을 알려드리겠습니다. 엑셀 줄간격 조절 방법_마우스로 조절 빈 엑셀에 데이터를 복사/붙여넣기를 합니다. 엑셀의 줄간격 기본값이 유지된 상태로 데이터가 입력되어 셀 밖으로 데이터가 삐져나갔습니다. 셀을 선택한 후 마우스 클릭하고 오른쪽으로 밀어줍니다. 이동한 거리만큼 줄간격이 조절되었습니다. 엑셀 줄간격 조절 방법_마우스로 조절 빈 엑셀에 데이터를 복사/붙여넣기를 합니다. 셀간격을 조절할 영역을 선택하고 오른쪽 위의 주소 있는 위치(F)를 마우스 더블클릭합니다. 셀간격이 자동 조절됩니다. 엑셀 줄간격 조절 방법_열 너비 입력 빈 엑셀에 데이터를 복사/붙여넣기를 합니다. 줄간격을 조절할 위치를 선택하고 마우스 우 클릭> '열 너비'를 선택합니다. 열 너비의 값을 입

최빈값 의미 (엑셀, Python) [내부링크]

통계와 데이터 분석에서 대푯값으로 쓰이는 다양한 값들이 존재합니다. 이번 포스팅은 그런 대푯값 중에 최빈값 (Mode)에 대해 알아보고 엑셀과 Python으로 실습해보겠습니다. 최빈값 (Mode) 통계학 용어로, 가장 많이 관측되는 수, 즉 주어진 값 중에 가장 자주 나오는 값 직접 계산 방법 아래 데이터에서 가장 많은 수를 찾아보겠습니다. 1, 2, 3, 4, 5, 6, 7, 7, 7, 8, 9 이런 경우 7을 제외한 나머지 숫자는 1개씩 있고 7이 3개가 있습니다. 따라서 최빈값은 7이 됩니다. 위와 같이 데이터 수가 적을 때는 직접 계산이 가능하지만 데이터가 많아지면 프로그램의 도움을 받아야 합니다. 엑셀 계산 0~20까지 100개의 Data가 있습니다. 이런 Data에서 일일이 개수를 세어 가장 자주 나오는 값을 구하기는 어렵습니다. 이때 'MODE'함수를 사용하면 쉽게 구할 수 있습니다. =MODE('데이터 영역') 값이 19로 확인됩니다. 실제로 가장 많이 나온 값이 19

표준오차 의미, 공식 [내부링크]

이번 시간에는 통계 용어에 대해 설명드리겠습니다. 일반적으로 통계 지식이 있는 경우 평균, 표준편차, 분산, 자유도와 같은 개념들은 무리 없이 설명할 수 있습니다. 하지만 표준오차에 대해서는 설명하기가 난해하신 분들을 많이 봤습니다. 이러한 애매한 지식을 확실하게 만들어드리겠습니다. 표준오차 (Standard Error) 표본분포의 표준편차, 평균의 표준편차 이 개념을 정확하게 알기 위해서는 중심극한정리를 알아야 합니다. 약간의 수식 전개가 있는데 크게 어렵지 않으니 천천히 읽어보시기 바랍니다. 모집단의 분산과 표준편차 모집단의 분산과 표준편차는 아래와 같은 수식적인 관계가 있습니다. 분산의 제곱근이 표준편차입니다. 표본의 분산과 표본표준편차(표준오차) 모집단과 달리 표본의 분산은 아래와 같은 수식입니다. 왜냐하면 중심극한정리에 의해 개별 집단의 평균을 구하기 위해 1/n을 한 값의 모임이 표본이기 때문입니다. 분산값 안에 있는 n은 분산 밖으로 나오면 제곱으로 됩니다. 왜냐하면 분

p값, p-value (의미, 해석) [내부링크]

이번 시간은 통계에서 가장 중요한 p값 (p-value)의 의미와 해석하는 방법을 알려드리겠습니다. p값만 알고 있다면 통계적인 지식이 깊지 않더라도 통계 프로그램을 통해 도출된 값을 해석해서 결론을 내리고 보고서와 논문을 작성할 수 있습니다. 실제로 최소한 p-value라도 알고 있다면 통계를 어느 정도 해석할 수 있기 때문에 이번 포스팅을 자세히 읽어보시길 추천드립니다. 통계적 유의성 통계적 유의성이란 실험이나 현상이 우연으로 일어난 것과는 극단적인 차이가 있다는 것을 판단하는 방법입니다. 결과가 우연으로 발생될 수 있는 변동성의 바깥에 존재할 때 통계적으로 유의하다고 말할 수 있습니다. 이런 통계적인 유의성을 검정(test) 하기 위해 귀무가설과 대립가설을 세우고 통계분석을 진행하는 것입니다. 위의 값은 평균이 10.87이고 표준편차가 6.07145인 표본집단의 평균이 12.1과 같은지를 평가한 결과입니다. 12.1은 우연으로 존재할 수 있는 영역 밖에 존재하기 때문에 귀무가설

신뢰구간(Confidence Interval) 의미 [내부링크]

이번 시간은 신뢰구간의 의미에 대해 알아보겠습니다. 통계에서 하나의 값으로 말하는 경우를 점추정, 구간으로 말하는 경우를 구간추정이라고 합니다. 통계적으로 표현할 때는 일반적으로 신뢰구간을 활용한 구간추정을 사용하곤 합니다. 신뢰구간 (Confidence Interval): 모수가 포함되어 있을거라고 자신하는 구간 예를 들어 설명드리겠습니다. 총 100개의 값을 가진 데이터의 히스토그램과 기술통계량을 나타내었습니다. 붉은색 박스로 표시한 Lower 95% Mean과 Upper 95% Mean의 값이 신뢰구간입니다. 다시 말해 데이터 평균은 10.87이고 데이터의 95% 신뢰구간은 9.67 ~ 12.07이라는 의미입니다. 신뢰구간은 구간 범위로 추정 값을 표현하는 일반적인 방법입니다. 용어 설명 신뢰구간을 설명하기 위해 알아야 할 기본적인 용어들을 설명하겠습니다. 1) 구간 추정: 어떤 정해진 구간 속에 모수가 포함되어 있을 것이라고 추정하는 것 2) 신뢰율: 구간이 모수를 포함할 확

카이제곱검정, 카이제곱분포 (모분산 검정 실습) [내부링크]

오늘은 통계적 분석방법 중 하나인 카이제곱 검정에 대해 알아보겠습니다. 카이제곱검정 (Chi-square test) 카이제곱 분포에 기초한 통계적 방법으로 관찰된 빈도가 기대되는 빈도와 의미 있게 다른지의 여부를 검정하기 위해 사용되는 검정방법 카이제곱검정(Chi-square test)의 '카이'는 그리스 문자 χ에서 유래되었습니다. 위와 같이 χ의 제곱으로 표현하는 경우도 있습니다. 카이제곱검정(Chi-square Test)의 용도 일반적인 카이제곱분포는 정규분포에서 편차제곱합(S)를 구한 후 모분산 (σ^2)으로 나눈 아래 수식으로 정의할 수 있습니다. 카이제곱검정이 어떤 경우 사용되는지를 나타내봤습니다. 1) 한 개의 모집단의 모분산 검, 추정 2) 적합도 검정 (Goodness of fit) : 관찰된 비율과 기대된 비율이 같은지 검정 3) 독립성 검정 (Test of Independence): 두 속성(기계별, 등급별 등등) 서로 독립인지 검정 4) 동질성 검정 (Test

변수에 따른 분석 방법 (단변량, 이변량, 다변량) [내부링크]

이번 시간은 변수의 개수 및 종류에 따라 분석하는 방법에 대해 대략적으로 알아보겠습니다. 분석 종류에 대해 간단히 설명하는 시간으로 수식 및 검정 절차에 대한 설명은 넘어가겠습니다. 단변량 (Univariate Analysis) : 변수가 하나일 때 ① 분포 ② 기술통계량 ③ one sample t-test ④하나의 집단에 대한 모분산 검정 이변량 (Bivariate Analysis) : 변수가 두 개 일 때 ① 상관분석 (연속형 데이터 2) ② 회귀분석 (연속형 데이터 2) ③ t-test (범주형 1, 연속형 1) ④ Logistic Regression (범주형 1, 연속형 1) ⑤ Mosiac Plot (범주형 데이터 2) ① 상관분석 (연속형 데이터 2) ② 회귀분석 (연속형 데이터 2) ③ t-test (범주형 1, 연속형 1) ④ Logistic Regression (범주형 1, 연속형 1) ⑤ Mosiac Plot (범주형 데이터 2) 다변량 (Multivariate A

엑셀 절대값 구하기 (abs 함수) [내부링크]

이번 포스팅은 엑셀에서 절대값을 가져오는 방법을 알아보겠습니다. 업무를 진행하거나 통계분석, 데이터 분석을 할 때 절대값이 필요한 경우가 많습니다. 예를 들어 MAE를 구한다든지 부호가 필요 없는 차이를 구하는 경우가 이에 해당됩니다. ※ MAE : Mean Absolute Error abs (absolute value) 절대치, 절대값 절대값은 아래의 수식을 따르게 됩니다. 이런 절대값은 엑셀로 쉽게 구할 수 있는데 바로 아래 수식을 사용하면 됩니다. =abs(셀주소) 엑셀 절대값 실습 아래 데이터가 있습니다. 양수와 음수가 함께 섞인 데이터를 절대값으로 나타내고자 합니다. abs를 입력합니다. abs함수의 괄호 안에 셀 주소를 입력합니다. 음수였던 -20의 값이 양수 20으로 변하는 것을 알 수 있습니다. 수식을 입력한 셀을 선택하고 오른쪽 아래 초록색을 클릭한 후 밑으로 끌고 내리면 수식이 복사가 됩니다. 절대값 수식이 복사되어 음수는 양수로 변경하고, 양수는 그대로 유지하는

분산분석(ANOVA) 의미와 해석 [내부링크]

이번 시간은 분산분석의 의미에 대해 알아보고 실제 Test 결과로 각 통계 값의 의미를 설명드리겠습니다. 분산분석을 평균을 비교하기 위한 방법입니다. 분산분석은 영어로 ANOVA라고 하며 Analysis of Variance의 약자입니다. 일반적으로 두 집단의 평균을 비교할 때는 t-test를 사용하고 2개를 초과하는, 3개 이상의 집단의 평균을 비교할 때는 분산분석을 사용합니다. 두 집단 평균 비교 : t-test 세 집단 이상의 평균 비교 : 분산분석 (ANOVA) 만약 3가지 그룹의 평균을 검정(test) 할 때 t-test로 검정한다면 총 3번의 test를 실시해야 합니다. 하지만 분산분석은 1번의 test로 평균 검정 할 수 있습니다. 평가 방법에 따른 Test 횟수 (3집단 가정) t-test를 실시한다는 것은 두 표본의 평균이 같다는 귀무가설을 검정(test) 하는 것입니다. 그와 유사하게 분산분석의 귀무가설도 셋 이상의 평균이 같다는 것을 검정(test) 합니다. 1)

t-test 방법 (엑셀 데이터 분석) [내부링크]

두 집단이 같다, 다르다를 판단하는 방법은 무엇일까요? 평균으로만 비교하기에는 애매한 경우가 많습니다. 172cm와 173m는 같을까요? 고작 1cm 차이라 같다면 얼마나 차이가 나야 다를까요? 단순하지만 공격받기 쉬운 이런 질문에 효과적인 대응 방법은 바로 통계를 활용하는 것입니다. 통계의 권위를 등에 업는다면 선배나 상사도 여러분의 말을 무시할 수 없습니다. 두 집단의 차이를 판정할 수 있는 방법을 아주 쉽게 알려드리겠습니다. 사실 엑셀에서 지원하는 기능만 잘 활용하면 대부분의 통계와 데이터 분석을 할 수 있을 거라 자신합니다. 실습을 통해 평균을 비교하는 방법을 알려드리겠습니다. 아래 표는 분석에 쓰일 데이터입니다. 이 데이터로 남학생과 여학생의 키가 같은지 엑셀로 비교하겠습니다. 분석 절차 엑셀이든 통계 프로그램이든 분석하는 절차는 같습니다. 두 집단의 평균을 비교하기 위해서 등분산을 먼저 확인합니다. (모수, 비모수 비교는 넘어가겠습니다. ^^:;) 분산이 같으면 '등분산

정규성 검정_5가지 방법 (JMP, Python) [내부링크]

통계분석을 진행할 때 가정 먼저 하는 일은 데이터를 관찰하는 것입니다. 기술통계의 다양한 방법들을 바탕으로 대략적인 데이터를 본 후 통계분석을 진행합니다. 본격적인 데이터 분석 시 데이터의 성질에 따라 모수 검정, 비모수 검정으로 분석 방법을 다르게 적용해야 합니다. 이것을 판정하는 방법이 '정규성 검정'입니다. 결과에 따른 검정 방법 정규성 만족 : 모수 검정 (일반적인 통계) 정규성 불만족 : 비모수 검정 이번 시간은 모수, 비모수를 판별하는 방법에 대해 알아보고 JMP와 Python으로 실습해 보겠습니다. 정규성 검정 5가지 방법 위의 테이블은 데이터 분석 업무를 진행할 때 사용하는 정규성을 판정하는 방법을 나타낸 것입니다. Q-Q Plot, Normal Quantile Plot, Anderseon-Darling, Shapiro Wilk는 JMP로 실습해 보고, Python 코딩으로 Anderseon-Darling, Shapiro Wilk, Kolmogorov–Smirnov을

엑셀열, 행 의미와 exact 함수 (데이터 비교) [내부링크]

이번 시간은 엑셀열과 행의 개념과 exact 함수 활용법도 알려드리겠습니다. 행, 열에 대해 한 번만 알아두시면 엑셀 뿐 아니라 Python 및 기타 프로그램에서도 활용 가능합니다. 엑셀열 (Row) 엑셀의 세로로 한 칸씩 늘어나는 방향입니다. 엑셀행 (Column) 엑셀의 가로로 한 칸씩 늘어나는 방향입니다. EXACT 함수로 데이터 비교 두 데이터의 차이를 알고 싶을 때 사용할 수 있는 함수를 소개 드리겠습니다. 엑셀을 수정하다가 데이터의 무결성을 알고 싶거나 원본 데이터와 어떤 부분이 변경되었지 확인할 때 'EXACT'를 쓰시면 쉽게 비교할 수 있습니다. 원본 데이터와 수정 데이터와 비교 값을 넣을 테이블을 같은 sheet에 둡니다. 비교할 테이블에 원본과 수정의 셀을 입력합니다. =EXACT('원본 셀 주소', '수정 셀 주소') 수식을 입력한 셀을 끌고 왼쪽 끝까지 끌어서 이동하고, 첫 번 열을 선택한 후 아래로 끌어서 옮겨주면 수식이 복사가 됩니다. 비교 테이블을 선택한

엑셀 렉 방지, 자동 저장 설정 [내부링크]

이번 시간은 엑셀 렉 발생을 막는 방법과 자동 저장 설정하는 법을 알아보겠습니다. 엑셀이 이유 없이 느려지는 경우 이것만 알고 있으면 엑셀의 속도를 쉽게 올릴 수 있으니 업무에 참고하세요. '하드웨어 그래픽 가속 사용 안 함' 체크 엑셀 렉이 생기거나 느려지는 가장 큰 이유는 '하드웨어 그래픽 가속' 때문입니다. '하드웨어 그래픽 가속 사양 안 함'을 선택하면 속도가 빨라지는 것을 알 수 있습니다. 파일 > 옵션 > 표시 > '하드웨어 그래픽 가속 사용 안 함' 체크 일부 컴퓨터에서는 해당 옵션이 보이지 않는 경우가 있는데 그럴 경우 '파워포인트' 또는 'word'에서 해당 옵션을 적용하면 됩니다. 셀 서식 삭제 엑셀이 갑자기 느려지는 경우 과도하게 설정된 셀 서식 때문인 경우가 있습니다. 필요 없는 셀 서식을 지우면 엑셀 속도가 상승될 수 있습니다. 홈 > 조건부 서식 > 규칙 지우기 > '시트 전체에서 규칙 지우기' 또는 '선택한 셀의 규칙 지우기' 피벗 테이블 및 수식 삭제 피

엑셀 자동계산 (자동 합계, 평균, 최대, 최소) [내부링크]

이번 시간은 엑셀에서 수식을 잘 모르는 분들께 유용한 팁을 알려드리겠습니다. 엑셀은 수식을 입력하지 않아도 계산할 수 있는 방법을 제공합니다. 엑셀 초보자도 기본적인 합계, 평균, 최대, 최소를 구할 수 있는 자동계산 방법을 알려드리겠습니다. 여러분이 만약 엑셀의 기본 함수를 모른다면 이 포스팅을 꼭 보셔야 합니다. 여러분이 만약 엑셀의 기본을 알고 여러 함수를 쓸 수 있다면 이번 포스팅을 참고만 하셔도 됩니다. 하지만 매번 엑셀로 계산을 하는데 식은땀을 흘리시거나 엑셀로 기본적인 계산을 하는 것조차 힘드신 분은 집중해서 봐주세요. 엑셀의 '자동 합계' 기능을 활용하면 수식 입력 없이 계산할 수 있습니다. '자동 합계' 실행 방법 엑셀의 '자동 합계'는 총 두 가지 경로로 실행할 수 있습니다. 1) 수식 > 자동 합계 첫 번째 방법은 수식에 들어가 실행하는 방법입니다. 2) 홈> 자동 합계 두 번째 방법은 홈에서 실행하는 방법입니다. 위의 두 가지 방법 중 편하신 방법으로 실행하면

귀무가설, 대립가설 의미 [내부링크]

추론통계를 진행할 때 가장 먼저 하는 일은 바로 가설(Hypothesis)을 설정하는 것입니다. 이번 시간은 통계분석의 절차와 가설설정 단계에서 귀무가설과 대립가설의 의미를 알아보겠습니다. 용어가 어렵게 느껴져 통계에 진입장벽이 되지만 누구나 이해할 수 있는 내용이니 천천히 읽어주세요. 통계분석의 절차 0단계 : 분석 내용 선택 1단계 : 가설설정 2단계 : 유의수준 설정 3단계 : 검정통계량 계산 4단계 : 기각역 계산 5단계 : 가설에 대한 판정 대부분의 통계분석은 위의 단계를 거쳐 진행됩니다. 가설설정 가설(Hypothesis)을 세우는 단계를 말합니다. 통계분석의 종류에 따라 가설이 다르지만 공통적으로 귀무가설과 대립가설은 쌍으로 존재합니다. - 귀무가설(Null Hypothesis) : 결과가 우연 때문에 발생되었다는 가설 (영가설) - 대립가설 (Alternative Hypothesis) : 영가설과 대조되는 가설, 즉 증명하고자 하는 가설 귀무가설 (H0, Null Hy

엑셀 파일 합치기_업무 효율 끝판왕_파이썬 자동화 [내부링크]

엑셀을 사용하다 보면 같은 서식의 여러 파일을 합쳐야 하는 경우가 생깁니다. 그런 경우 Column 제목을 뺀 나머지를 복사해서 붙이곤 합니다. 그런데 엑셀 파일이 수십 개라면 어떻게 할까요? 하나로 모아야 할 수십 개의 파일들... 한, 두 개면 수작업으로 ctrl +C, ctrl+v를 하면 됩니다. 하지만 작업해야 할 파일이 수십 개 혹은 수백 개인 경우가 가끔 생깁니다. 멘붕입니다. 저도 수십 개의 파일을 일일이 수작업으로 복사, 붙여넣기 많이 했습니다. 실수라도 발견하면 처음부터 다시 해야 하는 악몽 같은 일도 당연히 많았구요. 비효율의 끝판왕이죠. 파이썬을 활용하면 이런 반복작업을 10초 내로 완료할 수 있습니다. 이제 저는 수십 개의 파일 합치는 것 같은 저효율, 반복작업은 모두 파이썬으로 처리하고 있습니다. 프로그래밍 언어라고 겁을 먹고 포기하는 분들이 많습니다. 하지만 몇 가지 기능의 코드만 실행하는 정도는 코딩 지식이 없이도 가능합니다. 오늘 제가 자동화 코드를 공유

엑셀 피벗_16년 차 직장인 끝판 강의 (테이블 디자인 변경) [내부링크]

저는 16년 차 데이터 분석가이자 품질 기술사입니다. 여러분의 빠른 일 처리와 칼퇴를 위해 제가 가진 모든 지식과 노하우를 빠짐없이 알려드리겠습니다. 이번 시간은 엑셀 피벗의 의미와 사용, 디자인 변경을 통해 원하는 형식으로 바꾸는 방법에 대해 알아보겠습니다. 여러분이 알고 계셨던 피벗 테이블은 잊어주세요. 피벗 테이블만으로 데이터를 완벽하게 정리할 수 있고 디자인까지 예쁜!! 실무에 최적화된 피벗 테이블을 알려드리겠습니다. 쉽지만 자세하고 알찬 엑셀 피벗! 시작하겠습니다. 피벗 테이블의 의미 세로로 긴 데이터를 가로로 표현하는 것이 피벗입니다. 엑셀에서는 피벗 테이블을 통해 다양한 데이터 처리가 가능합니다. 피벗 테이블 적용 결과 왼쪽이 원본 데이터, 오른쪽이 피벗 테이블입니다. 피벗 테이블은 일반적으로 가로가 긴 형태를 가집니다. 피벗 테이블 작성 데이터를 선택합니다. 삽입 > 피벗 테이블을 클릭합니다. 배치할 위치를 선택합니다. 저는 기존 워크시트의 'K1'에 만들겠습니다. 확

히스토그램, 기술 통계 (엑셀, Python) [내부링크]

오늘은 기술 통계와 히스토그램을 그리는 방법에 대해 말씀드리겠습니다. 통계분석에서는 기술 통계, 데이터 분석은 EDA(탐색적 데이터 분석)로 부르는 절차 중 하나입니다. 데이터의 형태와 성질을 바탕으로 이후의 분석방법을 선택하기 위한 중요한 절차와 개념이니 업무에 활용하시기 바랍니다. 통계 분류 1) 기술 통계 : 데이터 분석을 할 때 데이터 자체를 확인하기 위한 통계적 분석, 평균, 분산, 표준편차 등 2) 추론 통계 : 표본집단의 데이터를 통해 모집단을 추론, 추정하는 통계 히스토그램은 기술 통계에 해당하는 값을 아주 잘 나타내는 지표입니다. 일반적으로 히스토그램을 통해 데이터의 분포를 확인하고 테이블 형태의 요약값을 보는 절차를 거칩니다. 다양한 분석 툴로 히스토그램을 나타내는 방법을 알아보겠습니다. 엑셀 히스토그램 대부분의 사람들이 사용하는 엑셀로 히스토그램을 그리는 방법을 알려드리겠습니다. 엑셀은 통계와 데이터 분석을 위한 다양한 기능을 제공하고 있으므로 엑셀만 사용하셔도

엑셀 용량 줄이기_간단하고 빠른 방법 [내부링크]

엑셀 파일로 작업하다 보면 용량이 늘어나는 경우가 많습니다. 용량이 늘어난 경우에도 pc 내에서만 작업하는 경우 속도가 느려지는 것 외에는 별다른 문제가 없습니다. 하지만 공용으로 사용하는 엑셀 문서 또는 외부로 메일 발송해야 하는 경우 문제가 발생됩니다. 회사의 시스템에 따라 다르지만 특정 용량 이상의 메일은 발송을 막은 경우도 있어, 잦은 메일 발송 시 대용량 엑셀은 부담이 될 수 있습니다. 이런 문제를 해결하기 위해 엑셀 용량 줄이는 방법을 알려드리겠습니다. 엑셀 파일 용량이 늘어나는 이유 다양한 그림 혹은 이미지 첨부 많은 데이터 일반적으로 엑셀 파일의 용량 증가 이유는 위의 2가지 경우가 많은 부분을 차지합니다. 위의 2가지 이유로 늘어난 엑셀의 용량을 효과적으로 줄일 수 있는 방법을 설명드리겠습니다. 그 외 수식을 많이 사용했거나 중복된 워크 시트, 피벗에 대한 부분은 간단히 해결 가능하니 넘어가겠습니다. 이미지 압축을 통한 용량 줄이기 많은 이미지가 포함된 엑셀 파일은

데이터 리터러시_전설적인 일잘러 선배의 비밀 [내부링크]

제가 다니는 회사에 자주 언급되는 전설적인 선배님이 계십니다. 누구도 풀지 못하는 문제를 단숨에 해결해 승진했다고 합니다. 그 선배님의 영웅담은 이렇습니다. 사고 나는 곳을 몇 날 며칠 밤새우며 관찰하다. 중대한 문제가 발생했지만 어디서 어떻게 생겼는지 아무도 몰랐습니다. 그런데 전설의 선배는 문제 발생 예상 장소에서 문제가 재현될 때까지 기다렸습니다. 물론 한 번의 시도로 성공하지는 못했습니다. 여러 번의 실패로 그분은 헛일하는 듯했습니다. A 장소에서 B 장소로 옮기고.. 실패를 거듭하다 결국 문제가 생기는 순간을 관찰하고 말았습니다. 문제의 원인을 알게 되니 해결은 쉬웠고 전설의 선배는 회사에 많은 이익을 안겨주었습니다. 모두들 그 선배의 헌신과 노력을 추앙하며 그렇게 승승장구했다고 합니다. 전설의 선배라 얼굴을 보지 못했지만 가끔 일하는 자세를 말할 때 회자되곤 합니다. 그 선배가 지금 직장 생활을 한다면? 불과 몇 년 전만 해도 지금에 비하면 모든 것이 열악했습니다. 데이터

텍스트 마이닝_Python을 활용한 형태소 분석 [내부링크]

오늘은 텍스트 마이닝의 의미를 알아보고 Python으로 형태소 분석을 해보겠습니다. 마지막으로 형태소 분석으로 정형화된 데이터를 워드클라우드로 시각화해 의미 있는 결과도 도출해 보겠습니다. https://terms.naver.com/entry.naver?docId=3386330&cid=58370&categoryId=58370 텍스트 마이닝 [ 1. 텍스트 마이닝이란?] 자연어 처리 기반 텍스트 마이닝은 언어학, 통계학, 기계 학습 등을 기반으로 한 자연언어 처리 기술을 활용하여 반정형/비정형 텍스트 데이터를 정형화하고, 특징을 추출하기 위한 기술과 추출된 특징으로부터 의미 있는 정보를 발견할 수 있도록 하는 텍스트 마이닝 기술이다.다음은 ETRI의 자연어 기반의 질의 · 응답 시스템으로 자연어가 처리되는 과정을 보여준다. [ 2. 텍스트 마이닝의 주요 기술] 자연어 처리 기반 텍스트 마이닝의 주요 기술로는 자연어 처리(파싱, 형태소 분석, 품사 태깅, 관계 추출, 의... terms

엑셀 찾기, 바꾸기 활용하여 데이터 처리하는 꿀팁 [내부링크]

이번 시간은 엑셀의 찾기와 바꾸기 기능에 대해 알아보겠습니다. 찾기를 활용하는 경우는 두 가지가 있습니다. 값을 찾을 때 값을 찾아서 바꿀 때 이런 경우 사용하는 엑셀의 기능을 알아보겠습니다. 엑셀의 찾기와 바꾸기 기능을 알아보기 위해 타이타닉 데이터를 사용하겠습니다. 엑셀 특정 값 찾기 'PC 17318'이라는 티켓 번호를 가진 행을 찾으려고 합니다. 이럴 경우 엑셀의 '찾기' 기능을 사용하면 손쉽게 찾을 수 있습니다. ctrl + f를 누릅니다. '찾기 및 바꾸기'에서 '찾을 내용'을 넣고 '모두 찾기' 또는 '다음 찾기'를 누릅니다. 찾고자 하는 셀이 표시됩니다. 엑셀 값을 찾아서 바꾸기 타이타닉 데이터 중 Passenger Class를 변경하고자 합니다. '1'을 1등석, '2'를 2등석, '3'을 3등석으로 바꾸고 싶습니다. 이런 경우에도 찾기를 활용하면 간단하게 처리할 수 있습니다. 값을 찾을 영역을 설정해 줍니다. 원하는 않는 영역의 값이 선택될 수 있기 때문에 열, 또

PDF JPG 변환_10초 만에 이미지 변환 (알 PDF 설치 및 사용) [내부링크]

PDF로 변환된 JPG와 같은 이미지 파일을 다시 이미지로 바꾸는 방법을 알려드리겠습니다. 10초 만에 PDF를 이미지로 바꿀 수 있습니다. 이 작업은 '알 PDF'를 통해 이뤄지기 때문에 '알 PDF' 설치가 필요합니다. 알 PDF 설치 방법 알툴즈 사이트에 접속해서 '알 PDF' 설치하기를 누릅니다. https://www.altools.co.kr/download/alpdf.aspx 알PDF | 공식 다운로드 알PDF는 PDF를 다양한 포맷으로 변환할 수 있고, PDF 합치기, PDF 용량 줄이기, 수정 등 PDF를 자유롭게 편집할 수 있는 PDF 변환/편집 프로그램입니다. www.altools.co.kr 파일을 다운로드하고 실행을 누르면 설치가 시작됩니다. 약관 동의를 누르고 설치를 진행합니다. '사용자 지정 설치'를 클릭하셔서 추가 설치되는 것들을 해제해 줍니다. 해제하지 않으면 불필요한 프로그램도 같이 설치되고 검색엔진도 'zum'으로 바뀌니 다시 설정하기 귀찮아집니다. 알

엑셀 칸 늘리기 (서식, 자동 맞춤) [내부링크]

엑셀에 값을 붙여 넣거나 입력하면 칸의 넓이가 안 맞는 경우가 많습니다. 그 이유는 기본으로 세팅된 열과 행의 값과 달라서 입니다. 엑셀의 열과 행의 기본 값은 아래와 같습니다. 엑셀 기본 설정 행/열의 값 엑셀 열 너비 기본 설정값 엑셀 행 높이 기본 설정값 엑셀의 버전에 따라 값이 다를 수 있지만 특정한 기본값이 설정되어 행이 좁거나 넓게 되는 문제가 발생됩니다. 행의 값이 맞지 않는 경우 엑셀은 이렇게 칸이 맞지 않는 경우 칸을 조절하는 다양한 방법을 지원합니다. 이번 시간은 칸을 늘리거나 줄이는 방법을 하나씩 알려드리겠습니다. 셀 선택 후 마우스로 늘리기/줄이기 셀 선택 후 더블 클릭 셀 선택 후 서식/값 입력 셀 선택 후 서식/자동 맞춤 1. 셀 선택 후 마우스로 늘리기/줄이기 변경하고자 하는 셀을 선택해 줍니다. (열 상단을 드래그하면 선택됩니다.) 화살표 위치 (선택된 셀 열 상단 오른쪽)를 마우스로 클릭해서 늘리거나 줄여 줍니다. 전체 행의 폭이 변경됩니다. 2. 셀

엑셀 카운트 함수_직장인 초필살기(countif, countifs,counta, countblank) [내부링크]

엑셀에서 수식을 통해 개수를 세는 count 함수에 대해 알아보겠습니다. 엑셀은 다양한 count 함수를 제공합니다. 그중 현업에서 자주 쓰이는 4가지 count 함수를 설명드리고 그 사용법까지 알려드리겠습니다. 저와 함께 하신다면 여러분도 칼퇴 하실 수 있습니다. 오늘은 예제 파일을 보면서 복잡한 조건을 가진 칸을 다양한 count 함수로 하나씩 채워가겠습니다. 예제는 타이타닉 생존자 데이터 중 일부를 가져온 것입니다. 타이타닉 생존자 데이터 Counta : 전체 count 빈칸을 제외한 숫자, 문자를 모두 카운트하는 함수입니다. =COUNTA(범위) 범위를 입력하면 해당 범위의 빈칸을 제외한 모든 셀을 카운팅 합니다. Countblank : 빈칸 count 빈칸을 카운트하는 함수입니다. =COUNTBLANK(범위) Countif : 조건에 맞는 셀을 count 범위 중 조건과 일치하는 셀을 카운트하는 함수입니다. =COUNTIF(범위, 조건) B열 중 객실 등급이 '1'인 셀을

엑셀 표준편차 (모집단, 표본집단) [내부링크]

이번 시간에는 엑셀에서 표준편차를 구하는 방법에 대해 알아보겠습니다. 표준편차를 구할 때 집단의 성격을 알아야 제대로 된 표준편차를 구할 수 있습니다. 집단의 구분 및 성격 모집단에서 샘플링(Sampling)을 통해 표본(Sample)이 만들어집니다. 표본(Sample)의 데이터를 통해 모집단의 성질을 추측, 추정 (Inference) 할 수 있습니다. 모집단 (Population Parameter) 분석하기 위한 원집단을 의미합니다. 표본집단 (Sample) 표본집단이란 모집단에서 데이터를 샘플링하여 만들어진 집단을 의미합니다. 모집단의 분산(Variance) 계산 방법 편차 제곱합을 1/n로 나눕니다. 표본집단의 분산(Variance) 계산 방법 편차 제곱합을 1/(n-1)로 나눕니다. 모집단의 통계량 계산 (예제) 10개의 값으로 모집단을 가정하여 통계량을 계산했습니다. 모분산 계산 공식에 제곱근을 취한 값과 stdev.p로 계산한 값이 같은 것을 알 수 있습니다. 모표준편차

이항분포 (Binomial Distribution)의 정규분포 근사 [내부링크]

확률변수에 의해 나타나는 확률 값을 그래프에 타점하면 분포가 되고, 이 분포를 확률분포로 정의합니다. 데이터를 분류할 때 정성적 데이터와 정량적 데이터로 우선 구분하고 다시 정량적 데이터는 연속형인 계량치와 이산형인 계수치로 나눌 수 있습니다. 이런 데이터의 특징에 따라 확률분포도 연속형 분포(계량치)와 이산형 분포(계수치)로 나누었습니다. 연속형 분포: 정규분포, t 분포, x^2 분포, F 분포, 지수분포 이산형 분포: 베르누이 분포, 이항분포, 푸아송분포, 초기하분포 연속형 분포 중 정규분포와 t 분포에 대해서는 이전 시간에 알아봤습니다. 자세한 내용은 아래 포스팅을 참고하세요. https://blog.naver.com/changeangel/222898754808 통계프로그램과 파이썬으로 알아보는 정규분포와 중심극한정리 정규분포를 왜 그렇게 강조하나요? 통계 수업을 듣거나 통계 관련 서적을 보면 정규분포를 강조하고 있습니... blog.naver.com https://blog.

상관분석 종류 (피어슨, 스피어만, 켄달 Python 코딩) [내부링크]

오늘은 상관분석에 대해 간단히 알아본 뒤 다양한 상관분석 방법을 설명드리겠습니다. 또한 Python 코딩을 통해 분석 방법에 따른 특징도 알아보는 시간을 가지겠습니다. https://blog.naver.com/changeangel/222903990267 엑셀 통계_엑셀 상관계수, 상관분석 어렵지 않아요. 안녕하세요. 여러분의 데이터 분석가 플래워드입니다. 엑셀로 상관관계를 분석할 수 있나요? 당연히 엑셀로... blog.naver.com 상관 및 회귀분석의 개념 상관 (Correlation) 분석 : 두 변수 간의 관련성을 확인 회귀 (Regression) 분석 : 두 변수 간의 관계를 함수적으로 정량화한 것 상관계수 (Correlation Coefficient) 수치적 변수들 간에 어떤 관계가 있는지를 나타내기 위해 사용되는 측정량 (-1 ≤ r ≤ 1) 상관계수의 검정 두 변수 간의 상관관계가 있는지에 대한 검정 H0 (귀무가설) : 두 변수는 상관관계가 없다. H1 (대립가설)

엑셀 추세선 _ 초간단 회귀분석 (산점도, 다항회귀, 결정계수) [내부링크]

이번 시간에는 복잡한 분석 없이 엑셀에서 간단히 회귀분석하는 방법을 알려드리겠습니다. 추세선 추가를 통해 간단히 회귀식을 구하는 법!! 바로 시작하겠습니다. x에 해당하는 y 값을 가지는 데이터가 있는 경우 두 가지 변수의 관계를 가장 잘 나타낼 수 있는 그래프는 산점도 (Scatter Plot)입니다. 엑셀 산점도(Scatter Plot)로 단순 선형 회귀 진행 데이터영역을 선택하고 삽입 > 분산형 차트를 클릭합니다. x와 y 값에 대한 산점도가 출력됩니다. 오른쪽 위의 녹색 십자가 (+)를 누릅니다. 추세선 > 기타 옵션을 선택합니다. 추세선 서식에서 선형을 선택합니다. '수식을 차트에 표시'와 'R-제곱 값을 차트에 표시'를 선택해 줍니다. 산점도에 회귀식과 결정계수 (R^2)가 출력되었습니다. 엑셀 산점도(Scatter Plot)로 다항(Polynomial) 회귀 진행 데이터영역을 선택하고 삽입 > 분산형 차트를 클릭합니다. x에 해당하는 y의 관계가 직선이 아닌 곡선으로 나

엑셀 틀고정 인쇄와 페이지 번호 삽입_틀고정 단축키에 대한 추가 설명 [내부링크]

안녕하세요. 여러분이 데이터 분석가 플래워드입니다. 오늘은 틀고정 한 상태로 인쇄하는 방법과 틀고정 단축키 사용방법에 대해 말씀드리겠습니다. 틀고정은 엑셀 데이터를 보는 데는 유용하지만 인쇄할 때는 틀고정이 적용되지 않는다는 문제점이 있습니다. 틀고정한 상태에서 인쇄를 하기 위해서는 추가로 설정을 해주어야 하는데 그 방법을 자세하게 설명드리겠습니다. 먼저 틀고정하는 법에 모르는 분은 아래 URL의 내용을 참조해 주세요. ^^ https://blog.naver.com/changeangel/222902959778 엑셀 틀고정_빠른실행도구모음으로1초 만에 실행되도록 알려드립니다. 안녕하세요. 여러분의 데이터 분석가 플래워드입니다. 오늘은 엑셀로 데이터 분석하기 위해 반드시 알아야 ... blog.naver.com 틀고정한 상태로 인쇄하는 법 이제 시작합니다. 예제 Data는 예전에 공유했던 다이아몬드 데이터를 사용하겠습니다. 틀고정을 적용 전 모습니다. 보기 > 틀고정 > 첫행고정 을 선

가설검정과 1종오류, 2종오류 [내부링크]

안녕하세요. 여러분의 데이터 분석가 플래워드입니다. 오늘은 가설검정의 의미와 제1종 오류, 제 2종 오류에 대해 알아보겠습니다. 가설검정, 추정과 같은 얘기가 재미없는 것을 알고 있습니다. 하지만 통계를 활용해 문제 해결을 하려면 반드시 알아야 하는 개념이라 간단히 언급하고자 합니다. 어려운 통계를 쉽게 설명하기 위해 노력하겠습니다. 가설검정 [Test of Hypothesis] 모수나 확률분포에 대하여 가설 (귀무가설, 대립가설)을 설정하고, 이 가설의 성립 여부를 시료의 데이터로부터 통계적 분석을 통하여 귀무가설과 대립가설 중 하나를 결정하는 과정 귀무가설 (H0, Null Hypothesis) : 검정의 대상이 되는 기준적인 가설로 모집단의 변화가 없다는 의미 대립가설 (H1, Alternative Hypothesis) : 귀무가설에 대립되는 가설, 새로운 집단이 기준의 모집단과 달라졌다는 의미 가설검정은 가설을 만들고 그것을 평가하는 일련의 절차입니다. 검정이라는 단어가 어려

mbti 검사 istj 특징 _ 데이터로 보는 mbti [내부링크]

안녕하세요. 여러분의 데이터 분석가 플래워드입니다. 오늘은 mbti에 대해 알아보겠습니다. mbti에 대해 모르시는 분은 없으실 거예요. mbti에 대해 대략적으로 알고 있지만 데이터로 정리된 게 적은 건 사실일 거예요. 그래서 오늘은 mbti에 대한 정보를 바탕으로 데이터 분석을 진행해 보겠습니다. 인터넷에 떠도는 '카더라~'가 아닌 mbti로 적은 글을 모아 단어를 추출해서 데이터의 신뢰도를 높였으니 참고해 주세요. 내용이 너무 많아 오늘은 istj에 대해 알아보고 다음번에 다른 성격 유형도 분석해 볼 예정입니다. 자료 출처 - Kaggle mbti - Naver Blog 크롤링 자료 조사를 위해 Kaggle의 mbti 분석 데이터를 참고했습니다. 그 후 Blog의 글을 크롤링 하여 분석했습니다. Kaggle mbti kaggle에서 진행했던 mbti 유형에 대한 데이터입니다. 심리학적인 분류를 통해 모은 8,675 건의 데이터로 분석을 진행했습니다. https://www.kag

엑셀 틀고정_빠른실행도구모음으로1초 만에 실행되도록 알려드립니다. [내부링크]

안녕하세요. 여러분의 데이터 분석가 플래워드입니다. 오늘은 엑셀로 데이터 분석하기 위해 반드시 알아야 할 틀고정에 대해 알아보겠습니다. 엑셀은 GUI 환경을 제공하여 직관적인 UI(User Interface)를 지원해 주지만 데이터가 많은 경우 Index(행)와 Column(열)의 이름을 못 보는 경우도 생깁니다. 스크롤을 하다 보면 Index/Column의 제목이 사라져서 지금 보는 데이터가 어떤 것인지 혼란스러운 경우도 있구요. 이런 경우를 대비해 엑셀의 틀고정을 '빠른 실행 도구 모음'으로 설정해둔다면 1초 만에 틀고정을 설정하거나 해제를 할 수 있습니다. 이렇게 다양한 엑셀의 기능을 활용하면 결과적으로 업무의 효율을 높일 수 있습니다. 제 글을 보고 따라 하면 앞으로의 엑셀 생활이 편해질 거예요. 이번 포스팅은 간단하지만 강력한 효용을 가지고 있기 때문에 꼭 따라 해보고 적용해 보시길 바랍니다. 기존 엑셀 분석의 문제점: 스크롤을 하다 보면 제목이 사라져요. 스크롤을 내리기

엑셀 통계_엑셀 상관계수, 상관분석 어렵지 않아요. [내부링크]

안녕하세요. 여러분의 데이터 분석가 플래워드입니다. 엑셀로 상관관계를 분석할 수 있나요? 당연히 엑셀로 상관관계 분석할 수 있습니다. 지난번에 엑셀 통계에 대해 알아본데 이어 오늘은 엑셀로 상관계수를 구하고 상관분석을 해보겠습니다. 저와 함께 데이터 분석의 재미에 빠져보시겠습니까? ^^ 데이터 분석을 진행할 때 데이터 간의 상관관계를 조사해 보는 것을 빼놓으면 안 됩니다. 이런 분석을 엑셀로 충분히 할 수 있습니다. 상관계수 (Correlation Coefficient) 수치적 변수들 간에 어떤 관계가 있는지를 나타내기 위해 사용되는 측정량 (-1 ≤ r ≤ 1) 출처: 위키피디아 데이터의 퍼짐 정도에 따라 상관 계수가 달라지는 것을 알 수 있습니다. 뚜렷한 형태를 띠더라도 선형의 관계가 형성되지 않으면 상관 계수는 0으로 나타나는 것을 알 수 있습니다. 상관분석 (Correlation Analysis) 두 변수들 간에 어떤 선형적인 관계를 갖고 있는지를 분석하는 방법 여기서 주의할

mbti 검사 ENFP 특징 _ 데이터로 보는 mbti (mbti 워드클라우드) [내부링크]

안녕하세요. 여러분의 데이터 분석가 플래워드입니다. 오늘은 mbti에 대해 준비했습니다. mbti 16가지 성격 중 오늘 제가 준비한 성격은 바로바로.. ENFP 이웃님들의 추천을 받아 순서대로 준비하고 있으니 다른 분들도 기다려 주시면 열심히 만들게요. ^^ 이전 포스팅은 아래 URL 참조해 주시면 감사드리겠습니다. https://blog.naver.com/changeangel/222902192284 mbti 검사 istj 특징 _ 데이터로 보는 mbti 안녕하세요. 여러분의 데이터 분석가 플래워드입니다. 오늘은 mbti에 대해 알아보겠습니다. mbti에 대해 모... blog.naver.com 자료의 출처는 지난번과 같은 두 가지입니다. Kaggle mbti Data Set Naver Blog 크롤링 성격유형에서 활동가로 나오는 ENFP는 사람들이 어떻게 생각하는 크롤링을 통해 알아보겠습니다. Kaggle ENFP 10가지 단어 ENFP를 설명하는 상위 10가지 단어에 대해 알아

[단변량 분석] JMP 통계분석 _ Univariate Analysis with JMP [내부링크]

안녕하세요. 여러분의 데이터 분석가 플래워드입니다. 저는 대기업 16년 차 데이터 분석가이자 품질관리 기술사입니다. JMP 통계 프로그램 공저자이며 JMP Discovery Summit 발표를 진행하기도 했습니다. 제 경험과 지식을 제 블로그에 모두 적어 방문해 주시는 분들께 도움이 되도록 하겠습니다. 경력 및 이력 대기업 16년 차 데이터 분석가 JMP 실무 활용 가이드 공저자 품질관리 기술사 AI & Machine Learning TF 2021 JMP Discovery Summit 발표 통계, Data 분석 사내 강사 JMP 프로그램을 활용하면 다양한 분석과 시각화가 가능합니다. JMP는 SAS에서 만든 GUI 환경의 통계분석 도구입니다. Global 반도체 업체인 Intel과 여러 기업에서 JMP로 분석된 결과를 요구할 정도로 공신력 있고 특히 제조 분야에서는 없어서는 안 될 통계 프로그램입니다. 이런 통계 Tool을 16년 동안 사용하며 얻은 노하우와 Tip을 여러분께 공유하

워드 클라우드 분석, 아마겟돈과 러시아 [내부링크]

푸틴 핵 위협 초고 수준, 아마겟돈 위험 바이든 뉴스를 보니 러시아의 핵 위협에 대해 아마겟돈 언급이 있었습니다. 외교적인 지식이 전혀 없는 저는 러시아와 아마겟돈이라는 단어에 대해 사람들이 언급한 단어들을 모아 분위기를 파악하고자 블로그 크롤링을 시작했습니다. 분석 목적: 아마겟돈과 러시아에 대해 포스팅한 단어 확인 분석 배경: 바이든 대통령의 '아마겟돈' 언급 분석 방법: 블로글 수집 후 워드 클라우드 작성 분석 도구: 구글 코랩, 파이썬, Konlpy, Word Cloud Java 환경 설정이 어렵기 때문에 Google Colab에 환경설정하여 분석했습니다. 여러 번 시도 끝에 성공하긴 했지만 형태소 분석은 제 PC보다 Colab에서 진행하곤 합니다. !pip install selenium !apt-get update !apt install chromium-chromedriver !cp /usr/lib/chromium-browser/chromedriver /usr/bin imp

실제 데이터 분석가가 사용하는 통계 프로그램은 뭘까? [내부링크]

데이터 분석가는 어떤 프로그램을 쓰는지 궁금하신가요? 현업에서 사용하는 프로그램과 Tool이 궁금하시다면 이 글이 여러분의 궁금증을 풀어줄 것입니다. 빅데이터 분석을 위한 도구에 대해 많은 주장이 있지만 정확한 사실을 알기 어려우셨을 거라 생각합니다. 저는 16년 동안 데이터 분석 업무를 하고 있습니다. 빅데이터에 관심이 많아 3년 전부터 Python과 Machine Learning을 배웠고 회사에서 AI TF 업무를 진행했습니다. 엑셀부터 시작해서 미니탭, SAS JMP, Python, R, Power BI, Spotfire를 모두 사용해왔고 현업에서 활용 중입니다. 많은 경험을 가진 데이터 분석가 입장에서 정확한 현실에 대해 말씀드리겠습니다. Python, R을 몰라도 되나요? 데이터 분석에서 빼놓을 수 없는 프로그램이 바로 Python과 R입니다. 빅데이터와 AI, Machine Learning, Deep Learning 관련 업무를 하는 데이터 사이언티스트들에게는 필수적인 프

통계프로그램과 파이썬으로 알아보는 정규분포와 중심극한정리 [내부링크]

정규분포를 왜 그렇게 강조하나요? 통계 수업을 듣거나 통계 관련 서적을 보면 정규분포를 강조하고 있습니다. 복잡한 수식을 가진 정규분포를 어디에 쓰고 이런 걸 왜 써야 하는지 몰랐습니다. 정규분포를 몰라도 통계프로그램이 데이터를 분석해 주기 때문에 저는 p-Value를 보고 귀무가설과 대립가설을 채택하기만 했습니다. 정규분포의 확률밀도 함수 평균이 0이고 표준편차가 1인 표준정규분포 [JMP Distribution Calculator] 하지만 품질관리기술사를 준비하면서 체계적으로 통계 이론을 정리할 필요성을 느꼈습니다. 그러다 보니 정규분포에 대한 중요성도 알게 되었습니다. 그에 더해 모집단이 정규성을 만족하지 않더라도 평균을 무수히 많이 취하면 정규분포에 근접한다는 중심극한정리에 대해 정확하게 이해할 수 있었습니다. 그렇게 알게 된 지식을 Python 코딩으로 그래프를 그려 표현하니 좀 더 이해하기 쉬웠습니다. 오늘은 제가 정규분포와 중심극한정리에 대해 이해한 내용을 바탕으로 글을

박스오피스 분석_ 데이터로 보는 한국영화순위 [내부링크]

안녕하세요. 여러분의 데이터 분석가 플래워드입니다. 오늘은 영화에 대한 데이터 분석해 보겠습니다. 앞으로 실제 그래프를 그려보는 시간을 자주 가져볼게요. PublicDomainPictures, 출처 Pixabay 한국 사람들은 어떤 영화를 많이 봤을까요? 매년 새로운 영화가 개봉되고 인기를 얻지만 누적 관객 수가 제일 많은 영화가 뭔지 정확히 떠오르기 힘드셨을 거예요. 오늘은 국내 박스오피스 순위를 알아볼 건데요. 데이터의 출처와 조회 일은 아래와 같으니 참고하시면 데이터를 이해하는 데 도움이 되실 거예요. 출처: 영화진흥위원회 통합전산망 (http://www.kobis.or.kr) 조회일: 2022-07-18 jeremyyappy, 출처 Unsplash 가장 많이 본 영화는 무엇인가요? 명량 감독 김한민 출연 최민식, 류승룡, 조진웅 개봉 2014. 07. 30. 가장 많이 본 영화는 '명랑'이었습니다. 자그마치 누적관객 수 천7백만 명을 돌파한 영화입니다. 201

엑셀통계_엑셀 데이터 분석 쉽게 알려드립니다. [내부링크]

고가의 프로그램 없이 데이터 분석할 수 있는 방법이 있나요? 저는 예전에 데이터 분석가가 되기 위해 코딩을 하거나 고가의 통계프로그램을 능숙하게 사용할 수 있어야 한다고 생각했습니다. 그래서 통계프로그램을 깊숙이 배우고, 몇 년 동안 파이썬과 R을 통해 AI와 Machine Learning을 배우기도 했습니다. 하지만 데이터 분석의 목적에 대해 생각하면서 일정 수준까지는 엑셀의 추가 기능으로 통계와 데이터 분석이 가능한 것을 알게 되었습니다. 엑셀만 제대로 활용해도 일정 수준의 분석은 충분히 가능합니다. https://blog.naver.com/changeangel/222897838576 실제 데이터 분석가가 사용하는 통계 프로그램은 뭘까? 데이터 분석가는 어떤 프로그램을 쓰는지 궁금하신가요? 현업에서 사용하는 프로그램과 Tool이 궁금하시다... blog.naver.com 통계와 데이터 분석의 목적은 화려한 그래프를 그리는 것이 아니라 숫자와 문자로 된 데이터로부터 의미 있는 결과

엑셀 히스토그램 간단히 만들기 [내부링크]

안녕하세요. 여러분의 데이터 분석가 플래워드입니다. 오늘은 엑셀의 그래프 기능 중 히스토그램(Histogram)에 대해 알아보겠습니다. 엑셀로 히스토그램을 그려야 하는데 어떻게 그려야 할지 몰라서 당황하신 경험 있으실 거예요. 숫자를 도수분표표로 그려야 하나? 피벗테이블로 데이터를 처리한 후 Bar Chart를 그리면 될까 망설이셨을 수 있고요. 저도 통계프로그램 없이 엑셀로 히스토그램을 그릴 때 멍하니 화면만 바라본 경험이 있습니다. 그런데 엑셀에서 아주 간단히 히스토그램을 작성할 수 있도록 기능을 지원하고 있습니다. 이 글과 아래 동영상을 보시면 앞으로 엑셀로 히스토그램 그리는 것을 전혀 두려워하시지 않으셔도 될 거라 자신합니다. 10초 만에 히스토그램 그리는 방법을 알려드릴게요. 1) 히스토그램을 그릴 데이터를 선택해 주세요. 첫 번째 행을 선택하고 Ctrl + shift + '화살표 아래'를 선택하면 해당 전체 영역이 선택됩니다 2) 삽입 > 통계 차트 삽입 > 히스토그램을

호구 말고 착한 사람 되기 [내부링크]

will0629, 출처 Unsplash 금 밟으셨어요. 선 넘으셨다고요! 무례한 행동을 하는 사람에게 하고 싶은 말이다. 쫄보이자 호구인 나는 이런 말을 당당하게 하지 못했다. 호구로 살았다. 삶의 이유와 목적이 남들의 시선과 다른 사람의 강요였던 적이 많았다. 내 선택권을 남에게 넘겨준 적도 있다. 타인의 무례한 말투나 행동에도 어색한 웃음으로 상황을 모면했다. 내 잘못이 아닌데 사과한 적도 많다. 내가 호구인 것을 알고 계속된 반성과 행동을 바꾸려 노력을 했지만 쉽지는 않았다. 호구는 멀리서 봐도 그 기운이 느껴지는 걸까? 어찌나 내 삶에 간섭하려 드는 사람들이 많은지... 내가 걱정된다며 충고를 해주는 사람이 많았다. 하지만 대부분이 진심 어린 충고가 아니라 괜히 시비 거는 경우가 대부분이다. 시간이 흘러 지나가듯 물어보면 그들은 나에게 한 말을 기억도 못 한다. 타인의 요구를 무조건 들어주는 것이 착한 것이 아니다. 나와의 관계를 소중히 생각하지 않고 함부로 대하거나 자존감

불황이지만 돈을 불리고 있습니다. [내부링크]

불황이지만 돈을 불리고 있습니다 저자 달시기|월천대사 출판 매경출판 발매 2019.04.10. 젊은 친구들은 말합니다. “저희가 무슨 돈이 있느냐”고. 일을 시작하기 전에 사회에 나오기 전에 할 수 있는 것들이 있습니다. 시간의 레버리지를 쓰면 됩니다. 젊을 때 돈에 대해서 공부하면 됩니다. 즉, 근로소득, 자본소득, 사업소득, 임대소득 등을 공부하고 자산이 불어가는 과정에 대한 스킬도 익히고 모의투자를 통해 주식이나 부동산을 보는 눈을 높이며 수많은 연습을 통해 잃지 않는 가치투자를 연마하면 됩니다. 처음에는 작게 시작해도 됩니다. 시간이 있으니 말입니다. 여러분에겐 시간이 있습니다. 시간의 레버리지를 잘 쓰고, 40대가 되서 돈의 레버리지를 잘 쓴다면 50이 채 되기 전에 경제적 자유를 이룰 수 있을 것입니다. #불황이지만돈을불리고있습니다. #재테크

Kaggle Survey_Python 사용자 필수 로드맵 [내부링크]

2021 Kaggle Machine Learning & Data Science Survey 데이터 분석과 Machine Learning, Deep Learning에 있어 가장 큰 대회인 Kaggle에서 2021년 Survey를 바탕으로 데이터 분석을 실시했습니다. 오늘은 그 결과에 대해 review 해보겠습니다. 나이에 따른 분류 Kaggle의 가장 많은 사용자는 25~29세로 나타납니다. 앞으로 사회에서 데이터 분석 실력이 높은 사람들이 충분히 공급될 걸로 보이고 있습니다. 성별에 따른 분류 Kaggle 사용자의 성별을 barchart로 보여줍니다. 남자가 여자에 비해 압도적으로 높은 것을 알 수 있습니다. 지역에 따른 분류 Kaggle 사용자의 국적을 보면 인도가 압도적으로 많고 그 후 미국, 일본, 중국, 브라질 순으로 보입니다. 아쉽게도 한국 국적을 가진 사용자는 많지 않은 것을 알 수 있습니다. Kaggle 참여자를 지도로 보면 대부분 인도와 미국, 중국에 몰려있는 것을 알

품질관리기술사 합격, 3개월 단기 합격 노하우 공개 [내부링크]

축하합니다. 최종 합격입니다. 기술사 준비한지 3개월 만에 필기 합격 후 동차에 실기 합격하여 최종적으로 기술사가 되었습니다. 비교적 짧은 준비 기간에 기술사 합격할 수 있었던 방법에 대해 알려드리겠습니다. 기술사 시험 결과 데이터 분석가이자 통계를 활용한 품질관리자입니다. 저는 데이터 분석가이자 통계를 활용해 품질관리 업무를 하고 있는 직장인입니다. 업무의 전문성을 더하기 위해 기술사 자격이 있으면 좋겠다는 생각은 해왔지만 실행에 옮기지는 못했습니다. 생각만 하고 행동에 옮기지 않으니 바뀌는 것은 없었습니다. 기술사를 가진 선배님들을 부러워했습니다. 사내 기술사님을 뵌 적 있습니다. 그분은 늘 당당하게 일하셨고 상대적으로 좋은 조건으로 이직을 하셨습니다. 저는 기술사님을 부러워했지만 기술사가 되는 건 생각조차 못 했습니다. 시간이 흘러 마음속에 있던 동경하는 마음이 커져 결국 행동을 했습니다. 제가 기술사 합격할 수 있었던 방법은 크게 다섯 가지로 정리할 수 있습니다. 1. 명확한

기술사가 알려주는 기초통계와 통계 용어 [내부링크]

통계 어렵지 않습니다. 저는 대기업 16년 차 데이터 분석가이자 품질관리 기술사입니다. JMP 통계 프로그램 공저자이며 JMP Discovery Summit 발표를 진행하기도 했습니다. 제 경험과 지식을 제 블로그에 모두 적어 방문해 주시는 분들께 도움이 되도록 하겠습니다. 경력 및 이력 대기업 16년 차 데이터 분석가 JMP 실무 활용 가이드 공저자 품질관리 기술사 AI & Machine Learning TF 2021 JMP Discovery Summit 발표 통계, Data 분석 사내 강사 통계 프로그램 공저자이자 품질관리 기술사가 기초부터 차근차근 알려드릴게요. 통계란? 통계학(statistics)은 산술적 방법을 기초로 하여, 주로 다량의 데이터를 관찰하고 정리 및 분석하는 방법을 연구하는 수학의 한 분야이다. 통계학은 관찰 및 조사로 얻을 수 있는, 데이터로부터, 응용 수학의 기법을 이용해 수치상의 성질, 규칙성 또는 불규칙성을 찾아낸다. 통계적 기법은 실험 계획, 데이터의

데이터 분석과 코딩으로 연봉 1억되기 [내부링크]

높은 연봉을 받고 싶으신가요? 회사에서 인정받고 싶나요? 현재의 연봉에 만족하지 못하시거나 회사에서 인정받고 싶은 분들은 이 글을 끝까지 읽으시길 당부드립니다. 회사에서 소모품으로 사용되다가 제대로 자신의 역량을 개발하지 못하는 안타까운 일들은 사라져야 합니다. 데이터 분석과 코딩을 제대로 배우시면 점차 높아지는 연봉을 느끼실 겁니다. 현재의 연봉이 만족스럽지 못하다면 높은 연봉을 주는 회사로 이직도 쉬운 게 데이터 분석 분야입니다. 데이터 분석이 중요하지 않았던 적은 없었지만 최근 AI, Machine Learning, 자동화가 화두가 되고 있습니다. 일부 대기업에서는 데이터 분석 가능 인력에 대해 채용 시 가산점을 주고 있으며 심지어 코딩 교육까지 진행하고 있습니다. 또한 해당 분야의 전문가는 높은 연봉으로 이직하는 등 나날이 데이터 분석에 대한 중요성이 점차 커지고 있는 추세입니다. https://m.hankookilbo.com/News/Read/A2022041811420004

분포에 의한 검정_확률이론 정리 [내부링크]

오늘은 확률에 대해 간단히 정리하겠습니다. 확률분포에 대한 개념을 안다면 평균 검정, 분산 검정을 할 수 있습니다. 집단 간의 평균과 분산에 대해 비교를 할 때는 개별 데이터가 아닌 분포를 통해 비교하고 있습니다. 이런 일련의 절차에 대한 이론적인 지식을 간단히 정리해두었으니 읽어보시고 향후 여러분들의 데이터 분석에 도움이 되시길 바랍니다. 확률 법칙 실험에서 모든 근원 사상들의 집합을 표본공간 S라 정의하고, 표본공간의 부분집합을 사상 또는 사건이라 할 때, 표본공간에서 주어진 조건이 일어날 수 있는 값을 확률이라 정의합니다. 다시 말하면 확률이란 어떤 사상 A가 일어날 것이라고 기대되는 가능성을 수치적으로 나타낸 값을 일컫는 말입니다. P(표본공간 전체) = 1 0 ≤ P(A) ≤1 확률 변수 주어진 조건하에서 특정 사건이 나올 수 있는 값들을 확률변수라 합니다. 확률변수에는 헤아릴 수 있는 이산확률변수와 헤아릴 수 없는 연속적인 개념인 연속확률변수로 나누어집니다. 1) 이산확률

대국굴기 (feat. 알리바바가 온다.) [내부링크]

중국에서의 사업은 중국 공산당 정부의 의지에 따라 한순간에 무너질 수도, 기업가치가 심각하게 훼손될 수도 있다는 사실을 알려준다. 알리바바가 온다. 알리바바가 온다 저자 임정훈, 남상춘 출판 더퀘스트 발매 2019.03.14. 현재 급변하는 중국 경제의 중심에는 알리바바라는 혁신적인 기업이 있다. 처음에는 중국의 제조업체를 전 세계 시장에 중개해 주는 B2B 중개 서비스 기업으로 출발했으나, 지금은 중국 내 전자상거래의 최강자로 자리 잡았다. 알리바바가 중국인들로부터 존경받는 것은 돈을 많이 벌어서이기도 하지만, 중국 경제 전반의 혁신을 이끌고 생활 수준을 업그레이드하기 때문이다. 알리바바의 경제 생태계 중에서도 빼놓을 수 없는 것이 결제 시스템인 알리페이다. 신용카드 사용자가 미미한 상황 (중국의 신용카드 보급률은 16%로 한국의 90%에 비해 절대적으로 낮다.)에서 판매자와 구매자가 안전하게 거래할 수 있도록 에스크로 서비스를 적용한 것이 성공의 비결이다. 에스크로란 상거래 시에

나의 지난 한 달은 새로운 도전의 연속이었다. [내부링크]

나에게 지난 한 달은 새로운 도전의 연속이었다. 처음 한달을 시작할 때는 변화의 기대 없이 시작했다. 충분히 열심히 살고 있다는 착각과, 이보다 더 많은 것을 할 수는 없을 것이라는 자만심을 가지고 있었다. 내가 한달을 시작한 이유는 명확하다. '이진선'님의 자기발견과 자기씽킹에 참여하기 위해서였다. 브런치와 페이스북을 통해 우연히 알게 된 진선님의 디자인적인 사고와 글쓰기 실력을 배우고 싶었다. 한달쓰기는 한달씽킹으로 넘어가는 길목이라는 애초의 나의 예상과 달리 많은 것을 나에게 안겨주었다. 출처: 이진선 브런치 한달쓰기를 시작한 후 매일 글쓰기를 하며 멤버들과 소통하며 내가 얻은 것들은 아래와 같다. 1. 나와 내 삶에 대한 명확한 인식 글을 써보니 내 삶에 대한 방향이 명확해졌다. 내가 좋아하는 것, 내가 바라는 삶이 어떤지 관조해보고, 앞으로 어떻게 살지 생각해볼 수 있었다. 2. 브런치 작가 선정과 대형 페이지 공유 브런치 작가가 되는 것에 대한 심리적 장벽이 있었다. 하지

부의 확장 (요약) [내부링크]

인생을 살며 돈 문제는 피할 수 없다. 그렇다면 즐기며 정면으로 돌파해야 한다. 하지만 자신을 속여 가며 돈에 대해 쿨한 척하다가 시간이 지나고 나서야 좌불안석하는 경우가 얼마나 많은가? 돈이 많을 때가 아니라 모자랄 때, 작은 욕심과 절박함에 바들바들 떨어야 했다. 나의 배포에 맞게 자원을 얻었을 때야 비로소 마음에 여유가 찾아왔다. 돈이 있어야만 내 인생의 선택권이 나에게 주어짐을 그제야 깨달았다. 돈은 약이 될 수 있고 자유가 될 수 있고 행복이 될 수 있다. 특히 내 힘으로 일궈낸 돈이라면 더욱 그렇다. 자원을 자원으로서 직시하면 그제야 진정한 무소유의 삶이 열리는 것 아닐까? 트레이더로서 자리를 잡으며 나는 자본주의의 면면을 냉철하게 응시해야 했다. 단 한 치의 낭만이나 변명도 용서되지 않는 곳이었다. 나 자신의 사소한 실수나 욕망을 모두 반성해야 했다. 돈만 좇는 트레이더라니, 얼핏 들으면 탐욕이 가득한 직업일 것 같지만, 사실은 수도승같이 모든 잡념을 끊고 오직 진리만을

때로는 아들로, 때로는 아빠로 (feat. 딸에게 보내는 심리학 편지) [내부링크]

딸에게 보내는 심리학 편지(개정증보판) 저자 한성희 출판 메이븐 발매 2020.01.28. 실패는 아무것도 아니다. 오히려 실패를 많이 해 본 사람일수록 성공할 확률도 높다. 그만큼 경험을 통해 얻는 것이 많기 때문이다. 그러니 나는 네가 완벽을 추구하기보다는 다양한 경험을 쌓으려고 노력했으면 좋겠다. 계속 고민만 하지 말고 일단 무엇이든 시도해 봤으면 좋겠다. 잘되고 못되고는 그다음 문제다. 딸에게 보내는 심리학 편지 인생을 40 정도 살다 보니 어설프게나마 알게 된 세상 사는 지혜가 바로 실패에 대한 열린 마음이다. 딸을 사랑하는 엄마는 딸에게 실패를 두려워하지 말고 계속 시도하라고 권한다. 비록 내 어머니는 아니지만 딸을 사랑하는 어머니이자 사회적으로 성공한 인생의 선배가 해주시는 말씀을 들으니 내가 어렴풋이 느꼈던 실패에 대한 인식을 확고히 다질 수 있었다. 20대 후반 직장 생활을 시작한 뒤부터 실패는 치명적이라고 생각했다. 사소한 실패도 인생을 좀먹고 비참한 최후를 맞이할

일 잘하는 엔지니어의 논리적 사고 방법(feat. 로지컬 씽킹) [내부링크]

엔지니어는 정해진 업무를 하는 '전술적 성과'와 창의적인 업무를 하는 '적응적 성과' 중 '적응적 성과'에 해당하는 업무를 주로 한다. 물론 그들도 회사의 시스템을 구동시키기 위해 일상업무도 수행하지만 업무의 성과는 주로 '적응적 성과'에 의해 평가받는다. 따라서 엔지니어들은 '적응적 성과'를 업무의 우선순위에 놓고 일해야 하고, 높은 '적응적 성과'를 위해 자신의 능력을 갈고 닦아야 한다. 마케팅 또는 영업, 기타 '적응적 성과'를 높이 평가받는 직종과 차이점은 '논리적인 사고'의 중요성에 있다. 타 직종은 고객을 감동시키거나 감정을 움직이거나 또는 열정을 보인다면 그것으로 '적응적 성과'를 달성할 수 있는 기회가 생긴다. 하지만 엔지니어의 업무는 열정과 노력보다는 현상에 대한 논리적인 접근과 해답을 찾는 것이 더 중요하다. younis67, 출처 Unsplash 제조 현장에서 일어나는 일들은 해결하기 어렵지만 명확한 답이 있는 것이 대부분이다. 문제가 발생되면 그에 대한 해답을

행복한 삶을 위해 (인생수업 발췌) [내부링크]

전에 어떤 모임에서 연세 드신 분들에게 “몇 살로 돌아가고 싶습니까?” 물었습니다. 그때 1위가 10대, 20대, 30대도 아닌 바로 50대였습니다. 청춘으로 돌아가고 싶어 할 것 같은데, 의외로 50대라는 대답이 나온 겁니다. 20대, 30대는 돈도 없고, 미래도 불확실해서 힘들었지만, 50대는 경제적으로 어느 정도 안정되었고 자식도 어느 정도 커서 힘이 덜 들고, 몸도 그런대로 활동할 만해서 좋았다는 겁니다. 그러니까 인생의 황금기는 50대라고 할 수 있습니다. 그런 황금기가 오고 있는데, 걱정할 일이 뭐가 있어요. 지금부터 10년 후를 미리 걱정할 게 아니라 그 동안에 준비하는 시간을 가지면 됩니다. 하고 싶은 사업이 있다면, 그 일터에 가서 봉사를 하면서 경험을 해보는 겁니다. 하고 싶은 일이 환경운동이라면 환경단체에 가입해서 다녀볼 수 있습니다. 사회사업이라면, 노인복지나 의료복지 분야에 회원 가입을 해놓고 다녀볼 수도 있어요. - <인생수업, 법륜> 지도자는 개인에게 책임

부자되는 가장 쉬운 방법 (feat. 존리의 부자되기 습관) [내부링크]

어떻게 하면 부자가 될 수 있나요? 신입사원이 나에게 던진 질문이다. 사실 나도 잘 모르겠다. 아껴 쓰고 모으면 부자가 될 거라 배웠지만 과연 그게 쉬울까? 내가 회사에 입사하고 13년이 지났으니 매달 200만 원씩 모았다고 해도 3억이다. 내 첫 월급이 200만 원이 안 되었고, 생활비, 각종 공과금과 차량 유지비 등등을 썼으니 현실적으로 2억도 모으기 힘들다. 2억이면 부산의 낡은 아파트 전세금도 되지 않는 금액이다. 대출받고 집을 사고 애들 키우고 차도 사고... 살다 보면 어쩔 수 없이 쓸 돈이 가득이다. 물론 연봉이 오르긴하지만 아이가 크고, 둘째가 생기니 지출도 늘어난다. 이럴 때 여러 가지 걱정이 든다. 노후 준비는 어떻게 할 수 있을까? 아이의 교육비는 어떻게 준비하지? Anemone123, 출처 Pixabay 앞이 깜깜하지만 뾰족한 수가 없다. 매일매일 똑같은 날들이 반복되다 보면 어느덧 은퇴할 시점이 다가올 것이고 노후 준비는 전혀 되어 있지 않을 것이다. 욜로니

내 삶의 디자인 [내부링크]

나 삶의 디자인 인생을 디자인하기 위해 과거와 현재, 그리고 미래를 아는 것이 필요하다. 1. 과거를 반성하고 분석 우선 과거를 객관적으로 바라본다. 자신의 성향과 기질, 습관을 파악해 스스로 할 수 있는 일과 할 수 없는 일을 구분한다. 2. 미래의 나를 상상 목표하는 미래를 상상해본다. 어떤 역량과 능력을 가지고 어떤 일을 하고 있을지 구체적으로 그려본다. 자신의 성향을 바탕으로 달성 가능한 목표를 정한다. 3. 현재의 나를 바라보기 상상한 미래와 현재의 내 상태를 비교한다. 그 차이를 객관적으로 작성하여 그것을 채우기 위해 어떤 노력이 필요한지 적는다. 4. 일상에 녹여내기 바라는 이상적인 미래의 내 모습을 위해 일과를 조정한다. 열정으로 시작하면 달성하지 못한다. 목표를 달성하기 위해 필요한 노력들을 하루 일과에 담는다. 5. 반성하고 계획을 조정 하루의 루틴에 목표 달성을 위한 노력을 담았다면 일정 시간이 지나면 가시적 성과가 있어야한다. 만약 가시적 성과가 없다면 노력을

조급한 마음 [내부링크]

이루지 못해서 고통스러우면 욕심이고, 아무렇지 않으면 원이다. 법륜스님 나는 요즘 새로운 도전들을 하고 있다. 빅데이터 분석을 위한 코딩 실습과 매일 글쓰기, 통계공부가 그것이다. 그런데 생각보다 성과가 나지 않으니 조바심이 난다. 지금 하는 활동들은 기존에 가지고 있던 능력과는 별개로 새롭게 시작하는 도전이기 때문에 편안한 마음으로 임하려했다. 하지만 처음 각오와는 다르게 생각보다 성과가 나지 않으니 다급한 마음이 든다. 괜히 재능 타령도 하고, 노력의 방향이 잘못된 것 같은 걱정도 든다. 남들과 비교하는 마음을 버리려고 애쓴 결과 이제는 다른 사람과 나를 비교하지 않는다. 각자의 사정이 있고, 능력과 관심의 차이가 있다는 것을 알기 때문에 오롯이 나에게 집중한다. 그런데 이제는 내가 되고 싶은 이상적인 모습과 현재의 차이 때문에 괴롭다. 어서 빨리 실력이 늘기를 바라며 조급한 마음을 먹지만 몸이 따라주지 않는다. 사실 답은 알고 있다. 흔들리지 않고 꾸준히 노력하면 성장할 것이다

일상의 행복 [내부링크]

메멘토 모리(Memento mori) "너의 죽음을 기억하라" , "너는 반드시 죽는다" 고대 로마에서는 개선 장군의 행렬 뒤에서 노예를 시켜 이 말을 큰소리로 외치게 했다. "메멘토 모리!" [Memento Mori!] 오늘은 승리해서 영광속에 있지만, 너도 언젠가는 죽는다. 그러니 겸손해라는 의미다. cadop, 출처 Unsplash 우리는 언젠가는 죽는다. 모든 것은 결국 사라진다. 지구도 언젠가는 멈추고, 태양도 꺼질 것이다. 그러니 지금을 즐겨라. 현재에 집중해라. 지금 행복하고 의미있는 일을 해라. 최근 나는 일상의 부재를 경험했다. 출장을 갔었기 때문에 일상과 떨어져 있었다. 휴일에 집에 돌아와서 다시 접한 나의 일상은 나에게 큰 행복을 준다. 오랜만에 만난 가족들이 너무 사랑스럽다. 그리고 내가 가진 물건들의 소중함을 새삼 느꼈다. 나의 일상은 거저 주어진 것이 아니다. 치열하게 원하고 노력했기 때문에 얻은 결과다. 일상에 있으면 행복감을 느끼기 어렵다. 낯익고 익숙

돈에 대한 짧은 글들 [내부링크]

돈을 버는 데만 집중하면 그것이 가지는 실질적인 가치를 느낄 여유가 없게 된다. 때문에 재테크는 돈버는 기술뿐만 아니라 돈 쓰는 기술까지도 포함이 되어야 한다. '돈을 지나치게 쓰면 안 된다.'는 부모님의 말씀은 전적으로 옳다. 그 이유는 명쾌하다. 지금 '화폐'의 성질상 돈은 그 자체가 증식해가는 숙명을 지고 있기 때문이다. 이것을 '화폐의 자기 증식 기능'이라고 한다. 그래서 이제는 공부해야 할 때다. 단순히 지적허영이나 자기만족을 위한 차원이 아니다. 살아남기 위해 처절하게 공부해야 한다. 계속해서 읽고, 외우고, 쓰다가 구식이 되어버린 지식을 비워내고 다시 새로운 것으로 채워 넣어야 한다. 그래야 자신의 자산을 지키며 끊임없이 부를 늘리고 새로운 기회를 창출할 수 있다. 결코 만만치 않은 시대임을 직시하며 정신을 바짝 차리자. 변화하는 부의 패러다임을 읽고 조금씩 앞서는 자가 승자의 위치에서 달콤한 결실을 만끽할 수 있다. sharonmccutcheon, 출처 Unsplas

연결, 스티브 잡스의 몰락과 성공의 비밀! (feat. 콘텐츠의 미래) [내부링크]

지금은 고인이 된 스티브 잡스는 '파괴적 혁신'을 바탕으로 새로운 시장을 장악하여 애플을 명실공히 최고의 기업으로 이끌었다. 하지만 그도 처음부터 자신을 역량을 떨치며 승승장구하지는 못했다. 1985년 5월 스티브 잡스는 자신이 설립한 애플에서 축출된다. 회사 내에서 매킨토시와 리사 컴퓨터를 개발하면서 애플사의 핵심 엔지니어와 경영진 사이에 반목이 심해졌고, 스티브 잡스는 이를 조화롭게 해결하지 못했다. 또한 특유의 독선적인 성격과 회심의 아이템인 맥 컴퓨터의 판매 부진의 이유로 회사에서 쫓겨나고 만다. 그는 회사를 위기에 빠뜨린 장본인이며 현실성 없는 망상가라는 불명예를 안고서 자신이 설립한 애플을 쓸쓸히 떠났다. 그리고 3년 후 1988년 미국의 가장 오래된 국립공원인 옐로스톤이 화재로 전체 면적의 20%가 소실되었다. 스티브 잡스의 몰락과 옐로스톤 화재는 놀랍도록 닮아있다. 2004년 옐로스톤은 끔찍한 화재에서 복구되었고 지금은 화재의 흔적은 사라졌다. 1988년 화재 발생 전

내 삶의 영역을 넓히다. [내부링크]

성장해 가는 과정 인생에서 의미심장한 성과를 거두고 싶다면, 안전지대 밖에서 오랜 시간을 보내야 한다. 그곳에서 최대한 성과를 거두는 게 좋다. 편하고 익숙한 상태에서 정체될 것인가, 아니면 박차고 나가서 불편을 감수하고 성장할 것인가? 편암함이 행복을 안겨줄 거라고 생각한다면 오산이다. 행복은 당신이 애써 이뤄 낸 성장에서 나온다. 탁월한 인생을 만드는 법 나는 편안한 영역(Comfort Zone)에 숨어서 나오기 싫어하는 내성적이고 게으른 사람이다. 사람들 앞에서 말할 때면 가끔 불안함을 느끼고 머리가 멍해질 때도 있다. 내가 제일 좋아하는 공간은 내 방이고 그곳에서 책을 읽거나 의자에 앉아서 멍하니 있는 것을 좋아한다. 정신적으로도 편안한 영역(Comfort Zone)에 갇혀 나오지 못했다. 새로운 지식을 받아들이기 싫고 내가 아는 것이 전부라고 믿는 우물안 개구리로 살았다. 그런 내가 작년 말부터 독서모임을 하고 올해는 매일 글쓰기를 시작했다. 나는 인지 범위가 한정된 상태로

맥도날드 아저씨의 낭만 일기 (feat. 사업을 한다는 것) [내부링크]

사업을 이야기할 때는 으레 좋은 아이템으로, 벤처 Capital의 투자를 받은 다음 스타트업을 시작하는 것을 떠올린다. 또는 회사를 다니며 돈을 모아 식당을 창업하는 방법도 있다. 다들 '나는 잘 될 거야'라고 기대하며 돈과 시간, 노동력을 투자하며 행복한 미래를 꿈꾼다. 하지만 세상일이 그렇게 쉽게 돌아가지는 않는다. 불굴의 의지와 실패에 대한 대비 없이 일을 벌였다가 뜻하지 않은 여러 고난과 어려움이 닥쳐오면 이내 운이 없었다고 말하며 포기한다. 부모님께서는 사업을 하셨다. 내가 5살 때부터 18살 때까지 업종은 달랐지만 줄곧 사업(장사)를 하셨고 나는 그것을 보고 자랐다. 나는 장사나 사업을 할 생각이 전혀 없다. 왜나하면 그것이 얼마나 힘든지를 알기 때문이다. 회사 생활 13년 차에 산전수전 공중전까지 다 겪었다고 자신하지만, 사업은 그것보다 더 버라이어티하고 힘들다. 부모님께서는 경찰서도 여러 번 갔다 오셨고, 약식 기소로 검사 앞에 취조도 받으셨다. 사회적으로 지탄받을 불

엔지니어 글쓰기 방법 [내부링크]

글쓰기는 누구에게도 할 수 없는 말을 아무에게도 하지 않으면서 동시에 모두에게 하는 행위 리베카 솔닛 나는 제조업에서 엔지니어로 13년째 일하고 있다. 엔지니어의 감성은 투박하다. 모든 것을 숫자로 표현해야 한다. 숫자로 설명하고, 숫자로 평가받는다. 그러다 보니 말하거나 글을 쓸 때 감정을 배제하고, 논리적이 되어야 한다. 실제적 인과관계가 드러나지 않은 사실에 대해 말하는 것이 꺼려지고 결과가 없는 상황에서는 말문이 막힌다. 나는 엔지니어다. 나에게 글쓰기는 정보의 전달과 논리적 인과관계의 설명을 위해 존재하는 행위다. 목적이 건조했기 때문에 엔지니어의 글은 인간미는 다소 떨어질 수 있다. 사실에 대한 객관적인 진실을 설명하거나 문제의 원인을 파악해서 정리하는 능력을 극도로 갈고닦아야 한다. 글을 쓰는 사람도 글을 읽는 사람도 모두 날카로운 분석과 논리적인 내용을 원한다. PIRO4D, 출처 Pixabay 엔지니어의 글쓰기는 감정을 드러내서는 안 된다. '너무 좋다.', '정말

Step by Step (feat. 세상에서 가장 발칙한 성공 법칙) [내부링크]

목표가 생겼다. 시간이 지날수록 더욱 뚜렸해지고 그 길을 따라가기 위한 이정표가 선명해지고 있다. 예전에는 꿈도 못 꿨던 일들이지만 지금은 노력하면 이룰 수 있을 것 같다. 삶에 치트키는 있다. 그것은 훌륭한 사람들에게 배우는 것이다. 내가 삶을 살아가는 방식도 비슷하다. 주변에 대단한 친구와 선배들을 보며 그들의 장점을 배우며 살아남았다. 나는 열정에 잘 노출되고 다른 사람의 열정에 물들어서 금세 달아오른다. 멘토는 왜 그토록 중요한가? 아무리 시간이 많다고 해도 혼자서 모든 시행착오를 다 겪을 수는 없고, 혼자 하는 실수는 자칫 실패로 이어질 수 있다. 타인의 실수를 보면서 거기에서 배우는 것이 좋다. 훌륭한 멘토와 위대한 스승은 우리가 빨리 배우도록 도와준다. 학교에서도 좋은 선생님이 있느냐 없느냐는 큰 차이다. 멘토의 장점은 또 있다. 멘토는 배움을 재미있는 것으로 바꿔준다. 멘토는 스트레스를 스트레스로만 보지 않고 상대해야 할 무언가로 바라보게 해주며, 우리가 최선을 다하고

쓸데없는 생각 - 타노스 이야기 [내부링크]

I am inevitable. (나는 필연적인 존재다.) 어벤져스 영화 어벤져스의 악당 타노스는 어떤존재일까? 우주의 멸망을 막기 위해 자신을 희생하는 사명감을 가진 영웅인가? 아니면 허황된 환상을 따르는 미치광이인가? 만약 인구가 너무 많아 타노스가 말한대로 전체 우주가 멸망했다면 어벤져스는 악당인가? 그랬다면 타노스는 숭고한 희생자인가? 타노스가 인티니티 건틀렛을 완성했을 때 핑거스냅으로 우주의 인구를 반으로 줄이지 않고 멸망하지 않도록 소원을 빌었다면 어떤 결과가 나왔을까? 결과가 우선할까? 과정이 우선할까?

2006년 어느 날 [내부링크]

얼마전 '코비 브라이언트'가 안타까운 사고로 사망했다. 코비브라이언트의 사고로 2006년의 어느 날이 떠올랐다. connor_jalbert, 출처 Unsplash 그는 나보다 1살 어린 후배다. 같은 학교, 같은 동아리 후배인 그의 카페 닉네임은 '코비브라이언트'였다. 그는 2006년 어느 여름 날 스스로 세상을 떠났다. 군대 제대 후 복학할 때 그를 처음봤다. 나는 우울한 성격을 가지고 있었다. 그래서 밝은 사람이 좋았다. 그는 밝았다. 항상 웃었고, 농담도 잘했다. 보잘 것 없는 나에게도 예의를 갖춰 인사했다. 항상 깍듯하게 선배들에 인사하고 스스름없이 행동하는 모습이 좋아서 같이 다녔다. 이라크 파병을 갔다와서 별명이 '이라크'였다. 항상 밝고, 재미있는 그가 많은 상처가 있다는 것을 함께 지내면서 차츰 알게 되었다. 그의 부모님은 이혼했다. 그는 평생을 할아버지 손에 컸다. 이라크 파병으로 모은 돈을 아버지에게 뺐겼다. 등록금과 생활비를 벌기 위해 쉬는 날이나 방학 때는 막

이별의 순간 (feat. 출장) [내부링크]

이별의 순간이 힘든 것을 처음으로 알게되었다. 어려서부터 정이 없다는 얘기를 들을 정도로 맺고 끊음이 정확했다. 헤어짐을 아쉬워한 적도 없고, 만날 사람은 어떻게든 만난다는 생각으로 살았다. 누군가와의 이별은 나에게 아무런 여운도 주지 못했다. 군대도 누구의 배웅도 없이 혼자갔다, 혼자왔다. 학교 졸업식, 입사 후 누군가의 전배, 퇴사와 같이 친구, 동료를 보지 못하는 것도 나에게는 큰 감흥을 주지는 못했다. 나에게 만남과 헤어짐은 자연스러운 일이기 때문에 살면서 이별로 힘들거라는 생각은 하지 못했다. 조금 전까지는 말이다... 회사교육으로 약 7개월 간의 출장을 가게 되었고, 오늘 출발한다. 출발 전 짐을 싸는데 7살 딸이 울기 시작한다. 자기도 데리고 가라고 떼를 쓴다. 아빠를 사랑하기 때문에 못보는게 싫다고 한다. 200일은 너무 길다고 아빠없는 집에 있기 싫다고 한다. 어르고 달래도 소용이 없다. 1시간 동안 딸과 씨름하다가 유치원 하루 안가는 조건으로 집에 있기로 했다. 그

나 자신을 파악하라 (직장) [내부링크]

직업적 관점에서 나를 바라본다. 직장생활을 하는 동안 나의 하루 중 가장 많은 시간을 회사를 위해 쓰고, 직장동료와 많은 시간을 보낸다. 직장에서의 나의 모습을 정확히 알고 앞으로 내가 발전할 방향을 설정해본다. Free-Photos, 출처 Pixabay 1. 나는 좋은 상사인가? 책임자의 입장에서 누군가의 상사로 일한 경험은 없지만 세부과업에 있어 상사로부터 책임을 위임받아 일한 경험은 많다. 팀원들과 함께 정해진 시간에 정해진 목표 달성을 위해 업무를 진행할 때 나의 모습은 그다지 나쁘지 않았다. 업무 진행사항을 주기적으로 체크하고 막히는 부분을 파악해서 타부서와 협의하여 해결해주면서 업무 효율을 높혔다. 하지만 팀원이 가진 전체 업무에 대한 고려없이 지엽적인 업무에 대한 리딩이었기 때문에 향후 리더의 자리에서 나의 역량에 대한 평가는 아직이르다. jaysung, 출처 Unsplash 2. 나는 좋은 부하인가? 이 질문에 대한 나의 답은 명확하다. 나는 좋은 부하가 아니다.

본질적인 삶을 살기 (feat. 에센셜리즘) [내부링크]

삶을 충실히 살고 있는가? 더 나은 미래를 위해 치열하게 노력했는가? 나는 바쁘고 열심히 살았지만, 발전이 없었다. 좀 더 나은 방향으로 발전한다기보다는 현재 상태를 유지하기 급급했다. 유행하는 TV 프로그램을 보고 바쁜 회사 업무에 시간을 쏟았다. 삶의 목표 없이 부평초처럼 이리저리 흐느적거린다. composita, 출처 Pixabay 회사 업무가 나에게 몰려서 바쁘고 힘들다고 생각했다. 사실은 그렇지 않다. 회사에서 시간을 보내지만 같은 업무를 발전 없이 반복했기 때문에 힘들었다. 생각 없이 일만 하니 발전이 없고, 일하는 시간은 오히려 늘어난다. 새로운 여러 업무가 생기면 기존 업무를 동료들에게 인계를 해야 하는데 그러지 못했다. 실력이 늘지 않고, 실적이 나지 않는다. 결국 마감일도 지키지 못하는 경우가 생겼다. 일에 치여 자기계발할 시간이 없는 것은 물론이고, 회사에서도 능력을 인정받지 못한다. manfredrichter, 출처 Pixabay 삶에 우선순위를 세우고 그것

내 삶의 캔버스 전략 [내부링크]

위대한 사람은 거의 언제나 명령을 따를 준비가 되어 있었고, 결국 나중에는 자기의 위대함을 입증했다. 마혼 경 위대함은 겸손한 시작에서 비롯되고 힘들고 귀찮은 일에서 시작된다. 스스로 돋보이기 위해 노력하기 보다 다른 사람들에게 도움이 되는 방향을 생각하고, 조직의 목표와 목적에 부합하는 일을 해야 한다. 그런 방식이 오랜 시간 축적되면 그 효과는 커진다. 다양한 문제를 해결함으로써 많은 것들을 경험하고 배우며 조직에서 꼭 필요한 사람으로 성장한다. 겸손한 자세로 업무를 하고 꼭 필요한 일을 했기 때문에 건전하고 활발한 인맥을 쌓았을 것이다. 그런 행동들은 조직 내 필요한 경우 쓸 수 있는 많은 편의를 비축해둔 셈이 된다. dustinlee, 출처 Unsplash 다른 사람을 도움으로써 궁극적으로 자신을 돕는 것, 이것이 바로 '캔버스 전략'이다. 이 전략은 장기적인 효과를 위해 단기적인 이익을 버리는 노력이다. 다른 사람들이 타인의 인정과 관심을 구할 때 나는 스스로 일을 하며

[통계와 JMP] 가설검정의 종류 [내부링크]

가설검정 (Hypothesis Test) 가설검정이란 추론 통계의 한 영역으로 모집단에서 우리가 알고 싶어 하는 특성(모수)에 대하여 가설을 세우고 표본으로부터 추정된 통계량을 근거로 가설에 대한 진위 여부를 검정하는 방법이다. 가설검정은 아래와 같이 상반된 두 가지의 가설인 귀무가설(H0)과 대립가설 (H1)을 세우고 어느 가설이 옳은지를 선택하기 위해 분석하는 것을 말한다. 이때 대립가설이란 우리가 증명하고자 하는 가설을 말하며 귀무가설이란 대립가설과 반대되는 가설을 의미한다. goumbik, 출처 Unsplash 가설의 예 H0 : 남자와 여자의 평균 신장은 차이가 없다. H1 : 남자와 여자의 평균 신장은 차이가 있다. 가설검정에서 주의할 점은 표본은 어디까지나 모집단을 대표하는 일부이기 때문에 가설을 검정하는 데 있어서 잘못된 판단을 할 가능성이 존재한다. 가설검정에서는 이러한 두 가지 오류가 존재한다. 가설검정의 두 가지 오류 제1종 오류: 귀무가설(Null Hyp

새로운 연결 [내부링크]

아이가 3월에 초등학생이 된다. 유치원을 졸업하고 새로운 환경에 들어가니 걱정도 되고, 아이의 성장이 기대도 된다. 초등학생 되는 기념으로 '키즈폰'을 사줬다. 아이와 연락도 하고 위치추적도 가능해서 유용할 것 같아 택배로 구입했다. 나는 현재 출장 중이다. 가족들과 길게 떨어진 적이 없어 그들이 그립고 보고싶다. 그런데 갑자기 모르는 번호로 전화가 온다. 내 핸드폰 번호와 끝자리가 같은 낯익은 번호다. 혹시나 해서 받으니 아이가 키즈폰을 받고 나에게 연락한 것이다. 아빠가 보고싶다고 한다. 주말에 내려가서 놀아줄 것을 약속하고 전화를 끊었다. 아이가 문자를 보낸다. 이제껏 수백, 수천 건의 문자를 보내고 받았지만 이 문자는 특별하다. 무려 8년 간 내가 보살폈던 세상에서 제일 사랑하는 내 아이가 나에게 보낸 첫 문자다. 좋은 정보나, 멋진 글이 아니지만 이 문자는 나에게 큰 울림을 준다. 이렇게 아이와 나는 새로운 연결이 생겼고, 나는 이 연결로 전달되는 정보가 기다려진다. #한달

비 오는 날 [내부링크]

ChristopherPluta, 출처 Pixabay 비 오는 날이 좋다. 우산 없이 비를 맞으며 거리를 걷는 것도 좋다. 비에 씻겨 먼지가 사라지듯, 내 더러운 마음도 씻기는 것 같다. 비 오는 날 우산 없이 걷다 보면 내 안에서 무언가 말을 건넨다. 힘든 삶을 위로해준다. 차가운 빗방울이 얼굴에 떨어지면 어린 시절이 떠오르고, 지나간 과거도 생각난다. 철없이 행동했던 과거의 모습들이 부끄럽지만 비 오는 날은 추억이 된다. 비 오는 날은 쉼표다. 정신없는 삶에 잠시 쉴 자리를 만들어준다. 과거를 돌아보고, 어리석었던 시절을 비웃기도 한다. 비 맞아 축축해진 옷을 말리듯 잠시 삶을 정비한다. 비 오는 날은 빗소리가 좋다. 사소한 소리는 들리지 않는다. 빗소리에 묻혀 내 허물도 감춰지는 것 같다. #한달 #한달쓰기 #비오는날

독재자 심리학 개론 (feat. 폭군) [내부링크]

Tyrant :전제군주, 폭군, 압제자, 독재자 자신이 권력을 행사할 수 있는 사람들을 대상으로 잔인하고 불공정한 방식으로 대하는 사람 폭군은 예전부터 존재했고, 직장과 조직 심지어 가족 안에서도 우리와 함께 숨 쉬고 있다. 그들은 어떤 특징을 가졌고, 우리의 삶에 어떤 영향을 미치는지 알아보자. 1. 리처드 3세 (거짓 자아의 희생양) 그는 태어날 때부터 장애인이다. 신생아 때 이빨이 있었고, 팔다리의 균형이 맞지 않았다. 게다가 꼽추로 등이 굽어있다. 그는 신생아 때부터 부모와 주변의 사랑을 받지 못한다. 신체의 장애로 억압을 받고 주변으로부터 조롱당했다. 그는 스스로를 사랑하는 법을 배우지 못했고 그로 인해 자신과 주변을 파괴하려는 성격이 생겼다. jonnysplsh, 출처 Unsplash “어머니의 수치와 혐오감은 아들이 사악한 행동을 저지른 데 따른 결과물이 아니었다. 그런 감정은 아들이 태어난 그 순간까지 거슬러 올라간다. 신생아를 처음 본 순간 그리고 신경질적이고 고집

미래를 위한 준비 [내부링크]

나는 에센셜리스트로서 직업적인 성공을 위해 집중할 것들에 대해 생각해보았다. 나의 강점에 좀 더 집중하여 높은 생산성을 올릴 수 있도록 노력할 것이다. 이 목표들은 나의 Portfolio를 구성하는 핵심적인 사항이며 지속적으로 정리한다면 향후 유용한 자산이 될 것이다. 1. Data 분석에 대한 책을 읽고 글로 작성 2. JMP를 이용한 Data 분석 방법 공부 3. 통계에 대한 이해와 공부 4. 빅데이터 with 파이썬 (AI, DS) 5. 관련 커뮤니티 활동 진행 1. Data 분석에 대한 책을 읽고 글로 작성 최근 DS, AI가 유행하고 있다. 관련 분야의 수요가 많다는 것일 수도 있지만 최근 인력의 공급도 많아지고 있다. 나는 현업의 업무 능력을 바탕으로 Data분석 도서를 읽고 서평을 쓰며, 외부에서 얻은 Data를 분석하여 SNS에 공유할 것이다. (사내 Data를 사용하는 것은 불법이므로 기존에 회사에서 분석한 자료는 배제) 2. JMP를 이용한 Data 분석 방법 공부