키자드에 등록된 kisooofficial의 네이버 블로그 포스트 목록

kisooofficial의 등록된 링크

kisooofficial로 등록된 네이버 블로그 포스트 수는 91건입니다.

Fall Semester를 마치며 [내부링크]

드디어 종강을 했다. 종강을 하고 나서, 조금 쉬면서 방학 계획도 짜고 있다. 생각보다 3학년 2학기에는 많은 생각이 들었던 시기인 거 같다. 먼저 결과를 공유하자면 [3학년 2학기까지 성적] [이번 학기 성적] 뭔가 많이 아쉽긴 하다. 사실, 1학기 때 출석 하나 때문에 목표했던 올 A+을 못해서 이번 학기도 목표를 똑같이 잡았는데 이루진 못했다. 전체적으로 모든 과목에서 시험은 잘 봤다. 1학기 때는 시험 때문에 뭔가 발목 잡히는 부분이 있었는데, 이번 학기에 시험으로 인해서 학점이 떨어지진 않았던 거 같다. 미시경제학은 그냥 교수님이 짠돌이라(절편인데 A0부터 D0까지 다 뿌림 ;; A+이 있는지 모르겠음. 이 교수님이 점수 컷을 정해 놓고 상평이든 절평이든 그 컷에 맞는 학점을 준다는데 ㅠㅠ) 오히려 저기서 안 털린 게 다행인 거 같다. 아쉬운 건 빅처응인데, 빅처응은 뭐... 빅처응 덕분에 이번 학기에 느낀 것은, 올 A+의 경우에는 내 실력도 실력이지만 운도 어느 정도는

[자연어처리 논문리뷰] Attention is all you need 리뷰 [내부링크]

자연어 처리를 공부하는 사람이라면, 거의 필수적으로 읽어야 하는 논문. 자연어 처리 메커니즘에 혁신적인 변화를 불러일으켰다고 생각함. 그 이후로 나오는 모든 언어 모델들은 결국엔 어텐션 기반으로 하고 있기 때문이다. 어텐션이 어떻게 돌아가는 지도 모른 채로 언어 모델을 공부할 수는 없다. 개인적으론, 그래도 모델 input 순서랑 positional encoding이 되는 순서대로 서술했으면 좋았을 거 같은데, 논문은 그게 아니어서 좀 그랬음. 텍스트 마이닝 배우고 나서 읽은 논문이라 그나마 다행이었는데, 논문의 의도가 궁금해진다. 첨부파일 딥러닝 논문 리뷰(Attention is All you need).hwp 파일 다운로드 1. 초록 어떤 연속적인 순서와 관련된 모델은 Encoder와 Decoder를 쌓아올린 것을 포함한 RNN과 CNN에 기반하고 있음. 가장 성능이 좋은 모델은 Attention Mechanism을 기반으로 Encoder와 Decoder를 쌓아올린 것임. 이 논

[데이콘 결산] 여행 상품 신청 여부 예측대회 결산 [내부링크]

https://dacon.io/competitions/official/235959/overview/description 데이콘 Basic 여행 상품 신청 여부 예측 경진대회 출처 : DACON - Data Science Competition dacon.io 오늘은, 8월 5일부터 9월 2일까지 데이콘에서 열렸던 여행 상품 신청 여부 예측 대회 리뷰를 해보려고 합니다. 향후, 제가 데이터 사이언티스트로써 준비할 때 도움이 되기 위해 정리하는 글이라서 가벼운 마음으로 읽어주시면 감사하겠습니다. [코드] https://dacon.io/competitions/official/235959/codeshare/6479?page=1&dtype=recent [Public 22위, Private 23위, Score 0.91875] Stacking Ensemble 데이콘 Basic 여행 상품 신청 여부 예측 경진대회 dacon.io 앞에 대회와는 다르게, 대회가 공개가 되어있어서, 따로 진행과정은 공유

How to be a data scientist? [내부링크]

GitHub - GIGI123422/Hello-Kaggle-KOR: Kaggle을 처음 접하는 사람들을 위한 문서 DATA SCIENCE ROADMAP 2022. Disclaimer — Everyone has different… | by Mohit kumar | Medium 매년 업데이트 하시는 듯

캐글 우승자 모아놓은거 [내부링크]

https://www.kaggle.com/code/sudalairajkumar/winning-solutions-of-kaggle-competitions Winning solutions of kaggle competitions Explore and run machine learning code with Kaggle Notebooks | Using data from Meta Kaggle www.kaggle.com

[결정트리 논문리뷰] Induction of Decision Trees - 논문리뷰 [내부링크]

확실히 옛날 알고리즘이라, 논문 읽으면서 옛날 알고리즘에 대해 알 수 있었음. 요즘은 그냥 결정 트리라는 용어로 기계학습을 배우는데, 결정 트리는 하나의 버전이 아니라 여러 개의 버전이 있었다는 것.. 참고로, 여기 아래쪽에서 사용하고 있는 '현재'라는 것은 논문을 쓸 당시를 이야기함. 제목 : Induction of Decision Trees(귀납법으로의 결정 트리) J.R. QUINLAN key word : 분류, 귀납, 결정 트리, 정보 이론, 지식 습득, 전문가 시스템 초록 : 지식 기반의 시스템과 관련된 기술을 개발하는 것은 계속 발전되어왔음. 다양한 시스템에서 사용되고 있는 결정 트리에 대해 요약하고, 동시에 ID3이라는 하나의 시스템을 소개. 기존의 알고리즘의 단점을 말하고, 이 단점을 극복할만한 두 가지 수단을 설명하고 비교할 거임. 서론 : 1950년대에 처음 인공지능이 논의될 때부터, 머신러닝은 주요 연구 분야였음. 그 이유는 현상으로써 지식을 이해하도록 시도하는

[Ensemble Method] Bagging Predictors 논문리뷰 [내부링크]

첨부파일 Bagging Predictors 논문리뷰.hwp 파일 다운로드 제가 정리한 것을 그대로 복붙하는 형식인데, 글자 깨지는 거랑 사진 안들어가는 것이 많아서 첨부파일로 올립니다. 그래도 결정 트리 읽다가 좀 더 익숙한 앙상블 관련된 거 읽으니까 좀 나아진 거 같음. 제목 : Bagging Predictors key word : Aggregation, Bootstrap, Averaging, Combining 초록 : 배깅 예측기는 다양한 예측 분류기를 결합한 방법이다. 그리고 이 예측기는 어떤 통합적인 예측 분류기가 된다. 회귀 문제에서는 모든 분류기에 대한 평균을 내고, 분류 문제에서는 voting을 실시한다. 학습 데이터 셋을 복사하는 것으로부터 시작(이 복제품은 새로운 학습 데이터가 되고)이 되고, 이러한 방법은 결국엔 정확도를 향상시킨다. 중요한 요소는 데이터가 서로 다른 특성을 가지면서 교란이 된다면, 배깅은 성능 향상이 될 것이다. Introduction L은 tra

광운대학교 데이터 애널리틱스 수업 요약 + 연습문제(기말고사) [내부링크]

광운대 데이터 애널리틱스 수업 요약본입니다. 중간고사는 이렇게 따로 요약은 안했고, 기말고사때 시험공부하면서 배웠던 내용들 요악합니다. 내용 : 딥러닝(MLP, RNN, LSTM, GRU, Transfer Learning, AutoEncoder, GAN, Self-Supervised learning) 강의 자료는 저작권때문에 올리지 않습니다. 교수님 사랑해요. 첨부파일 데이터 애널리틱스 Final Exam 대비.pdf 파일 다운로드

[2022 마이 블로그 리포트] 올해 활동 데이터로 알아보는 2022 나의 블로그 리듬 [내부링크]

초반엔 관리를 계속 하다가 중도에 너무 바빠서 관리를 못했는데도 여러모로 올 한 해 블로그로 이룰 수 있는 건 다 이루고 가는 듯! 2022 마이 블로그 리포트 2022년 올해 당신의 블로그 리듬을 알아볼 시간! COME ON! campaign.naver.com

[통계학] 13. 추정과 점추정이란? [내부링크]

목차 추정 (1) 추정이란? 2. 점추정을 바람직하게 하는 방법 3. 표준편차와 표준오차 1.추정 (1) 추정이란? 제가 처음 통계학 관련 글을 썼을 때 이 그림을 사용했었죠. 우리가 통계적으로 분석할 때는 현실적으로는 모집단 전체를 기준으로 하기가 힘듭니다. 이유는 간단하지만, 시간이 정말 걸린다는 단점이 있죠. 물론, 모집단(Population) 자체가 많지 않다면 굳이 표본(Sample)을 뽑지 않고 모집단 자체를 분석하겠지만, 그렇지 않은 경우가 많습니다. 당연한 이야기겠지만, 우리가 표본으로 분석해서 나온 통계량은 모집단의 모수와 완전히 정확할 확률은 적습니다. 전체를 기준으로 분석하는 경우와 일부만 가지고 하는 경우는 다를 거니까요. 따라서, 우리의 목표는 표본을 이용하여 모집단의 모수를 최대한 정확하게 추정을 해야 합니다. 여기서, 추정이라는 단어에 초점을 맞춰야 할 텐데요. 그럼, 추정을 어떻게 할 수 있을까요? 크게 두 가지 예시를 들어볼게요. 1) 음.. 이 표본을

[걸그룹 아련한 노래] 여자친구(GFRIEND) - 밤(Time for the moon night) / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘은 걸그룹 여자친구의 노래를 가져왔습니다. 여자친구의 대표곡을 말하라고 하면 보통은 '시간을 달려서(Rough)'를 떠올리곤 하죠. 아무래도 여자친구의 학교 3부작인 유리구슬 - 오늘부터 우리는 - 시간을 달려서로 이어지는 흐름이 너무 좋기 때문에, 3개의 노래 중에서 대표곡을 떠올리기 쉽습니다. 오늘은 학교 3부작이 아닌 '밤'이라는 노래를 가져왔습니다. 미니 6집이고, 사실 이 노래가 여자친구의 커리어에 있어서 중요한 시점이었어요. 2016년에 시간을 달려서와 너 그리고 나로 성공했지만, 2017년에 발매한 3곡이 연달아 연간 차트 진입에 실패하면서, 음원 강자로써 아쉬운 성적을 보여줬기 때문인데요, 아마 2017년이 그룹의 방향성을 결정하는 데 있어서 많은 고민이 있었던 시간인 것 같기도 합니다. 그전에 '같은 콘셉트를 계속한다' '자가복제다'와 같은 평가가 있었던 것은 사실이기 때문에, FINGERTIP으로 다른 콘셉트를

핸즈 온 머신러닝 1장 리뷰 [내부링크]

---------------------------------------- 책을 보고 저만의 언어로 바꾼 것이라 이해하는 데 조금 차이가 날 수 있습니다. --------------------------------------------- 핸즈온 머신러닝 저자 오렐리앙 제롱 출판 한빛미디어 발매 2020.05.04. 1. 머신러닝 : 데이터로부터 학습하도록 컴퓨터를 프로그래밍 시키는 것이다. 학습시키는 데이터를 훈련 데이터라고 함. Q. 이 때, 머신러닝 모델이 잘 훈련되었는 지 안되었는 지를 확인하는 방법은? 바로 검증을 하는 것이다. 검증은 무엇으로 하는가? 검증 역시 데이터로 한다. 이 때, 검증하는 데이터를 검증 데이터 또는 테스트 데이터(Test Data)라고 한다. 그런데, 머신러닝 모델을 검증하기 위한 기준이 필요하지 않은가? 어떤 기준으로, 이 모델이 잘 되었는 지 안 되었는지를 판단하는 건가? 그 기준으로 정확도, 재현율, 정밀도, F1-Score, ROC-AUC 커브,

핸즈 온 머신러닝 2장 리뷰 [내부링크]

---------------------------------------- 책을 보고 저만의 언어로 바꾼 것이라 이해하는 데 조금 차이가 날 수 있습니다. --------------------------------------------- 핸즈온 머신러닝 저자 오렐리앙 제롱 출판 한빛미디어 발매 2020.05.04. 2장에서는 전체적으로, 우리가 데이터를 수집하고, 전처리와 EDA 분석을 진행하고, 모델을 구축해서 성능을 평가하는 일련의 과정을 담고 있다. 그래서, 아무것도 모르는 상태에서 2장을 보게 되면 어려울 수 있다. 그러나 좀 쉽게 정리를 해보려고 한다. 크게는 5가지 단계로 나눈다. 데이터 수집 -> 데이터 전처리 -> 데이터 탐색적 분석 -> 데이터 모델 구축 -> 모델 성능 평가로 나눌 수 있다. 물론 책에서는 배포하는 것까지 해서 총 6가지로 나누고 있지만, 5가지만 해보려고 한다. 데이터 수집 데이터 수집 단계는 말 그대로 데이터를 수집하는 것이다. 데이터를 미리 잘

[에스엠] GOT the beat - Step Back / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 작사에서 손 떼 너 안녕하세요! 오늘 소개해 드릴 노래는 GOT the beat의 Step Back입니다. SM이 선보이고 있는 프로젝트인 'Girls On Top(걸스온탑)'가 있죠. 일단 이 프로젝트를 간단히 설명하자면, SM 소속의 프로젝트 명의 앞 글자를 따서, GOT로 만든 것이고, 노래 분위기에 따라, SM에 소속된 가수들이 다릅니다. GOT the beat는 그중 유닛명이라고 생각하시면 되고, 그다음에 나올 또 다른 노래가 정해지면, 아마 그때는 GOT the beat가 아니라 GOT OOOOOO로 바뀌게 될 겁니다. 아무튼, 걸스온탑의 프로젝트로 시작점을 알렸던 GOT the beat의 Step Back인데, 일단 노래는 정말 정말 좋은 것 같습니다. 하지만, 가사가 정말... 하.... 무슨 100억짜리 비트에 10원짜리 가사를... 정말 제 개인적인 의견이고요. 제가 보통 노래를 들을 때 가사를 그렇게 신경 쓰면서 듣는 편이

랜덤 포레스트 과적합 피하는 법 [내부링크]

cross - validation (kfold, stratified KFold) 하이퍼 파라미터 최적화 ( GridSearchCV, RandomizedSearchCV, BayesianOptimization) n_estimator, max_features, max_depth, min_samples_leaf 조정해보기 피쳐 줄여보기

[데이콘 결산] SW중심대학 공동 AI 경진대회 리뷰 및 결산 [내부링크]

https://dacon.io/competitions/official/235902/overview/description SW중심대학 공동 AI 경진대회 ❮예선❯ 출처 : DACON - Data Science Competition dacon.io 오늘은, 8월 1일부터 8월 26까지 데이콘에서 열렸던 SW 중심대학 공동 AI 경진대회 리뷰를 해보려고 합니다. 향후, 제가 데이터 사이언티스트로써 준비할 때 도움이 되기 위해 정리하는 글이라서 가벼운 마음으로 읽어주시면 감사하겠습니다. [코드] https://dacon.io/competitions/official/235902/codeshare/6157?page=1&dtype=recent [KWIC, Private 8위] LGBM + Random Forest + Extra Trees SW중심대학 공동 AI 경진대회 ❮예선❯ dacon.io [심리 테스트 공모전 결산] 1. 데이터 구성 마키아벨리즘 질문, TIPI 질문, VCL 질문, 그

[종강 기념] [현재 멜론 Top100 1위][아이브 노래] 아이브(IVE) - LOVE DIVE / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 정말 오랜만에 인사를 드립니다. 보니까 4월달 이후로 포스팅을 계속 하지 않았네요. 그동안, 정말 바쁜 하루를 지내고 있었고, 음악 감상평을 올리기도 힘들 정도로, 많이 바빴습니다. 특히나 최근 2주 동안은 거의 새벽까지 깨어있다가 아침에 학교가고 그런 루틴이 계속 반복이 되었죠. 종강만 엄청 기다렸는데, 결국 17일날 종강을 했네요! 그래서 다시 블로그 활동을 시작해보려고 합니다. 오늘 소개해 드릴 노래는 아이브(IVE)의 'LOVE DIVE'입니다. 작년에 'ELEVEN'으로 데뷔했던 아이브가 5개월 만에 다시 새로운 노래를 들고 왔는데요, 특히나 Z세대의 사랑법과 관련한 노래 가사로 많은 공감을 불러일으키고 있습니다. 요즘 데뷔하는 대부분의 그룹들은 이제 멤버 전원이 2000년대생인 경우가 많아졌죠. 그러면서, 그룹의 정체성 자체도 점점 Z세대의 느낌이 나도록 신경쓰는 느낌이 납니다. 사실, 좋아하는 사람이 생기면 직진하는 사

[아이돌 발라드 노래] [에이핑크 11주년 곡] 에이핑크(Apink) - 나만 알면 돼 / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘 소개해 드릴 노래는 바로 '에이핑크(Apink)의 나만 알면 돼'입니다! 이 노래는 에이핑크의 데뷔 11주년을 기념하여 나온 노래입니다. 전 포스팅에서 언급한 적이 있는데요, 에이핑크 같은 경우엔 데뷔 주년마다 항상 디지털 싱글을 발매하고 있습니다. 올해도 역시나 데뷔 11주년을 맞이해서 디지털 싱글을 발매하였습니다. 뮤비를 보면, 뭐 당연하다고 느끼실 수 있겠지만, 지금까지 걸어왔던 에이핑크만의 추억이 담겨 있다는 것을 볼 수 있습니다. (다른 팬송도 마찬가지이긴 해요.) 사실 에이핑크 팬들에게는 마음이 아플 수도 있는 게, 이 노래가 나오기 며칠 전, 손나은의 에이핑크 탈퇴 소식이 있었죠. 이 노래의 녹음 기간과, 준비 기간을 생각해 본다면, '딜레마(Dilemma)' 활동 이전에, 어느 정도 결정이 된 것 같기는 합니다. (딜레마 같은 경우엔, 올해 2월이 아닌, 작년 상반기 컴백이 예정이 되었던 거라 뮤비 촬영 등에 참

[통계학] 11. R을 이용하여 확률분포 나타내기 [내부링크]

목차 1.d, p, q, r 2. 이항분포를 R로 나타내기 3. 정규분포를 R로 나타내기 4. 푸아송분포를 R로 나타내기 5. 적용 예제 이번 포스팅은 통계 관련된 내용보다는, 우리가 지금까지 배운 확률분포들을 어떻게 R에서 나타낼 수 있는지를 보겠습니다. 이항분포, 정규분포, 푸아송분포 등 대부분은 R을 이용해서 분포를 비교하고, 확인할 수 있습니다. 1. d, p, q, r 첫 번째로 d, p, q, r을 보겠습니다. 소제목을 보자마자 도대체 저게 뭐야?라고 하실 수 있을 텐데요!! 이것을 처음에 간단하게 정리하면, 어렵지 않게 접근할 수 있어요! 아래 우리가 배울 3개의 확률분포는 각각 영어 이름을 가지고 있습니다. 이를테면, 이항분포는 binom, 정규분포는 norm, 푸아송분포는 pois의 형태입니다. 그럼, d, p, q, r은 뭐냐고요? 바로, 각 분포에서 우리가 관찰하는 포인트에 맞춰서 나온 알파벳입니다. 감이 안 올 것 같아서, 간단히 어떤 의미를 가지고 있는지 짚어

[통계학] 12. 여러 가지 표본분포 - 카이제곱분포, t-분포, F-분포 [내부링크]

목차 1. 표본분포란? 2. 카이제곱분포란? (1) 의미와 필요한 이유 (2) 카이제곱분포의 통계량과 모양 (3) 카이제곱분포표 3. t-분포란? (1) 의미 (2) t-분포 모양 (3) t-분포표 4. F-분포란? (1) 의미 (2) F-분포 모양 1. 표본분포 표본분포는 모집단이 아닌 표본 통계량과 관련한 분포입니다. 가령, 표본평균이나 표본분산이 되겠죠. 표본분포에는 카이제곱분포, t-분포, F-분포가 있습니다.(이보다 더 많을 수도 있습니다.) 우리가 실제로 모집단의 모수를 추정할 때, 표본의 통계량을 이용해서 모수를 추정하는데, 추정한 모수의 결괏값에 상관없이, 표본에서 나온 통계량과 관련한 분석을 진행할 수 있습니다. 지금부터 관련된 분포를 보겠습니다. 2. 카이제곱분포 (1) 의미와 필요한 이유 카이제곱분포는 쉽게 말해서 표본분산의 분포와 관련한 지표입니다. 이항분포는 시행 횟수와 확률, 정규분포는 평균과 표준편차와 관련이 있었죠. 카이제곱분포는 표준정규분포를 따르는 모

[비 올 때 듣기 좋은 윤하 노래] 윤하(YOUNHA) - 비가 내리는 날에는 / 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘 소개해 드릴 노래는 윤하 노래인데요, 여러분은 비 올 때 듣기 좋은 노래로 무엇을 떠올리시나요? 아마 헤이즈의 '비도 오고 그래서', 폴킴의 '비', 에픽하이의 '우산'을 떠올릴 것 같은데요. 비 노래로 조금은 덜 알려진 윤하의 '비가 내리는 날에는'을 가져왔습니다. 근데 이 노래가 사실은 직접적으로 비와 연관이 있는 건 아닙니다. 가사를 잘 보면, 비와 관련된 내용보다는 발라드 특유의 사랑과 이별에 대한 내용이라고 느껴지는데요. 연인과 이별을 하고 나서 흘리는 눈물을 비에 비유했기 때문에, 제목은 비와 관련 있는 것처럼 보이지만, 실제 내용은 조금 다르다는 점이 있습니다. 그러나, 사실 제목에서 주는 이미지는 무시하지 못하기 때문에, 비 올 때 듣는 것도 굉장히 좋습니다. 윤하 노래는 대중들에게 엄청나게 알려져 있다기보다는, 마니아층이 매우 강하죠. 그래서 윤하 노래를 들을 땐 타이틀곡만 듣는 것이 아니라, 수록곡까지 모두

[케이시 감성 노래] 케이시(Kassy) - 늦은 밤 헤어지긴 너무 아쉬워 / 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘은 케이시(Kassy)의 '늦은 밤 헤어지긴 너무 아쉬워'라는 노래를 가져왔습니다. 제가 유독 케이시의 노래를 가져오는 이유가 있는데요, 사실 남자 고백 노래는 꽤 있는데, 여자 고백 노래가 많지는 않은 것 같아요. 그렇다고, 케이시가 고백 노래만 잘하는 것도 아니고 이별 노래도 상당히 잘하죠. 이 앨범 안에는 고백과 이별 모두 들어가 있는 것 같습니다. 더블 타이틀곡 중 하나인 '늦은 밤 헤어지긴 너무 아쉬워'는 고백의 느낌이 강하다면, '점점 지쳐가'는 이별의 느낌이 조금 더 강한 것 같아요(제 개인적인 느낌입니다.) '늦은 밤 헤어지긴 너무 아쉬워'는 사랑을 시작할 때 느끼는 행복함과 설렘을 가사로 잘 표현하였습니다. 케이시 같은 경우엔 고음을 막 내는 가수보다는 차분한 상황에서 감정을 잡고 가는 가수라는 생각이 더 강하게 듭니다. 그래서 다른 가수들과 조금 차별화가 느껴진다는 생각도 있어요. 고음이 노래의 퀄리티를 정말

3학년 1학기를 마치며 (feat. 지옥의 3학년) [내부링크]

6월 17일, 참빛 설계 팀 프로젝트 발표를 마지막으로, 이번 학기를 종강하였다. 종강하고 나서, 학교를 나가기도 했지만, 다른 학기와는 다르게 계속해서 휴식을 취하는 중이다. 그 이유는 여러 가지가 있지만, 차차 공개를 해야 할 것 같다. 이번 학기를 하면서 느낀 것은, 우리는 한 번에 수많은 것을 완전히 얻는 것은 힘들다는 거였다. 수강신청을 하기 전 내가 생각했던 것은 기계학습과 데이터 마이닝 수업을 통해서는 데이터 분석하는 역량과 머신러닝 모델에 대해서 더 잘 알게 되기를 바랐다. 정보디자인프로그래밍을 통해서는 React와 d3를 이용해서 개발까지 할 수 있고, 텍스트 마이닝을 통해 자연어 처리까지 할 줄 아는 사람이 되는 것을 꿈꿨다. 여기다, 참빛 설계 프로젝트에서는 추천 시스템을 통한 웹 페이지 구축까지 있었기 때문에, 이번 학기가 끝나면 그래도 내가 원하는 만큼 성장할 줄 알았다. 흔히, 광운대학교 이상민 교수님이 말씀하시는 '우리는 인공지능을 주로 하지만, 서비스화를

[볼빨간사춘기 데뷔곡] 볼빨간사춘기 - 싸운날 / 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 오늘은 볼빨간사춘기의 데뷔 앨범의 타이틀곡인 '싸운날'을 가져왔습니다. 노래 제목에 있는 대로 누군가와 싸우고 났을 때의 우리의 모습을 잘 투영시킨 노래인 것 같네요. 아마 볼빨간사춘기가 전하려는 의도는 연인과 다투고 나서의 모습이 아닐까 싶지만, 사실 연인이 아니더라도 누군가와 싸우게 되면 노래 가사 속 우리들과 비슷할 거라고 생각해요. 친한 친구와 싸우면 연락도 밭지 않고 그러기도 하잖아요. 아무튼, 다시 노래로 돌아오면, 연인과 데이트를 하거나 같이 있다가 싸우면 '연인의 손을 뿌리쳐서 돌아선 나'가 됩니다. 그러나, 막상 돌아서면 '내가 괜히 화냈나?'라는 생각을 하면서 천천히 걷고, 주변을 서성거리지만 시간은 돌이킬 수가 없게 되죠. 먼저 용기를 내어 전화를 걸어보지만, 상처를 크게 받은 상대방은 전화를 받지 않습니다. 붙잡아 주기를 원하지만, 이미 저질러 버렸죠. 그런 상황이 '로맨택한 너도 한여름 밤에 설렘도 처음으로 돌릴 순 없어

[레드벨벳 신곡] 레드벨벳(Red Velvet) - Feel My Rhythm / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요. 되게 오랜만이네요. 요즘 시험도 시작했고, 아무래도 개강하다 보니까, 예전처럼 매일매일 포스팅하는 것이 많이 힘들더라고요. 그래도 시간을 조금씩 내서 포스팅을 하려고 합니다. 오늘 가져온 노래는 최근에 나온 노래인데요. 바로 레드벨벳의 Feel My Rhythm입니다. 바로 'The Reve Festival'의 2022버전으로 나온 노래인데요, 저 앨범명이 되게 익숙해서 뭔가 봤더니 2019년에 짐살라빔(Zimzalabim) -> 음파음파(Umpah Umpah) -> Psycho로 이어졌던 그 앨범이더라고요. 많은 분들이 느끼기로는, 2019년 피날레 앨범으로 나왔던 'Psycho'의 봄 버전이라고 말씀을 하시는데요, 저도 거의 비슷한 느낌이 나는 것 같아서 좋았어요. 전체적으로 앨범이 봄 감성을 자극한다는 느낌을 받고, 주제가 '꿈', '환상'이라는 느낌도 받습니다. 무엇보다 이 앨범에서 주목할 만한 부분이 바흐의 'G선상의 아리

[오마이걸 신곡 리뷰] 오마이걸 (OH MY GIRL) - Real Love / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘은, 지난주 월요일에 나왔던 오마이걸의 신곡을 리뷰해 보는 시간을 갖도록 하겠습니다. 타이틀곡은 바로 'Real Love'인데요. 'Real Love'는 사랑에 빠진 순간 주위를 둘러싼 모든 것들이 낯설고 이국적이게 느껴지는 그 특별한 순간을 담은 곡입니다. 멜론에 나온 곡 소개대로 가사를 읽어보면 곡 소개가 이해가 되는 부분이 많죠. '7시간 비행 뒤 만날 것 같은 섬'이라는 부분이나 '사랑을 말하기 이보다 완벽한 밤은 없어'라고 하는 부분에서 알 수 있습니다. 다만, 개인적으로는 너무 아쉽다는 느낌을 처음엔 많이 받았는데, 저만 그런 느낌을 받은 건 아니었네요. 사실, 오마이걸은 수록곡, 타이틀곡을 워낙 잘 뽑기로 유명한 그룹입니다. 오마이걸 팬이 아닌 사람이 봐도, '비밀정원', 'CLOSER' 등 노래를 정말 잘 뽑았던 그룹인데, 사실 왜 Real Love를 타이틀곡으로 했을까라는 아쉬움이 많이 듭니다. 계속 반복되는 리

[블랙핑크 좋은 노래] BLACKPINK - Lovesick Girls / 가사 및 파트 별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘은 블랙핑크의 'Lovesick Girls'를 가져와 봤어요. 보니까, 추석 연휴인 금요일에 오후 1시에 발매를 했었더라고요. 아무래도 미국쪽을 노리고 그렇게 한 것 같다는 생각이 듭니다. 'Lovesick Girls'는 인간은 왜 그렇게 사랑에 상처받고 아파하면서도 또 다른 사랑을 찾아가는지에 대한 궁극적인 질문을 던지는 가사가 돋보이는 곡이라고 합니다. 최근에 연애를 하다가 헤어지면 '아, 난 이제 솔로로 좀 지낼래'라고 하지만, 그런 사람들을 보면 얼마 안가서 새로운 사람을 찾으며 또 다른 행복한 연애를 하곤 하죠. 그런 부분에 있어서 공감을 불러일으킬 수 있는 것 같습니다. 사실, 블랙핑크 노래가 조금 어둡다라는 느낌을 많이 받는 편입니다. 이 노래의 전작이었던 'How you like that'이나, 'Kill this love'와 같은 노래가 그런데요. 항상 dark한 그런 컨셉만 해왔던 건 아닙니다. '마지막처럼'과

[볼빨간 사춘기 봄 노래] 볼빨간사춘기 - 나들이 갈까, 별 보러 갈래? / 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘은 다시 한번 볼빨간사춘기의 노래로 찾아왔습니다. 날씨가 봄인 것만큼 봄 노래를 끌고 왔는데요! 특별히 두 개를 가져왔습니다. 원래는 '별 보러 갈래?'만 추천하려다가, 같은 앨범에 또 좋은 노래가 맞잖아요. 'Mermaid', '나들이 갈까', 'Seattle Alone' 등.. 너무 좋은 노래가 많아서, 하나만 추천하기가 너무 아깝더라고요. 일단, 메인 노래는 '별 보러 갈래?'입니다. 이 앨범에 무려 타이틀곡이 3개나 되는데요. 이걸 더블 타이틀이라고도 하지 않고, 뭐라고 하나요? 아무튼, '나만 봄'과 더불어서 너무나도 좋은 노래인 '별 보러 갈래?'와 '나들이 갈까'를 가져왔습니다. 내가 가장 좋아하는 별을 좋아하는 그, 우연히 눈이 마주쳐버린 나와 같은 소울메이트와 함께 무작정 별을 보러 떠나, 모래사장 위를 뛰어다니며 별을 쫓는 두 남녀의 운명 같은 만남을 노래로 담아냈습니다. 말 자체는 별 보러 가자는 게 그냥 한

[정은지 솔로 데뷔곡] 정은지(Apink) - 하늘바라기(Feat. 하림) / 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오랜만에 인사드립니다. 개강도 하고, 시험공부도 해야 해서 업로드를 계속 못하고 있었어요. 계속 못 올릴 것 같았는데, 오늘이 알고 보니까 100일 도전 마지막 날이더라고요. 그래서, 마지막 날은 놓칠 수가 없어서 포스팅을 하기로 했습니다. 오늘 가져온 노래는 바로, 에이핑크의 메인보컬 정은지의 솔로 데뷔곡인 '하늘바라기'입니다. 곧 있으면 하늘바라기가 나온 지 6주년이 되는데요, 이 당시에도 상당히 히트를 쳤고, 지금까지도 꽤 많이 듣는 노래 중 하나입니다. 사우디에 계신 아버지를 떠올리면서 쓴 노래인데요, 이 시대에 계신 모든 아버지들을 향한 감동의 메시지를 담았습니다. 많은 발라드들이 주제를 연인과의 사랑으로 다룬다는 점에서 차이가 있는데요, 실제로 어버이날에도 많이 듣는 노래라고 합니다. 어떻게 보면, 정은지의 노래 실력이 너무 안 드러난 것 같았는데, 같은 가사와 멜로디를 부르더라도, 정은지는 감정을 너무 잘 살리는 그런

[숨겨진 레드벨벳 명곡] 레드벨벳(Red Velvet) - 카풀 (Carpool) / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘 노래는 바로 레드벨벳의 카풀(Carpool)을 가져와 봤어요! 카풀(Carpool)이 무엇인지 아시나요? 같은 곳을 향해 가는 사람끼리 같은 차를 타서 가는 것을 말해요! 쉽게 말해서, 여행 갈 때 목적지가 같은 사람에게 같이 여행 가자고 하는 거라고 생각하면 됩니다. 그럼 이 노래가 그런 부분이랑 연관이 있을까요? 바로~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~ 있다는 점이죠. 카풀(Carpool)은 도시의 빌딩 속에서 우연히 만난 상대에게 여름 속으로 함께 드라이브를 떠나자고 제안을 하고 있는 모습을 보여주고 있습니다. 가사에도 워낙 잘 보이죠? 차에 타고 싶다는 모습, 낯설고 어렵고 쉽지 않지만, 즐겁게 여행을 가자고 제안하는 모습이 보입니다. 이 노래는 레드벨벳의 앨범인 'The ReVe Festival' 시리즈의 'Day 2'에 수록되었던 곡이며, 피날레 앨범에서도 같이 수록되었습니다. 아마, 앨범 발매

[오마이걸 대표곡] 오마이걸 - 살짝 설렜어 (Nonstop) / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘 소개해 드릴 노래는 바로, 오마이걸의 가장 대표적인 노래인 '살짝 설렜어 (Nonstop)입니다. 오마이걸을 단번에 대세 그룹으로 올려주었던 노래입니다. 사실 이전부터, 오마이걸 노래를 개인적으로 계속 들어왔었고, '컬러링북', '불꽃놀이' 등 개인적으로 되게 좋아했던 노래들이 많았는데, 퀸덤 이후로 이렇게 빛을 보니까 좋기는 하네요. 말 그대로, 노래 제목에 쓰여있는 대로, 설레는 감정을 드러낸 노래입니다. 그런데, 단순히 그냥 가사로 '설렜다' 이게 아니라, 보드게임을 하다가 무인도에 갇힌 상황으로 표현하였습니다. 이런 부분은 뮤비를 보면 자세하게 나오죠. 부루마블 판에서 주사위를 던지고, 무인도에 갇히는 장면이 나오면서, 노래 가사와 연결이 됩니다. 그럼 여기서, 부제목 Nonstop의 의미를 좀 봐야 하는데, 멜론 보니까 이런 말이 있네요 NONSTOP 게임”은 놀이판에 있는 다양한 장소들을 거쳐가며 “NONSTOP”

[케이시 발라드 노래] 케이시 - 가을밤 떠난 너 / 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오랜만에 인사드립니다. 오늘은 케이시의 대표곡 중 하나인 '가을밤 떠난 너' 리뷰입니다. 참고로, 이 앨범의 이름이 'Rewind'인데, Rewind가 무엇일까요? '되감다'라는 뜻을 가지고 있는데, 아무래도 타이틀 제목처럼 가을밤에 떠난 사람을 다시 remind를 하겠다는 의미를 가진 것 같습니다. 가을이라는 계절이 주는 왠지 모를 공허함과 쓸쓸함에 이미 지나간 시간이지만 후회라는 걸 한다고 합니다. 사실, 이 노래 발매되었을 때, 아쉬웠던 점이 많은데, '그때가 좋았어'랑 멜로디가 너무 비슷하고, 노래 전체 분위기가 비슷한 것이 아닐까?라는 생각이 들었습니다. '그때가 좋았어' 다음 노래가 '진심이 담긴 노래'인데, 그래도 '진심이 담긴 노래'는 멜로디가 다른 부분이 있었고, 조용한 분위기에서 이별한 사람에 대한 진심을 표현하고 있어서 좋았습니다. 그래도, 케이시 노래를 다 듣는 사람으로서, 성장과 발전 없이 제자리에 머무는 가

[레드벨벳 수록곡] Red Velvet (레드벨벳) - 여름빛 (Mojito) / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘 소개해 드릴 노래는 바로... 레드벨벳의 '여름빛(Mojito)'입니다. 사실, 이건 타이틀곡은 아니고, 수록되어 있던 노래를 가져왔는데요, 워낙 SM이 수록곡까지 좋은 거로 유명하잖아요. 이미 유명한 '빨간 맛(Red flavor)'보다는, 숨겨진 명곡을 가져왔습니다. 오늘 레드벨벳이 컴백하는데 또 어떤 노래로 올지 되게 궁금하네요. '여름빛(Mojito)'는 사랑하는 이와 여행을 떠나는 설렘과 아름다운 여름 풍경을 몽환적 분위기로 표현하였습니다. 귓가에 속삭이는 듯한 가사로 재미를 더했는데요, 저는 개인적으로 비트도 너무 좋았어요. 그리고, 여름에 나온 노래다 보니, 지금 듣는 게 좀 그럴 수도 있지만, 가사가 여름이랑 너무 잘 맞았던 것도 좋네요. '네가 금요일이라면 필요 없어 saturday'라는 표현은 누가 생각했는지 정말 대단하다고 밖에 느껴지지 않아요. 이처럼, 사랑하는 사람에 대한 가사와 동시에 여름에 떠나는 여

[레드벨벳 여름 노래] Red Velvet (레드벨벳) - 음파음파(Umpah Umpah) / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘 소개할 노래는 'The ReVe Festival' 앨범 Day 2의 타이틀곡인 '음파음파'입니다. 어제 레드벨벳이 컴백한 기념으로 또 한 번 같은 가수의 노래를 찾아왔는데요. 어제 나온 신곡인 'Feel my rhythm'을 듣고 뭔가 이 노래도 같이 생각나더라고요. 사실, 가사 때문에 되게 익숙했었어요. 아무튼, 노래 정말 좋은데, 꼭 한번 들어보세요. 여름에 나온 노래라 그런지, 봄보다는 여름에 조금 더 맞는 것도 사실이지만, 봄에 들어도 시원하고 청량한 느낌을 주고 있습니다. 수영을 모티브로 한 가사에 자신의 눈빛과 매력에 빠져 허우적대는 상대에게 호흡법을 알려줘서 즐거운 추억을 만들고 싶은 마음을 표현했다고 하는데요, 그 호흡법이 바로 '음파음파'아닐까요? 뿐만 아니라, 가사 안에도, 이전의 레드벨벳 노래의 타이틀곡이 숨어져 있습니다. 이런 추억과 관련된 내용은 뮤비에서도 나오는데요, 중간에 몇몇 안무는 이전 노래에서

[조영수 리메이크 프로젝트] 케이시 (Kassy) - 언제나 사랑해 / 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오랜만이네요. 오늘은 최근에 나온 노래인 케이시(kassy)의 '언제나 사랑해'입니다. 어디서 많이 들어본 노래 같지 않나요? 예전에, '밤하늘의 별을'과 더불어 대표되는 싸이월드 미니홈피 BGM으로 많이 쓰였던 것 중 하나입니다. 이 노래는 원곡인 제이세라의 곡을 어쿠스틱으로 연주된 악기를 사용하여 따뜻하고 아련하게 표현하였습니다. 비슷한 느낌으로, 케이시의 '지친 하루 끝에 너와 나'를 꼭 들어보세요. '지친 하루 끝에 너와 나'는 어쿠스틱스러운 것 없이도 사람들에게 충분히 힘이 되어 주는 노래입니다. 케이시 노래를 자주 즐겨 듣고, 좋아하는 사람으로서, 너무 발라드스러운 노래도 좋지만, 이렇게 중간 지점에 있는 노래를 더 잘 살리는 것 같아요. 케이시가 '그때가 좋았어', '진심이 담긴 노래', '가을밤 떠난 너'와 같이 음원 성적이 좋았던 것들은 모두 발라드이기도 하지만, 발라드에 악기가 가미된 곡에 더 잘 어울리는 것 같네

[케이시 발라드 히트곡] 케이시(Kassy) - 진심이 담긴 노래(True Song) / 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘 소개해 드릴 노래는 케이시 대표 히트곡 3개 중 하나인 '진심이 담긴 노래'입니다. 전작인 '그때가 좋았어'의 상승세 흐름을 그대로 이어갔던 노래인데요. 진심을 어떤 말로 표현을 해야 할지 모르는 사람들을 위해 만든 노래입니다. 사랑하는 사람한텐 사랑 노래, 이별한 사람들한테는 그리움의 노래가 될 수도 있겠네요. 전체적으로 그냥 '발라드'스럽고, 무난하게 들을 수 있는 곡이라고 생각합니다. 사실 저 시기에 유독 사재기 의심 가수가 많아서 일부 사람들이 몰아갔던 느낌이 있는데, 단순히 증거가 '낮에 떨어지고 새벽에 올라간다'라는 증거 하나만으로는 단정 짓기 어려운 게 사실입니다. 케이시뿐만 아니라 역주행 가수들이 새벽에 추이가 올라갔던 사례가 많았던 게 사실이기도 하죠. 가끔 노래방 가서 이 노래 부르긴 하는데, 생각보다 많이 높더라고요. 높은 음에 감정까지 전달해야 하기 때문에, 겉으로는 되게 쉬운 노래 같아 보여도 전혀 쉽지

[SM 리마스터링 프로젝트] aespa - Dreams Come True / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘 소개해 드릴 곡은 바로 'Dreams Come True'인데요, 과연 누구 노래일까요? 바로 aespa 노래입니다. 그런데, 이 노래는 사실 원래 있었던 곡입니다. 1998년, S.E.S가 먼저 부른 노래인데요, 이 노래를 어쩌다 에스파가 불렀을까요? SM이 작년에, 유튜브와 손잡고 90년대와 00년대의 향수를 자극하겠다는 일명 '리마스터링 프로젝트'를 내면서, SM의 옛날 노래들을 SM 가수가 커버하게 되었습니다. 원곡과 편곡된 이번 노래가 많이 다르지 않아서, 크게 이질감이 드는 것도 전혀 없더라고요. 무엇보다, 1998년 노래를 지금 들어도 크게 촌스럽지 않았던 거 같아요. 들어보니까, 이수만이 직접 핀란드에서 이 노래를 사서, S.E.S가 불렀다고 하네요. 예전 노래를 지금 들으면 별로인 댄스 곡이 많다고 개인적으로 생각하는데, 그렇지 않은 곡 중 하나라고 생각합니다. aespa가 이 노래를 내고, S.E.S 버전도 들

[빌보드 핫 100 첫 1위] 방탄소년단 - Dynamite / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘은 오후에 한 번 인사를 드리려고 하는데, 사실 쓰는 걸 조금 미뤄놓기도 해서 지금 써봅니다. 오늘 가져온 곡은 무려... 대한민국 가수 최초로 빌보드 핫 100 1위를 했던 노래를 가져왔습니다. 기존의 최고 기록이 싸이의 '강남스타일'이 9주 연속 핫 100 2위를 해서 1위는 하지 못했었는데, 그 힘든 기록을 세웠던 노래입니다. Dynamite는 코로나로 인해 힘든 일상을 살아가는 모든 세계의 현대인들에게 "Light it up" 하며 빛을 밝혀주는 희망의 메시지를 담은 노래입니다. 방탄소년단이 처음으로 영어로 곡을 소화하는 새로운 도전에 나섰는데요, 단순히 노래 연습뿐만 아니라 영어 공부랑 발음 연습도 엄청나게 했을 것 같아요. 사실, 방탄소년단 같은 경우엔 이 앨범이 아니어도 계속 해외에서 인기를 쌓아가고 있었던 상황이었기 때문에, 이렇게 영어 가사로 내는 도전도 해볼 수 있었죠. 이전 앨범이었던 [MAP OF THE S

[통계학] 10. 여러 가지 확률분포 (4) : 푸아송분포 [내부링크]

목차 1. 푸아송분포 (1) 푸아송분포란 (2) 푸아송 분포의 확률질량함수 구하기 (3) 푸아송 분포의 확률질량함수 유도 과정 (4) 적용 예제 2. 푸아송분포, 이항분포, 정규분포와의 관계 (1) 푸아송분포의 변화 (2) 푸아송분포와 이항분포 정규분포와의 관계 1. 푸아송분포 지난 시간까지, 우리는 실생활에서 많이 쓰이는 분포를 봤습니다. 오늘은 조금 가벼운 내용을 다루려고 하는데요, 그중 하나가 푸아송 분포입니다. (1) 푸아송분포란 푸아송분포는 일정한 단위 시간, 단위 공간에서 어떤 사건이 랜덤하게 발생하는 경우에 사용할 수 있는 이산형 확률분포로, 많은 사건 중에서 특정한 사건이 발생할 가능성이 매우 적은 확률변수가 갖는 분포입니다. 그럼, 사건이 발생할 가능성이 매우 드문 것이 무엇이 있을까요? 예를 들면, 손을 씻다 세면기에 휴대전화를 빠트릴 횟수라거나, 평화로운 시기에 기마대의 기마병의 낙마사고가 발생할 횟수가 해당이 될 겁니다. (2) 푸아송 분포의 확률질량함수 구하기

[여행 노래 추천] 볼빨간사춘기 - 여행 / 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 요즘 봄이 오고 있고, 날씨도 되게 좋고 여행 가기 너무 좋은 날씨 아닌가요? 그래서 오늘 추천해 드릴 노래는 바로 여행 갈 때 듣기 좋은 노래! 바로 볼빨간사춘기의 여행입니다. 우리가 여행을 언제 가는지 보면, 방학 때 가죠. 방학이라는 시간은, 학기 중에 힘든 우리에게 휴식의 시간을 주기도 합니다. 바쁘고 숨 막히는 일상 속에서 어디론가 떠나버리고 싶을 때, 여기저기 치이면서 지쳐버린 모든 청춘에게 바치는 노래입니다. 여행을 갈 때 듣기 좋은 노래이면서, 동시에 힘들 때 위로가 되는 노래이기도 합니다. 아직까지도 봄에 많이 듣고, 여행 갈 때 필수 노래로 꼽히는 이유는, 그만큼 공감되는 가사와 더불어 멜로디가 너무 좋기 때문이 아닐까 싶습니다. 사실, 이 앨범 같은 경우엔, 볼빨간사춘기가 새로운 변화를 시도했던 곡이기도 합니다. 어떤 분들이 보기에는, 목소리가 비슷하니까 또 자가복제 아닌가?라는 생각을 할 수도 있지만, 그렇지

[볼빨간사춘기 연애 노래] 볼빨간사춘기 - 좋다고 말해 / 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 어제에 이어서 오늘도 볼빨간사춘기의 노래를 가져왔습니다. 볼빨간사춘기의 대표곡 수에 비해서 제가 소개해 드린 곡이 많이 없었더라고요. 그래서, 이틀 연속 추천해 드리려고 합니다. 우주를 줄게와 더불어 대표곡으로 꼽히는 '좋다고 말해'인데요, 사실은 이 노래가 '우주를 줄게'와 타이틀곡으로 고민을 하다가, 뺐었던 노래였다고 합니다. 좋다고 말해는 추운 겨울 가로등 아래에서 내게 좋아한다고 말했지만, 다음날 갑자기 모른 척하고 지나치는 그에게 더 이상 고민하지 말고, 확신을 달라는 마음을 표현하였습니다. 가사를 너무 어렵게 해석하지 않아도, 그런 부분이 많이 보이죠. '넌 나의 남자친구이자 나는 너의 여자친구다' 하는 부분, '가로등 아래에서 좋다고 했지만 다음 날 쌀쌀하게 굴더라' 등. 이렇게 해석하기 쉬운 노래들도 좋다고 생각해요. 다른 이야기지만, SM 같은 경우엔 좀 사람을 어지럽게 해서 오히려 해석을 하게 만드는데, 그런 부분

[봄 노래 추천] 볼빨간사춘기 - 나만, 봄 / 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 지난 글에서 예고했지만, 또다른 볼빨간사춘기의 노래를 가져왔습니다. 날이 정말 따뜻해지고 있죠! 어딘가 놀러가기 너무나도 좋은 날씨고, 또 무엇보다 계절이 '봄'이잖아요. 봄이면 무엇을 해야 하죠???.. 사랑하는 사람과 놀아야 하겠죠?? 아, 물론 저한테는 해당되는 내용이 아니니까 넘어갈게요^^. 좋아하는 그가 나만 봐 줬으면 좋다는 의미를 '나만, 봄'이라고 표현하면서도 나만 갖고 싶은 '나만 봄'이라고 중의적으로 표현을 했네요. 또, 여기서 제 생각을 덧붙이자면, '나만 봄이고 싶다'라고 하면서 감정을 더 극대화시킨 것도 있는 것 같습니다. '여행'이후로 장르를 계속해서 확장은 시켰지만, 그래도 '비슷하다'라는 의견이 좀 있었습니다. 이 노래 다음에 나온 노래가 '워커홀릭'인데, 그 점을 고려한다면, 볼빨간사춘기 특유의 '그 분위기'로 낸 노래가 이게 마지막인 거 같아요. 그 이후로 'Dancing Cartoon'으로 조금 이

[통계학] 8. 여러 가지 확률분포 (2) : 이항분포 [내부링크]

1. 이항분포 (1) 이항분포란? (2) 이항분포의 확률질량함수 (3) 이항분포의 평균과 분산 (4) 이항분포의 모양 변화 2. R로 이항분포 확인해보기 (1) 이항분포로 확률질량함수 확인하기 (2) 이항분포의 누적분포함수 구하기 (3) 이항분포의 분위 p에 해당하는 값 찾기 (4) 이항분포로부터 난수 생성 함수 1. 이항분포 우리는 지난 시간에 베르누이 시행에 대해서 알아보았습니다. 베르누이 시행은 '성공', '실패'처럼 결과가 두 개인 시행을 독립적으로 반복 시행을 하는 것을 말합니다. 우리는 이 베르누이 시행이 한 번 일어날 때의 평균과 분산을 구해보았는데요. 오늘은, 베르누이 시행을 n번 할 때의 평균과 분산을 알아보는 시간을 가져보도록 하겠습니다. (1) 이항분포란? 이항분포는 성공 확률이 p로 일정한 베르누이 시행을 n번 반복해서 실험을 했을 때의 성공 횟수에 대한 확률분포입니다. 다시 정리해보면 1) 실험이 n번 반복되더라도 성공 확률 p는 변하지 않고 동일해야 합니다.

[(여자) 아이들 노래] [데뷔곡] (여자) 아이들 - LATATA / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 오늘 소개해 드릴 노래는 아이들의 데뷔곡인 LATATA입니다. 사랑에 빠져 이 밤을 불태우도록 신나게 춤추고 싶은 그 마음을 'LATATA'라고 표현하였습니다. 이 앨범이 무려 아이들의 데뷔곡인데요, 데뷔곡의 앨범이 [I AM]이죠? I am 이라고 하니까 어떤 것이 생각나시나요? 자기 자신을 표현하려는 느낌이 듭니다. 실제로, 이 앨범에서는 아이들이라는 멤버 6명을 6트랙으로 나누어서 소개를 하고 있어요. 큐브에서 데뷔하였고, 이 앨범으로 바로 대세 그룹으로 발돋움을 했습니다. 사실, 이 당시에 대형 기획사 그룹아니면 중소형 기획사에서 그룹이 뜨는 것이 거의 없었죠. 그나마 모모랜드의 뿜뿜이었는데, 모모랜드 같은 경우엔 다른 의미에서의 이미지 상실이 컸습니다. 모모랜드 말고는 여자친구가 있는데, 여자친구도 2015년 데뷔였고 그 이후엔 중소형 기획사에서 이렇다 할 그룹이 없었습니다. 그러나, 데뷔 후에 뮤직비디오 1억 뷰를 바로 찍으면서 멜론

[레전드 듀엣곡] 청하, 폴킴 - Loveship / 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘은 폴킴과 청하가 부른 loveship을 가져왔습니다. Loveship은 오래된 친구라 미처 눈치채지 못한 채로 지나쳐온 설레는 감정을 담은 노래입니다. 너라는 사람이 좋아서 가까워지긴 했지만, 서로 아무 말도 못했다는 가사를 시작으로, 두 사람이 계속 엇갈리는 것을 가사로 담아냈습니다. 무엇보다, 작사랑 작곡을 모두 폴킴이 단독으로 했다는 것에 놀랬네요. 일단 너무 좋은 노래이기도 하고, 또, 청하랑 음색이 잘 어울렸다고 생각해요. 이 당시에 둘 다 음원 쪽에서는 계속 탑이라서, 당연히 멜론 1위를 했을 줄 알았는데, 아무노래에 막혔더라고요. 의외로 둘의 조합이 안 좋다는 사람이 꽤 많았네요? 제 개인적으로는 화음 넣을 때 목소리도 좋았는데 이런 평이 나와서 놀랍네요. 좋은 듀엣곡 추천해드리고 갑니다. [뮤비] https://youtu.be/dM5gMsePq-o [가사] 너라는 사람이 좋아져 버렸어 우리 가까워지긴 했지 뭐가

[레드벨벳 노래] Red Velvet(레드벨벳) - 러시안 룰렛 / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘은 레드벨벳의 러시안 룰렛을 가져왔습니다. 요 근래 개강을 하면서 조금씩 바빠져서 포스팅이 늦어졌는데요, 레드벨벳이 3월 21일 복귀를 확정 지었습니다. 레드벨벳도 벌써 데뷔한 지 8년이 지나가네요. 보통 어떤 그룹을 보면 이 그룹의 '콘셉트'라는 것이 보이죠. 예를 들면, 에이핑크와 여자친구는 청순, 이런 식으로 말이죠. 그러나, 레드벨벳은 그 틀을 자주 깨는 시도를 많이 합니다. 이 노래가 나오기까지 노래 흐름을 보면 Ice Cream Cake -> Dumb Dumb -> 7월 7일 -> 러시안 룰렛의 흐름인데 4개의 곡 모두 분위기가 다릅니다. 특히, 이 노래의 전작인 7월 7일과는 더더욱 다르죠. 그래서인지 개인적으로 노래 나올 때 기대를 많이 하고 들어요. 러시안 룰렛이라는 용어 자체를 처음 접하는 분도 계시지만, 아닌 분들도 있죠. 러시안 룰렛이라는 게 회전식 연발 권총에 총알 하나만 장전해서 머리에 총을 겨누어 방아

[에이핑크 노래][봄 노래 추천] Apink(에이핑크) - Mr. chu / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘 리뷰할 노래는 에이핑크의 미스터 츄(Mr. chu)입니다. 이 노래는 사랑하는 사람과 나누는 첫 입맞춤의 두근거림을 표현한 통통 튀는 가사다 돋보이는 노래인데요, 같은 청순 계열의 노래이지만 이전의 노래(Nonono, 몰라요, My my)와는 주제가 조금 다르다고 볼 수 있습니다. 지금 생각해 봐도 콘셉트에 맞게, 노래를 정말 잘 구성했다고 생각하네요. 확실히, 청순 콘셉트를 했을 때는 신사동호랑이랑 워낙 잘 맞았었다고 생각합니다. '미스터 츄 ~ 입술 위에 츄 ~ 달콤하게 츄~' 하는 부분이 되게 중독성이 있고, 중독성만 있는 것이 아니라 멜로디의 흐름도 좋았다고 생각합니다. 사실, 이 노래가 에이핑크에게는 되게 분수령이 되었던 노래입니다. 이전에 NONONO가 엄청나게 히트를 해서, 그 흐름을 이어가냐 마냐가 중요했던 노래였죠. 이 당시에 평론가들 사이에서도 '청순은 죽었다' vs '청순은 에이핑크 고유의 identity를

[통계학] 9. 여러 가지 확률분포 (3) : 정규분포 [내부링크]

1. 연속확률변수와 확률밀도함수 (1) 이산확률변수 이산확률변수는 확률변수 X가 가질 수 있는 값이 유한하였죠? 연속확률변수는 어느 구간에 속하는 모든 값을 가질 수 있습니다. 쉽게 말해서, 실수 전체의 집합에서 정의된 함수 또는 닫힌 구간 [0, 2]에서 정의된 함수 같은 것을 생각하면 됩니다. ex. 버스를 기다리는 시간, 제품의 수명 등 이산확률변수의 확률분포는 확률변수가 가지는 각 값에서의 확률에 의해 정해집니다. 그러나, 연속확률변수는 각 구간에서의 확률에 의하여 확률분포가 정해집니다. 다시 말하면, P(X=3)이 아닌, P(1 < X < 5)와 같은 구간에 의하여 확률분포가 정해집니다. 연속확률변수에서 각 값을 가질 확률은 0입니다. (2) 확률밀도함수 연속확률변수 X가 alpha <= X <= beta에서 모든 실숫값을 가질 수 있다고 가정하겠습니다. 이 연속확률변수 X에 대하여 일 때, f(x)를 확률밀도함수라고 합니다. 확률밀도함수는 다음 세 성질을 만족합니다. 연속

[보아 노래 리메이크곡][볼빨간사춘기] 볼빨간사춘기 - 아틀란티스 소녀(Atlantis Princess) / 가사 [내부링크]

[멜론 정보] < 보아 - 아틀란티스 소녀 > < 볼빨간사춘기 - 아틀란티스 소녀 > [노래 소개 및 감상평] 안녕하세요! 오늘은 리메이크 곡으로 찾아왔습니다. 2020년, 보아 데뷔 20주년 기념 프로젝트 'Our Beloved BoA'의 두 번째 주자로 나섰던 볼빨간사춘기가 부른 아틀란티스 소녀를 가져왔습니다. 아틀란티스 소녀는 잃어버린 어린 시절의 꿈과 희망을 전설의 대륙, 잃어버린 문명, 아틀란티스로 비유한 동화 같은 가사와 함께 보아의 깊고 부드러운 목소리가 돋보이는 노래입니다. 이 노래를 볼빨간 사춘기만의 새롭고 신비로운 사운드로 완성하였습니다. 사실 이렇게 리메이크 곡을 내다보면, 원곡이 더 좋다는 반응이 많은데, 이 노래 같은 경우엔 리메이크가 잘 어울린다는 평이 많았습니다. 저도 또한 그렇게 생각하는 게, 평소 볼빨간사춘기의 음색과 이 노래의 배경, 시간적 상황까지 모두 들어맞았던 노래라고 봅니다. 개인적으로 요즘 노래 듣다가 이전 노래 들으면 느낌이 달라서 낯선 느

[(여자)아이들 노래] (여자) 아이들 - Oh my God / 가사 및 파트별 가사 [내부링크]

[멜론 정보] [노래 소개 및 감상평] 안녕하세요! 오늘은 (여자) 아이들의 'Oh my god'을 가져왔습니다. (여자) 아이들이 오는 3월 14일, 데뷔 후 처음으로 정규 앨범을 발매합니다. 또한, 지난 8월 전 멤버 '수진'의 탈퇴 이후 첫 앨범이기도 합니다. 아이들 컴백 기념으로 이 노래를 가져왔는데요, 아이들 노래는 항상 전소연이 단독 작사를 하고 작곡까지 하고 있죠. 데뷔 때부터 콘셉트를 잘 살린다는 평이 많았고, LATATA로 그 당시 최단기간만에 1위를 차지하기도 합니다. 사실 아이들이 주목은 계속 받고 있었지만, 뭔가 애매한 포지션이었다가, '퀸덤' 출연 이후, 팬덤이 기하급수적으로 커졌죠. 이 앨범에서 무려 10만 장의 초동 판매량을 기록합니다. 퀸덤의 상승세를 그대로 이어나간 곡인데요, 'Oh my god'은 거부, 혼란, 인정, 당당함과 같은 감정을 겪으면서, 현실과 부딪힘을 통해 나 자신을 믿어야 한다는 것을 노래로 표현하였습니다. 이 앨범의 이름도 'I tr

[파이썬으로 데이터 주무르기] 1강 내가 몰랐던 코드 모음 (1) [내부링크]

1. 파이썬으로 엑셀 데이터 부르는 과정과 컬럼명 바꾸기 pop_Seoul = pd.read_excel('폴더경로', header = 2, usecols = []) # header = 2 : 엑셀의 세 번째 줄부터 읽으라는 표시다. # usecols : 엑셀의 열 중 사용할 열만 가져오는 표시다. pop_Seoul.rename(columns = {A : B}) # 컬럼의 이름을 A에서 B로 바꾼다. ex. pop_Seoul.rename(columns = {'pop_Seoul.columns[0] : '구별', pop_Seoul.columns[1] : '인구수'}) 2. 판다스에 내장되어 있는 date_range 함수 dates = pd.date_range('20130101', periods = 6) # 2013-01-01부터 6일간 해당 # 사용 예시 df = pd.DataFrame(np.random.randn(6, 4), index = dates, columns = ['A', 'B'

[파이썬으로 데이터 주무르기] 1강 내가 몰랐던 코드모음 (2) - 파이썬 데이터프레임 합치기(concat) [내부링크]

1. 파이썬 concat # pd.concat([df1, df2]) : df1와 df2를 합친다. 기본값은 열 방향으로 합침 # pd.concat([df1, df2, df3], keys = ['x', 'y', 'z']) -> result.index를 하면 labels = [[0, 0, 0, 0, 1, 1, 1, 1, 2, 2, 2, 2], [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11]] 여기서 result.index.get_level_values(0) : 앞 level (0, 1, 2), result.index.get_level_values(1) : 뒤 level( 0~11) # concat의 열 붙이는 방법 1) axis = 0인 경우 인덱스에 새로운 값 붙이고 컬럼 값을 따라감 2) axis = 1인 경우는 컬럼에 새로운 값 붙이고 인덱스 값을 따라감 ex. df1, df4의 데이터프레임이 다음과 같다고 생각하자. df1 df4 A B C D B D F 0

[파이썬으로 데이터 주무르기] 1강 내가 몰랐던 코드모음 (3) - 시각화 [내부링크]

1. matplotlib의 라벨, 굵기 설정 plt.plot(x, y, label = name) # x축, y축 동일한데 이 그래프 자체의 이름이 name이 됌. plt.xlabel('time') # x축의 이름을 time으로 하겠다는 뜻이다. plt.ylabel('Amplitude') #y축의 이름을 amplitude로 하겠다는 뜻이다. # lw옵션 : lw = 3이면 굵기를 3으로 하겠다는 이야기 # color 옵션 : 그래프 모양의 색깔을 정할 수 있음 # linestyle 옵션 : 파이썬 그래프의 스타일을 정할 수 있음. # marker 옵션 : 각 점마다 마커를 지정할 수 있음('o', '>' 등이 있음) # markerfacecolor : marker의 색깔을 정할 수 있음 # markersize : 마커의 크기를 정할 수 있음. 사용 예시 : plt.plot(t, y, color = 'green', linestyle = 'dashed', marker = 'o', mark

[파이썬으로 데이터 주무르기] 1강 내가 몰랐던 코드모음 (4) - poly1d, polyfit [내부링크]

1. polyfit의 기본개념 fp1 = np.polyfit(data_result['인구수'], data_result['소계'], 1) # 인구수 컬럼과 소계 컬럼 사이에서 최소제곱법을 이용한 회귀식 도출 # polyfit의 세 번째 인자는 몇 차식으로 반환하는 지를 쓰는 것이다. #fp1을 출력하면 array([a, b])와 같이 출력하는데 이는 ax+b를 의미한다. # fp1은 데이터를 통해 얻은 최적의 값이기 때문에 실제 데이터값과 일치하지는 않는다. f1 = np.poly1d(fp1) fx = np.linspace(100000, 700000, 100) # fp1에서 나온 ax+b의 값 fx를 이용하여 그려줌. 2. poly1d로 연산하기 # poly1d([1, -1]) : x-1을 의미한다. # poly1d([1, 1, 1]) : x^2+x+1를 의미한다. # poly1d([1, -1]) + poly1d([3, 2])를 하면? => (x-1) + (3x+2) 이므로 4x+1이

[파이썬으로 데이터 주무르기] 2강 내가 몰랐던 코드모음 - Google Maps 이용하기 [내부링크]

1. 데이터 가져오는 과정에서 천 단위 콤마 없애기 ex. 72,544이면 72544로 가져온다. crime_anal_police = pd.read_csv('경로', thousands = ',') 2. Google Maps에서 API 키 가져오기 import googlemaps gmaps_key = "***********************" gmaps = googlemaps.Client(key = gmaps_key) 3. gmaps.geocode로 위치의 정보 알아보기 gmaps.geocode('서울중부경찰서', language = 'ko') => 리스트의 형태로 정보가 다 나옴. 4. 리스트에 위치 정보 넣기 station_addreess =[] #주소 station_lat = [] #위도 station_lng = [] #경도 for name in station_name: #station_name = 경찰서이름 tmp = gmaps.geocode(name, language =

[파이썬으로 데이터 주무르기] 2장. 내가 몰랐던 코드 모음 (2) - Pivot Table [내부링크]

1. pivot_table이란? pivot : (회전하는 물체의 균형을 잡아주는) 중심점 또는 '돌리다'라는 뜻 데이터 처리 기법의 하나. 데이터베이스, 스프레드시트 등의 데이터를 내가 보고 싶은 대로 요약해서 보여주는 통계 2. 파이썬에서의 pivot_table 사용해보기 (1) pivot_table의 기본 pd.pivot_table(df, index = ['Name']) # Name 컬럼에 있는 것을 인덱스로 바꿔줌 # 특별히 지정한 것이 없으므로 숫자형 데이터 컬럼들이 남게 된다. # 중복된 Name의 항목들은 하나로 합쳐지고 value 값들은 평균을 가지게 됌. (2) 인덱스가 여러 개인 경우 pd.pivot_table(df, index = ['Name', 'Rep', 'Manager']) # 인덱스가 Name, Rep, Manager 세 개가 되고 나머지는 숫자형 컬럼들이 나타남 (3) 특정 value만 지정해서 나타나도록 할 수 있음. pd.pivot_table(df, i

[파이썬으로 데이터 주무르기] 2강 내가 몰랐던 코드 모음 (3) - sklearn에서의 preprocessing [내부링크]

데이터를 분석하기 전에 전처리가 꼭 필요하다. 그 중 파이썬에서 전처리와 모델링을 할 수 있도록 도와주는 라이브러리가 있는데 preprocessing이다. 1. 여러 가지 스케일링 종류 (1) StardardScaler() : 기본 스케일링, 평균과 표준편차를 사용(0, 1) (2) MinMaxScaler() : 최댓값이 1, 최솟값이 0이 되도록 스케일링 (3) MaxAbsScaler() : 최대절댓값이 1, 최소절댓값이 0이 되도록 스케일링 (4) RobustSclaer() : 중앙값과 IQR 값 사용 (이상치에 덜 민감함) 2. 적용 코드(MinMaxScaler) from sklearn import preprocessing col = ['강간', '강도', '살인', '절도', '폭력'] x = crime_anal[col].values min_max_scaler = preprocessing.MinMaxScaler() # 최댓값이 1, 최솟값이 0이되도록 스케일링 x_scaled

[파이썬으로 데이터 주무르기] 2강. 내가 몰랐던 코드모음 (4) - Seaborn 라이브러리 사용하기 [내부링크]

1. Seaborn 라이브러리 : matplotlib도 그래프를 그려주지만, Seaborn 라이브러리는 통계적 분석이 필요한 경우에 더더욱 많이 사용함 그릴 수 있는 그래프 : boxplot, distplot(히스토그램), lmplot(회귀선), heatmap(히트맵), pairplot 등 2. Seaborn으로 그래프를 그리기 전에, 한글 폰트 깨짐을 방지해주는 코드를 넣는다. import platform path = "c:/Windows/Fonts/malgun.ttf" from matplotlib import font_manager, rc if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': font_name = font_manager.FontProperties(fname=path).get_name() rc('font', family=font_nam

[파이썬으로 데이터 주무르기] 2강 내가 몰랐던 코드 모음 - (5) 지도 시각화 도구 Folium [내부링크]

1. 사용법 (1) folium 라이브러리 임포트 import folium (2) Map -> location 중심으로 지도를 보여준다. folium.Map(location = [45.5236, -122.6750], zoom_start = 13, tiles = 'Stamen Toner') # location : 지도를 보여줄 위치 지정 # zoom_start : 지도 보여주는 확대/축소 비율 지정(숫자가 커질수록 확대) # tiles : 어떤 곳을 중심으로 보여줄지 결정 # tiles 옵션 : 'Stamen Toner'은 하천 중심 'Stamen Terrain'은 산림 위주 [출력 예시] (3) Marker -> Map을 보여줄 때 지정된 위치를 마커를 통해 보여준다. folium.Marker([45.5244, -122.6699], popup = 'The Waterfront', tooltip = 'Waterfront').add_to(map_2) # popup : 지도에 표시될 마커의

[파이썬으로 데이터 주무르기] 3장. 내가 몰랐던 코드모음 (1) - BeautifulSoup 이용하기 [내부링크]

1. 웹 데이터를 가져오는 BeautifulSoup 이용하기 (1) BeautfiulSoup import하기 from bs4 import BeautifulSoup (2) html 파일 가져오기 page = open('파일경로', 'r').read() soup = BeautifulSoup(page, 'html.parser') # 문서 전체를 저장함 print(soup.prettify()) #html 코드 전체 출력 print(soup.children) # 한단계 아래에서 포함된 태그를 알고 싶을 떄 [출력] 1-1 다른방법 import requests from bs4 import BeautifulSoup webpage = requests.get(url) soup = BeautifulSoup(webpage.content, 'html.parser') 2. BeautifulSoup의 여러 가지 모듈 (1) html에 접근 html = list(soup.children)[2] #html에 접

[파이썬으로 데이터 주무르기] 3강 - 내가 몰랐던 코드 모음 (2) - 사이트에 접근 [내부링크]

1. 사이트에 접근하기 (1) 오류가 뜨지 않는 경우 from bs4 import BeautifulSoup from urllib.request import urlopen url_base = 'https://www.chicagomag.com' url_sub = '/Chicago-Magazine/November-2012/Best-Sandwiches-Chicago/' url = url_base + url_sub html = urlopen(url) soup = Beautifulsoup(html, "html.parser") soup (2) 오류가 뜨는 경우 from bs4 import BeautifulSoup from urllib.request import urlopen, Request, urljoin headers = {'user-agent' : 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_14_4) AppleWebKit/537.36 (KHTML, like

[파이썬으로 데이터 주무르기] 3강 - 내가 몰랐던 코드 모음 (3) - 저장한 데이터로 분석하기 [내부링크]

1. 엑셀로 저장한 데이터 다시 불러오기 import pandas as pd data = {'Rank' : rank, 'Menu':main_menu, 'Cafe':cafe_name, 'URL' :url_add} df = pd.DataFrame(data) df = pd.DataFrame(data, columns = ['Rank', 'Cafe', 'Menu', 'URL']) df.to_csv('연결경로', sep = ',', encoding = 'UTF-8') (1) 잘 되었는 지 확인 df = pd.read_csv('C:/Users/revol/DataScience/data/best_sandwiches_list_chicago.csv', index_col = 0) df.head() (2) 첫 번째 가게에 대한 정보 확인 req = Request(df['URL'][0], headers = headers) html = urlopen(req) soup_tmp = BeautifulSoup(htm

[파이썬으로 데이터 주무르기] 3강 - 내가 몰랐던 코드 모음 (4) - tqdm 모듈과 지도 시각화 [내부링크]

1. tqdm 모듈 설치 (1) anaconda prompt에서 설치 conda install -c cond-forge tqdm (2) 적용 from tqdm import tqdm_notebook price = [] address = [] for n in tqdm_notebook(df.index): req = Request(df['URL'][n], headers = headers) html = urlopen(req) soup_tmp = BeautifulSoup(html, 'lxml') gettings = soup_tmp.find('p', 'addy').get_text() price.append(gettings.split()[0][:-1]) address.append(' '.join(gettings.split()[1:-2])) <상태 표시바> <상태 완료바> 2. 기존 데이터프레ㅣ임에 price랑 address 정보 저장 df['Price'] = price df['Address'] =

[파이썬으로 데이터 주무르기] 5장 - 내가 몰랐던 코드 모음 (1) matplotlib inline [내부링크]

1. 필요한 라이브러리 import import platform import matplotlib.pyplot as plt from matplotlib import font_manager, rc (1) %matplotlib inline %matplotlib inline #노트북을 실행한 브라우저에서 바로 볼 수 있게 함. (2) 운영체제에 맞게 폰트를 지정 if platform.system() == 'Darwin': rc('font', family='AppleGothic') elif platform.system() == 'Windows': font_name = font_manager.FontProperties(fname=path).get_name() rc('font', family=font_name) else: print('Unknown system... sorry~~~~') 2. 파이썬의 plt.rcParams => 폰트, 크기, 선의 색, 두께 등을 활용할 수 있음 import m

[파이썬으로 데이터 주무르기] 5강 - 내가 몰랐던 코드 모음 (2) fillna 결측치 처리하기 [내부링크]

1. fillna의 쓰임 먼저 알기 fillna(value, method, axis, inplace, limit, downcast) value : 스칼라, 딕셔너리, 시리즈, 데이터프레임이 들어갈 수 있음 method : backfill, bfill, pad, ffill axis : 0, 1, columns limit : ? (1) 데이터 먼저 선언 df = pd.DataFrame([[np.nan, 2, np.nan, 0], [3, 4, np.nan, 1], [np.nan, np.nan, np.nan, 5], [np.nan, 3, np.nan, 4]], columns=list("ABCD")) df [출력 결과] (2) NaN 값 0으로 채우기 df.fillna(0) (3) Nan 값을 앞에 있는 값으로 채우기 df.fillna(method = 'ffill') (4) Nan 값을 뒤에 있는 값으로 채우기 df.fillna(method = 'bfill') (5) Nan 값을 이전 값으로

[파이썬으로 데이터 주무르기] 5장 - 내가 몰랐던 코드 모음 (3) - get_level_values(), stack() [내부링크]

1. 먼저 임의의 데이터를 pivot table로 전환시켜보자. pop = pd.pivot_table(population, index = ['광역시도', '시도'], columns = ['구분'], values = ['인구수', '20 - 39세', '65세이상']) pop #get_level(0) : 광역시도 get_level_value(1) : 시도 [출력 결과] 여기서 인덱스쪽에 광역시도가 level 0에 해당하고, 시도가 level 1에 해당한다. (1) pop.columns.get_level_values() pop.columns.get_level_values(0) [출력 결과] pop.columns.get_level_values(1) [출력 결과] (2) 불린형이랑 같이 쓰는 거도 가능 pop[pop['소멸위기지역'] == True].index.get_level_values(1) (3) 활용 예시 tmp_columns = [pop.columns.get_level_values

[자료구조] 1. ADT란? [내부링크]

자료구조를 시작하기 전에, ADT의 개념에 대해 알아보자. 1. ADT : Abstract Data Type의 약어, 추상 자료형이라는 뜻. 어떤 기능의 구체적인 과정은 보여주지 않고, 그냥 그 기능이 무엇인지만 알려줌 어떤 연산 기능이 있는데 보통은 Constructors(인스턴스 생성 및 초기화), Accessors(인스턴스에 포함한 데이터 리턴), Mutators(인스턴스 변경), Iterators(연속적으로 데이터 처리)로 나뉜다. 1) 기능이 무엇인지 알려주는 것이기 때문에 그 데이터 타입에 대해 'How'보다는 'What'에 초점을 맞추고 있음 2) 따라서, 이런 속성 때문에 블랙박스에 비유되기도 함. Ex. 핸들은 방향을 꺾을 수 있게 하고, 백밀러로 뒷 차가 오는 지 오지 않는 지 확인을 한다. 우리는 이것들이 이런 기능을 하고 있으니까 쓰는 것이다. 핸들이랑 백밀러가 내부에 어떤 성분 으로 구성이 되어있고, 이것은 어떻게 만들어졌냐는 우리의 알 바가 아님. 그냥 그

[자료구조] 2. 빅-오 표기법과 시간 복잡도 계산 [내부링크]

목차 1. 알고리즘의 성능 분석 기법 (1) 실행 시간을 측정하는 기법 (2) 알고리즘의 복잡도를 분석하는 기법 2. 빅-오 표기법(Big-O Notation) 3. 알고리즘을 보고 시간 복잡도 판단하기 1. 알고리즘의 성능 분석 기법 알고리즘의 성능을 분석하는 방법은 두 가지가 있습니다. 실행 시간을 직접 측정하거나, 알고리즘의 복잡도를 분석하는 방법이 있습니다. (1) 실행 시간을 측정하는 기법 실행 시간을 측정하는 방법은 두 개의 알고리즘의 실제 실행 시간을 측정하는 것입니다. from time import time start_time = time() run algorithm end_time = time() elapsed = end_time - start_time 위 코드와 같이 어떤 알고리즘을 실행할 때마다 코드를 작성하여 시간을 측정할 수 있습니다. 그러나, 이는 명확하게 한계가 존재합니다. 먼저, 알고리즘을 직접 만들어야 합니다. 하나의 알고리즘이면 상관이 없습니다. 하지

[자료구조] 3. 재귀(Recursion) [내부링크]

목차 1. 순환 알고리즘 (1) 팩토리얼 (2) 피보나치 수열 (3) 거듭제곱근 계산 (4) 이진 탐색 2. 무엇이 더 좋다!라고 결정할 수는 없다. 1. 순환 알고리즘 순환은 알고리즘이나 함수가 수행 도중에 자기 자신을 다시 호출하여 문제를 해결하는 기법을 말합니다. 정의 자체가 순환적으로 되어 있는 경우에 매우 적합합니다. 팩토리얼 계산, 피보나치수열, 이항 계수, 하노이 탑, 이진 탐색 문제 등 순환 알고리즘이 사용되는 경우가 많습니다. (1) 팩토리얼 factorial() 함수에서 또다시 factorial() 함수를 호출하고 있습니다. < 파이썬으로 구현한 팩토리얼 - 재귀 버전> def Factorial(n): if n == 0: return 1 else: return n * Factorial(n-1) 처음에 n = 4를 넣게 되면 1) 4 * factorial(3)가 되면서 factorial(3)를 call 합니다. 2) 같은 방법으로 factorial(1) = 1을 도출

[자료구조] 4. 배열 기반의 Sequences - Compact Array, Referential Array [내부링크]

목차 1. 파이썬의 Sequence Types 2. Low-Level Arrays(로우 레벨의 배열) (1) 배열 3. 파이썬 List의 Compact Array 성질 4. 파이썬 List의 Referential Array 성질 (1) 슬라이싱 (2) 배열 생성 (3) extend 1. 파이썬의 Sequence Types Sequence는 '연속'이라는 뜻을 가지고 있죠. 근데, 프로그래밍을 할 때 이 단어를 그대로 사용하게 되면, 오히려 더 헷갈리거나 의미에 집착할 수도 있다고 생각합니다. 그래서 예시로 아는 게 좋을 거 같은데요. 파이썬의 Sequence Types에는 리스트, 튜플, 문자열이 있습니다. 이들은 모두 인덱싱이 가능하다는 점이 있습니다. (e.g seq[k]) 다만, 각 Sequence Types의 인덱스에 있는 값을 바꿀 수 있냐 없냐에 조금의 차이가 있습니다.(리스트는 가능하지만, 튜플과 문자열은 불가능). 2. Low-Level Arrays(로우 레벨의 배열)

[자료구조] 5. 배열 기반의 Sequences - Dynamic Arrays과 Amortization(동적 배열) [내부링크]

목차 1. Low-level Array의 한계 2. 파이썬의 list 클래스 (1) 특징 (2) 동적 배열(Dynamic Array)를 제공하는 방법 (3) 파이썬 List가 Dynamic Array인 것 확인하기 (4) 동적 배열(Dynamic Array) 형성 과정 3. 파이썬으로 Dynamic Array 구현하기 1. Low-level Array의 한계 우리는 지난 시간에 Low-level Array와 관련하여 배웠습니다. Low-level Array 같은 경우에는 배열을 메모리에 할당하기 위해서, 정확한 크기가 명시가 되어야 합니다. 파이썬의 투플과 문자열 같은 경우엔 초기화가 될 때, size를 변화시킬 수 있습니다. 다시 말하면, 중간에 크기를 갑작스럽게 확장시키지 못한다는 뜻이죠. 이러한 한계를 해결해 주는 것이 바로 List입니다. 2. 파이썬의 list 클래스 (1) 특징 : 파이썬의 리스트 클래스는 명확한 한계점 없이 요소를 계속 넣을 수 있는 장점이 있습니다. 우

[파이썬 자료구조] 6. 스택(Stack) [내부링크]

목차 1. 스택(Stack)이란? (1) 스택의 근본적인 연산 (2) 스택의 예 (3) 스택의 연산 과정 2. 스택(Stack) ADT(스택의 기능) 3. 파이썬으로 스택을 구현하기 (1) 스택을 구현한 클래스 (2) 각 연산의 시간복잡도 1. 스택(Stack)이란? 우리가 친구들과 대화하면서 한 번 쯤은 '스노우볼 엄청 굴러갔다', '스택 엄청 쌓였다'라는 표현을 써봤을 겁니다. 여기서 '스택'은 무엇을 말하는 걸까요? 뭔가 쌓인 느낌이 들지 않나요? 스택이라는 것은 쉽게 말해서 나중에 일어난 일을 가장 먼저 처리하는 것을 말합니다. (1) 스택의 근본적인 연산 : pushing(삽입), popping(삭제) => LIFO(last-in, first-out) (2) 스택의 예 : 인터넷 웹 브라우저 접속 후 뒤로가기 버튼을 누르는 행위, 텍스트 에디터와 관련한 사항 우리가 인터넷 웹 사이트에 접속을 하게 되면, 그 주소가 스택이라는 곳에 쌓이게 됩니다. 여기서 뒤로가기를 누르면 우

[파이썬 머신러닝 완벽가이드] 1. 머신러닝의 개념과 Numpy 모듈 사용하기 [내부링크]

참고 자료 파이썬 머신러닝 완벽 가이드 저자 권철민 출판 위키북스 발매 2020.02.07. 목차 1. 머신러닝의 개념 2. 파이썬 머신러닝 생태계를 구성하는 주요 패키지 3. Numpy (1) ndarray 개요 (2) ndarray 편리하게 생성하고 차원 변경 - arange(), zeros(), ones(), reshape() (3) ndarray의 인덱싱과 슬라이싱 (4) 행렬 정렬방법 - argsort()와 sort() 01. 머신러닝의 개념 데이터를 기반으로 패턴을 학습하고 결과를 예측하는 알고리즘 기법 현실 세계에서 문제 해결을 하는 데 매우 큰 일조를 하고 있음. ex. 금융 거래 사기 치는 것 데이터 분석 영역 ---> 머신러닝 기반의 예측 분석으로 재편되는 중 1) 머신러닝의 분류 – 지도학습, 비지도학습, 강화학습 지도학습 -> 분류, 회귀, 추천 시스템 비지도학습 -> 클러스터링, 차원 축소, 강화학습 2) 데이터 전쟁 : 머신러닝의 단점은 데이터에 매우매우매우

[파이썬 머신러닝 완벽가이드] 2. 판다스 사용하기 [내부링크]

참고 서적(p.39 ~ p.85) 파이썬 머신러닝 완벽 가이드 저자 권철민 출판 위키북스 발매 2020.02.07. 목차 01. 판다스 1) 판다스 개요 2) 데이터 가져오기 3) 데이터 프레임으로 변환하는 방법 4) 데이터 생성하고 수정하기 5) 데이터 필터링 6) ix, loc, iloc -> 판다스에서의 인덱싱 7) 판다스에서의 정렬 - sort_values() 8) Aggregation 함수 - sum(), min(), max(), count() 9) 결손 데이터 처리하기 01. 판다스 : 다양한 포맷으로 된 파일을 dataframe으로 변환하는 API 제공 1) 판다스 개요 read_csv() : csv 파일 포맷 변환 read_table() : delimeter가 ‘\t’인 것을 변환 read_fwf() : fixed width, 즉 고정 길이 기반의 칼럼 포맷 변환 그런데, csv에서 delimeter을 구분하고 있어서 read_csv(‘파일명’, sep = ‘\t’);

[파이썬 머신러닝 완벽 가이드] 2장. (1) 학습 데이터와 테스트 데이터 분리하기 [내부링크]

목차 01. 사이킷런 소개와 특징 1) skikit-learn 라이브러리 설치 후 확인 02. 첫 번째 머신러닝 만들어보기 - 붓꽃 품종 예측하기 1) 붓꽃 데이터 세트 로딩 2) 학습 데이터와 데이터 세트를 분리하기 3) 학습 데이터에서 학습한 내용을 기반으로 테스트 데이터에서 결과 예측 03. 사이킷런의 기반 프레임워크 익히기 1) Estimator 클래스와 fit(), predict() 메서드 2) load_iris()가 반환하는 객체의 키(feautre_names, target_name, data, target)값 출력 [참고 서적] 2장 p.86 ~ p.99 파이썬 머신러닝 완벽 가이드 저자 권철민 출판 위키북스 발매 2020.02.07. 01. 사이킷런 소개와 특징 가장 많이 사용되는 머신러닝 라이브러리. 최근엔 텐서플로, 케라스 등의 딥러닝 전문 라이브러리의 강세로 인해 줄어들기는 하지만 데이터 분석가가 가장 많이 의존하는 라이브러리. 설치 : Anaconda promp

[파이썬 머신러닝 완벽가이드] 2장. (2) 교차 검증 - K 폴드, Stratified K 폴드 [내부링크]

[참고 서적 - 파이썬 머신러닝 완벽 가이드 p.100 ~ p.117] 파이썬 머신러닝 완벽 가이드 저자 권철민 출판 위키북스 발매 2020.02.07. 목차 04. Model Selection 모듈 소개 (1) 학습/테스트 데이터 세트 분리 - train_test_split() (2) K 폴드 교차 검증 (3) Stratified K 폴드 (4) cross_val_score() API 04. Model Selection 모듈 소개 (1) 학습/테스트 데이터 세트 분리 - train_test_split() #학습/테스트 데이터 세트 분리 - train_test_split() from sklearn.datasets import load_iris from sklearn.tree import DecisionTreeClassifier from sklearn.metrics import accuracy_score from sklearn.model_selection import train_tes

[파이썬 머신러닝 완벽 가이드] 2장. (3) 데이터 전처리 방법 [내부링크]

[참고 서적 - 파이썬 머신러닝 완벽가이드 p. 118 - 127 ] 파이썬 머신러닝 완벽 가이드 저자 권철민 출판 위키북스 발매 2020.02.07. 목차 05. 데이터 전처리 (1) 데이터 전처리가 중요한 이유 (2) 데이터 전처리 방법 - 레이블 인코딩과 원-핫 인코딩 (3) 피처 스케일링과 정규화 - StandardScaler, MinMaxScaler 05. 데이터 전처리 (1) 데이터 전처리가 중요한 이유 데이터 전처리 방법은 머신러닝 알고리즘을 돌리는 것만큼 중요합니다. 왜냐하면, 알고리즘은 데이터에 기반하기 때문에, 어떤 데이터를 입력으로 가지느냐에 따라 결과가 달라집니다. 머신러닝 알고리즘을 적용할 때는 결손 값을 허용하지 않습니다. 여기서 결손 값이라 하면 판다스에서 NaN이나, Null 값을 이야기합니다. 그러면, 머신러닝 알고리즘을 돌리기 위해서는 Null 값을 다른 값으로 바꿔야 합니다. 여기서 또 고민이 되겠죠? 도대체 결손 값을 어떻게 바꿔야 할 지가 막막합

[파이썬 머신러닝 완벽가이드] 2장. (4) 사이킷런으로 수행하는 타이타닉 생존자 예측 [내부링크]

06. 사이킷런으로 수행하는 타이타닉 생존자 예측 (1) 데이터 전처리 [데이터 확인] import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns %matplotlib inline titanic_df = pd.read_csv('titanic_train.csv') titanic_df.head(3) 타이타닉 데이터를 가져온 후 상위 3개의 그룹의 데이터를 확인합니다. [데이터 정보 확인] print('\n ### 학습 데이터 정보 ### \n') print(titanic_df.info()) 데이터 정보를 확인하면, 결측값이 얼마나 있는 지 확인할 수 있습니다. RangeIndex가 891개이므로 결측값이 없다면 Non-Null Count가 891이어야 합니다. 여기선 891이 아닌 Age, Cabin, Embarked 컬럼에는 결측값이 존재한다는 것을 알 수 있습니다. [결측값 확

[파이썬 머신러닝 완벽가이드] 3장. (1) 오차 행렬 [내부링크]

목차 01. 정확도 (1) 타이타닉 데이터를 정확도로 판단할 때 가지는 맹점 (2) 정확도가 가지는 한계 02. 오차 행렬 일반적으로 모델이 분류나 회귀냐에 따라 성능 평가 지표를 다르게 정합니다. 회귀에서는 대부분 예측값과 실제값의 오차 평균값에 기반합니다. 분류의 성능 평가 지표에는 정확도, 오차행렬, 정밀도, 재현율, F1 스코어, ROC AUC 가 있습니다. 분류에서 일반적으로는 정확도를 가지고 판단합니다. 여기서 말하는 정확도는 예측 결과 데이터와 실제 결과 데이터가 얼마나 정확하고 오류가 적게 발생하는가에 기반합니다. 01. 정확도 (1) 타이타닉 데이터를 정확도로 판단할 때 가지는 맹점 정확도를 판단하는 방법은 다음과 같습니다. 하지만, 정확도만 가지고 결과를 판단했다가는 잘못된 평가 결과에 빠질 수 있습니다. 앞서 2장에서 보았던 타이타닉 생존자 예측을 다시 보겠습니다. 타이타닉 데이터를 보면, 여자가 남자보다 생존율이 높았습니다. 그래서, 아무 생각없이 남자는 사망,

[파이썬 머신러닝 완벽가이드] 3장. (2) 정밀도와 재현율 [내부링크]

목차 03. 정밀도와 재현율 (1) 정밀도와 재현율의 개념 (2) 사이킷런이 테스트 데이터를 예측하는 과정 (3) 정밀도/재현율 트레이드오프 (4) 정밀도와 재현율 100% 03. 정밀도와 재현율 (1) 정밀도와 재현율의 개념 앞서, 우리는 정확도만으로 성능 평가를 하는 것은 결함이 있다고 했습니다. 그래서 나온 개념이 오차 행렬이었죠? 오차 행렬은 예측 클래스와 실제 클래스로 나누어서 네 개의 구역에 대한 정보를 담고 있습니다. 이 오차 행렬로부터 나오는 것이 바로 정밀도와 재현율입니다. 정밀도와 재현율은 Positive 데이터 세트에 초점을 맞춘 지표입니다. 정밀도와 재현율은 다음과 같이 계산합니다. 정밀도의 식을 보면, 예측을 Positive로 한 것 중 실제로 Positive 했던 것의 비율입니다. 재현율은, 실제로 Positive 했던 것들에 대해 예측을 Positive로 정확하게 한 비율입니다. 조금 차이가 있죠? 그러면 도대체, 왜 저 둘을 나눴을까요? 쓰임을 다르 게

[파이썬 머신러닝 완벽 가이드] 3장. (3) F1 스코어와 AUC 스코어 [내부링크]

04. F1 스코어 지난번 포스팅에서 정밀도와 재현율에 대해서 살펴보았죠? 이 두 지표는 어느 하나에 치중하는 것이 아니라 보완적인 관계를 가지는 것이 중요하다고 했습니다. 이 점에 초점을 맞춘 것이 F1 스코어입니다. F1 스코어는 정밀도와 재현율 값 중 어느 한 쪽으로 치우치지 않을 때 더 높은 값을 가집니다. F1 스코어의 공식은 다음과 같습니다. 사이킷런에서는 F1 스코어를 구하기 위해 f1_score()이라는 API를 제공합니다. import pandas as pd from sklearn.model_selection import train_test_split from sklearn.linear_model import LogisticRegression titanic_df = pd.read_csv('titanic_train.csv') y_titanic_df = titanic_df['Survived'] X_titanic_df = titanic_df.drop('Survived',

[파이썬 머신러닝 완벽 가이드] 3장. (4) 피마 인디언 당뇨병 예측 [내부링크]

목차 06. 피마 인디언 당뇨병 예측 (1) 데이터 세트 다운 받기 (2) 피마 데이터 정보 (3) 피마 데이터 살펴보기 (4) 머신러닝 알고리즘으로 당뇨병 예측하기 (5) 데이터를 다시 전처리하여 재현율 높이기 06. 피마 인디언 당뇨병 예측 (1) 데이터 세트 다운 받기 Pima Indians Diabetes Database | Kaggle (2) 피마 데이터 정보 3장에서 배운 내용을 토대로 피마 인디언 당뇨병을 예측해보도록 하겠습니다. 피마 인디언 당뇨병 데이터 세트는 북아메리카 피마 지역 원주민의 Type-2 당뇨병 결과 데이터입니다. 피마 인디언 당뇨병 데이터 세트는 다음과 같은 피처로 구성되어 있습니다. Pregnancies 임신 횟수 Glucose 포도당 부하 검사 수치 BloodPressure 혈압(mm Hg) SkinThickness 팔 삼두근 뒤쪽의 피하지방 측정값(mm) Insulin 혈청 인슐린(mu U/ml) BMI 체질량지수 DiabetesPedigreeF

[파이썬 머신러닝 완벽가이드] 4장. (1) 분류와 결정 트리 [내부링크]

01. 분류의 개요 02. 결정 트리 (1) 결정 트리의 개념 (2) 사이킷런으로 결정 트리 만들기 (3) 결정 트리의 장단점 01. 분류의 개요 우리는 2장과 3장에서 지도학습을 주로 했습니다. 지도학습은 명시적인 정답이 있는 데이터로부터 학습하여 레이블 값을 예측하는 것을 말합니다. 지도학습 중에서 가장 대표적인 유형이 바로 분류입니다. 오늘은 분류에 대해 알아보려고 하는데요. 분류는 다양한 머신러닝 알고리즘으로 구현할 수 있습니다. ex. 베이즈(Bayes) 통계와 생성 모델에 기반한 나이브 베이즈, 로지스틱 회귀, 결정 트리, 서포트 벡터 머신, 최소 근접 알고리즘, 신경망, 앙상블 등 4장에서는 주로 앙상블 방법을 다루는데요. 앙상블은 일반적으로 배깅(Bagging)과 부스팅(Boosting) 방식으로 나뉩니다. 랜덤 포레스트(Random Forest)가 가장 대표적인 배깅 방식이고, 그래디언트 부스팅(Gradient Boosting)이 부스팅의 대표 방식입니다. 그래디언트

[파이썬 머신러닝 완벽 가이드] 4장. (2) 결정 트리 실습 - 사용자 행동 인식 데이터 세트 [내부링크]

02. 결정트리 (4) 결정 트리 실습 - 사용자 행동 인식 데이터 세트 이번에는 결정 트리를 이용해 UCI 머신러닝 리포지토리에서 제공하는 사용자 행동 인식에 대한 예측 분류를 해보겠습니다. 해당 데이터는 30명에게 스마트폰 센서를 장착하고, 사람의 동작과 관련된 여러 가지 피처를 수집한 데이터입니다. 해당 사이트에서 데이터를 다운받으면 이렇게 많은 메모장이 나오는 데, 각 메모장은 다음과 같은 역할을 합니다. test 테스트 데이터가 들어 있습니다. train 학습 데이터가 들어 있습니다. features.txt 데이터에 있는 피처의 이름이 기술되어 있습니다. features_info.txt 각 피처와 관련된 설명이 들어 있습니다. activity_labels.txt 타켓 데이터인 action의 숫자 값 의미가 들어 있습니다. 1. 데이터 전처리하기 import pandas as pd import matplotlib.pyplot as plt %matplotlib inline fe

[통계학] 7. 여러 가지 확률분포 (1) : 베르누이 시행(Bernoulli's trials) [내부링크]

1. 확률분포의 평균과 분산 (1) 확률분포의 평균(기댓값) (2) 분산 2. 베르누이 시행 (1) 베르누이 시행의 기댓값과 분산 3. 적용 예제 1. 확률분포의 평균과 분산 (1) 확률분포의 평균(기댓값) 우리는 앞서, 확률변수라는 것을 배웠습니다. 이번엔 이 확률변수에 대해서, 확률분포의 평균과 분산을 구해보려고 하는데요, 예를 들어보겠습니다. 0, 1, 2의 평균은 어떻게 구할까요? 바로 (0 + 1 + 2) / 3으로 구하잖아요. 이렇게 상수 0, 1, 2의 평균에서 1/3은 각 자료(0, 1, 2)들이 모두 동일하게 1/3의 비중을 가지고 있는 것을 암묵적으로 표현하고 있어요. 이런 내용을 확률분포에 적용하게 되면, 1/3에 해당하는 것이 각 값이 나타날 확률로 바뀌게 됩니다. X 1 2 3 P(X=x) 0.2 0.3 0.5 예를 들어, 위 확률분포표에서 평균을 구하면 1 * 0.2 + 2 * 0.3 + 3 * 0.5로 구한다는 것입니다. 여기서 0.2, 0.3, 0.5가

[통계학 응용] 6. 확률 (2) : 확률의 덧셈법칙과 곱셉법칙 [내부링크]

1. 확률이란? (1) 확률에 사용되는 여러 가지 용어 (2) 두 사건의 연산 2. 확률의 법칙 (1) 확률의 덧셈 법칙 (2) 확률의 곱셈 법칙 (3) 여사건의 법칙 3. 적용 예제 풀어보기 1. 확률이란? 다시 한번 확률을 정의하겠습니다. 확률이라는 것은 어떤 일이 일어날 수 있는 가능성의 정도를 수로 나타낸 것입니다. (1) 확률에 사용되는 여러 가지 용어 확률에 사용되는 여러 가지 용어가 있습니다. 표본공간과 여러 가지 사건인데요. 그 용어들을 정리하겠습니다. 용어 뜻 표본공간 확률 실험으로부터 출현 가능한 모든 결과들의 모임 사건 표본공간의 각 원소(각 개별 결과)들의 부분집합 근원사건 어떤 사건이 하나의 원소로만 구성된 사건 예를 들어보겠습니다. 앞 시간에서도 했지만, 동전을 두 번 던지는 행위를 예로 들겠습니다. 앞면이 나오는 것을 H, 뒷면을 T로 한다면 표본공간 S = {HH, HT, TH, TT}가 됩니다. 이때, 앞면이 한 번만 나오는 '사건'을 A 사건이라고 하

[통계학 응용] 5. 확률 [내부링크]

목차 1. 확률 (1) 추론 통계학의 기본은 확률이다 (2) 경험적 확률과 수학적 확률 2. 확률변수 (1) 확률변수의 뜻 (2) 확률변수의 분류 : 이산확률변수, 연속확률변수 1. 확률 (1) 추론 통계학의 기본은 확률이다 추론 통계학이 무엇일까요? 이미 언급하였지만, 전체를 조사하지 않고 무작위로 선택한 일부를 바탕으로 전체 상태를 예측하는 통계학이라고 하죠. 우리가 전체의 집단을 조사할 수 있으면 좋지만, 그럴 수 없는 환경인 경우가 많잖아요. 그래서, 표본을 조사해서 모집단의 특성을 추론합니다. 하지만, 추론을 한다는 것은 정확한 값을 알아낼 수는 없기 때문에, 결국엔 우리가 추론하는 모든 것들이 확률로 연결이 되어있습니다. (2) 경험적 확률과 수학적 확률 확률은 크게 두 가지로 나눌 수 있는데, 경험적 확률과 수학적 확률입니다. 경험적 확률은 말 그대로 경험으로부터 나오는 확률인데요. 예를 들어, 우리가 동전을 200번 던져서 102번 앞면이 나왔으면 앞면이 나올 확률이

[통계학 응용] 4. R 기본 문법 배우기 [내부링크]

목차 1. 연산자 (1) 산술연산자 (2) 논리연산자 2. 변수 만들기 3. 벡터 (1) 벡터에서 데이터 세트 형성 (2) 객체 확인 함수 -> ls(), rm() (3) 기존 데이터 세트 (파일 ) 읽기 4. 여러 가지 기능 (1) 간단한 기술 통계랑 계산 (2) 중심경향성과 변동성 알기 (3) 변동성 한 번에 알기 5. 차트 그리기 (1) 히스토그램 그리기 (2) 꺾은선 그래프 1. 연산자 (1) 산술연산자 R에서의 연산자로 사칙연산을 들 수 있습니다. R의 산술연산자는 다음과 같이 정리할 수 있습니다. 연산자 설명 예 결과 + 더하기 3+2 5 - 빼기 3-2 1 * 곱하기 3*2 6 / 나누기 3 / 2 1.5 ^ 혹은 ** 승수 3 ^ 2 9 x %% y x를 y로 나눈 나머지 값 반환 3 %% 2 1 x %/% y 나누기의 결과를 정수로 3 %/% 2 1 [사용 예시] (2) 논리연산자 논리연산자는 연산의 결과가 논리값(TRUE 혹은 FALSE)입니다. 연산자 예 결과 <

[통계학 응용] 3. R 설치하기 [내부링크]

목차 1. R은 무엇인가? 2. R 설치하기 (1) R 설치하기 (2) R Studio 설치하기 3. R 설치되었는지 확인 (1) R 엔진 확인 (2) RStudio 설치 확인 4. RStudio 구조 알기 오랜만에 인사드리네요! 우리가 통계학을 하기 위해서는 R, Python 같은 툴은 필수적이라고 생각합니다. 그래서, 잠시 통계 용어는 멈추고, 오늘은 R의 기초 이론에 대해 배워보도록 하겠습니다. 1. R은 무엇인가? R은 데이터 분석 및 그래픽 언어로, Ross Ihaka와 Robert Gentleman의 1996년 논문을 통해 등장합니다. 이 두 저자의 이름 첫 글자에서 따와서 R이라고 하는데요, 매우 강력하고 유연하다는 장점이 있지만, 다소 복잡하다는 단점이 있습니다. 2. R 설치하기 (1) R 설치하기 1) The Comprehensive R Archive Network (r-project.org)에 접속 2) Download R for windows 클릭 3) Base

[통계학 응용] 2. 모집단과 표본의 추출 [내부링크]

목차 1. 모집단과 표본에 대한 여러 가지 용어 (1) 모집단과 표본이란? (2) 모수와 통계량 (3) 추정치 2. 모집단과 표본의 추출 (1) 확률적 표본 추출 (2) 비확률적 표본추출 1. 모집단과 표본에 대한 여러 가지 용어 (1) 모집단과 표본이란? 모집단은 통계적인 관찰의 대상이 되는 집단 전체를 말합니다. 예를 들어, 대한민국의 모든 여성, 어떤 쇼핑몰 회원 전체, 대한민국의 모든 국민이 이에 해당합니다. 하지만, 모집단은 전체를 전수조사하기가 쉽지 않습니다. 우리나라 국민 5천만을 일일이 조사하는 것은 상당히 부담스러운 결정이겠죠? 그렇기 때문에 우리는 모집단에서 일부만 조사를 합니다. 즉, 여기서 일부를 표본이라고 합니다. (2) 모수와 통계량 (1)에서 우리는 모집단과 표본에 대해 알아보았습니다. 그럼, 여기서 질문을 하나 해보겠습니다. 모집단에서의 평균이랑 표본의 평균이랑 같을까요? 우연의 일치로 같을 수 있겠지만, 다를 겁니다. 즉, 모집단의 데이터와 표본의 데이

[통계학응용] 1. 통계학의 정의와 분석 과정 [내부링크]

먼저 질문을 한번 던져볼게요. 1) 동전을 던졌더니 3번 연속 앞면이 나왔을때, 4번째는 어느 쪽의 내기를 걸면 좋을까요? 2) 평균 수심이 5cm인 하천이서 성인이 익사했다는데, 어떻게 이런 결과가 나올 수 있을까요? 1. 통계학의 정의와 목적 (1) 통계학의 정의 통계학은 숫자로 표시되는 정보를 수집하고 정리하며, 이를 분석해서 신뢰성이 있는 결론을 이끌어내는 방법을 연구합니다. 통계학은 크게 '기술통계'와 '추측통계'로 나누게 되는데, 기술통계는 표본을 통해 수집된 자료를 분석하고 해석하는 것이라면 추측통계는 표본을 통해 수집된 자료를 바탕으로 모집단의 특성을 추론합니다. 이 그림 하나로 통계를 설명할 수 있는데, 모집단(population)에서 일부를 추출(sampling)해서 나온 표본(sample)을 통해 모집단의 특성을 추론(inference)한다. 예를 들어보면, 우리나라 선거 기간에 여론조사를 할 때, 모든 5000만 국민에게 전화를 돌릴 수는 없다. 여기서 모든 5