backend-jeong의 등록된 링크

 backend-jeong로 등록된 티스토리 포스트 수는 95건입니다.

OUTER JOIN 사용방법 (LEFT JOIN, RIGHT JOIN, FULL OUTER JOIN) [내부링크]

Oracle에서 INNER(내부) Join과 Outer(외부) 조인이 있는데 여기서 외부조인은 동일한 값이 없는 행도 반환할 때 사용하는 구문이라고 한다. 즉 두 테이블을 조인할때 조건에 해당하지 않는 데이터도 표시한다. O..

빅데이터분석기사 3회차 실기/필기 합격 후기 [내부링크]

2020 겨울에 1회 시험이 있었는데 코로나로 연기가 되고 다음 2021년도 2회 이지만 1회 시험에서는 사실상 첫 시험이다보니 책이랑 열심히 본게 의미가 없었고 차라리 ADsP나 볼걸 후회 했었음 ㅋㅋ 과락은 없었는..

빅데이터분석기사 3회차 시험 후기 [내부링크]

방금 빅분기 3회를 치고 왔습니다. 원래 목표는 2회차에 바로 붙는거였는데 그때는 필기 교재 적중률이 참담해서;;;; 아무튼 오늘 시험을 쳐보니 개인적으로 필기보다 실기가 훨씬 쉬웠습니다. 예전부터 pandas랑..

[빅분기] 실기 작업형 2유형 간단 정리 [내부링크]

구체적으로 어떤식으로 하는지는 여러번 올려드렸으니 자세한 예시는 다른 게시글을 참고해주시면 됩니다. 그냥 코드없이 말로 설명할려고 합니다. 1. 데이터 확인하기 일단 데이터가 들어 왔습니다. 독립(설명)..

[빅분기] 실기 이기적 14주차 작업형 1유형 문제 풀이 [내부링크]

데이터 출처 :https://www.kaggle.com/unsdsn/world-happiness (참고, 데이터 수정) 데이터 설명 : 전세계 행복도 지표 조사 data url = https://raw.githubusercontent.com/Datamanim/datarepo/main/happy2/ha..

[빅분기] 실기 이기적 13주차 작업형 1유형 문제 풀이 [내부링크]

데이터 출처 :https://www.data.go.kr/data/15051872/fileData.do(참고, 데이터 수정) 데이터 설명 : 서울특별시_공공자전거 시간대별 이용정보 data url = https://raw.githubusercontent.com/Datamanim/datare..

[빅분기] 실기 이기적 12주차 작업형 1유형 문제 풀이 [내부링크]

데이터 출처 :https://www.kaggle.com/darinhawley/fifa-world-cup-goalscorers-19302018(참고, 데이터 수정) 데이터 설명 : 1930 ~2018년도 월드컵 출전선수 골기록 data url = https://raw.githubusercontent.c..

[빅분기] 실기 이기적 11주차 작업형 1유형 문제 풀이 [내부링크]

데이터 출처 :https://www.kaggle.com/kukuroo3/youtube-episodic-contents-kr(참고, 데이터 수정) 데이터 설명 : 유튜브 "공범" 컨텐츠 동영상 정보 ( 10분 간격 수집) dataurl1 (비디오 정보) = https://raw.gi..

[빅분기] 실기 이기적 10주차 작업형 1유형 문제 풀이 [내부링크]

10주차 작업형 1유형 데이터 출처 :https://www.kaggle.com/rsrishav/youtube-trending-video-dataset?select=KR_youtube_trending_data.csv (참고, 데이터 수정) 데이터 설명 : 유튜브 데일리 인기동영상 (한국)..

[빅분기] 실기 이기적 6,7,8,9주차 작업형 1유형 문제 풀이 [내부링크]

6주차 작업형 1유형 데이터 출처 :https://www.kaggle.com/uciml/red-wine-quality-cortez-et-al-2009(참고, 데이터 수정) 데이터 설명 : 레드 와인 퀄리티 예측문제 Data url :https://raw.githubusercontent.com..

[빅분기] 실기 이기적 6주차 예상 문제 풀이 - 1 [내부링크]

작업형 1유형 데이터 출처 :https://www.kaggle.com/mohansacharya/graduate-admissions(참고, 데이터 수정) 데이터 설명 : 대학원 입학 가능성 예측 Data url :https://raw.githubusercontent.com/Datamanim/data..

[빅분기] 실기 이기적 5주차 예상 문제 풀이 - 2 [내부링크]

작업형 1유형 데이터 출처 :https://www.kaggle.com/harlfoxem/housesalesprediction (참고, 데이터 수정) 데이터 설명 : 킹카운티 주거지 가격 예측문제 Data url :https://raw.githubusercontent.com/Datamanim..

[빅분기] 실기 이기적 5주차 예상 문제 풀이 - 1 [내부링크]

작업형 1유형 데이터 출처 :https://www.kaggle.com/mirichoi0218/insurance/code(참고, 데이터 수정) 데이터 설명 : 의료비용 예측문제 Data url :https://raw.githubusercontent.com/Datamanim/datarepo/main/Me..

[빅분기] 실기 이기적 4주차 예상 문제 풀이 - 2 [내부링크]

작업형 1유형 데이터 출처 :https://www.kaggle.com/adityakadiwal/water-potability (참고, 데이터 수정) 데이터 설명 : 수질 음용성 여부 (Potablillity 컬럼 : 0 ,1 ) Data url :https://raw.githubusercontent..

[빅분기] 실기 이기적 4주차 예상 문제 풀이 - 1 [내부링크]

작업형 1유형 데이터 출처 :https://www.kaggle.com/teejmahal20/airline-passenger-satisfaction?select=train.csv (참고, 데이터 수정) 데이터 설명 : 비행탑승 경험 만족도 (satisfaction 컬럼 : 'neutral or..

[빅분기] 실기 이기적 3주차 예상 문제 풀이 - 2 [내부링크]

작업형 1유형 데이터 출처 :https://www.kaggle.com/iabhishekofficial/mobile-price-classification?select=train.csv (참고, 데이터 수정) 데이터 설명 : 핸드폰 가격예측 (price_range컬럼 0(저렴) ~3(매우비..

[빅분기] 실기 이기적 3주차 예상 문제 풀이 - 1 [내부링크]

작업형 1유형 데이터 출처 :https://www.kaggle.com/anmolkumar/health-insurance-cross-sell-prediction(참고, 데이터 수정) 데이터 설명 : 자동차 보험 가입 예측 Data url : https://raw.githubusercontent.co..

[빅분기] 실기 이기적 2주차 예상 문제 풀이 - 2 [내부링크]

작업형 1유형 데이터 출처 :https://www.data.go.kr/data/15007122/fileData.do (참고, 데이터 수정) 데이터 설명 : 2018년도 성인의 건강검 진데이터 (흡연상태 1- 흡연, 0-비흡연 ) 데이터 url : https://raw...

[빅분기] 실기 이기적 2주차 예상 문제 풀이 - 1 [내부링크]

작업형 1유형 데이터 출처 :https://www.data.go.kr/data/15007122/fileData.do (참고, 데이터 수정) 데이터 설명 : 2018년도 성인의 건강검 진데이터 (흡연상태 1- 흡연, 0-비흡연 ) 데이터 url : https://raw...

[빅분기] 실기 이기적 1주차 예상 문제 풀이 - 2 [내부링크]

작업형 1유형 데이터 출처 : https://www.kaggle.com/shubh0799/churn-modelling 에서 변형 데이터 설명 : 고객의 신상정보 데이터를 통한 회사 서비스 이탈 예측 (종속변수 : Exited) Data url : https://raw...

[빅분기] 실기 이기적 1주차 예상 문제 풀이 - 1 [내부링크]

데이터 출처 : https://data.kma.go.kr/cmmn/static/staticPage.do?page=intro 데이터 설명 : 2020년도 이화동(서울) , 수영동(부산)의 시간단위의 기온과 강수량 데이터 url : https://raw.githubusercontent.c..

[빅분기] 단답형 예상 문제 정리 모음 [내부링크]

대부분 후기를 보니 필기시험쳤을때 핵심적인 내용과 주제어 위주로 나왔다고 합니다. 불안하신분들은 필기책을 아직 안버리셨다면 쭉 훑어보시는 것도 나쁘지 않을거 같습니다. 문제와 정답을 따로 적어두었습니..

[빅분기] 실기 작업형 2유형 예상/연습문제 [내부링크]

1. 작업형 2유형 예시(분류, 확률) [자격증] - [빅분기] 실기 작업형 2유형 : 모형 구축 및 평가 영역 - 2 [빅분기] 실기 작업형 2유형 : 모형 구축 및 평가 영역 - 2 이번에는 예제 문제를 한번 풀어봅시다. 문..

[빅분기] 실기 작업형 1유형 예상/연습문제 [내부링크]

작업형 1유형에 대한 예상, 연습문제를 간단하게 만들어 보았습니다. 예시로 나온 1유형문제와, 실기 2회 복원 문제를 임의로 만들어 보았습니다. 복원문제라고 적어둔것도 저도 무슨 문제인지 몰라서 대충 어떻게..

[빅분기] 실기 1985 Automobile 자동차 가격 예측 문제 [내부링크]

https://www.kaggle.com/fazilbtopal/auto85 1985 Automobile Dataset 1985 Auto Imports Database www.kaggle.com 이번에는 캐글의 competition은 아니지만 자동차 데이터를 가지고 가격 예측을 한번 해보겠습니..

[빅분기] 실기 캐글 타이타닉 생존자 예측 문제 [내부링크]

https://www.kaggle.com/c/titanic/data 이번에는 집값 예측에 이어서 타이타닉 생존자 예측 문제를 해보겠습니다. 데이터는 마찬가지로 캐글에서 받으셔서 사용하면 되겠습니다. 지난번 집값 예측은 정확한 값을..

[빅분기] 실기 캐글 보스턴 집값 예측 문제 [내부링크]

빅데이터분석 실기 작업형 2유형 대비를 위해서 캐글의 입문자를 위한 문제 몇가지를 풀어볼 생각입니다. 여러가지 유명한 것들이 있는데 거의 한번씩은 다들 보는 타이타닉과 보스턴 집값 문제 그리고 한두개정..

[빅분기] 실기 훈련데이터 추출 후 표준편차 구하기 [내부링크]

*문제: 훈련 데이터 80%추출 후 결측치 중앙값으로 보정. 보정 전후의 표준편차 차이 구하기. 사실 훈련 데이터를 80% 추출하라는게 어떤 기준을 주고 80%를 뽑아라는건지 의미를 잘 모르겠지만 일단 보스턴집값데..

[빅분기] 실기 복원 문제 Pandas 값 다루는 방법 [내부링크]

*문제: 특정 칼럼의 가장 큰 값 10개를 그중 가장 작은 값으로 대치 후 다른 칼럼 값으로 조건을 걸어 특정 칼럼의 평균 구하기 https://www.kaggle.com/c/house-prices-advanced-regression-techniques/data 복..

[빅분기] 실기 작업형 2유형 : 범주데이터 처리하기 [내부링크]

[자격증] - [빅분기] 실기 작업형 2유형 : 모형 구축 및 평가 영역 - 2 [빅분기] 실기 작업형 2유형 : 모형 구축 및 평가 영역 - 2 이번에는 예제 문제를 한번 풀어봅시다. 문제부터 바로 보면 다음과 같습니다...

[빅분기] 실기 작업형 2유형 : 하이퍼파라미터 탐색하기 [내부링크]

[자격증] - [빅분기] 실기 작업형 2유형 : 모형 구축 및 평가 영역 - 2 [빅분기] 실기 작업형 2유형 : 모형 구축 및 평가 영역 - 2 이번에는 예제 문제를 한번 풀어봅시다. 문제부터 바로 보면 다음과 같습니다...

[빅분기] 실기 작업형 2유형 : 모형 구축 및 평가 영역 - 2 [내부링크]

이번에는 예제 문제를 한번 풀어봅시다. 문제부터 바로 보면 다음과 같습니다. 데이터는 총 3개가 주어집니다. y_train, X_train, X_test 입니다. 보통 데이터를 학습할때 그냥 원본 Raw데이터를 주고 split data..

[빅분기] 실기 2회 복원 문제 정리 [내부링크]

사실 이번 3회 시험은 두번째라 지난번에 나왔던 것들은 모조리 안나오고 새로운 애들이 나올 수 있을 법도한데 대충 이런 문제가 나왔구나 하고 감을 익히는 정도로 살펴보자 단답형 빈 칸 채우기 : 이상값, 과..

[빅분기] 실기 작업형 2유형 : 모형 구축 및 평가 영역 - 1 [내부링크]

이번에는 scikit-learn을 바로 써보기 보다 그냥 작업형 2유형이 무엇인지 쭉 살펴보고 넘어갈려고 합니다. 빅분기 카테고리를 만들기도 애매하기는 한데 나중에 정리하던가 하고 일단 시험까지는 scikit-learn 카..

[빅분기] 실기 작업형 1유형 : 데이터 처리 영역 풀이 [내부링크]

12월 4일 빅데이터분석기사 실기가 있는데 준비겸 포스팅을 한 1주일동안 해볼까 합니다. 예시부터 가볍게 풀면서 봅시다. 이 글을 보시는 분들을 기본적으로 파이썬을 다루고 sickit-learn은 모르지만 pandas와 n..

[다이나믹] 백준 1003번 피보나치 함수 [내부링크]

문제 백준 1003번 fibonacci(3)을 호출하면 다음과 같은 일이 일어난다. fibonacci(3)은 fibonacci(2)와 fibonacci(1) (첫 번째 호출)을 호출한다. fibonacci(2)는 fibonacci(1) (두 번째 호출)과 fibonacc..

[그리드] 백준 11399번 ATM [내부링크]

문제 백준 11399번 인하은행에는 ATM이 1대밖에 없다. 지금 이 ATM앞에 N명의 사람들이 줄을 서있다. 사람은 1번부터 N번까지 번호가 매겨져 있으며, i번 사람이 돈을 인출하는데 걸리는 시간은 Pi분이다. 사람들..

[다이나믹] 백준 1463번 1로 만들기 [내부링크]

백준 1463번 문제 정수 X에 사용할 수 있는 연산은 다음과 같이 세 가지 이다. X가 3으로 나누어 떨어지면, 3으로 나눈다. X가 2로 나누어 떨어지면, 2로 나눈다. 1을 뺀다. 정수 N이 주어졌을 때, 위와 같은 연..

[그리드] 백준 2839번 설탕배달 [내부링크]

백준 2839번 문제 상근이는 요즘 설탕공장에서 설탕을 배달하고 있다. 상근이는 지금 사탕가게에 설탕을 정확하게 N킬로그램을 배달해야 한다. 설탕공장에서 만드는 설탕은 봉지에 담겨져 있다..

[재귀함수] 코드업 3704 계단 오르기 [내부링크]

코드는 이상이 없는데 왜인지는 모르겠는데 해결이 안되네요 import sys sys.setrecursionlimit(10000) n = int(input()) dic={} def step(n): if n in dic: return dic[n] if n <= 1: dic[n]=1 return 1 elif n =..

[재귀함수] 코드업 3702 파스칼의 삼각형 [내부링크]

이 문제는 지난 피보나치 수열과 별반 다를게 없습니다. [코딩테스트] - [재귀함수] 피보나치 수열과 메모이제이션해결 거기에다가 재귀함수를 사용하지만 시간초과과 뜨기 때문에 메모이제이션정도만 추가를 하면..

[재귀함수] 재귀로 삼각형 * 별 출력하기 [내부링크]

문제 풀면서 살짝 PTSD온줄 알았네요 학교에서 C언어 수업들을때 이상하게 반복문이 약했는데 별 출력하기 문제에서 조금만 꼬아버리면 그대로 해맸거든요  그런데 재귀로 푼다... 흠..? 천천히 보면 딱히 어렵지..

[재귀함수] 코드업 1930 SuperSum [내부링크]

이번에는 입력 함수가 조금 햇갈리게 나왔습니다. 하나씩 입력을 받는게 아니라 여러줄을 던져주게 되는데 몇 줄인지는 랜덤이라는 거지요 코드업은 기본적으로 입력이 단순했기 때문에 input으로 충분히 처리가..

[재귀함수] 우박수 3n+1 출력하기 + 역순출력하기 [내부링크]

n = int(input()) def woonum(num): if num==1: print(num) return else: print(num) if num%2==1: return woonum(int(num*3+1)) else: return woonum(int(num/2)) woonum(n) 코테처음부터 하면서 유형별로 파는데..

[재귀함수] 10진수를 2진수로 변환 [내부링크]

사실 이 문제는 재귀 함수를 쓸것도 없고 파이썬이라면 bin이라는 2진수로 바꾸는 함수가 내장되어 있어서 이거 그대로 쓰면 됩니다. n = int(input()) a = bin(n) print(a[2:]) 다만 이진수를 표시하는 0b가 들어..

[재귀함수] 피보나치 수열과 메모이제이션해결 [내부링크]

어떤 C언어든 파이썬이든 재귀함수를 다루게되면 단골로 나오는게 피보나치 수열입니다. 자연에서 나타는 패턴이나 뭔가 있다고 하지요 n = int(input()) def recur(num): if num == 0: return 0 elif num == 1:..

[재귀함수] 1부터 n까지 곱하는 팩토리얼 계산 [내부링크]

n = int(input()) def recur(num): if num == 1: return 1 else: return num*recur(num-1) print(recur(n)) 바로 지난번 1부터 n까지 더하기에서 더하는것을 곱하는것으로 반환하면 됩니다. 따로 설명할 것도 없네요

[재귀함수] 1부터 n까지 합 구하기 [내부링크]

n = int(input()) def recur(num): if num == 1: return 1 else: return num+recur(num-1) recur(n) recur에서 자기보다 1작은 녀석을 불러오다가 계속 가다보면 1을 만나겠지요 그거를 쭉 더하게 됩니다. 해보면..

[재귀함수] 두 수 사이의 홀수 출력하기 [내부링크]

이번에는 재귀로 두 수 사이의 홀 수 출력하기 입니다. 앞서서 n부터 1까지나 1부터 n까지 출력 하는 것을 해보았다면 이번에는 쉬울 겁니다. 첫 시작은 a이고 끝은 b라고 주어진 상태이니까요 a, b = map(int,inp..

[재귀함수] 1부터 n까지 (역순)출력하기 [내부링크]

말그대로 정수 n이 입력을 받으면 1부터 n까지 출력하는 재귀 함수를 만드는 것입니다. 재귀는 말그대로 자기 자신을 호출 하는것인데 주로 파보나치수나 팩토리얼등에서 코드가 간결하게 만들어지기 때문에 사용..

[BFS] 넓이 우선 탐색을 위한 파이썬 알고리즘 (큐) [내부링크]

[코딩테스트] - [DFS] 깊이 우선 탐색을 위한 파이썬 알고리즘 (재귀,스택) [DFS] 깊이 우선 탐색을 위한 파이썬 알고리즘 (재귀,스택) DFS Depth First Search 트리나 그래프에서 한 루트로 탐색하다가 특정 상황..

[DFS] 깊이 우선 탐색을 위한 파이썬 알고리즘 (재귀,스택) [내부링크]

DFS Depth First Search 트리나 그래프에서 한 루트로 탐색하다가 특정 상황에서 가장 깊숙히 들어가서 확인한뒤 돌아가 다른 루트로 탐색을 반복하는 방식으로 주로 백트래킹에 사용합니다. 일반적으로 재귀호출..

[리스트] 성실한 개미 [내부링크]

출처: codeup 6098 (파이썬 기초 100문제) 문제는 다음과 같습니다. 10 x 10 행렬이 있는데 (2,2) 좌표에서 시작해서 무조건 오른쪽으로 출발을하는데 벽을 만나면 밑으로 내려오게 되고 아니면 다시 오른쪽으로..

[리스트] 설탕과자 뽑기 [내부링크]

출처: 코드업 6097 문제는 바로 찾아서 보시면 됩니다. 기초 100문제는 사실 문제라기 보다는 파이썬 맛보기로 익히는게 아닌가 싶을 정도였는데, 사실 나도 하면서 얕은복사 실수를 저지른다던가 문제를 잘못 이..

[리스트] 바둑알 십자 뒤집기 [내부링크]

출처 : codeup 6096번 멍청하게 for문과 숫자를 착각해서 거진 2시간인가 맴돌았다. 전체 코드는 다음과 같다. d=[0]*19 for i in range(0,19): d[i]=list(map(int, input().split())) 가장먼저 리스트를 입력하는..

[정렬] 두 배열의 원소 교체 [내부링크]

두개의 배열 A,B를 가지고 있다. 두 배열은 N개의 원소로 구성되어 있으며, 배열의 원소는 모두 자연수다. 최대 K번의 바꿔치기 연산을 수행할 수 있는데, 바꿔치기 연산이란 배열 A에 있는 원소 하나와 배열 B에..

[정렬] 성적이 낮은 순서로 학생 출력하기 [내부링크]

N명의 학생 정보를 받은 다음 정보는 이름과 성적으로 구분된다. 각 학생의 이름과 성적 정보가 주어졌을때 성적이 낮은 순서대로 학생의 이름을 출력한다. #N을 입력받기 n = int(input()) #N명의 학생 정보를 입..

[정렬] 위에서 아래로 [내부링크]

크기과 상관없이 나열된 숫자를 큰수부터 작은수로 정렬한다. 대게 이런 경우 복잡한 정렬코드를 쓰기보다는 그냥 파이썬 내장 정렬함수를 사용하는것이 편리하다. #N을 입력받기 n = int(input()) #N개의 정수를..

[BFS] 미로탈출 [내부링크]

N x M 크기의 직사각형 형태의 괴물이 들어있는 미록 ㅏ있다. 현재 위치는 (1,1)이고 출구는 (N,M)위치에 존재하며 한번ㅇ네 한 칸 씩 이동 할 수 있다. 이때 괴물이 있는 부분은 0으로, 괴물이 없는 부분은 1로..

[DFS] 음료수 얼려먹기 [내부링크]

NxM 크기의 얼음 틀이 있다. 구멍이 뚫려 있는 부분은 0, 칸막기가 존재하는 부분은 1로 표시된다. 구멍이 뚫려 있는 부분끼리 상, 하, 좌, 우로 붙어 있는 경우 서로 연결되어 있는 것으로 간주한다. 이때 얼음..

[시뮬레이션] 게임 개발 [내부링크]

조건 게임 캐릭터가 맵안에서 움직이는 시스템을 개발하고자 한다. 캐릭터가 있는 장소는 1x1 크기의 정사각형으로 이루어진 NxM크기의 직사각형으로, 각각의 칸은 육지 또는 바다이다. 캐릭터는 동서남북 중 한..

[시뮬레이션] 왕실의 나이트 이동 [내부링크]

체스판은 8x8로 이루어져 있습니다. 임의의 위치에 나이트를 놓았을때 이동할 수 있는 횟수는 몇가지가 될까요? 일단 최대 8개이지만 놓인 위치에 따라서 달라지겠지요 여기서 좌표를 단순히 숫자,숫자가 아니라..

[시뮬레이션] 시간 찾아내기 [내부링크]

정수 N이 들어올때 00시00분00초부터 N시59분59초까지의 모든 시각중에서 3이 하나라도 포함되는 경우의 수를 구하는 프로그램을 작성하기 1을 입력했을 때 다음은 3이 하나라도 포함되어 있으므로 세어야 하는 시..

[시뮬레이션] 지도 상하좌우 찾아가기 [내부링크]

NxN 크기의 정사각형 공간 위에 서 있다고 가정하자 가장 왼쪽 위 좌표 (1,1)에서 시작을 해서 LRUD중 하나의 문자를 입력해서 해당 문자를 따라서 이동하는데(상하좌우) 최종적으로 이동하는 곳을 출력하기 n = i..

[그리드] 1이 될 때까지 [내부링크]

출처 : 2018 E 기업 알고리즘 대회 문제 어떤 수 N이 1이 될 때까지 다음의 두 과정 중 하나를 반복적으로 선택하여 수행하려 한다. 두번째 연산은 N이 K로 나누어 떨어질 때만 선택할 수 있다. N에서 1을 뺀다. N..

[그리드] 작은 숫자 카드 꺼내기 [내부링크]

기출 : 2019 국가 교육기관 코딩 테스트 숫자카드게임 숫자가 쓰인 카드들이 NxM 형태로 놓여있다. 이때 N은 행의 개수를 의미하며, M은 열의 개수를 의미한다. 먼저 뽑고자 하는 카드가 포함되어 있는 행을 선택..

[그리드] 큰수의 법칙 문제 1 [내부링크]

기출 : 2019 국가 교육기관 코딩테스 문제 숫자의 개수(n), 더할횟수(m), 최대 반복횟수(k) 를 입력을 받고 값을 출력하기 예를 들어서 5,8,3이 들어오게 되고 배열이 2,3,4,5,6이라고 가정하면 6+6+6+5+6+6+6+5..

Pandas 데이터프레임 중간 생략없이 전체 보는 방법 [내부링크]

판다스에서 데이터프레임이나 시리즈를 볼때 데이터가 너무 많으면 알아서? 중간을 생략해버립니다. 그런데 사실 하나하나 볼때가 있는데 너무 불편하지요 물론 다른 방법으로 확인이 가능하지만 일단은 귀찮습니..

Pandas로 이상치 처리하기 quantile 사용 [내부링크]

이번에는 quantile를 가지고 이상치를 처리해보도록 하겠습니다. 백분위수로 보통 IQR*1.5-Q1 ~ IQR*1.5+Q3을 기준으로 하고 이를 넘어가면 이상치로 판단합니다. 보다 큰 값 또는 작은 값들을 대체하거나 빼버리..

Pandas loc와 iloc차이 [내부링크]

앞에서 loc와 iloc로 문제를 푼게 있었습니다. 이번에는 좀더 자세하게 알아보고자 합니다. loc는 location의 약어로, 데이터 프레임의 행 또는 칼럼의 label이나 boolean array로 인덱싱하는 방법입니다. 즉, ..

판다스 이상치를 최대/최소로 변환하는 방법 clip() [내부링크]

빅데이터분석기사 복원문제에서 상위 10개 값을 특정 값으로 치환해서 계산하는게 있었습니다. 찾아보니 판다스에서 clip라는 함수를 이용하면 간단하게 처리를 할 수 있는 것을 보고 한번 해보겠습니다. 데이터는..

Pandas 데이터프레임 범주값을 가진 열만 추출하기/제외하기 [내부링크]

데이터를 전처리 할때 범주값과 이산값열을 분리를 하고 표준화를 수행하고 결측치를 처리했는데 좀 복잡하게 했습니다. 그런데 찾다보니 역시 필요한거는 이미 다 구현이 되어 있더라고요 numeric_features = all..

Pandas의 결측값 처리 방법 isnull, dropna, fillna [내부링크]

데이터 분석을 할때 먼저 선행되어야 할 것으로 데이터 정제가 있고 대표적으로 결측값 처리에 대해서 다루게 됩니다. 이번 빅분기 실기를 준비를 하면서 Pandas를 통해서 결측값을 확인하고 이를 대체하거나 버리..

Pandas의 count()와 value_counts()의 차이 [내부링크]

df = pd.DataFrame(X_scaled_minmax) df[df[0]>=0.5].count() 제가 무언가를 셀때 count()를 사용했었는데 판다스를 써본적이 있거나 다른 곳에서 value_counts()라는 것도 보신분이 있을 것입니다. 둘은 어떻게..

파이썬 여러 줄 입력 받기 stdin.readline [내부링크]

코딩테스트를 할때 데이터 입력값이 한두개이거나 한줄에 불과하면 input을 사용하는 것에서 만족했지만 이번에는 이야기가 좀 다릅니다. 1줄당 3개의 값이 들어오는데 몇 줄이 들어오는지 안알려준다? 그럴때 필..

Pandas 병합 merge사용 방법과 속성의 값 정리 [내부링크]

파이썬 판다스 pandas.DataFrame.merge에 대해서 어떻게 사용하는지 살펴보고자 합니다. 데이터프레임1.DataFrame.merge(데이터프레임2, how='inner', on=None, left_on=None, right_on=None, left_index=False, r..

깃허브와 데스크탑 깃 사용 간단하게 따라하기 [내부링크]

데스크탑용 깃을 사용하는 방법을 간단하게 적어볼려고 합니다. 준비물은 깃허브는 가입이 되어 있으셔야 합니다. https://git-scm.com/downloads Git - Downloads Downloads macOS Windows Linux/Unix Older rele..

깃허브(Git-hub)블로그 만들어보기 테마 적용 3편 [내부링크]

깃허브로 블로그 만들어보기 1, 2편에이은 3편입니다. 이번에는 테마를 적용해보겠습니다. 만약 여러분이 웹프로그래밍 프론트엔드를 능숙하게 다를줄 아는 능력자라면 이런거 볼것도 없이 바로 직접 만드시면되고..

깃허브(Git-hub)블로그 만들어보기 (윈도우환경) - 2편 [내부링크]

지난번에는 간단하게 사용할 프로그램 설치를 하고 설명을 했는데 이번에는 만드는거 까지 해보겠습니다.  가장먼저 Repository를 만드는 것입니다. username.github.io 이런식으로 Repository name를 설정해..

깃허브(Git-hub)블로그 만들어보기 (윈도우환경) - 1편 환경설정 [내부링크]

일단 여러분들이 깃허브로 블로그를 만들려고 시도를 해보거나 이 글을보러 들어오신 분들은 당연히 git에 대해서 알고 있으시리라 생각을 하고 commit이 뭔지, push가 뭔지등의 언급은 없이 바로 넘어가겠습니다...

데이터의 누락값이란 무엇일까? [내부링크]

데이터 분석에 있어서 누락값은 필수적으로 다루어야 하는 녀석인데, 누락값은 무엇이고 어떻게 처리할까? import pandas as pd import numpy as np from numpy import NaN, NAN, nan 일단 기본적으로 numpy의 Na..

파이썬 스택을 이용한 문자열 역순 출력 프로그램 [내부링크]

문제 : 사용자로부터 문자열을 받고 역순으로 출력하는 프로그램을 작성하여라. 단 스택을 이용해야 한다. 스택의 경우 리스트와 유사하지만 다릅니다. 리스트의 경우에는 어느 곳이든 접근할 수 있지만, 스택의..

파이썬 문자열 회문 확인 프로그램 만들기 [내부링크]

문제 : 회문(Palindrome)이란 앞뒤 어느 쪽에서 읽어도 같은 말과 구문을 뜻한다. "eye", "madam", "I'm Adam", "race car"등은 모두 회문이라고 할 수 있다. 물론 구두점, 스페이스(공백), 대소문자등을 무시를..

파이썬의 배열구조와 연결된 구조 [내부링크]

파이썬을 배울때 C와 다른 언어에 비해서 초보자들이 쉽게 접근 할 수 있는 이유는 리스트에 있습니다. 이런 리스트 형식의 자료구조를 가지고 스택이나 큐, 덱과 같은 선형적인 자료구조를 간단하게 구현을 할 수..

파이썬을 이용한 sorting 정렬과 탐색 선택, 삽입, 버블 [내부링크]

이번에는 파이썬 자료구조 정렬과 탐색을 살펴보도록 하겠습니다. 정렬의 개념과 알고리즘 동작, 그리고 집합관련 연산의 효율을 향상시키는 방법을 이해하는 포스팅을 해보겠습니다. 우선 정렬 알고리즘 종류에는..

파이썬 입력을 map과 list를 이용해서 저장하는 방법 [내부링크]

파이썬의 내장함수인 map는 여러 개의 데이터를 한번에 다른 형태로 바꾸기 위해서 사용합니다. 주로 list와 tuple과 함께 사용하지요 문법은 다음과 같습니다. map(변환 함수, 순회 가능한 데이터) list와 함께..

파이썬 아스키코드 변환 함수 ord와 chr [내부링크]

아스키코드의 뜻은 미국 정보교환 표준 부호 (American Standard Code for Information Interchange)이다. 줄여서는 ASCII라고 표현합니다. 컴퓨터는 0과1 2비트로 모든것을 연산하는데 그렇다면 글자는 어떻게 표..

파이썬을 이용한 탐색과 맵 자료구조 [내부링크]

이번 포스팅에서는 탐색, 맵, 엔트리, 딕셔너리에 대해서 살펴봅시다. 탐색은 테이블에서 원하는 탐색키를 가진 레코드를 찾는 작업입니다. 맵 또는 딕셔너리는 탐색을 위한 자료구조로 엔트리 또는 키를 가진 레..

파이썬 리스트에서 2x2배열에서 얕은 복사가 일어나는 경우 [내부링크]

오늘도 어김없이 코딩테스트를 준비하기 위해서 문제를 이것저것 풀어보는데 2차원배열 문제에서 값이 제대로 삽입되지 않는 문제가 있었습니다. 만약에 numpy를 사용했다면 np.zeros((n,n))으로 간단하게 만드는..

파이썬 다운 방식 파이썬 철학(Pythonic Way) [내부링크]

파이썬에는 파이썬다운 방식이라는 고유한 철학이 있습니다. 언어차원에서 Zen of Python이라는 이름으로 철학을 제공하는데 import this로 이를 볼 수 있습니다. The Zen of Python, by Tim Peters Beautiful is..

파이썬 /, %, //, divmod 연산자 뜻과 사용방법 [내부링크]

파이썬 /, %, //, divmod 연산자 뜻 사용방법 / 나누기 % 나머지 반환 // 몫 반환 divmod(a,b) -> 몫, 나머지 한번에 내가 멍청해서 그런가 이상하게 한번씩 생각이 안나서 뇌정지온다. 그거 말고도 나머..

Missing optional dependency 'xlrd' 문제해결 방법 [내부링크]

엑셀 파일을 집어 넣으면 ImportError: Missing optional dependency 'xlrd'. Install xlrd >= 1.0.0 for Excel support Use pip or conda to install xlrd. 이런식으로 에러 메세지가 출력 되는데 말그대로 xlrd..

Jupyter 주요 단축키 모음 [내부링크]

Jupyter 주요 단축키 모음 (1) 셀 선택 모드 (Command Mode) [esc] 또는 [ctrl] + [m]를 눌러 셀이 아래와 같이 파란색이 된 상태(셀 선택 모드)에서 해당 단축키 누른다. 위로 셀 추가 [a] 아래로 셀 추가 [b]..

C언어 조건연산자 If, 반복문 while, for 연습 문제 풀이 [내부링크]

1. 1에서부터 표준 입력으로 받은 양의 정수까지의 합을 출력하는 프로그램을 작성하시오. #include int main() { int num,i,sum; printf("양의 정수를 입력하세요 : "); scanf("%d",&num); for(i=1,sum=0;i<=num..

C언어로 배열에 중복되지 않는 로또수(랜덤수) 출력하기 [내부링크]

파일정리하다가 튀어나온 C언어로 배열에 중복되지 않는 로또수(랜덤수) 출력하기를 포스팅해볼려고 한다. 이거는 내가 강렬하게 기억하는게 작년에 이 문제가 나왔는데 어버버거리면서 틀린 기억이 난다. 로또수..