2riing의 등록된 링크

 2riing로 등록된 네이버 블로그 포스트 수는 58건입니다.

블로그 방문자수, 실2 자축 [내부링크]

주당 방문자수가 845명을 찍었다 .. ! 또 오르락 내리락 할 수도 있겠지만 암튼 뿌듯하다 이것이 바로 소소한 업적 ? 사람들이 들어와서 낚이는게 아니라 좋은 정보를 얻어갈 수 있었으면 좋겠다.. 오타 고치자 (제발) 그리고 실2 자축 4월안에 실1 가고 5월안에 골드가자 .. !

ModuleNotFoundError: No module named 'django-extensions' 및 설치 [내부링크]

1. 오타확인 하이픈 & 언더바 => 언더바임 django-extensions X django_extensions O 2. 설치를 안함 pip install django-extensions 3. 설치를 안함(feat.requirements.txt) pip install -r requirements.txt 3. 앱에 추가를 안함 settings.py에 들어가서 추가해줍니다. 언더바임 언더바 장고 공식문서 https://django-extensions.readthedocs.io/en/latest/installation_instructions.html

AttributeError: module 'django.db.models' has no attribute 'models' [내부링크]

AttributeError: module 'accounts.views' has no attribute 'password' https://stackoverflow.com/questions/54890189/attributeerror-module-django-db-models-has-no-attribute-model Attribute Error는 대체로 오타 혹은 실수로 생기는 오류이다. 눈을 씻고 잘 찾아보자

[django] 커스텀 유저, Substituting a custemo User model [내부링크]

[주의] 첫 migrate 하기 전에 해야함 1. setting.py AUTH_USER_MODEL = '앱이름.유저이름' 쓰기 AUTH_USER_MODEL = 'accounts.User' 으로 작성해주었다. 2. accounts(해당앱) - models.py에 작성하기 AbstractUser을 상속받아와서 새로운 커스텀 User을 만들어주었다. 3. admin.py에 추가 => 이건 안해도 동작한다. 왜 그런지 아시는분은 댓글을 남겨주세요 @@ 장고 공식문서 링크 https://docs.djangoproject.com/en/4.0/topics/auth/customizing/#substituting-a-custom-user-model

CRUD 장고 프로젝트 [내부링크]

** 게시판 만들기 ** - 글 생성 - 글 수정 - 글 삭제 - 댓글 작성 기능 - 댓글 삭제 기능 회원정보 수정과 회원탈퇴 이외의 기능들을 구현했다. 부트스트랩5를 사용해서 화면을 만들어주었고, Views.py를 짜는게 가장 어려웠다. 혼자서 천천히 만들어보니 어떤 방식으로 동작하는지 약간은 알 것 같았다.

[SQLD] 집계함수, GROUP BY, HAVING [내부링크]

집계함수(Aggreate Function) - COUNT(*) : 유일하게 NULL 값 포함, 나머지는 NULL값 제외 - COUNT(_) - SUM(_) - AVG(_) - MAX(_) - MIN(_) - STDEV(_) : 표준편차 - VAR(_) : 분산 GROUP BY 절 그룹별 검색을 위해서 사용된다. FROM/WHERE절 뒤에 위치한다. SELECT * FROM 테이블명 WHERE ___ GROUP BY ____ HAVING _____ ** HAVING은 GROUP BY절에 의해서 만들어진 소그룹에 대한 조건 적용 HAVNING 절 집계함수는 WHERE 절에는 사용할 수 없지만, HAVING에서는 사용할 수 있다. => 집계함수 사용가능 SELECT * FROM 테이블명 GROUP BY ID HAVING AVG(AGE) > 30 집계함수와 NULL - 전체 건수가 NULL값인 경우 => 함수의 결.......

[SQLD] ORDER BY, SELECT 문장 실행 순서 [내부링크]

ORDER BY - SQL 문장의 제일 마지막에 위치함 - ORACLE에서는 NULL이 가장 큰값, SQL Server에서는 NULL이 제일 작은 값 => 오름 차순 정렬을 했을 때 NULL값의 위치가 반대임 ASC(ASCending) : 오름차순 DESC(DESCending): 내림차순 SELECT 컬럼명 FROM 테이블명 WHERE 조건식 ORDER BY (ASC|DESC) ORDER BY CASE SELECT DEPT_ID, SALARY FROM EMP ORDER BY (CASE DEPT_ID WHEN 30 THEN 1 WHEN 10 THEN 2 ELSE 3 END) SALARY DESC; DEPT_ID가 30인 것들 부터 첫번째로 정렬 DEPT_ID가 10인 것들을 두번째로 정렬 나머지는 3순위, SALARY는 내림차순으로 정렬 SELECT 문장 실행 순서 - 특정 테이블이 FROM에서 사용되지 않았는데, 그 이.......

[SQLD] 조인(Equi join/Non Equi join) [내부링크]

조인 여러개의 테이블을 연결해서 데이터를 출력하는 것 일반적으로 PK와 FK값의 연관에 의해서 성립 그러나 PK FK의 연관이 없어도 성립되는 경우도 있음 Equi JOIN(동등조인) 두개의 테이블 간에 컬럼 값들이 서로 정확하게 일치하는 경우에 사용 조인의 조건을 where절에 작성하고 '=' 연산자로 표현한다. SELECT EMP.EMP_NAME, DEPT.DEPT_NAME FROM EMP, DEPT WHERE EMP.DEPT_ID = DEPT.DEPT_ID; Non Equi Join(비동등 조인) 컬럼값이 정확하게 일치하지 않는 경우 BETWEEN, >, >=, <. <= 등을 사용함 SELECT EMP.EMP_NAME, EMP.SALAARY, SALGRD.GRADE FROM EP, SALGRD WHERE EMP.SALARY BETWEEN .......

정처기 21년 2회 (15점) [내부링크]

1. 애드 훅 네트워크(Ad-hoc Network) 'ad hoc' : 특정 목적을 위해, 한정목적의를 의미하는 라틴어의 어구 / 1. formed of usef for a special purpose 기지국 필요 X 기반네트워크 장치 필요 X 사용분야 : 긴급 구조, 긴급 회의, 전쟁터에서의 군사 네트워크 ex) an ad hoc meeting : 특별 회의 3. SHIFT 연산자 , >> , << << 2 왼쪽으로 2만큼 shift >> 3 오른쪽으로 3만큼 shift a = 100 100 = 64 + 32 + 4 = 100 100 을 2진수로 변환하면 문제에서 i = 1, 2 1) i 가 1일경우 a >> i == a >> 1 == a -> 1 (오른쪽으로 shift i만큼) * 그러나 1을.......

[ADsP] 시계열 분석(Time Series Analysis) [내부링크]

시계열자료(Time Series Analysis) - 시간의 흐름에 따라 관찰된 값 - 비정상성 시계열자료 : 대부분의 자료, 다루기 어려움 - 정상성 시계열 자료 : 비정상성 시계열을 다루기 쉽게 시계열 자료로 변환한 것 정상성(Stationarity) * Stationary : 움직이지 않는, 변하지 않는 ex)a stationary population 시계열을 생성하는 통계적 속성이 시간에 따라 변하지 않음을 의미 지그재그 모양을 수평으로 막 그리면 정상성이다. 정상성을 가지는 시계열은 b와 g / d와 h는 계절성이 보이기 때문에 정상성X * 계절성 : 고정된 빈도로 연or 월 등마다 반복 되는 성질 비정상 시계열을 정상 시계열로 만드는 방법 차분(diffence) : 데이터의 차이를 구해.......

[ADsP] 다차원척도법(MDS; Multi Dimensional Scaling) [내부링크]

다차원 척도법(Multidimensional Scaling) - 객체간 근접성(Promity)를 시각화하는 통계 기법 - 대상을 변수로 측정한 후에 개체들 사이의 유사성/비유사성을 측정해서 2차원 공간에 점으로 표현하는 법 다차원 척도법 목적 - 데이터에 잠재한 패턴, 구조를 찾아냄 - 그 구조를 기하학적으로 표현 - 데이터 축소의 목적으로 이용 - 데이터가 만들어진 현상이나 과정에 고유의 구조로서 의미를 부여 다차원 척도법 방법 유클리드 거리행렬 활용 적합정도를 스트레스 값으로 나타냄 스트레스와 적합도 수준 M은 STRESS or S-STRESS로 사용됨 - 스트레스 값이 0.05 이하이면 적합도가 좋은 것으로 반복 분석 중단해도됨 다차원 척도법의 종류 1. 계.......

[ADsP] 주성분 분석(Principla component Analysis) [내부링크]

주성분분석(Principal Component Analysis) 부선분 : 서로 상관성이 높은 변수들의 선형 결합 주성분으로 상관성이 높은 변수들을 요약, 축소하는 기법 주성분분석의 목적 - 차원 축소 - 변수 축소 (다만, 회귀분석이나 의사결정나무등 입력변수간의 산관계수가 높은 다중 공선성이 존재할 경우 문제가 됨) - 군집 분석 수행시 군집화 결과와 연산속도 개선 요인분석과 주성분 분석의 비교 요인분석(Factor Analysis) 두 개 이상의 변수들에 잠재되어있는 공통 인자를 찾아내는 기법 요인분석& 주성분분석의 공통점 - 데이터를 축소하는데 활용 - 새로운 변수 만들 수 있음 요인분석& 주성분분석의 차이점 1) 생성된 변수의 수 2) 생성된.......

[SQLD] 데이터 모델링, 데이터 독립성, ERD [내부링크]

모델링 현실세계를 단순화, 추상화해서 이용하기 쉬운 형식으로 표현 특징 - 단순화 - 추상화 : 필요한 부분이나, 중요한 부분 통합하여 표현 현실 세계를 일정한 형식으로 표현 - 명확화 : 모호함을 제거하고 정확하게 기술 데이터 모델링 현실세계 -> DB로 옮기는 과정 고객의 요구사항을 분석, 검증하여 ->기호로 객관적으로 표현, 물리적으로 구현 데이터 모델의 기능 - 가시화 - 구조화 - 명세화 - 문서화 - 다양한 관점 - 표현 방법 제공 데이터 모델링의 유의점 - 비유연성 : 데이터 정의-사용프로세스간의 유연성이 좋아야함 - 비일관성 : 데이터에 모순X - 중복성 : 중복저장X 데이터 모델링의 3가지 요소 - Things - .......

[SQLD] 엔티티(Entity) [내부링크]

엔티티(Entity) 실제, 객체 업무에 필요하고 유용한 정보를 저장, 관리하는 Things 인스턴스의 집합을 의미 엔티티의 특징 - 업무정보 : 업무에서 반드시 필요하고 관리가 필요한 정보 - 식별가능 : 유일 식별자 존재 - 인스턴스의 집합 : 인스턴트 2개 이상의 집합 - 업무 프로세스에 이용 : 반드시 업무 프로세스에 이용 - 속성을 포함 : 반드시 2개 이상의 속성을 포함 - 관계의 존재 : 1개 이상의 관계 존재, but 특정 상황에는 관계 생략 가능 엔티티의 분류 1. 유/무형에 따른 엔티티 분류 - 유형 엔티티(Tangible Entity): 물리적 형태가 있는 것 ex) 사원, 물품, 강사 - 개념 엔티티(Conceptual Entitiy) : 물리적 형태 X 개념적 정보 ex.......

[SQLD] 정보요구사항 [내부링크]

정보요구사항 정보시스템 개발을 위해서 업무의 개선 사항이나 신규 개발사항을 요청하는 내용 정보 요구사항 생명주기 모형 1. 정보요구사항 수집 : 사용자 면담 등 2. 정보 요구사항 분석 및 정의 3. 정보 요구사항 상세화 4. 정보 요구사항 검증 수집 - 분석 및 정의 - 상세화 - 검증 https://blog.naver.com/2riing/222654092490 정보 요구사항 유형 - 외부 인터페이스 요건 - 기능 개선 요건 - 성능 개선 요건 - 보안 개선 요건 +) 정처기 요구공학과 같고 내용이 직관적이다.

[SQLD] 데이터 베이스 [내부링크]

데이터베이스 유형 - 계층형 : 트리형태, 1: N - 네트워크형 : N:N - 관계형 : Key&Value, SQL이용 - 객체 지향헝 - 객체 관계형 : 객체 + 관계 - NoSQL - NewSQL : 관계형 + NoSQL 5번에 NoSQL에 대한 설명 있음 https://blog.naver.com/2riing/222689005954 관계형 데이터 베이스 - Key Value들로 데이터를 저장 및 관리하는 데이터베이스 유형 관계형 데이터 베이스 특징 - 정규화 - 데이터 표준화 : 데이터 품질 확보 - 무결성 보장 - 회복성 - 동시 사용 - 보안 기능 관계형 데이터 베이스 주요 용어 - 테이블 - 열 - 행 - 값 - 키 - 관계 - 속성 - 튜플 - 카디널리티 https://blog.naver.com/2riing/222640159344 카디널리티? 5개 속성.......

[SQLD] DDL (Data Definition Language) [내부링크]

데이터 정의어(DDL, Data Definition Language) 생성, 변경, 삭제 데이터 구조와 관련된 명령어 대상: 도메인, 스키마, 테이블, 뷰, 인덱스 데이터 유형 컬럼을 정의할 때 자료의 유형을 규정한다. 자료유형을 벗어나면 에러 - CHARACTER(size) 문자 데이터, 고정길이 - VARCHAR(size) 문자 데이터, 최대사이즈 지정 최대 길이는 존재하지만 가변길이로 조정됨 - NUMERIC(p, s) 정수 or 실수 p: 전체 자리수 s:소수 부분 자리수 - DATETIME Oracle은 1초단위 SQL Server는 3.3ms단위로 관리한다. DDL명령어 CREATE생성, ALTER수정, DROP개체 삭제, TRUNCATE내용삭제 CREATE 데이터 베이스, 테이블, 인덱스 등을 생성하는 명.......

[정처기 실기] SQL정리 [내부링크]

CREATE CREATE TABLE 학생( 학번 VARCHAR(10) PRIMARY KEY, 전공 VARCHAR(20) FOREIGN KEY REFERENCES 학과(학과코드), 이름 VARCHAR(10) UNIQUE, 생년월일 CHAR(8) NOT NULL, 성별 CHAR(1) CHECK(성별='M' OR 성별 ='F') 입학일 DATE DEFAULT SYSDATE ); ** CHECK : 제약 조건 설정 SYSDATE : 현재 날짜 ** ALTER 1) 컬럼 추가 ALTER TABLE 학생 ADD 전화번호 VARCHAR(11) UNIQUE; ALTER TABLE 학생 ADD 전화번호 VARCHAR(11) UNIQUE; => 학생 테이블에 '전화번호'라는 컬럼 추가 2) 컬럼 제약 조건 수정 ALTER TABLE 학생 MODIFY 이름 VARCHAR(30) NOT NULL; ALTER TABLE 학생 MODI.......

[python] 백준 1389 케빈 베이컨 / 실버 1 [내부링크]

min_sum 초기화는 0으로 하지 말자 !! (제발) 22분 소요 백준 BFS문제

[python] 백준 11725 트리의 부모 찾기 / 실버 2 [내부링크]

16일 전에 트라이 했던거 다시 풀었다.. 51분 30초 소요 !! 노드를 행렬로 그렸더니 메모리 초과가 나나 싶어서 리스트로 그려줬더니 이제 시간초과가 난다 중간중간에 나던 런타임 에러는 sys.stdin.readline() 할 때 백준에다가 import sys 복붙 안한 ... NameError,,, 10분은 삽질한듯 시간 초과를 해결해주기 위해서 for i in range(N)으로 전부 검색해 주던 것을 for i in range(tree[v][i])로 해서 시간을 단축시켜주었다.

[python] 4963 섬의 개수 / 실버 2 [내부링크]

17분 소요 비슷한 유형을 많이 풀어봐서 그런지 설계를 따로 하지 않았는데도 답이 시원하게 잘 나왔다 (**) cnt = 0으로 해줬다가 무한루프에서 왜돌지,, 고민하고 다시 1로 바꿔주었습니다

[python] 프로그래머스 비밀지도 [내부링크]

bin(숫자) 하면 칸이 7개일 때, 1111이면 -> 0001111 이런식으로 앞에 0을 붙여줘야하는 문제 !

[python] 백준 3085 사탕게임 [내부링크]

좀 생각없이.. 양심없이 짠 코드인가 싶긴 하지만 백준 채점기준으로 메모리는 python3쓴 다른 사람들이랑 비슷하고 시간은 좀 짧거나 비슷한 편이다. 그렇지만 더 개선해나갈 여지가 있다고 생각함. 42분 소요

[python] 백준 10026 적록색약 [내부링크]

코드가 좀 지저분.. cnt를 넣어주는 조건을 잊어버려서 디버깅 하면서 반례를 발견해낸 문제 ! 28분 소요

[python] 백준 1152 단어의 개수 / 브론즈 2 [내부링크]

구현이 약한 것 같아서 구현문제 들어가봤는데 1분 컷 할거라고 생각했던 문제에서 11분 소요 ㅎㅎ 역시 사람은 다 아는 것 같아도 자만하지 말고 차근차근 쌓아나가야한다..

[ADsP 1과목] 위기 요인과 통제 방안, 미래의 빅데이터 [내부링크]

빅데이터 시대의 위기 요인 1. 사생활 침해 ex) 여행가서 페북에 올린사람 집 털기 2. 책임 원칙 훼손 : 예측 알고리즘의 희생양. ex) 범죄 예측 프로그램에 의해서 범죄를 저지르지 않았는데 체포. 3. 데이터 오용 - (과거의 데이터로 예측한) 미래는 늘 맞을 수는 없음 - 잘못되거나 과장된 데이터를 사용하면 문제 발생 위기 요인에 따른 통제방안 1. 동의에서 책임으로 ex) 개인정보 제공자의 동의 -> 개인정보 사용자의 책임 사용자가 책임을 지게 되기 때문에, 적극적인 보호장치 예상 2. 결과 기반 책임 원칙 고수 3. 알고리즘 접근 허용 ' 알고리즘 접근권'을 제공해서 예측 알고리즘의 부당함을 반증할 수 있는 방법을 명.......

[ADsP 1과목] 빅데이터 분석과 전략 인사이트 [내부링크]

빅데이터 열풍과 회의론이 제기되고 있음 빅데이터 회의론의 원인 및 진단. 1. 투자 효과를 거두지 못했던 부정적 학습효과 -> 과거의 고객 계획 관리(CRM; Customer Relationship management)의 부정적 학습 효과 공포마케팅 : 도입만 하면 모든 문제를 한 번에 해소할 것처럼 강조 but, 거액을 투자해서 도입해도 어떻게 활용하고 어떻게 가치를 뽑아 내야할지 모름 2. 성공사례가 기존의 분석 프로젝트를 포함한 경우 - 빅데이터가 필요 없는 분야 (우수고객, 이탈예측, 구매패턴 분석 등) - 빅데이터 업체들이 CRM성과를 빅데이터 성과로 포장 결론 : 단순히 빅데이터에 포커스 X, 분석해서 가치를 만드는 것에 집중 다음이야기 : 빅데이.......

[ADsP 1과목] 전략 인사이트 도출을 위한 필요 역량 [내부링크]

데이터 사이언스의 의미와 역할 1. 의미 데이터공학, 수학, 통계학, 컴퓨터공학, 시각화, 해커의 사고방식, 해당분야의 전문지식의 종합 학문 (정형/ 비정형 상관 없이) 데이터로부터 의미있는 정보를 추출하는 것 2. 역할 핵심 이슈에 답을 하고 사업의 성과를 견인해 나갈 수 있어야함 소통력 필요 ! 데이터 사이언스의 구성요소 IT 컨설팅 : IT + 비지니스 분석 전략 컨설턴트 : Analytics + 비지니스 분석 IT : 시그널 프로세싱, 프로그래밍, 데이터 엔지니어링, 데이터 웨어하우스, 고성능 컴퓨팅 https://blog.naver.com/2riing/222688931242 데이터 웨어하우스, 데이터 레이크, 데이터 마트에 대해서 정리 분석(Analytics) : 수학, 확률, .......

[django] Creating a ModelForm without either the 'fields' attribute or the 'exclude' ... [내부링크]

Creating a ModelForm without either the 'fields' attribute or the 'exclude' attribute is prohibited; form CommitmentForm needs updating 'fields' 특성 또는 'exclude' 특성 없이 Model Form을 만드는 것은 금지됩니다 앱내에 forms.py에 fields가 없거나 오타가 났는지 살펴보기 일반적인 형식

[빅분기 1과목] 데이터 적재, 데이터 웨어하우스, 데이터 마트, 데이터 레이크 [내부링크]

데이터 적재 데이터를 수집한 후에는 빅데이터 시스템에 적재해야한다. RDBMS, HDFS, NoSQL 저장 시스템에 데이터를 적재할 수 있다. 데이터 적재 도구 - 플루언티드(Fluentd) 오픈 소스 데이터 수집 소프트웨어 - 플럼(Flume) : 많은 양의 로그데이터 효율적으로 수집, 이벤트와 에이전트를 활용하는 분산형 로그 수집 기술 - 스크라이브(Scribe) 다수의 서버로 부터 실시간으로 스트리밍 되는 로그 데이터를 수집하는 대용량 실시간 로그 수집 기술 - 로그 스태시(Logstash) 모든 로그 정보를 수집하여 하나의 저장소에 출력해주는 시스템 * stash : 넣어두다, 숨기다 ex) She has a fortune stashed awasy in various bank accounts. +) DW, D.......

[빅분기 1과목] 빅데이터 저장기술 [내부링크]

빅데이터 저장 기술 대용량의 저장공간, 빠른 처리 성능, 확장성, 신뢰성, 가용성 등을 보장해야함 - 분산 파일 시스템 - 데이터 베이스 클러스터 - NoSQL 분산 파일 시스템 1. 구글 파일 시스템(GFS; Google File System) 파일을 64MB의 고정된 크기, 청크로 나눠서 각 청크와 여러 개의 복제본을 청크 서버에 분산하여 저장 <구성요소> - 클라이언트 - 마스터 - 청크 서버 2. 하둡 분산 파일 시스템(HDFS; Hadoop Distributed File System) 테라바이트, 페타바이트 이상의 대용량 파일을 분산된 서버에 저장하고 저장된 데이터를 빠르게 처리할 수 있게하는 분산 파일 시스템 구글 파일 시스템 논문에서 -> 또 논문을 낳아서 2006년에.......

[python] SWEA 연산 [내부링크]

visited를 set으로 만들어주지 않으면 시간초과가 뜨는 문제 ..! 처음엔 next v의 범위를 상한 선만 설정해줬는데, M이 자연수(= 양수) 이기 때문에 음수를 오갈 필요가 없었다. https://www.acmicpc.net/problem/1697 매우 유사한 문제 !!

[빅분기 3과목] 분석 도구(R, 파이썬), 데이터 분할 [내부링크]

분석 도구 R S언어(통계 프로그래밍 언어)를 기반으로 만들어진 오픈소스 프로그래밍 언어 특징 사용자가 패키지 직접 추가 가능 그래프 패키지로 강력한 시각화 CRAN(The Comprehensive R Archive Network)존재 평가데이터 다운로드 가능 15,000이상의 패키지가 있음 Rstudio(IDE) window, mac, linux OS 전부 지원 인터프리터 언어지만, 상용버전인 S-PLUS보다 속도가 빠를때가 많음 파이썬 C언어 기반의 오픈소스 프로그래밍 언어 특징 - 배우기 쉬움 - 들여쓰기 이용 - R보다 시각화 라이브러리가 빈약함 - 주피터노트북, 파이참, PTVS IDE 존재, but 대표적인 통합 개발 환경 없음 - OS전부 지원 - PYPI(Python Package Index) 사용자들이 작.......

[빅분기 3과목] 회귀분석 [내부링크]

회귀분석 - 독립변수와 종속변수 간에 선형적인 관계를 도출 - 하나 이상의 독립변수들이 종속변수에 미치는 영향을 분석 - 독립 변수를 통해 종속 변수를 예측함 독립변수와 종속변수 독립변수(Independent variable) : 다른 변수에 영향을 받지 않고 종속 변수에 영향을 주는 변수 종속변수(Dependent variable) : 독립 변수에 영향을 받아서 변화하는 변수 ex) 폐압 발생률(종속변수)에 영향을 주는 흡연량(독립변수), 음주량(독립변수) +) 독립변수가 연속형 자료일 경우 공변량/ 범주형 자료일 경우 요인이라고 부른다. 회귀분석 변수 - 영향을 주는 변수(x) 독립변수, 설명변수, 예측변수, 위험인자, 공변량, 요인 - 영향을 받는 변수(y).......

[빅분기 3과목] 로지스틱 회귀분석(Logistic Regression Analysis) [내부링크]

로지스틱 회귀 분석(Logistic Regression Analysis) : 지수함수, S자형 곡선 독립변수 : 수치형 종속변수 : 범주형 -> 양성/음성, 합격/불합격 설명변수의 값이 주어지면, 반응변수의 각 범주에 속할 확률이 얼마인지를 추정하여 추정 확률을 기준치에 따라 분류하는 목적 로지스틱 회귀 분석 필요성 로지스틱 회기 분석의 대상이 되는 종속변수의 결과는 0,1만 나오는데 선형회귀를 적용할경우 해당 범위를 벗어나기 대문에 예측의 정확도를 위해서 로지스틱 회귀 분석이 필요하다. 로지스틱 회귀 분석의 원리 로짓(Logit)변환을 통해 독립변수가 얼마이든 종속변수의 결과값이 항상[0,1]에 있도록 한다. 바로 로짓으로 변환 X 오즈, 오즈비.......

[빅분기 3과목] 의사결정나무(Decision Tree) [내부링크]

의사결정나무 의사결정 규칙을 Tree구조로 나타내서 전체자료를 몇 개의 소집단으로 분류 or 예측 분석하는 방법이다. 분류함수를 활용 시각화해서 파악 쉬움 계산 결과가 직접적으로 나타남 의사결정나무의 구성요소 Split : 나무가지 생성 Prunning: 가지를 잘라내서 모향을 단순화함 - 부모마디 - 자식 마디 - 뿌리 마디(Root) - 끝 마디 (Terminal Node, Leaf Node) - 중간마디 (Internal Node) - 가지 - 깊이 해석력 : 결과를 해석하고 설명할 수 있는 정도 예측력 : 실제 예측의 정확도 의사결정나무의 분석 과정 1. 의사결정 나무 성장(Growing) 2. 가지치기 (Pruning) 3. 타당성 평가 4. 해석 및 예측 불순도의 여러가지 척도 목표 변수.......

[빅분기 3과목] 인공신경망 [내부링크]

인공신경망(ANN; Artificial Neural Network) 입력값을 받아서 출력값을 만들기 위한 활성 인공신경망은 가중치를 알아내는 것이 목적 퍼셉트론(Perciptron) 인간의 신경망에 있는 뉴런의 모델을 모방하여 입력층, 출력층으로 구성한 인공 신경망 모델이다. <구성요소> 입력값, 가중치, 순 입력함수, 활성화 함수, 예측값(출력값)으로 되어있음 <퍼센트로 학습과정> 입력값과 가중치를 순 입력함수에서 각각 곱하고 더함 예측값 1또는 -1을 출력 예측값이 실제와 다를 경우 가중치 업데이트 <퍼셉트론의 XOR 선형 분리 문제점> XOR은 선형 분리를 할 수 없는 문제점이 있음 따라서 다층 퍼셉트론으로 해결하였음 다층 퍼셉트론.......

[빅분기 3과목] 서포트 벡터 머신 [내부링크]

서포트 벡터 머신(SVM; Support Vector Machine) 벡터 공간에서 훈련데이터가 속한 2개의 그룹을 분류하는 선형 분리자를 찾는 기하학적 모델이다. 초평면(Hyperplane)중에서 데이터들과 가장 먼 초평면을 선택하여 분리하는 지도학습 기반의 이진 선형 분류 모델이다. 특징 최적의 분리 초평면을 찾아서 분류 및 회귀를 수행한다. 변수 속성간 의존성 고려 X 모든 속성을 활용함 훈련시간이 상대적으로 느리지만 정확성이 뛰어나며 과대적합의 가능성이 낮은 모델 구성요소 - 결정경계(Decision Boundary) - 초평면(Hypeplane) - 마진 : 결정 경계에서 서포트 벡터까지의 거리(여유공간) - 서포트 벡터 - 슬랙변수(= 여유변수) 서포트 벡터.......

[빅분기 3과목] 연관성분석(Association Analysis), 군집분석(Cluster Analysis) [내부링크]

연관성 분석 = 장바구니 분석, 서열 분석 상호관계 혹은 종속관계를 찾아내는 분석기법 연관석 분석 특징 - 분석 방향이나 목적이 없어도 가능 - 조건반응(if-then) 이해하기 쉬움 - 매우 간단하게 분석을 위한 계산 가능 - 온라인 쇼핑의 상품 추천에 활용 연관성 분석 측정지표 - 지지도 - 신뢰도 - 향상도 연관성 분석 알고리즘 1. 아프리오리(Apriori)알고리즘 - 가능한 모든 경우의 수를 탐색하는 방법을 개선하기 위해서 - 발생 빈도가 높은 것을 찾는 알고리즘 - 항목이 많아질 수록 기하급수적으로 늘어나기 때문에 항목을 줄여줘야함 -> 아프리오리 알고리즘 - 단점 : 데이터 세트가 큰 경우 모든 후보 아이템 세트들에 대해서.......

[python] PEP 8이란? + 파이썬 문법 팁 [내부링크]

PEP(Python enhancement Proposal) PEP8 = Style Guide for Python Code https://peps.python.org/pep-0008/ 작성자 : Gudio van Rossum, Barry Warsaw, Nick Coghlan * Gudio van Rossum, 귀도 반 로섬 네덜란드의 개발자, 파이썬을 개발한 것으로 유명함 1989: 파이썬 구현 시작 1991 : 파이썬 발표 2005-2012 : 구글 2013-2019 : 드롭박스 2020: MS입사 <귀도 반 로섬의 개인 소개 페이지> +) 귀엽다... https://gvanrossum.github.io/ <Guido van Rossum's new blog> https://www.artima.com/weblogs/index.jsp?blogger=guido Introduction에서 소개하기를 PEP8은 Python에 대한 코딩 규칙을 설명한다고 함 스타.......

[python] 주로 사용하는 파이썬 기본 라이브러리 [내부링크]

import collections import heapq import functools import itertiools import re import sys import math import bisect form typing import * bold표시한 것이 안써본 것 import heapq https://jungeun960.tistory.com/146 import functool https://docs.python.org/ko/3/library/functools.html import re *regex (regular expression): 정규표현식 정규 표현 처리를 하기 위해서 사용, 문자열의 추출이나 치환, 분할 등이 가능 (사용하면 편할 것 같다) ex) re.findall을 통해서 정수만 추출해 올 수 있음 (혁명..) https://brownbears.tistory.com/506 https://engineer-mole.tistory.com/189 import bisect 목록 정렬을 유지하기 위해서 요.......

[python] 빅오 [내부링크]

빅오란 입력값이 무한대로 향할 때 함수의 상한을 설명하는 수학적 표기 방법 파일이 너무 크면 인터넷에서 이메일이나 Cloud로 전송하는 것보다 usb or 하드 디스크를 직접 가지고 가서 물리적으로 전달하는게 더 빠를 때가 있다. +) 이러한 이유 때문에 우리는 가장 최악의 수인 빅오를 염두해 두어야 한다

[빅분기 1과목] 데이터 수집 [내부링크]

데이터 수집 대상 - 내부 데이터 ex) 서비스 : ERP, CRM 네트워크: 백본, 방화벽, 스위치 마케팅: VOC 접수 데이터, 고객 포털 시스템 등 - 외부 데이터 ex) 소셜 : SNS 네트워크 : 센서데이터 공공 : 정부 공개 경제 데이터 수집 방식 및 기술 1. ETL(Extract Transform Load) 데이터를 DW or DM으로 이동시키기 위해서 데이터를 추출, 변환, 적재하는 기술이다. 추출(Extract): JDBC(Java Database Connectivity), ODBC(Open Database Connectivity)이용 2. FTP(File Transfer Protocol) - 서버와 클라이언트의 연결 - 클라이언트와 서버 사이에서 파일 송수신을 하기 위한 프로토콜 - TCP 프로토콜 사용, 20번&21번 포트 사용 ex) A.......

[빅분기 1과목] 데이터 유형, 데이터 변환 기술 [내부링크]

구조적 관점에서의 데이터 유형 데이터를 구조 관점(스키마 구조 또는 연산 가능여부)에 의해서 분류 - 정형데이터(Structured Data) 정형화된 스키마 구조 O, 값과 형식에서 일관성을 가짐 컬럼과 로우 구조 ex) 관계형 데이터 베이스(RDB), 스프레드 시트, ERP, CRM, SCM - 반정형 데이터(Semi-structured Data) 스키마 구조 O , 값과 형식에서 일관성을 가지지 않음 내부 데이터 구조에 대한 메타 데이터 정보를 가지고 있음 !! ex) XML, HTML, JSON, RSS, 센서 데이터, 웹로그, 시스템 로그, 알람 - 비정형 데이터(Unstructured Data) 스키마 구조 X, ex) SNS, 웹게시판, 텍스트/이미지(RGB형식으로 저장)/ 오디오(시간에 따른 진폭으로 저장.......

[빅분기 1과목] 데이터 비식별화 [내부링크]

데이터 비식별화(Data De-identification) 특정 개인을 식별할 수 없도록 개인 정보의 일부 또는 정부를 변환하는 일련의 방법 데이터 비 식별화 적용대상 1. 그 자체로 개인을 식별할 수 있는 정보 - 개인을 식별할 수 있는 정보 : 이름, 전화번호, 주소, 생년월일, 사진 - 고유 식별정보: 주민번호 등 - 생체 정보 - 기관, 단체등의 이용자 계정 : 계좌번호, 이메일 주소 등 2. 다른 정보와 함께 결합하여 개인을 알아볼 수 있는 정보 - 개인 특성 : 성별, 생일, 나이, 우편번호, 병역여부 등 - 신체 특성 : 혈액형, 신장, 병명 등 - 신용 특성 - 경력 특징 : 학교명, 학력, 직업 - 전자적 특성 : PC사양, 쿠키 정보, 비밀번호, 접속일시 - 가.......

[알고리즘] 그래프의 기본 [내부링크]

소개 그래프 : 객체와 객체 사이의 연결 관계 표현 - 정점& 간선들의 집합으로 구성됨 - V개의 정점을 가지는 그래프는 최대 (V-1)/2개의 간선을 가질 수 있음 무향 그래프(Undirected Graph) : 방향 X인 그래프 ex) 친구관계 유향 그래프(Directed Graph) : 방향 O인 그래프\ ex) 애정관계, 작업의 선후관계, 기업간의 공급관계 가중치 그래프(Weighted Graph): 이동하는데 드는 비용을 간선에 부여한 그래프 인접(Adjacency) : 방향성을 가지는 경우 1->2 일 때, 1번 정점은 2번정점의 인접 정점이 아님 - 완전 그래프 : 모두 인접해있음 - 부분 그래프 : 원래 그래프에서 일부의 정점이나 간선을 제외한 것 경로 : 간선들을 순서대로 나.......

[알고리즘] 그래프 탐색 [내부링크]

그래프 탐색 ex) 친구들에게 소식 전달 문제 그래프 순회 비선형 구조인 그래프로 모든 자료를 빠짐없이 탐색 ex) DFS, BFS DFS 정점에서 갈 수 있는 방향, 이미 방문하지 않았던 정점을 선택하여 이동 더 이상 갈 곳이 없으면, 가장 최근에 방문한 갈림길이 있는 정점으로 돌아와서 결국 모든 정점을 방문하는 순회방법 후입선출 stack or 재귀호출 사용 BFS 인접한 정점들을 모두 차례로 반복 차례로 너비 우선 탐색 진행 선입선출 자료구조인 queue를 활용함

[알고리즘] 상호배타 집합들 [내부링크]

서로소 또는 상호 배타 집합들 서로 중복 포함된 원소가 없는 집합들로 교집합이 없음 집합에 속한하나의 특정원소(대표자-Representative)를 통해 각 집합들을 구분 표현방법 : 연결 리스트, 트리 <상호 배타 집합 연산> Make-Set(x) : 원수 x만으로 구성된 집합을 생성하는 연산 Find-Set(x) : x가 속한 집합을 알아내가 위해 시용, 집합의 대표자를 알기 위한 연산 Union(x,y) : x가 속한집합 + y가 속한집합 <연결 리스트 표현> 같은 집한의 원소들은 하나의 연결 리스트로 완리 연결 리스트의 첫 번째 원소를 집합의 대표 원소로 선택 두 집합을 합칠 때에는 크기가 작은 집합을 큰 집합의 뒤에 연결한다. <트리 표현> 하.......

[빅분기 1과목] 데이터 품질, 데이터 품질 검증 방법 [내부링크]

빅데이터 품질 요소와 품질 전략 - 정확성(Accruacy) : 데이터 사용 목적에 따라 정확성을 다른 기준으로 적용 - 완전성(Completeness) : 완전학 확보보다는 필요한 데이터를 식별하는 수준으로 적용가능 - 적시성(Timeliness) : 소멸성이 강한 데이터에 대해 어느 정도의 품질 기준?을 적용할 것인지 결정 (적시의 품질기준, 적품(거품)) * timeliness (타임 리니스) : 적시(適時), 시기적절함 ex) 웹로그 데이터, 위치 데이터 등은 n일, 몇시간, 몇분 동안만 타당성을 가짐 - 일관성(Consistency): 같은 데이터라 할지라도 사용 목적에 따라 달라지는 데이터 수집 기준 때문에 데이터 의미가 달라질 수 있음 빅데이터 품질 기준 1. 정형데이터.......

병합정렬 [내부링크]

<병합정렬> 정렬된 자료의 집합을 병합하여 한개의 집합으로 만듬 분할정복 사용 최소 단위까지 문제를 나눈 후 차례대로 정렬 <알고리즘 : 분할과정> <알고리즘 : 병합과정> 리스트를 사용할 경우 : 분리/ 병합하는 과정에서 자료의 비교 연산과 이동 연산이 발생하여 비효율적 연결 리스트를 구현할 경우 : 리스트를 사용할 경우의 비효율적 단점을 극복하여 효과적 구현 가능 +) 연결리스트 : 데이터 요소의 선형 집합, 데이터의 순서가 메모리에 물리적인 순서대로 저장되지 않는다. - 특정 인덱스에 접근하기 위해서는 전체를 순서대로 읽어야하므로 탐색애 O(n)이사용됨 - 시작 끝지점에 아이템을 추가하거나 추출하.......

[python] 백준 2538 영역 구하기 [내부링크]

지금까지의 문제는 기본 map이나 maze등이 주어져있었다면, 이건 주어진 좌표로 직접 이차원 배열을 그리고 DFS를 해주는 문제이다

[python] SWEA 베이비진 게임 [내부링크]

먼저 들어오는 plyaer가 먼저 종료해야하니까 A, B 순서대로 검사를 해주는 것이 포인트 !

정처기 실기 21년 1회 (40점) [내부링크]

1. RARP(Reverse Address Resolution Protocol) 역방향 주소 확인 프로토콜 MAC주소에 해당하는 IP주소를 알려주는 프로토콜 (따라서) 역순 주소 결정 프로토콜 이라고도 부른다. * ARP(Adress Resolution Protocol) IP주소->MAC주소 변환 RARP == Reverse ARP이다. +) 내 생각 인터넷 계층의 프로토콜로 (IP/ ARP/ RARP)는 외우고 있으면 좋을 듯 응용계층의 프로토콜의 예시가 더 많이 나와있지만 정보처리기사에서 요구하는 프로토콜은 인터넷/전송 계층이 많이 출제 되는 것 같다. ex) ICMP, TCP 9. 블랙박스 기법 https://blog.naver.com/2riing/222656185022 위 링크에서 대충 보고 넘어가서 적으라고 하니까 어려웠다. 하나.......

[빅분기 1과목] 데이터 확보 계획, 분석 절차 및 작업 계획 [내부링크]

데이터 확보 계획 1. 데이터 획득 방안 및 수립 내부데이터 획득시 : 부서간 업무협조, 정보보안 고려 외부데이터 획득시 : 다양한 인터페이스 및 법적인 문제 고려 2. 데이터 확보 계획 수립 절차 목표정의 : 비지니스 성과 목표 정의 요구사항 도출 : 데이터 정제수준, 저장형태, 플랫폼 구축 여부 등 세부 요구사항 파악 예산안 수립 계획 수립 : 인력투입, 일정관리, 위험 및 품질관리 +) 목표를 정의하고, 뭘 원하는지를 알고나서, 예산을 정하고, 마지막으로 상세 계획을 짠다. 예산이 마지막이 아니고 계획 수립이 마지막에 있는 것이 포인트 ! 분석 절차 및 작업 계획 - 빅데이터 분석 절차 문제인식 연구 조사 모형화 : 분석문제의 단순.......

18-21 시간쓰기 [내부링크]

18~21시에는 유난히 집중하기가 힘들다 근데 퇴근시간이라서 멀리 돌아다니기는 어렵다. <이 시간을 활용해서 할 수 있는 것> (생산적인 휴식) - 운동(런데이 or 산책) - 교정 치과가기 - 카페가서 책읽기 - 샤워하기 - 나간김에 맛있는 밥 먹고오기 (그냥 휴식) - 잠 - 유투브 보기(뭘 볼지 찾는게 힘들다) (공부하기) - 스터디를 이시간에 한다 - 보충수업을 들어서 강제로 공부한다

[python] 백준 2644 촌수계산 [내부링크]

먼저오는게 부모~ 자식 하면서 이런저런 말로 현혹시키지만 그냥 A-> B까지 가는 최단거리 찾아서 출력하는 문제이다. BFS 기본 문제인데 문제 컨셉 때문에 촌수 진짜로 계산한다고 헷갈렸다..

[python] GREEDY [내부링크]

탐욕 알고리즘, Greedy Algorithm 최적 해를 구하는데 사용되는 근시안적 방법 여러 경우중 하나를 결정할 때마다 최적이라고 생각하는 것을 선택해 나가는 방식 그것이 최적이라는 보장은 없음 ex) 거스름돈 가장 큰 단위의 동전순으로 (500->10) 거스름돈 세기 시간복잡도 O(n) 시간복잡도 (개념, 치트키, 정렬별 시간복잡도) https://dingrr.com/blog/post/%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98%EC%8B%9C%EA%B0%84%EB%B3%B5%EC%9E%A1%EB%8F%84-big-o (예제) https://dingrr.com/blog/post/%EC%95%8C%EA%B3%A0%EB%A6%AC%EC%A6%98-%EC%8B%9C%EA%B0%84%EB%B3%B5%EC%9E%A1%EB%8F%84-%EC%98%88%EC%A0%9C-15%EC%A2%85 Binary Search 의 시간.......