365blackstar의 등록된 링크

 365blackstar로 등록된 네이버 블로그 포스트 수는 50건입니다.

NoSQL / ① [내부링크]

문제3) NoSQL 모델링 패턴 3가지 및 NoSQL 모델링 절차를 설명하시오. 답) 빅데이터 저장 DB, NoSQL의 개요 가. NoSQL의 개념 관계형 데이터베이스(RDBMS)의 테이블-컬럼과 같은 스키마 없이, 분산 환경에서 단순 검색 및 추가 작업이 용이하고, 지연(latency)과 처리율(throughput)이 높은 DBMS 나. NoSQL의 데이터 모델 유형 모델 유형 개념도 설명 Key/Value Store Unique 한 Key 에 하나의 Value 를 가지고 있는 형태의 모델. Ordered Key/Value Store Key/Value Store 의 확장된 형태로 Key/Value Store 와 데이타 저장 방식은 동일하나, 데이타가 내부적으로 Key를 순서로 정렬되어 저장 Document Key/Value Store Key에 해당하는 Value의 데이터 타입 이 XML, JSON, YAML Document. 타입이 저장 2. NoSQL 모델링 패턴 3가지 가. A

DAS, NAS, SAN [내부링크]

문제 7) DAS(Direct Attached Storage), NAS(Network Attached Storage), SAN(Storage Area Network) 답) 연결방식에 따른 스토리지 유형, DAS, NAS, SAN 의 개념 DAS 네트워크 경유 없이 전용 케이블로 서버에 직접 연결된 저장 장치 NSA 서버가 데이터를 전송 및 공유할 수 있게 네트워크로 연결된 저장 장치 SAN 서버와 저장장치를 Fiber Channel 스위치로 연결한 고속 데이터 네트워크 데이터 저장 용량 확충을 위해 네트워크 기반으로 저장장치를 연결하여 구성 2. DAS, NAS, SAN 의 구성 및 기술 특징 가. DAS, NAS, SAN 의 구성 설명 DAS NAS SAN 서버와 직접 연결 LAN 기반 연결 FC 스위치 통한 연결 나. DAS, NAS, SAN 의 기술 특징 설명 구분 DAS NAS SAN 접속장치 없음 이더넷 스위치 FC 스위치 스토리지 공유 가능 가능 가능 파일시스템 공유 불가

세마포어(Semaphore)와 모니터(Monitor) / ① [내부링크]

문제1) 세마포어(Semaphore)와 모니터(Monitor) 답) 동시성에 대한 SW 적인 해결책 세모포어와 모니터의 개요 가. 세모포어와 모니터의 정의 세마포어(Semaphore) 모니터(Monitor) 운영체계 또는 프로그램 작성 내에서 상호배제를 지원하는 매커니즘 세마포어 변수(S) 및 두 개의 연산(P,V)으로 임계영역에 접근하는 잠금장치에 대한 이론적 기반 Concurrent-Pascal, Module-2/3, JAVA 등 프로그래밍언어 수준에서 세마포어처럼 상호배제 기능을 제공하는 소프트웨어 모듈 나. 동시성 지원을 위한 세마포어와 모니터의 역할 2. 세마포어와 모니터의 개념적 상호관계 및 상세 설명 가. 세모포어와 모니터의 개념적 상호관계 세마포어는 모니터에게 이론적 기반을 제공하고 모니터는 세마포어의 타이밍 문제점을 보완 나. 세모포어와 모니터의 상세 설명 구분 세마포어(Semaphore) 모니터(Monitor) 주체 OS, 개발자 주체의 동시성 지원 프로그래밍 언어

데이터 구조(Data Structure) [내부링크]

문제2) 데이터 구조(Data Structure)에 대하여 다음을 설명하시오. 가. 선형 구조(Linear Structure)의 개념 및 유형 나. 비선형 구조(Non-Linear Structure)의 개념 및 유형 다. 선형 구조(Linear Structure)와 비선형 구조(Non-Linear Structure) 비교 답) 선형 구조(Linear Structure)의 개념 및 유형 가. 선형 구조(Linear Structure)의 개념 자료를 구성하는 원소들을 순차적으로 나열 시킨 형태의 데이터 구조 나. 선형 구조(Linear Structure)의 유형 유형 개념도 설명 배열(Array) 동일한 크기와 형식으로 구성된 연속적인 기억공간 리스트(List) 여러 데이터의 집합을 서로 연결 시키는 자료구조 유형: 단방향, 양방향, 환형 리스트 스택(Stack) 후입선출(Last In First Out) 특성을가지는 자료구조 pop(): 가장 위 항목 제거. push(item): it

선형자료구조, 비선형자료구조 / ① [내부링크]

문제4) 선형자료구조와 비선형자료구조 답) 선형 자료구조 가. 선형 자료구조(Linear Data Structure)의 개념 정의 데이터를 저장하는 방식이 데이터와 데이터를 1:1 대응 구조로 관계로 저장시키는 자료구조 특징 구조가 간단 accesss 속도가 빠름 나. 선형 자료구조의 유형 유형 개념도 설명 Array 같은 데이터형의 요소들이 동일한 크기로 순서를 갖고 나열되어 있는 집합 Linked List 데이터를 노드단위로 관리를하여 각 노드가 데이터와 포인터를 가지고 있어 순서를 유지하는 자료구조 Queue 선형리스트의 한쪽에서는 삽입 작업이 이루어지고 다른 한쪽에서는 삭제 작업이 이루 어지도록, 먼저 들어온 데이터 가 먼저 나가는 자료구조 Stack 모든 원소들의 삽입(insert)과 삭제(delete)가 리스트의 한쪽 끝에서만 수행되는 제한 조건 을 가지는 선형 자료 구조 (linear data structure) 2. 비선형 자료구조 가. 비선형 자료구조(Non-Line

Heap [내부링크]

문제2) 자료구조 Heap의 2가지 유형인 Max-heap과 Min-heap을 설명하시오 답) 완전이진트리를 기본으로 한 자료구조, 힙(Heap)의 개념 완전이진트리(Complete Binary Tree)에 있는 Node 중에서 Key 값이 가장 큰 Node나 가장 작은 Node를 찾기 위한 자료구조 max-heap은 가장 큰 값을 빠르게 찾기 위한 것이고, min-heap은 가장 작은 값을 빠르게 찾기 위한 것 2. 가장 큰 값을 빠르게 찾기 위한 Max-heap 상세 설명 가. Max-heap 상세 설명 구분 Max Heap(최대 힙) 정의 부모 Node의 키 값이 자식 Node의 키 값보다 항상 크거나 같은 완전이진트리 개념도 개념 Max Heap에 대해서 원소의 개수만큼 삭제 연산을 수행하여 큰 수부터 POP하여 내림차순으로 정렬 수행 나. Max-heap 알고리즘 구현 사례 struct MaxHeap { vector<unsigned int> heap; int count; M

메시지 큐잉 [내부링크]

문제1) 메시지큐잉에 대한 개념과 필요성, 종류, 기능에 대하여 설명하시오 답) 메시지큐잉에 대한 개념과 필요성 가. 메시지큐잉의 개념 개념 서로 다른 응용 프로그램 사이에서 비동기 메시지를 사용하여 데이터 송수신을 위한 메 시지 지향 미들웨어(Meesage Oriented Middleware: MOM)를 구현한 시스템 개념도 관련 개념 메시지 지향 미들웨어(Message Oriented Middleware : MOM) 분산 시스템 간 메시지를 주고 받는 기능을 지원하 는 소프트웨어나 하드웨어 인프라 메시지 큐(Message Queue : MQ) MOM을 구현한 시스템 브로커(Broker) Message Queue 시스템 AMQP(Advanced Message Queueing Protocol) 메시지 지향 미들웨어를 위한 프로토콜 나. 메시지큐잉의 필요성 필요성 설명 확장성 기능 별로 모듈을 분리하여 구성하기 때문에 확장에 용이 데이터의 영속성 데이터를 메모리 대신에 디스크에 저장하

공공데이터 표준화 지침 [내부링크]

문제 1) 공공기관의 데이터베이스 표준화지침에서 정의하는 테이블 정의서에 기록될 항목과 항목의 작성 지침에 대하여 설명하시오. 답) 공공기관 데이터베이스 표준화 지침의 개요 공공기관에서 생성 또는 취득하는 데이터에 대해 저장하는 데이터베이스의 표준화에 대한 사항 지침 전자정부법 제50조, 시행령 제59조 "공공데이터의 제공 및 이용활성화에 관한 법률"에 근거 2. 테이블 정의서에 기록될 항목 구분 기록될 항목 설명 테이블 객체 정보 물리 DB명 유일한 객체 값을 식별하기 위한 물리명 테이블 소유자 해당 테이블에 대한 소유자/부서 테이블 한글명 테이블 식별을 용이하게 하기 위한 논리명 테이블 유형 일반, 파티션, 클러스터, 뷰 등 유형 관련 엔티티명 현실에서의 엔티티, 구현 대상 엔티티 테이블 관리 정보 테이블 설명 테이블의 성격, 주제, 데이터 유형 등 설명 업무분류체계 정보기능분류체계에 따른 분류레벨 기재 보존기간 데이터의 보관 기간 테이블 볼륨 물리적 데이터 크기, 저장 건수 발

운영체제 메모리 관리 기법 [내부링크]

문제5) 운영체제 메모리 관리 기법 중 페이징 기법과 세그멘티이션 기법의 개념을 설명하고, 두 기법에 대하여 비교 설명하시오. 답) 운영체제 메모리 관리기법의 개요 물리적 메모리 한계를 극복하고 다수의 사용자에 의한 메인 메모리 공유를 위해 가상 메모리를 관리하는 기법 메모리 관리기법 중 할당정책에서 페이징기법과 세그멘테이션 기법이 사용 2. 페이지 기법과 세그멘테이션 기법의 개념 가. 고정할당 방식, 페이징 기법의 개념 정의 메모리(보조기억장치)를 고정된 작인 크기의 프레임으로 미리 나누어 주기억 장치에 사상 시키는 형식 구성도 구성요소 가상주소 가상페이지 번호와 페이지 오프셋으로 구성 VPN 가상 페이지 번호(Virtual Page Number) PPN 물리적 페이지 번호(Physical Page Number) 제어 부분 페이지에 대한 접근권한 필드와 페이지가 메모리에 존재하는지 나타내는 비트 나. 가변할당 방식, 세그멘테이션 기법의 개념 정의 블록의 크기가 다른 가변적인 크기로

오토 스케일링(Auto Scaling) [내부링크]

문제8) 오토 스케일링(Auto Scaling) 답) 오토 스케일링(Auto Scaling)의 정의 서버의 CPU, 메모리, 디스크, 네트워크 트래픽 등의 시스템 자원들의 메트릭(Metric)값을 모니터링 해 서버 사이즈를 자동으로 조절하는 기술 2. 오토 스케일링의 동작방식 상세설명 가. 오토 스케일링의 동작방식 및 메트릭 지표 메트릭 지표 CPU 사용률 used (%), 서버 그룹 내 서비스별 CPU들의 사용률 메트릭 지표 NW Packets 네트워크 in/out packet 및 bytes 메트릭 지표 Disk I/O 디스크의 read/write bytes와 Access 횟수 메트릭 지표 오토 스케일링은 6단계의 동작 절차를 통해 수행되며, 메트릭 지표 정의 기준 초과시 Alert 발생 나. 오토 스케일링의 동작 절차 및 주요 지표 구분 동작 절차 설명 모니터링 1. Metrics CPU 사용률, NW Packet, Disk I/O 등의 시스템 자원 정보 수집 2. Alert 발

메모리 인터리빙(Memory Interleaving) [내부링크]

문제 11) 메모리 인터리빙(Memory Interleaving) 답) 병렬 메모리 접근, 메모리 인터리빙(Memory Interleaving)의 개요 메모리 접근시간을 최소화하기 위해 메모리를 복수개의 모듈로 나누고 각 모듈에 연속적인 주소를 부여하여 동시에 접근이 가능하게 하는 기법 버스의 경합이나 기억장치의 충돌 회피를 위하여 기억장치를 여러 개의 독립적인 모듈들로 나누고 그 모듈들에서 동시에 엑세스 동작이 일어날 수 있도록 하는 기법 2. 메모리 인터리빙(Memory Interleaving)의 유형 유형 개념도 설명 상위 인터리빙 개념 : 일반적인 기억장치 주소지정 방식으로 기억장치 주소를 모듈들에 순차적으로 지정하는 방식 특징 - 상위 비트: 모듈 선택 신호로 사용 - 하위 비트: 모듈 내 기억장소 선택 장단점 - 장점: 한 모듈 에러 시 해당 모듈만 영향을 받음 - 단점: 동시 액세스를 통한 성능 향상이 어려움 하위 인터리빙 개념 : 기억장치 주소가 모듈 단위로 인터리빙

우선순위 역전(Priority Inversion) [내부링크]

문제2) Real Time Scheduling 이 갖는 문제 중 우선순위 역전(Priority Inversion)이 있다. Task1, Task2, Task3 순으로 우선순위가 낮다고 할 때 우선순위 역전을 사례기반으로 설명하고, 우선순위 역전을 해결하기 위한 2가지 기법에 대하여 설명하시오.(단 P,V 연산을 사용한다.) 답) 화상 탐사선 Path Finder 호의 치명적 오류, 우선순위 역전의 개요 정의 실시간 스케줄링 문제의 하나로 공유자원 동기화 시 높은 우선순위 프로세스가 낮은 우선순위 프로세스로 인하여 수행이 지연되는 현상 발생조건 선전 스케줄링 : 임계영역 상호배제위한 공유자원 동기화 문제(Mutex, Semaphore) 비선점 스케줄링 : 저순위 Task 가 먼저 도착하고 자원점유 2. 우선순위 역전 사례기반 설명 가. 우선순위 역전 설명 Task1 이 가장 높은 우선순위를 갖지만 Task3, Task2 보다 나중에 완료 나. 우선순위 역전 상세설명 순서 설명 ① 낮은

빅 엔디언(Big Endian)과 리틀 엔디언(Little Endian) / ① [내부링크]

문제 11) 빅 엔디언(Big Endian)과 리틀 엔디언(Little Endian) 답) 바이트의 저장 순서 결정 Byte Order, 빅 엔디언(Big Endian)과 리틀 엔디언(Little Endian)의 개요 빅 엔디언 (Big Endian) 데이터를 메모리에 적재 할 때, 메모리 시작 주소에 데이터의 상위 바이트부터 순차적으로 적제 하는 방식 리틀 엔디언 (Little Endian) 데이터를 메모리에 적재 할 때, 메모리 시작 주소에 데이터의 하위 바이트부터 순차적으로 적재 하는 방식 엔디언은 컴퓨터의 메모리와 같은 1차원의 공간에 여러 개의 연속된 대상을 배열하는 방법을 의미 2. 빅 엔디언(Big Endian)과 리틀 엔디언(Little Endian)의 상세 설명 가. 빅 엔디언의 상세 설명 개념도 구분 빅 엔디언(Big Endian) 대표회사 IBM 저장방식 낮은 주소에 Most Signficant Bit 저장 앞에서부터 Stack 에 Push 형 변환 Stack 내

스레싱(Thrashing) / ① [내부링크]

문제10) 스레싱(Thrashing) 답) 1. CPU 이용률 저하현상, 스레싱(Thrashing) 의 개요 운영체제의 CPU 사용률 검사, 페이지에 대한 지역성 이용, Hit Ratio 높이는 정책으로 페이지 부재 연속 발생하여 잦은 페이지 교환 등에 성능이 급격히 저하되는 현상이 발생 Locality 기반한 Working Set 과 Page Fault Frequency 를 조정, 예방관리 대응함 2. 스레싱의 개념 및 발생 원인 설명 가. 스레싱의 개념 개념 프로세스가 과도한 멀티프로그래밍과 지역성 부족으로 페이지 부재율이 증가하여 CPU가 정상 처리보다 잦은 페이지 교체 리소스 부족으로 성능이 저하 되는 현상 나. 스레싱 발생 원인 설명 원인구분 발생환경 현상설명 Locality 부족성 저용량 Memory 계속 페이지 부재 발생 성능 저하 저사양 CPU 부적절한 페이지 교체 정책 Locality 미고려 CPU 이용률 감소 새로운 프로세스의 추가 적재 페이지빈도 미고려 과도한 멀

Race Condition / ① [내부링크]

문제3) Race Condition 답) 일관성 위협, 공유자원 사용을 위한 프로세스간 경합, Race Condition 의 개요 가. Race Condition 의 개념 공유 자원에 대해 여러 개의 프로세스(스레드)가 동시에 접근을 시도할 때 접근의 타이밍이나 순소 등이 결과값에 영향을 줄 수 있는 상태 2. Race Condition 시나리오 및 제어 문제 가. Race Condition 시나리오 P1, P2 가 공유자원 접근 순서에 따라, 결과 값이 변경됨 나. Race Condition 제어 문제 Mutual Exclusion (상호배제) 두 개 이상의 프로세스가 공용 데이터에 동시에 접근하는 것을 막아야 한다. 다른 프로세스가 그 자원을 사용하지 못하면 문제를 피할 수 있다. Deadlock (교착상태) 상호배제를 시행하면, 추가적으로 발생하는 제어 문제, 프로세스가 각자 프고그램을 실행하기 위해 두 자원 모두에 엑세스 해야 한다고 가장할 때, 두 자원 모두를 필요로 하므로

IT 전시회 World Show [내부링크]

안녕하세요 아이티신비 입니다. 혁신과 연결, 디지털 세상의 모든 가능성 , 월드 IT쇼 를 소개하려고 합니다. 차세대 첨단 산업을 주도하는 대표 전시회 온라인 사전등록하면 무료입장이 가능하니 2024 월드 IT쇼 에서 차별화된 기술을 경험해 보시길 바랍니다. IT전시회 World IT Show 국내 최대 규모 IT전시회 4월 코엑스 개최 www.worlditshow.co.kr 공감과 댓글은 아이티신비에게 큰 힘이 됩니다. 블로그 글이 유용하다면 블로그를 구독해주세요.

오피니언 마이닝(Opinion Mining) [내부링크]

문제 11) 오피니언 마이닝마이닝(Opinion Mining) 답) 온라인 소셜 데이터 분석을 위한 오피니언 마이닝의 정의 웹콘텐츠의 텍스트에 나타난 사람들의 의견이나 성향 등의 주관적인 데이터를 분석하는 자연어 처리 기술 2. 감정분석을 위한 오피니언 마이닝 시스템 구성도 및 기술 요소 가. 오피니언 마이닝 시스템 구성도 웹크롤링, 머신러닝 분류기분류기, Word2Vec 등의 기술을 활용한 결과를 시각화 제공 나. 오피니언 마이닝 기술 요소 분류 기술요소 내용 추출/수집 Web Crawling 웹 텍스트 자동 수집 과정 용이 주관성 탐지 감성과 관련없는 부분 제외 Opinion Mining 알고리즘 ML분류기(나이브 베이지안, SVM), Word2Vec 단어 극성분석 단어들의 긍정적/부정적 표현 도출 Summary (시각화) 전처리 토큰화, 말뭉치(corpus) 주석, 세그먼테이션 Opinion 요약 텍스트 극성, 출현빈ㄴ도, 감성 및 관계 점수 오피니언 마이닝 기술 활용하여 기업

데이터 시각화(Data Visualization) [내부링크]

문제 2) 데이터 시각화(Data Visualization)와 관련하여 다음을 설명하시오. 가. 데이터 시각화의 개요 나. 데이터 시각화의 원리 및 절차 다. 데이터 시각화 유형 라. 효과적인 데이터 시각화를 위한 효율화 방안 답) 데이터 시각화의 개요 정의 정보의 목적에 부합하는 효과적인 전달을 위해 수집된 정보를 재조직하고, 시각화하여 정보전달효과를 극대화하는 프로세스 데이터 분석 결과를 한눈에 알아볼 수 있도록 데이터 시각화 원리 및 절차를 준수해야 함 2. 데이터 시각화의 원리 및 절차 가. 데이터 시각화의 원리 원칙 설명 Abstraction - Figuration 실제의 물체와 같은 것들일 수록 형상에 가깝고, 차트나 박스와 같이 단순화한 표현들은 추상에 가까움 Functionality - Decoration 장식에 집중하기보다 그 데이터자체의 표현에 집중하였는가, 꾸미는데 더 집중하였는가를 표현 Density - Lightness 자세히 살펴봄으로써 많은 데이터들을 얻을

군집분석(Cluster Analysis) / ① [내부링크]

문제 5) 군집분석(Cluster Analysis) 답) 개체집합 내 유사성 분석, 군집분석의 개요 가. 군집분석(Cluster Analysis)의 개념 개념도 정의 군집내 객체간 유사성과 군집간 상이성상이성(이질성이질성)을 규명하기 위해 관측치 또는 개체를 의미 있는 몇 개의 부분 집단으로 나누는 비지도 학습 기반의 분석기법분석기법 군집분석이란 비슷한 내용을 묶고 다른 내용과는 멀리하는 것 나. 군집분석(Cluster Analysis) 의 특징 탐색적 주어진 자료의 사전정보 없이 의미 있는 자료구조 탐색 데이터 거리가 정의된 다양한 형태의 데이터에 적용 가능 유사도 물리적 거리가 가까운 항목들은 동일 집단으로 묶임 비지도학습 기반으로기반으로, 유사도 측정을 통하여 군집을 형성함형성함 2. 군집분석(Cluster Analysis)의 거리 및 유사도 척도 가. 군집분석(Cluster Analysis)의 거리 척도 구분 측정 설명 유클라디안 거리 좌표상에서 데이터들 간의 직선거리를 의미

텐서플로(TensorFlow) / ① [내부링크]

문제 6) 텐서플로(TensorFlow) 답) 1.구글의 인공지능 플랫폼 라이브러리라이브러리, TensorFlow 개념 가. TensorFlow 정의 머신러닝 모델의 손쉬운 제작과 빌드 및 배포를 위해 구글에서 만든 엔드 투 엔드 오픈소스 플랫폼 나. TensorFlow 특징 직관적 API 케라스 , 파이썬파이썬, C++ API 이외 Backward Compatible 지원 이중 모드 CPU , GPU 모드별로 ML 연산과 단순작업 분할 TPU 텐서플로우 전용 최적화 칩셋 활용 2. TensorFlow Architecture 및 구성요소 가. TensorFlow Architecture (2.0 기준기준) 간소화된 API 기반으로 케라스케라스(Keras)와 에거엑스큐션에거엑스큐션(eager execution)을 활용한 모델 구축 나. TensorFlow 구성요소 항목 특징 기능설명 Tensor Int , String 동작 정의 그래프 모서리 일반 값 , 다양한 요소 값 Operatio

데이터 거버넌스(Data Governance) / ① [내부링크]

문제 4) 데이터 거버넌스(Data Governance) 답) 기업 데이터 관리 지침, 데이터 거버넌스(Data Governance)의 개요 정의 전사 차원의 모든 데이터에 대한 정책, 지침, 표준화, 전략을 수립하고 데이터를 관리하는 조직과 프로세스를 구축함으로써 고품질의 데이터를 활용하여 기업의가치 창출을 지원하는 체계 2. 데이터 거버넌스(Data Governance) 프레임워크(Framework)와 주요 기능 가. 데이터 거버넌스(Data Governance) 프레임워크(Framework)와 구성 요소 구성요소 설명 원칙(Principle) 데이터를 유지, 관리하기 위한 지침과 가이드 보안, 품질 기준, 변경 관리 조직(Organization) 데이터를 관리할 조직의 역할과 책임 데이터 관리자, 데이터베이스 관리자, 데이터 아키텍트 프로세스(Process) 데이터 관리를 위한 활동과 체계 작업 절차, 모니터링 활동, 특정 활동 나. 데이터 거버넌스(Data Governance

데이터 관리 / ② [내부링크]

문제 3) A기업에서는 비지니스 수행과정에서 수집된 많은 양의 빅데이터(Bigdata)를 통합 관리하고자 한 다. 데이터 관리에 대한 아래의 사항을 설명하시오. 가. 데이터 거버넌스(Data Governance)의 개념 및 주요 기능 나. 마스터 데이터(Master Data)의 개념과 필요성 다. 마스터 데이터 관리(Master Data Management)의 구성요소와 구축 시 고려사항 답) 데이터 거버넌스(Data Governance)의 개념 및 주요 기능 가. 데이터 거버넌스(Data Governance)의 개념 전사 차원의 모든 데이터에 대한 정책, 지침, 표준화, 전략을 수립하고 데이터를 관리하는 조직과 프로세스를 구축함으로써 고품질의 데이터를 활용하여 기업의 가치 창출을 지원하는 체계 데이터 품질 관리 (DQM) 데이터 프로파일링 및 데이터 정제와 같은 작업을 포함하여 데이터 사용방법에 따라 실행 메타 데이터 관리 데이터 검색 중 데이터를 찾고, 분석 도구가 빅데이터를 정

데이터 표준화 / ① [내부링크]

문제 11) 데이터 표준화의 필요성과 기대효과 답) 데이터 중심 경영의 핵심, 데이터 표준화의 개념 개념 시스템별 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 전사적으로 적용하는 활동 요소 데이터 명칭 기업 내에서 데이터를 유일하게 구별해주는 이름 데이터 정의 데이터가 의미하는 범위 및 자격 요건을 규정 데이터 형식 데이터 표현 형태의 정의를 통해 데이터 입력 오류와 통제 위험을 최소화 데이터 규칙 데이터 값을 사전에 정의함으로써 데이터 입력 오류와 통제 위험을 최소화 데이터의 정확한 의미를 파악할 수 있게 할 뿐만 아니라 데이터에 대한 상반된 시각을 조정하는 역할 수행 2. 데이터 표준화의 필요성 가. 데이터 표준화의 필요성 데이터 표준화 부재로 정보시스템 개발 및 운영상에서 데이터 의미 파악 어려움 증대 나. 데이터 표준화의 필요성 구분 필요성 설명 데이터 운영 데이터 불일치 정보시스템 개발 및 운영 과정상에서 동일한 의미의 데이터를 다

데이터 산업법 [내부링크]

문제 4) 최근 데이터 산업 발전을 위하여 "데이터 산업진흥 및 이용에 관한 촉진법"(약칭:데이터산업법)을 제정하였 다. 이 법의 목적 및 주요 내용과 기대효과에 대하여 설명하시오. 답) 데이터 산업의 육성, 데이터산업법의 개요 및 목적 가. 데이터 산업법의 개념 4차 산업혁명의 핵심인 데이터경제 전환에 적극 대응하고, 데이터의 생산, 유통, 활용을 촉진하기 위한 법제 데이터 산업발전 기반 조성 및 데이터 경제 활성화를 위한 ‘데이터 산업진흥 및 이용촉진에 관한 기본법’ 나. 데이터 산업법의 목적 데이터의 생산, 거래 및 활용 촉진에 관하여 필요한 사항을 정함으로써 데이터로부터 경제적 가치를 창출하고 데이터산업 발전의 기반을 조성하여 국민생활의 향상과 국민경제의 발전에 이바지함을 목적으로 한다 2. 데이터 산업법의 주요 내용 가. 데이터 산업법의 주요 내용 구분 주요내용 설명 산업 발전 관점 국가 전체의 데이터 컨트롤 타워 확립 국가 데이터 정책위원회 신설 신속한 의사 결정과 투자

옵티마이저(Optimizer) [내부링크]

문제 4) 데이터베이스 옵티마이저(Optimizer)에 대한 아래의 사항을 설명하시오. 가. 옵티마이저의 개념 나. RBO(Rule Based Optimizer)와 CBO(Cost Based Optimizer) 비교 다. 옵티마이저의 적용 시 고려사항 답) 옵티마이저(Optimizer)의 개념 가. 옵티마이저(Optimizer)의 정의 및 기능 구분 설명 정의 사용자가 질의한 SQL문을 처리 가능한 실행계획을 탐색하고 각 실행계획에 대한 비용을 추정하여 최적의 실행계획을 수립하는 DBMS의 핵심 엔진 핵심 기능 실행 계획 탐색 주어진 SQL 질의를 처리할 수 있는 실행 계획들을 나열(P1, .., Pn) 비용 산정 각 실행계획의 예상비용을 계산 많은 실행계획들 중에서 최종적으로 가장 비용이 적게 드는 실행계획 Pi를 선택해서 SQL을 실행하고 결과를 사용자에게 제공. 나. 옵티마이저(Optimizer)의 처리 절차 질의 처리 단계 핵심 기능 설명 Query Rewrite 질의 변환기

DA와 DBA [내부링크]

문제 5) DA(Data Architect)와 DBA(Database Administrator)의 역할을 비교하여 설명하시오. 답) 효율적인 데이터 관리를 위한 조직 구성 기업에서 효율적인 데이터 관리를 위해서는DA(Data Architect)와 DBA(Database Administrator), DW(Data Warehouse)로 구분하여 조직을 운영 2. 시스템 구축단계별 DA와 DBA의 역할 개념비교 DA 데이터 기반으로 정책, 표준화, 아키텍처, 설계 업무를 수행하는 자 데이터 관점에서 구축하려고 하는 업무를 사용자/현업 담당자와 협의 및 분석하여 개체(entity)와 속성(attribute) 추출 및 정의하는 담당자 DBA 개발에 필요한 DB를 설치하고, DA로 받은 논리분석(ERD) 결과를 기반으로물리적 테이블을 생성 및 SQL튜닝하는담당자 3. DA(Data Architect)와 DBA(Database Administrator)의 역할 상세비교 구분 DA(Data Arc

데이터 품질관리 지침 [내부링크]

문제 2) 데이터 품질관리 프레임워크, 데이터 관리, 데이터 구조관리, 데이터 관리프로세스에 대하여 설명하시오. 답) 데이터 품질관리 프레임워크 설명 정의 데이터 품질관리의 대상이 되는 구성요소와 요소들 간의 관계를 정의한 데이터 품질관리의 기본 개념틀 관리 목적 데이터 품질관리 요소는 크게 데이터 값(data value), 데이터 구조(data hierarchy), 데이터 관리 프로세스(data management process)로 구분 각 요소들은 상호 연계되어 정보시스템의 데이터 품질에 영향을 주고 있으므로 통합적이고 체계적인 관리 노력이 필요 프레임워크 데이터 품질관리 프레임워크는 관리 대상과 관리 조직을 기본축으로 한다. 2. 데이터 관리 관리항목 세부항목 설명 표준 데이터 정의 정보시스템에서 사용하는 용어, 도메인, 코드 및 기타 데이터 관련 요소에 대해 공통된 형식과 내용으로 정의하여 사용하는 표준 관련 데이터 관리목적 정보시스템의 데이터 품질 확보를 위한 필수 요소로,

빅데이터분석도구를 선택하는 원칙 / ① [내부링크]

문제 5) 빅데이터 분석도구를 선택하는 원칙 답) 1. 데이터활용 명확한 정보제공, 빅데이터 분석도구의 정의 대량의 데이터들의 분석을 통해 가치있고 활용성이 높은 정보를 얻을 수 있도록 도와주는 도구 2. 빅데이터 분석도구를 선택하는 원칙 설명 가. 조직관점 종합적 선택 원칙 원칙 세부항목 설명 품질 기능성 빅데이터의 처리 분석 시각화 기능 성능 다양한 유형 방대한 양의 데이터 처리 속도 보안성 데이터 침해 프리이버시 침해 사용성 학습성 Learning Cost 측정 편의성 사용자인터페이스 모델링 용이성 목표달성도 다양한 모델 구축 가능여부 벤더 벤더 명성 벤더의 업력 자본금 재무상태 등 컨설팅 능력 최근 구축 사이트 레퍼런스 유지관리 유지관리서비스 등급별 비용 E o S 기간 고려 결과물 이해성 결과물에 대한 직관적 이해 가능여부 시각화 시각화 표현의 다양성 표 그래프 등 지원 리포트관리 자동 레포팅 저장 검색의 용이성 각 항목별 5 점 척도 활용하여 전문가 평가 실시 후 선택 나

인공지능 학습용 데이터 [내부링크]

문제 6) 디지털 뉴딜 데이터 댐 의 핵심인 인공지능 학습용 빅데이터 구축 사업의 성공적 추진을 위한 정책과 데이 터 품질에 대한 관심도가 높아지고 있다 . 다음의 내용을 설명하시오 가. 인공지능 학습용 데이터의 특성 나. 데이터 획득·정제 방법과 기준 다. 데이터 라벨링 (Data Labeling) 및 어노테이션 (Annotation) 방식 답) 인공지능 학습용 데이터의 특징 구분 설명 정의 머신러닝 , 딥러닝 등 AI 모델 학습을 위해 활용되는 데이터를 총칭 지도학습에 활용되는 라벨링 된 데이터 구성 원천(원본 ) 데이터 원시데이터를 라벨링 공정에 투입하기 위해 필요한 전처리 등 정제 작업을 수행 한 데이터로 라벨링데이터가 부여되지 않은 상태의 데이터 라벨링 데이터 원천데이터에 부여한 참값 ’, 파일형식이나 해상도 등의 속성 , 그리고설명이나 주석 등이 포함된 어노테이션 의 집합 특성 데이터 파일 단위로 관리 크게 텍스트 , 음성 , 이미지 , 동영상 등 주로 비정형데이터가 다수

데이터 거버넌스 [내부링크]

문제 1) 코로나-19(Covid-19)로 인한 언택트 시대의 데이터 주권 이슈와 데이터 거버넌스 전략 방향에 대하여 설명하시오. 답) 코로나-19 시대 데이터 주권 확립을 위한 데이터 거버넌스 전략의 필요성 필요성 코로나19의 영향이 장기화되면서 언택트 문화가 일상화 되고 있고 데이터 자원의 폭발적 증가를 의미하며 데이터 확보를 위한 데이터 주권 확보 차원으로 진화되고 있고 확립 차원에서 데이터 거버넌스 전략이 필요 데이터 주권이란 데이터가 수집된 국가 내의 법률 및 거버넌스 구조에 종속되는 것으로 언택트 시대에 이슈로 부각 되는 중 2. 코로나-19로 인한 언택트 시대의 데이터 주권 이슈 이슈 설명 데이터 이동 국경간 데이터 이동과 글로벌 데이터 기업의 조세 형평성 등 데이터를 매개로 한 국가간 무역 분쟁으로 ‘데이터 민족주의(Data Nationalism)’을 촉발 디지털세 기존 법인세 체계에 디지털 비즈니스 모델이 적용될 수 있도록 ‘주요 디지털 사업장(signifcant d

웹 크롤링(Web Crawling) [내부링크]

문제1) 웹 크롤링(Web Crawling)에 대하여 설명하시오. 답) 웹 컨텐츠 수집 자동화, 웹크롤링의 개요 가. 웹크롤링(Web Crawling)의 개념 웹 크롤링 흐름도 웹 크롤링의 개념 웹 크롤러를 이용해 월드 와이드 웹을 탐색하여 원하는 정보를 얻어 내거나 기억시킨 동작을 하는 컴퓨터 프로그램 웹 페이지 크롤링을 통해 직접 접근해 정보를 빠르게 수집하거나 자동 이메일 수집 또는 웹 유지관리를 위해 사용 모든 URL을 탐색하여 우선순위별로 다운로드를 반복수행하고, DB에 저장 후 크롤링 종료 나. 웹 크롤링(Web Crawling)의 동작원리 동작원리 설명 HTML 파싱 HTML 페이지를 가져와서, HTML/CSS등을 파싱하고, 데이터 추출 Open API 호출 Open API(Rest API)를 제공하는 서비스를 활용하여 데이터 추출 웹 크롤러 활용 Selenium 등 도구를 활용, 브라우저를 직접 조작하여 데이터 추출 웹크롤러를 활용하여 자동으로 웹 데이터를 추출하는 것

MongoDB / ① [내부링크]

문제 8) MongoDB의 개념 및 특징 답) Document 기반 NoSQL, MongoDB의 개념 정의 프로덕션 환경에서 데이터베이스를 확장할 수 있는 기능을 제공하는, C++로 작성된 Document 지향의NoSQL 데이터베이스 관리 시스템 2. MongoDB의 특징 및 구성방식 가. MongoDB의 특징 특징 설명 Document-oriented MongoDB는 JSON형태로 데이터를 관리 도큐먼트는 MongoDB가 데이터를 저장하는 최소 단위 유연한 스키마 스키마의 선언 없이 필드의 추가와 삭제가 자유로운 Schema-less 구조 비 관계형 데이터베이스 관계(Relationship) 개념이 없는 비 관계형 데이터베이스 조인(Join)을 지원하지 않으며, 대신 임베디드 방식의 도큐먼트 구조를 사용하거나 레퍼런스 방식의 도큐먼트 구조를 사용한 후 애플리케이션에서 조인 비 트랜잭션 트랜잭션을 지원하지 않고 각각의 도큐먼트 단위로 처리됩니다. 트랜잭션을 지원하지 않으므로 Comm

공간DB [내부링크]

문제 3) 공간 DB에서 사용되는 공간 연산자(Spatial Operator)를 5개 나열하고 설명하시오. 답) 공간 DB(Spatial DB) 개념 문자와 숫자 등으로 표현되는 비공간 데이터와 공간 객체의 좌표값으로 표현되는 공간데이터의 집합 공간 DB 에서 사용되는 연산자는 크게 공간 관계 함수와 공간 분석 함수로 구분 2. 공간적 관계의 결과 확인, 공간 관계 연산자 상세 설명 가. 공간 관계 연산자 연관도 공간 관계 함수는 공간 객체들의 기하학적 공간 관계를 Boolean 형식으로 결과를 반환 나. 공간 관계 연산자 상세설명 공간관계 연산자 설명 Equals(g1, g2) g1과 g2가 동일하면 True 반환, 상이하면 False 반환 Disjoint(g1, g2) g1과 g2가 겹치는 곳이 없으면 True 반환, 아니면 False 반환 Within(g1, g2) g1과 g2가 영역 안에 포함되면 True 반환, 아니면 False 반환 Overlaps(g1, g2) g1과 g

Column Family 데이터베이스 / ① [내부링크]

문제 11) Column Family 데이터베이스 답) Row 단위 저장소, Column Family 데이터베이스의 개념 Key-Value Store 방식의 단점을 극복하기 위해, 하나의 Key에 여러 개의 Column을 저장하고, Column Value 조합으로 구성된 데이터베이스 2. Column Family 데이터베이스의 구성도 및 구성요소/유형 가. Column Family 데이터베이스의 구성도 Row Key와 관련된 많은 열이 있는 행으로 Column Family에 데이터를 저장 나. Column Family 데이터베이스의 구성요소 및 유형 구분 구성 및 유형 설명 구성요소 Column Family Column들을 물리적으로 배치, 각각의 Row들은 같은 Column Family들을 가짐 Row Row Key와 하나 또는 여러 개의 Column들로 구성 Row Key를 이용해 문자 정렬 Row Key Row 식별자, Row Key값 수으로 정렬됨, 검색시 사용되는 기본 키

데이터베이스 튜닝 [내부링크]

문제 3) 데이터 용량이 증가할수록 데이터베이스 튜닝(Tuning)의 필요성이 증가하고 있다. 데이터베이스 튜닝 에 대한 아래의 사항을 설명하시오. 가. 데이터베이스 튜닝의 개념과 목적 나. 데이터베이스 설계 단계 튜닝 기법 다. 힌트(Hint)의 유형 답) 데이터베이스 튜닝의 개념과 목적 가. 데이터베이스 튜닝의 개념 데이터베이스의 응용, 데이터베이스 자체, 운영체제의 조정 등을 통해 최적의 자원으로 최적의 성능을 얻을 수 있도록 개선하는 작업 나. 데이터베이스 튜닝의 목적 업무적인 환경과 시스템적 환경에 적합한 데이터베이스 파라미터를 설정 데이터베이스에 접근하는 SQL 문장을 가능한 한 디스크 블록에 최소로 접근하도록 함 디스크 블록에서 한번 읽어오는 데이터는 가능하면 메모리 영역에 보관 모든 사용자의 SQL 문장은 공유 가능하도록 명명 표준을 준수하여 작성 잠금(Lock) 발생이 최소가 되도록 함 2. 데이터베이스 설계 단계 튜닝 기법 구분 설명 반정규화 데이터 정합성 유지 수

CAP이론의 한계와 PACELC 이론 / ① [내부링크]

문제 7) CAP 이론의 한계와 PACELC( Partition Availability Consistency Else Latency Consistency ) 이론 답) CAP 이론의 개념 및 한계 CAP 이론 개념 어떠한 분산 시스템도 일관성일관성(Consistency), 가용성가용성(Availability) 그리고 분할내성분할내성(생존성생존성, Partition tolerance) 중에 3가지를 만족시킬 수 없다는 이론 CAP 이론의 한계점을 보완하기 위해 PACELC 이론을 사용하여 네트워크 장애상황 및 정상상황을 나누어 설명 2. PACELC 이론 개념 및 구성요소 가. PACELC 이론 개념 개념도 개념 CAP 이론을 보완하여 , 네트워크가 장애일때와 정상일때를 나누어 중시해야할 품질속성을 정의한 이론 P( 네트워크 파티션 상황에서 A( 가용성 과 C( 일관성 의 상충 관계와 E(else, 정상 상황에서 L( 지연 시간 과 C( 일관성 의 상충 관계를 설명 나. PACELC

다차원 색인구조(Multidimensional Index Structure) / ① [내부링크]

문제 9) 다차원 색인구조(Multidimensional Index Structure) 3가지 답) 다차원 색인 구조의 정의 이미지나 멀티미디어 데이터와 같은 비정형 데이터의 효율적 검색을 위해 여러개의 필드(애트리뷰트)를 동시에 키로 사용한 색인구조 2. 다차원 색인구조 3가지 구조 가. 다차원 색인 구조 유형 유형 개념도 설명 PAM (Point Access Method) 다차원의 점(Point) 데이터 저장 및 검색 SAM (Spatial Access Method) 선, 면 등과 같은 크기를 갖는 다차원 데이터를 저장 및 검색 나. 다차원 색인 3가지 구조 유형 색인구조 설명 PAM k-d 트리 Binary Search Tree를 다차원 공간으로 Straightforward하게 확장한 것 기본 구조와 알고리즘은 Binary Search Tree와 유사 k-d-b 트리 B-트리와 k-d 트리의 결합 Grid File 전체 공간을 하나 이상의 격자(grid)로 분할 QuadTree

데이터 품질관리 [내부링크]

문제 3) 데이터 품질관리에 대하여 다음을 설명하시오. 가. 데이터 품질관리 아키텍처 나. 데이터 품질관리 성숙도 다. 정형 데이터 및 비정형 데이터 품질기준 라. 데이터 품질관리 전략 답) 데이터 품질관리 아키텍처 가. 데이터 품질관리 아키텍처의 정의 데이터의 품질을 확보하기 위한 품질 목표 설정, 품질 진단 및 개선 등 일련의 활동과 이를 지원하기 위한 모든 기술 나. 데이터 품질관리 아키텍처의 개념도 데이터 품질을 확보하기 위해 DQM3 및 데이터 거버넌스 적용 필요 2. 데이터 품질관리 성숙도 가. 데이터 품질관리 성숙도 모델의 개념 데이터 품질관리 수준을 진단하고 개선 과제 및 방안을 단계적, 체계적으로 제시하기 위해 개발된 데이터 품질관리 프로세스의 성숙도 모델 데이터 품질기준 정확성, 일관성, 유용성, 접근성, 적시성, 보안성 데이터 품질관리 프로세스 요구사항관리, 데이터구조관리, 데이터흐름관리, 데이터베이스 관리, 데 이터 활용 관리, 데이터표준관리, 데이터 오너십 관

샤딩(Sharding) [내부링크]

문제 3) 데이터베이스 샤딩(Sharding)에 대한 아래의 사항을 설명하시오. 가. 샤딩의 개념 및 분할방법 나. 샤딩과 파티셔닝(Partitioning)의 차이점 다. 샤딩 적용 시 고려사항 답) 샤딩(Sharding)의 개념 및 분할방법 가. 샤당의 개념 DBMS 레벨에서 데이터를 나누는 것이 아니고 물리적으로 다른 데이터베이스에 데이터를 샤드(Shard)라고 부르는 각각의 개별 파티션으로 수평 분할 방식으로 분산 저장하고 조회하는 방법 나. 샤당의 분할방법 방법 설명 사례/특징 Vertical Partitioning 테이블 별로 서버를 분할하는 방식 구현 간단. 전체 시스템에 큰 변화 필요 없음. 각 서버 데이터 거대해지면 추가 샤딩 필요 사용자 프로필정보용 서버, 사용자 친구리스트용 서버, 사용자가 만든 콘텐츠용 서버 등으로 분할하는 방식 Range based Partitioning 하나의 feature나 table이 점점 거대해지는 경우 서버를 분리하는 방식 데이터를 분할

트랜잭션 / ① [내부링크]

문제6) 데이터베이스 트랜잭션(Transaction)의 특징 답) 데이터베이스 처리 논리적 작업단위, 트랜잭션의 개요 데이터의 정확한 일관성과 무결성을 보장하기 위해 완전히 종료해야 하는 데이터베이스 처리의 논리적 작업 단위(Logical Unit of Work) 2. 데이터베이스 트랜잭션 특징 특징 개념도 설명 구현기법 원자성(Atomicity) 하나의 트랜잭션의 모든 연산이 데이터베이스에 반영되거나 전형 반영되지 않아야 함(All or Nothing) Commit Rollback 일관성(Consistency) 일관된 상태의 데이터베이스에 서 하나의 트랜잭션 정확히 수행 시 또다른 일관된 상태 유지 도메인 무결성 릴레이션 무결성 고립성(Isolation) 하나의 트랜잭션이 왼료되기 전 까지는 갱신 중인 데이터에 다른 트랜잭션이 접근하지 못하도록 제 한 SQL-92isolation level 영속성(Durability) 하나의 트랜잭션이 완료된 이후 에는 장애가 발생해도 갱신한 데

데이터베이스 병행 제어 기법 [내부링크]

문제2) 데이터베이스 병행 제어 기법 및 필요성 답) DB일관성을 위한 동시성 제어의 정의 및 필요성 정의 다수의 트랜잭션이 동일한 데이터에 동시에 접근하려고 할 때, 각 트랜잭션이 독립적으로 수행된 결과를 보장하는 기법 필요성 트랜잭션 처리 결과의 직렬성 보장, 동시 실행 트랜잭션 수를 최대화, 데이터 무결성 보장 병행 작업에 의해 발생할 수 있는 데이터 베이스의 비 일관성 방지 갱신손실 한 트랜잭션의 갱신을 다른 트랜잭션이 덮어써 갱신 무효화 현황파악오류 읽기 작업 트랜잭션이 쓰기 작업 트랜잭션의 중간 데이터를 읽어 일관성 손실 모순성 한 트랜잭션이 여러 데이터를 갱신하는 동안 다른 트랜잭션이 어떤 것은 갱신 전 값을 읽고 어떤 것은 갱신 후 값을 읽어 불일치 발생 연쇄복귀 한 트랜잭션이 Rollback 연산을 수행하는 도중 다른 트랜잭션 Rollback 될 데이터를 읽어 발생하는 오류 2. 데이터베이스 동시성 제어 기법 기법 설명항목 상세설명 Timestamp 정의 트랜잭션 순

정규화 [내부링크]

문제2) 데이터베이스에서 정규화는 이상현상(Anomaly)이 있는 릴레이션(Relation)을 해결하기 위한 방법이 다. 다음의 <수강테이블>을 활용하여 설명하시오. 가. 이상현상 3가지와 발생 이유 나. 해결방안 다. 테이블 재구성 답) 수강테이블에서 이상현상 3가지와 발생 이유 가. 수강테이블에서 이상현상 3가지 삽입이상 학번 입력 시 학과, 지도교수, 수강코드를 재 입력해야 함 삭제이상 수강코드 삭제 시 학번, 학과, 지도교수 같이 삭제 갱신이상 일부 학번의 학과 수정 시 다른 컬럼의 학과도 함께 수정해야 함 나. 이상현상 발생 이유 2차 정규화 이전 : 부분함수 종속성 존재 3차 정규화 이전 : 이행함수 종속성 존재 2. 수강테이블 이상현상 해결방안 2차 정규화 3차 정규화 3. 수강테이블 재구성 공감과 댓글은 아이티신비에게 큰 힘이 됩니다. 블로그 글이 유용하다면 블로그를 구독해주세요.

병행제어(Concurrency Control) [내부링크]

문제5) 데이터베이스의 병행제어(Concurrency Control)에 대하여 다음을 설명하시오. 가. 병행제어의 정의 나. 병행제어의 기법의 종류 다. 병행제어의 문제점 답) 데이터베이스의 일관성 확보, 병행제어의 개념 정의 다중 사용자 환경을 지원하는 데이터베이스 시스템에서 여러 트랜잭션들이 성공적으로 동시에 실행될 수 있도록 지원하는 기능 목적 데이터베이스의 무결성 및 일관성 보장 트랜잭션 직렬화를 통한 처리량 극대화 병렬 처리로 사용자 응답시간 최소화 2. 병행제어의 기법의 종류 단계 개념도 설명 Locking 특정 트랜잭션이 데이터 항목에 대하여 잠금(Lock)을 설정하면, 잠금을 설정한 트랜잭션이 해제(Unlock)할 때까지 데이터를 독점적으로 사용할 수 있는 것 (Shared Lock, Exclusive Lock 구성) 2PL(2단계 Locking) 모든 트랜잭션들이 Lock과 Unlock 연산을 확장단계와 수축 단계로 구분하여, 상호배제 원리를 이용한 트랜잭션간의 직렬

정규화, 역정규화 / ① [내부링크]

문제 6) 관계형 데이터베이스의 정규화와 역정규화 답) 관계형 데이터베이스의 정규화와 역정규화 개요 관계형 데이터베이스 모델링 수행 시 데이터의 이상현상을 제거하고 성능향상을 위해 사용되는 기법 2. 관계형 데이터베이스의 정규화와 역정규화 상세 설명 가. 정규화(Nomalization) 설명 구분 설명 원칙 정보의 무손실, 데이터 중복성 감소, 분리의 원칙 유형 1정규화 복수의 속성값을 갖는 속성 분리 2정규화 주식별자에 종속적이지 않은 속성 분리(부분함수종속 제거) 3정규화 속성에 종속적인 속성 분리(이행함수종속 분리) BCNF 다수의 주식별자 분리 4정규화 다가 종속(Multi-Valued Dependency) 속성 분리 5정규화 결합 종속(Join Dependency) 일 경우 두 개 이상의 N개로 분리 6정규화 Join 종속이 후보키를 통해서만 성립 (모든 원소들이 후보키를 포함한 Relation) 빈번한 Join 으로 성능이 저하되어 일정 부분 중복을 허용하는 반정규화 수행

데이터베이스 제5정규형 / ① [내부링크]

문제 8) 데이터베이스 제5정규형 답) 후보키 통하지 않는 조인 종속(Join Dependency) 제거. 제5정규형의 개요 가. 데이터베이스 제5정규형의 정의 결합종속(JD: Join Dependency)이 있을 경우, N개의(2개 이상) 테이블(Entity)로 분리하는 정규화 기법 나. 정규화의 기본 원칙 정보의 무손실 분리된 관계를 표현한 정보는 분리 전 정보를 모두 포함하며, 더 바람직한 구조를 소유 데이터 중복 감소 중복으로 인한 이상 현상 제거 분리의 원칙 독립된 관계성은 하나의 독립된 관계로 분리하여 표현 2. 데이터베이스 제5정규형의 개념도와 이상 현상 가. 데이터베이스 제5정규형의 개념도 나. 데이터베이스 제5정규형의 이상현상 이상현상 개념도 설명 삽입 이상 릴레이션 SPC’에서 (S2,P1,C1)의 삽입 시 (S1,P1,C1)의 삽입 필요 역은 미 성립 삭제 이상 릴레이션 SPC에서 (S1,P1,C1)의 삭제 시 다른 투플 중 어느 하나를 함께 삭제 (S2,P1,C

스타 스키마(Star Schema) / ① [내부링크]

문제 13) 스타 스키마(Star Schema) 답) DW 설계를 위한 스타 스키마의 개념 스타 스키마 개념도 스타 스키마의 개념 다차원 의사결정 지원 데이터를 관계형 데이터베이스로 전환하는데 사용되는 데이터 모델링 기법 정규화된 Fact Table을 중심으로 비정규화된 Dimension Table들이 배치되는 형태의 모델링 기법 2. DW 설계를 위한 스타 스키마의 개념 가. 스타 스키마의 구성요소 구성요소 설명 사실(Facts) 중심테이블로서 관련성이 높은 Measure들의 집합집합 차원(Dimensions) 각 Fact를 분석하는 하나의 관점 속성(Attribute) 각 차원 테이블이 가지고 있는 속성 속성계층(Hierarchies) 차원 내 정의된 속성들 간에 존재하는 계층 관계 나. 스타 스키마의 구조 개념 설명 개념 Fact 테이블과 Dimension 테이블로 데이터를 분리하여 설계한 모델 특징 장점: 이해하기 쉽고쉽고, 계층구조 정의가 용이하고용이하고, 물리적인 조인수가

데이터 모델링 [내부링크]

문제 5) 아래 조건으로 학생과 수강신청서 간의 관계에 대하여 다음을 작성하시오 개체(Entity) 속성(Attribute) 학생 학번, 성명, 전화번호 수강신청서 신청번호, 과목명, 교수명, 학점 학생과 수강신청서는 일 대 다의 관계이다관계이다. 즉즉, 한 사람의 학생이 다수의 수강신청을 할 수 있고있고, 수강신청서 1개는 특정학생의 수강신청서로 되어 있다 가. ERD(Entity Relationship Diagram) 나. 관계형 데이터 모델모델(Relational Data Model) 답) 현실세계 업무를 데이터 모델로 표현표현, 데이터 모델링 개요 현실세계의 업무 프로세스를 추상화하여 데이터베이스의 데이터로 표현하기 위한 설계과정 학생과 수강신청서간의 관계를 모델링하기 위해위해, ERD, 관계형 데이터 모델로 작성 2. 주어진 문제의 ERD(Entity Relationship Diagram)작성 개체(Entity) 속성(Attribute) 학생 학번, 성명, 전화번호 수강신청

NoSQL [내부링크]

웹 2.0 시대의 대용량 비정형 데이터 처리, NoSQL 의 개요 데이터의 변화 NoSQL 의 정의 ACID 를 우선으로 하는 관계형 데이터베이스의 한계를 벗어나, Web2.0 의 비정형 초고용량 데이터 처리를 위해 데이터의 읽기 보다 쓰기에 중점을 둔 데이터베이스 비정형 데이터 저장을 위한 BASE 특성을 가지며 CAP 분산 컴퓨팅 이론을 따름 2. NoSQL 의 아키텍처 및 데이터 모델 종류 가. NoSQL 의 아키텍처 분산 병렬 처리에 적합한 확장성을 제공 나. NoSQL 의 데이터 모델 종류 데이터모델 개념도 핵심설명 대표DB Key/Value Store Unique한 Key에 하나의 Value를 가지고 Key 기반의get, put, delete 기능제공 Put(Key, Value), Value :=get(Key) 형태의 API로 접근 빠른 처리가 가능 Redis DynamoDB Memcache Column Family Store 한 key에 한 value만을 두는 단점을 극

데이터 무결성 vs 정합성 [내부링크]

문제5) 소데이터 통합 및 마이그레이션 프로젝트에서 데이터 무결성 목표를 달성하기 위해서는 데이터들의 정합성 을 확보하고 신뢰도를 높이는 일이 매우 중요하다. 다음의 내용을 설명하시오. 가. 데이터 무결성(Integrity)과 정합성(Consistency)의 차이 나. 데이터 값(Value) 진단 프로파일링(Data Profiling)의 중점 분석 관점 다. 데이터 마이그레이션 검증 테스트 방법 답) 데이터 통합 프로젝트 달성 위한, 데이터 무결성 필요성 데이터 통합 및 마이그레이션 프로젝트 성공위해 데이터 무결성 확보가 필요함 2. 데이터 무결성과 정합성의 차이 및 데이터 값 진단 프로파일링의 중점 분석 관점 설명 가. 데이터 무결성과 정합성의 차이 구분 무결성 정합성 개념 데이터 값이 정확한 상태 데이터의 올바른 유무와 상관없이 데이터들의 값이 서로 일치하는 상태 차이점 어떤 데이터는 정합성은 이상이 없으나, 무결성이 훼손 (중복 데이터가 다 틀린 값으로 정합성은 맞으나, 무결성