샤드 분산 처리 시스템인 엘라스틱 서치는 여러 대의 노드를 효율적으로 활용하기 위해 데이터를 샤드라는 단위로 나눠서 분산 저장함 데이터를 분산 저장하면 클러스터의 수평적인 확장이 가능하고 작업을 분산 처리해 성능과 처리량을 높일 수 있다. 인덱스는 가상의 논리적 단위 document 인덱싱과 검색은 샤드에서 일어난다. 인덱싱을 할 때 코디네이터 노드, 최초 요청을 수신한 노드는 문서에 별도의 ID가 주어지지 않는다면 랜덤 ID 생성 _routing 파라미터가 명시되지 않았다면 ID를 이용해 document가 인덱싱될 샤드를 결정한다. shard = hash(_routing) % 프라이머리 샤드 개수 샤드 선택 공식 document가 어떤 샤드에 저장되는 지 결정하는 것을 라우팅 프라이머리 샤드와 레플리카 샤드 데이터 원본을 프라이머리 샤드에 저장하고 유실 방지하고 가용성 확보하기 위한 데이터 복제본, 레플리카 샤드를 만들어서 사용함 인덱스 설정에서 프라이머리 샤드 개수와 레플리카 샤...
#레플리카샤드
#샤드
#세그먼트
#엘라스틱서치
#인덱스
#재할당
#프라이머리샤드
원문링크 : [ElasticStack] 샤드, 프라이머리 샤드, 레플리카 샤드