[Elasticsearch] 장애 발생 시 대응, 자주 발생하는 장애 유형

빠른 기본 상황 파악 먼저 cerebro, kibana 모니터링 도구에서 지표 확인 모든 노드가 클러스터에 붙어 있는지, 미할당 샤드가 생겼는지 확인하는 게 중요함 GET _cat/health를 통해 red, yellow 상태 돌입 여부, 미할당 샤드 수, 클러스터에 있는 노드 수 확인 GET _cat/nodes를 통해 마스터 노드 확인, 평균 부하, 힙 사용량, 메모리 사용량, CPU 사용량 확인 GET _nodes/stats의 fs 항목에서 디스크 사용량 확인 샤드 할당 비활성화 _cat/health나 _cat/nodes의 수행 결과, 클러스터에 있어야 할 노드 수보다 적게 노드가 있으면 바로 샤드 할당이 끄는 것이 중요함 Node 하나가 Cluster에서 빠지면 그 노드가 들고 있던 샤드의 수만큼 replica 샤드의 수도 줄어든다. 그러면 elasticsearch는 number_of_replicas를 맞추기 위해 새 복제본을 할당하고 복사하는 작업 수행 장애 상황인데 이 작업...

#elasticsearch #엘라스틱서치 #장애

원문링크 : [Elasticsearch] 장애 발생 시 대응, 자주 발생하는 장애 유형