Architecting Modern Data Platforms 13

13장 데이터 백업과 재해복구

고가용성을 고려했다 하더라도 서비스의 응답성 유지만으로 발생하지 않는 다른 문제에 대비하기 위해 데이터 백업과 재해복구 대책을 미리 수립해야 한다.

컨텍스트

다양한 분산 시스템
정책과 목표
장애 시나리오
  • 노드의 심각한 상태 저하
  • 노드의 부분적 장애
  • 노드 장애
  • 네트워크 파티셔닝
  • 데이터센터 장애
  • 사용자로 인한 장애
적합한 데이터 원본
전략
복제
스냅샷
백업
랙 인식 및 고가용성
데이터 타입
  • 데이터
  • 메타데이터
  • 일시적인 데이터
일관성
검증
요약

데이터 복제

HBase
클러스터 관리 도구
카프카
요약

하둡 클러스터 백업

데이터베이스
서브 시스템
클라우데라 매니저
아파치 앰버리
HDFS
하이브 메타데이터
HBase
우지
아파치 센트리
아파치 레인저
사례 연구: 우지를 이용한 자동 백업
개요
하위 플로우: HDFS
하위 플로우: HBase
하위 플로우: 데이터베이스
백업 플로우

복구

  • 전체 다시 빌드
  • 부분 다시 빌드
  • 장애 복구