HDInsight HBase의 마이그레이션 및 고가용성 전략 결정

완료됨

고객이 자주 직면하게 되는 과제는 클러스터 업그레이드 중에 온-프레미스에서 또는 버전 간에 HBase 클러스터를 마이그레이션하는 것입니다. HDInsight HBase는 마이그레이션, 업그레이드 및 데이터 손실 방지를 위해 아래 옵션을 제공합니다.

hbase 폴더 복사

/hbase 폴더를 복사하는 전략은 일반적으로 주기적인 백업 또는 마이그레이션에 사용됩니다. HDInsight HBase는 /hbase 폴더의 디스크에 플러시된 모든 데이터 및 메타데이터 파일을 저장합니다.

참고

이 프로세스에서는 클러스터 간 실시간 복제를 제공하지 않으며 특정 테이블을 마이그레이션하는 세분성도 제공하지 않습니다.

아래 단계를 순서대로 실행하여 HDInsight 클러스터를 백업/마이그레이션합니다. HDInsight /hbase는 wasbs://<containername>@<accountname>.blob.core.windows.net/hbase에 저장됩니다.

  1. 원본 클러스터에서/hbase 폴더가 있는 경로를 파악합니다.
  2. 원본 클러스터에 대한 모든 쓰기를 중지하고 디스크에 대해 플러시를 강제로 실행하여 메모리에 아무것도 없도록 합니다.
  3. Blob Storage의 경우 AzCopy를 사용하고 Azure Data Lake Storage의 경우 AdlCopy를 사용하여 /hbase의 데이터를 대상 Azure Storage에 복사합니다.
  4. DR 시나리오용인 경우 데이터는 재해 발생 시 나중에 사용할 수 있도록 주기적으로 다른 지역에 저장할 수 있습니다.
  5. HBase 마이그레이션용인 경우 데이터는 새로 생성된 HDInsight HBase 클러스터의 /hbase 폴더에 복사할 수 있습니다.

HBase hbase 폴더 복사 프로세스에 대한 자세한 내용은 HDInsight hbase 폴더 복사 설명서에 있습니다.

내보내기 및 가져오기

내보내기 및 가져오기를 사용하면 백업 프로세스를 보다 효율적으로 제어할 수 있으므로 전체 폴더 대신 특정 테이블을 백업하도록 선택할 수 있습니다. 이 프로세스에서는 HBase 클러스터의 내보내기 유틸리티를 사용하여 선택한 테이블을 클러스터에 연결된 로컬 스토리지로 내보냅니다. 테이블을 내보낸 후 대상 클러스터에서 가져올 수 있습니다. 내보내기 및 가져오기 작업에 대한 자세한 내용은 HDInsight HBase 내보내기 및 가져오기 설명서에 있습니다.

테이블 복사

테이블 복사는 효율적인 복사 메커니즘입니다. 테이블 복사를 통해 전체 또는 부분 테이블 복사 프로세스를 세부적으로 제어할 수 있으며 HBase 읽기 및 쓰기 경로를 사용하여 테이블의 일부 또는 전체를 행 단위로 원본에서 대상으로 복사합니다. 원본과 대상 클러스터는 같은 클러스터일 수도 있고 다른 클러스터일 수도 있습니다. 테이블 복사 작업에 대한 자세한 내용은 HDInsight HBase 테이블 복사 설명서에 있습니다.

스냅샷

스냅샷은 특정 시점 백업을 사용하여 테이블 롤백 요구 사항을 지원할 수 있습니다. 스냅샷은 실제 테이블 데이터의 복사본이 아니며 관리자가 테이블을 이전 상태로 되돌릴 수 있도록 하는 메타데이터 정보입니다. 스냅샷은 HDFS 수준에서 작동하며 클러스터 리소스 최적화에 마스터 및 지역 서버를 포함하지 않습니다. 스냅샷 작업에 대한 자세한 내용은 HDInsight HBase 스냅샷 설명서에 있습니다.

복제

HBase 복제 기능을 사용하여 재해 발생 시 고가용성 및 비즈니스 연속성을 보장할 수 있습니다. 데이터가 비동기 방식으로 클러스터 간에 복사되므로 복제는 지역 내에서 그리고 전역 HADR 모델을 보장하는 Azure 지역 사이에서 작동할 수 있습니다. HBase 복제 작업에 대한 자세한 내용은 HDInsight HBase 복제 설명서에 있습니다.