判斷 HDInsight HBase 中的移轉和高可用性策略

已完成

客戶常面臨的挑戰,是要在叢集升級期間從內部部署或在不同版本間遷移 HBase 叢集。 HDInsight HBase 提供下列用於遷移、升級及防止資料遺失的選項。

複製 hbase 資料夾

複製 /hbase 資料夾的策略常用於定期備份或移轉。 HDInsight HBase 會將其所有已排清至磁碟的資料和中繼資料檔案,儲存在 /hbase 資料夾下。

注意

此程序並不會進行叢集之間的即時複寫,也不會提供遷移特定資料表的細微性。

依序執行下列步驟來備份/移轉 HDInsight 叢集。 HDInsight /hbase 儲存在下列位置:wasbs://<containername>@<accountname>.blob.core.windows.net/hbase

  1. 找出 /hbase 資料夾在來源叢集中的路徑
  2. 停止所有對來源叢集的寫入,並強制排清磁碟以確保記憶體中沒有任何內容。
  3. 使用 AzCopy (用於 Blob 儲存體) 或 AdlCopy (用於 Data Lake Storage),將 /hbase 中的資料複製到目標 Azure 儲存體目的地。
  4. 若是用於災害復原案例,則資料可定期儲存在不同的區域中,以備日後發生災害時使用。
  5. 若是用於 HBase 移轉,則可將資料複製到新建 HDInsight HBase 叢集的 /hbase 資料夾。

您可以在 HDInsight hbase 資料夾複製文件中找到 HBase hbase 資料夾複製程序的詳細資訊。

匯出和匯入

匯出和匯入可讓您更妥善地掌控備份程序,而您可以選擇備份特定資料表,而非整個資料夾。 此程序會使用 HBase 叢集的匯出公用程式,將選取的資料表匯出至連結到叢集的本機儲存體。 匯出之後,即可從目標叢集匯入資料表。 如需關於使用匯出和匯入的詳細資訊,請參閱 HDInsight HBase 匯出與匯入文件

複製資料表

複製資料表是有效率的複製機制,可讓您精細控制完整或部分資料表的複製程序,並使用 HBase 讀取和寫入路徑,將部分或所有資料表逐列從來源複製到目的地。 來源和目的地叢集可以是相同或不同的叢集。 如需關於使用複製資料表的詳細資訊,請參閱 HDInsight HBase 複製資料表文件

快照集

快照集可啟用時間點備份,以符合資料表復原需求。 快照集不是實際資料表資料的複本,而是可協助管理員回到資料表原有狀態的中繼資料資訊。 快照集會在 HDFS 層級運作,且不牽涉到主要和區域伺服器進行叢集資源最佳化。 如需關於使用快照集的詳細資訊,請參閱 HDInsight HBase 快照集文件

複寫

HBase 複寫功能可在發生災害時用來確保高可用性和商務持續性。 資料會以非同步方式在叢集之間複製,而複寫可在區域內和 Azure 區域之間執行,以確保全域 HADR 模型。 如需關於使用 HBase 複寫的詳細資訊,請參閱 HDInsight HBase 複寫文件