确定 HDInsight HBase 中的迁移和高可用性策略

已完成

客户经常面临的一个难题是如何在群集升级过程中迁移来自本地的或者不同版本的 HBase 群集。 HDInsight HBase 提供以下选项来迁移和升级数据,并防止数据丢失。

复制 hbase 文件夹

复制 /hbase 文件夹的策略通常用于定期备份或迁移。 HDInsight HBase 将所有刷新后的数据和元数据文件都存储在 /hbase 文件夹下的磁盘中。

注意

此过程不提供群集之间的实时复制,也不提供迁移特定表的粒度。

若要备份/迁移 HDInsight 群集,请按顺序执行以下步骤。 HDInsight/hbase 存储在下列位置:wasbs://<containername>@<accountname>.blob.core.windows.net/hbase

  1. 确定/hbase 文件夹在源群集中的路径
  2. 停止所有指向源群集的写入操作,并强制刷新磁盘以确保内存中不会有任何内容。
  3. 使用 Blob 存储的 AzCopy 或 Data Lake Storage 的 AdlCopy,将 /hbase 中的数据复制到目标 Azure 存储目标。
  4. 在 DR 方案中,可以定期将数据存储在不同的区域中,以供将来在发生灾难时使用。
  5. 如果用于 HBase 迁移,可以将数据复制到新创建的 HDInsight hbase 群集的 /hbase 文件夹中。

有关 HBase hbase 文件夹复制过程的详细信息,请参阅 HDInsight hbase 文件夹复制文档

导出和导入

导出和导入可以更好地控制备份过程,并且可以选择备份特定的表而不是整个文件夹。 此过程使用 HBase 群集的导出实用功能,将所选表导出至附加到群集的本地存储中。 之后可以从目标群集导入导出的表。 有关如何使用导出和导入的详细信息,请参阅 HDInsight HBase 导出和导入文档

复制表

复制表是有效的复制机制,可对整个或部分表复制过程进行精细的控制,并使用 HBase 读取和写入路径从源到目标按行复制部分或全部表。 源群集和目标群集可以是相同或不同的群集。 有关使用复制表的详细信息,请参阅 HDInsight HBase 复制表文档

快照

快照可以启用时间点备份以启用表回滚要求。 快照不是实际表数据的副本,而是可帮助管理员返回到表以前的状态的元数据信息。 快照在 HDFS 级别运行,不涉及用于优化群集资源的主服务器和区域服务器。 若要了解有关使用快照的详细信息,请参阅 HDInsight HBase 快照文档

复制

HBase 复制功能可用于在发生灾难期间维持高可用性和业务连续性。 系统会以异步方式在群集之间复制数据,并且复制能在区域内以及 Azure 区域之间进行,可以为全局 HADR 模型提供保证。 有关使用 HBase 复制的详细信息,请参阅 HDInsight HBase 复制文档