你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文提供有关将 Azure HDInsight 群集重新定位到新区域的分步指南。
先决条件
在开始重定位过程之前,请确保满足以下先决条件:
标识依赖资源:收集所有依赖于 Azure HDInsight 的资源。 根据部署,在重定位之前,可能需要在目标区域中部署和配置以下资源:
- 计算(虚拟机)
- Azure SQL 数据库(元存储)
- 存储帐户或 Data Lake Gen 2
- Azure Key Vault
- 公共 IP 地址
- 专用终结点
- Azure 虚拟网络
- Azure Active Directory、Azure Active Directory 域、托管标识服务、企业安全性套餐
- Azure DNS
- 目标区域中的配额可用性(请求配额增加)。
验证区域支持:确认目标区域中是否支持 HDInsight 及其依赖资源。
准备目标登陆区域:确保目标登陆区域准备就绪,并匹配评估的体系结构。
文档网络设置:记录网络配置,包括防火墙和隔离设置。
标识元存储数据库:列出源群集中配置的所有元存储数据库。
查看已安装的应用程序:记录已安装的 HDInsight 应用程序和执行的操作脚本。
检查可用性区域支持:验证目标区域是否支持可用性区域。 有关详细信息,请参阅 区域可用性。
停机时间注意事项
了解重定位过程中可能涉及的停机时间。 有关详细信息,请参阅 适用于 Azure 的云采用框架:选择重定位方法。
准备搬迁
导出模板
导出 HDInsight 群集的 Azure 资源管理器 (ARM) JSON 模板或 Bicep 文件。 这些模板定义并自动部署 HDInsight 群集及其关联的资源。 使用以下方法之一导出模板:
修改模板
更新导出的 Bicep 文件或 ARM 模板以反映新区域。 确保将相应地更新所有资源详细信息,例如存储帐户、托管标识、用户帐户(例如 sshuser)、网络配置和元存储数据库。
重新定位源存储帐户
将源存储帐户重新定位到目标区域。 有关详细步骤,请参阅 将存储帐户重新定位到另一个区域。
重定位关联的作业
将与 HDInsight 群集关联的作业重新定位到目标区域。 根据 HDInsight 实现,遵循相应的指导方案:
- Oozie 管道/工作流:使用 Hue 的导入/导出方法。 请参阅使用 Hue UI 迁移管道。
- HBase 工作负荷:使用备份和复制。 请参阅 备份和复制方法。
- Kafka 工作负载:使用 Mirror Maker。 请参阅 Mirror Maker。
同步数据
使用 Azure 数据工厂(ADF)或其他定义的数据迁移计划执行从源存储到目标存储的增量数据同步。
重新部署群集
部署更新后的 Bicep 文件或 ARM 模板,以在目标区域中创建 HDInsight 群集。 有关详细信息,请参见:
- 从 VS Code 部署 Bicep 文件
- 使用 Azure CLI 部署 Bicep 文件
- 使用 Azure PowerShell 部署 Bicep 文件
- 使用 Azure Cloud Shell 部署 Bicep 文件
- 使用 Azure CLI 部署 ARM 模板文件
- 使用 Azure PowerShell 部署 ARM 模板文件
- 使用 Azure Cloud Shell 部署 ARM 模板文件
验证重定位
重定位后,验证 HDInsight 群集及其依赖资源。 执行冒烟和集成测试,以确保所有配置都正确且数据可访问。
清理
(可选)如果不再需要资源,则放弃或清理源区域中的资源。
后续步骤
有关在 Azure 中移动资源和灾难恢复的详细信息,请参阅: