迁移概述:SQL Server 到 Azure SQL 数据库
适用于: Azure SQL 数据库
了解用于将 SQL Server 数据库迁移到 Azure SQL 数据库的选项和注意事项。
可迁移在以下位置运行的现有 SQL Server 数据库:
- 虚拟机上的 SQL Server
- Amazon EC2 (Elastic Compute Cloud)
- 适用于 SQL Server 的 Amazon RDS(关系数据库服务)
- Google Compute Engine
- Cloud SQL for SQL Server - GCP (Google Cloud Platform)
有关其他迁移指南,请参阅数据库迁移。
概述
对于需要完全托管的“平台即服务”(PaaS) 的 SQL Server 工作负载,建议使用 Azure SQL 数据库作为目标选项。 SQL 数据库处理大多数数据库管理功能。 该数据库还具有内置的高可用性、智能查询处理、可伸缩性和性能功能,以适合多种应用程序类型。
SQL 数据库为多种部署模型和服务层级灵活性,以满足不同类型的应用程序或工作负载。
迁移到 SQL 数据库的主要好处之一是可以使用 PaaS 功能实现应用程序现代化。 如此一来,无需再依赖实例级别范围内的技术组件,例如 SQL 代理作业。
其次,还可以使用 SQL Server 的 Azure 混合权益将 SQL Server 本地许可证迁移到 Azure SQL 数据库,从而节省成本。 如果选择基于 vCore 的购买模型,则可以使用此选项。
请务必查看 Azure SQL 数据库中提供的 SQL Server 数据库引擎功能,以验证迁移目标的可支持性。
注意事项
评估迁移选项时要考虑的关键因素如下:
- 服务器和数据库的数量
- 数据库大小
- 迁移过程中可接受的业务停机时间
本指南中列出的迁移选项考虑了这些因素。 逻辑数据迁移到 Azure SQL 数据库的时间取决于数据库中对象的数量和数据库的大小。
可为各种工作负载和用户首选项提供工具。 可以通过基于 UI 的工具对单个数据库进行快速迁移。 其他工具可以自动迁移多个数据库,以大规模处理迁移。
选择适当的目标
请考虑一般准则,以帮助你选择正确的 Azure SQL 数据库部署模型和服务层级。 可在部署期间选择计算和存储资源,然后在使用 Azure 门户之后对其进行更改,而不会导致应用程序停机。
部署模型:了解应用程序工作负载和使用模式,以决定使用单一数据库还是弹性池。
- 单一数据库表示完全托管的数据库,适用于大多数现代云应用程序和微服务。
- 弹性池是单一数据库的集合,其中包含一组共享的资源(例如 CPU 或内存)。 弹性池适用于将池中的数据库与可预测的使用模式(可有效共享同一组资源)相结合。
购买模型:在 vCore、数据库事务单位 (DTU) 或无服务器购买模型之间进行选择。
- 利用 vCore 模型,可以选择 Azure SQL 数据库的 vCore 数量,因此,当从本地 SQL Server 进行转换时,这是最简单的选择。 这是支持使用 Azure 混合权益节省许可证成本的唯一选项。
- 基于 DTU 的购买模型提取基础计算、内存和 I/O 资源,以提供混合的 DTU。
- 无服务器模型适用于需要自动按需缩放的工作负载,计算资源按每秒使用情况计费。 无服务器计算层将在非活动期间(仅对存储计费)自动暂停数据库。 当活动返回时,它将自动恢复数据库。
服务层:在三个专为不同类型的应用程序设计的服务层级之间进行选择。
- 常规用途/标准服务层提供了一个面向预算的平衡选项,具有计算和存储功能,适用于交付中间层和更低层的应用程序。 在存储层内置了冗余,以便从故障中恢复。 这适用于大多数数据库工作负载。
- 业务关键/高级服务层适用于需要高事务速率、低延迟 I/O 和高级别复原能力的高层应用程序。 次要副本可用于故障转移和卸载读取工作负载。
- 超大规模服务层级适用于需要更高性能和高可用性、快速备份和还原和/或快速存储和计算可伸缩性的所有客户。 这包括迁移到云以对其应用程序进行现代化的客户以及已经在 Azure SQL 数据库中使用其他服务层级的客户。 超大规模服务层级支持广泛的数据库工作负载(从纯 OLTP 到纯分析)。 它针对 OLTP 和混合事务与分析处理 (HTAP) 工作负载进行了优化。
重要
管理 Azure SQL 数据库中的事务日志记录速率以限制过高的数据引入速率。 因此,在迁移过程中,可能必须扩展目标数据库资源(vCore 或 DTU),以减轻 CPU 或吞吐量的压力。 选择适当大小的目标数据库,但在必要时可以计划为迁移扩展资源。
SQL Server VM 替代项
也许 Azure 虚拟机中的 SQL Server 比 Azure SQL 数据库更符合你的业务要求。
如果你的业务符合以下情况之一,请考虑改用 SQL Server 虚拟机 (VM):
- 需要直接访问操作系统或文件系统(例如,为了在装有 SQL Server 的同一个虚拟机上安装第三方代理或自定义代理)。
- 严重依赖于目前尚不支持的功能,例如 FileStream/FileTable、PolyBase 和跨实例事务。
- 需要保持使用特定的 SQL Server 版本(例如 2012)。
- 计算要求比托管实例的要求低得多(如只需一个 vCore),且数据库整合不可接受。
迁移工具
建议使用以下迁移工具:
技术 | 说明 |
---|---|
Azure Migrate | 此 Azure 服务可帮助你在 VMware 上大规模发现和评估 SQL 数据。 它提供 Azure SQL 部署建议、目标大小调整和每月费用估计。 |
适用于 Azure Data Studio 的 Azure SQL 迁移扩展 | 适用于 Azure Data Studio 的 Azure SQL 迁移扩展由 Azure 数据库迁移服务提供支持,可帮助你评估数据库要求,以了解迁移准备情况、获取适用于 Azure 资源的 SKU 建议,并将 SQL Server 数据库迁移到 Azure。 可以使用 PowerShell 和 Azure CLI 迁移单一数据库或大规模数据库。 |
下表列出了可替代的迁移工具:
技术 | 说明 |
---|---|
事务复制 | 通过提供“发布服务器 - 订阅服务器”类型迁移选项,同时保持事务一致性,将数据从源 SQL Server 数据库表复制到 Azure SQL 数据库。 在发布服务器上发生的增量数据更改将传播到订阅服务器。 |
导入和导出服务/BACPAC | BACPAC 是扩展名为 .bacpac 的 Windows 文件,用于封装数据库的架构和数据。 既可以使用 BACPAC 从 SQL Server 源导出数据,也可以将数据导入 Azure SQL 数据库。 可以通过 Azure 门户将 BACPAC 文件导入到新的 SQL 数据库。 对于大型数据库或大量数据库,为提高缩放性和性能,应考虑使用 SqlPackage 命令行工具来导出和导入数据库。 |
大容量复制 | 大容量复制程序 (bcp) 工具将数据从 SQL Server 实例复制到数据文件中。 使用该工具从源中导出数据,并将数据文件导入到目标 SQL 数据库中。 若要执行高速大容量复制操作以将数据移动到 Azure SQL 数据库,可使用智能大容量复制工具,利用并行复制任务来实现传输速度最大化。 |
Azure 数据工厂 | Azure 数据工厂中的复制活动使用内置连接器和集成运行时将数据从源 SQL Server 数据库迁移到 Azure SQL 数据库。 数据工厂支持各种连接器,可将数据从 SQL Server 源迁移到 Azure SQL 数据库。 |
比较迁移选项
比较迁移选项,选择适合你业务需求的路径。
下表比较了我们推荐的迁移选项:
迁移选项 | 何时使用 | 注意事项 |
---|---|---|
Azure Migrate | - 从不同环境发现和评估单一数据库或大规模数据库。 | - 包括基础结构、数据和应用程序的所有迁移前步骤,例如发现、评估和正确调整本地资源的大小。 |
适用于 Azure Data Studio 的 Azure SQL 迁移扩展 | - 迁移单一数据库或大规模迁移。 - 仅限脱机模式。 受支持的源: - 本地 SQL Server(2008 以后),或 Azure 虚拟机上的 SQL Server - Amazon EC2 上的 SQL Server - Amazon RDS for SQL Server - Google Compute Engine 上的 SQL Server |
- 可通过 PowerShell 或 Azure CLI 自动执行大规模迁移。 - 完成迁移的时间取决于数据库的大小和数据库中的对象数。 - 不使用 PowerShell 或 Azure CLI 时,需要 Azure Data Studio。 |
下表比较了替代迁移选项:
方法或技术 | 何时使用 | 注意事项 |
---|---|---|
事务复制 | - 通过不断地将源数据库表中的更改发布到目标 SQL 数据库表进行迁移。 - 对所选表(数据库的子集)执行全部或部分数据库迁移。 支持的源: - SQL Server (2016 - 2019),存在一些限制 - AWS EC2 - GCP 计算 SQL Server VM |
- 与其他迁移选项相比,设置相对复杂。 - 提供连续复制选项以迁移数据(无需使数据库脱机)。 - 在源 SQL Server 实例上设置发布服务器时,关于事务的复制,有一些限制需要考虑。 有关详细信息,请参阅对发布对象的限制。 - 可以监视复制活动。 |
导入和导出服务/BACPAC | - 迁移单个业务线应用程序数据库。 - 适用于较小的数据库。 - 不需要单独的迁移服务或工具。 受支持的源: - SQL Server (2005 - 2019) 本地或 Azure VM - AWS EC2 - AWS RDS - GCP 计算 SQL Server VM |
- 需要停机,因为数据需要在源处导出并在目标处导入。 - 导出或导入中使用的文件格式和数据类型需要与表架构一致,以避免“截断”或“数据类型不匹配”错误。 - 导出包含大量对象的数据库所花费的时间可能会大大增加。 |
大容量复制 | - 执行全部或部分数据迁移。 - 可以适应停机。 支持的源: - SQL Server (2005 - 2019) 本地或 Azure VM - AWS EC2 - AWS RDS - GCP 计算 SQL Server VM |
- 从源导出数据并导入目标时需要停机时间。 - 导出或导入中使用的文件格式和数据类型需与表架构一致。 |
Azure 数据工厂 | - 从源 SQL Server 数据库迁移和/或转换数据。 - 通常要为商业智能 (BI) 工作负载将多个数据源的数据合并到 Azure SQL 数据库。 |
- 需要在数据工厂中创建数据移动管道,以将数据从源移动到目标。 - 成本是一个重要考虑事项,基于管道触发器、活动运行、数据移动的持续时间等因素。 |
功能互操作性
如果迁移的工作负载还依赖其他 SQL Server 功能,则还有其他注意事项。
SQL Server Integration Services
通过将 SQL Server Integration Services (SSIS) 包重新部署到 Azure 数据工厂中的 Azure SSIS 运行时,将包迁移到 Azure。 Azure 数据工厂提供运行时以在 Azure 中运行 SSIS 包,从而支持 SSIS 包的迁移。 另外,还可以使用数据流,在 Azure 数据工厂中本地重写 SSIS ETL(提取、转换、加载)逻辑。
SQL Server Reporting Services
将 SQL Server Reporting Services (SSRS) 报表迁移到 Power BI 中的分页报表。 使用 RDL 迁移工具来帮助准备和迁移报表。 Microsoft 开发了此工具来帮助客户将报表定义语言 (RDL) 报表从 SSRS 服务器迁移到 Power BI。 它在 GitHub 上提供,并记录了迁移方案的端到端演练。
高可用性
手动设置 SQL Server 高可用性功能(如 Always On 故障转移群集实例和 Always On 可用性组)在目标 SQL 数据库上已过时。 Azure SQL 数据库的常规用途(标准可用性模型)和业务关键(高级可用性模型)服务层中均已内置高可用性体系结构。 业务关键/高级服务层还提供读取扩展功能,该功能允许出于只读目的连接到其中一个辅助节点。
除了 Azure SQL 数据库中包含的高可用性体系结构之外,还可借助故障转移组功能,管理将数据库复制和故障转移到另一个区域中的服务器的操作。
登录名和组
在 Azure SQL 数据库中不支持 Windows 登录名,请改为创建 Microsoft Entra ID(以前称为 Azure Active Directory)登录名。 手动重新创建任何 SQL 登录名。
SQL 代理作业
Azure SQL 数据库不直接支持 SQL 代理作业。 请改用弹性作业。
系统数据库
对于 Azure SQL 数据库,唯一适用的系统数据库为 master 和 tempdb
。 若要了解详细信息,请参阅 Azure SQL 数据库中的 tempdb。
高级功能
请确保利用 SQL 数据库中基于云的高级功能。 例如,你无需担心管理备份的问题,因为该服务会进行管理。 你可以还原到保留期内的任何时间点。
若要增强安全性,请考虑使用 Microsoft Entra 身份验证、审核、威胁检测、行级别安全性和动态数据掩码。
除了高级管理和安全功能以外,SQL 数据库还提供工具来帮助你监视和优化工作负载。 Azure SQL Analytics(预览版)是一种高级解决方案,用于在单个视图中跨多个订阅大规模监视 Azure SQL 数据库中的所有数据库的性能。 Azure SQL Analytics 使用内置的智能收集和直观显示关键性能指标,以进行性能故障排除。
自动优化会持续监视 SQL 执行计划的性能,并自动修复已确定的性能问题。
迁移资产
如需更多帮助,请参阅以下资源,这些资源是为支持实际迁移项目而开发的。
资产 | 说明 |
---|---|
数据工作负荷评估模型和工具 | 此工具为工作负载提供建议的“最适合”目标平台、云就绪性和应用程序/数据库修正级别。 它提供简单的一键式计算和报表生成功能,通过提供统一的自动化目标平台决策过程,帮助加速大规模评估。 |
使用 PowerShell 批量创建数据库 | 可以使用一组三个 PowerShell 脚本创建资源组 (create_rg.ps1)、Azure 中的逻辑服务器 (create_sqlserver.ps1) 和 SQL 数据库 (create_sqldb.ps1)。 这些脚本包括循环功能,因此你可以根据需要循环访问和创建任意数量的服务器和数据库。 |
使用 MSSQL-Scripter 和 PowerShell 批量部署架构 | 此资产在 Azure 中创建一个资源组、一个或多个逻辑服务器来承载 Azure SQL 数据库,从一个本地 SQL Server 实例(或多个 SQL Server 2005+ 实例)导出每个架构,并将这些架构导入 Azure SQL 数据库。 |
将 SQL Server 代理作业转换为弹性数据库作业 | 此脚本将源 SQL Server 代理作业迁移到弹性数据库作业。 |
用于将本地 SQL Server 登录名移动到 Azure SQL 数据库的实用工具 | PowerShell 脚本可创建 T-SQL 命令脚本以重新创建登录名,并从本地 SQL Server 选择数据库用户到 Azure SQL 数据库。 该工具允许将 Windows Server Active Directory 帐户自动映射到 Microsoft Entra 帐户,还可以选择性地迁移 SQL Server 本机登录名。 |
使用 Logman 自动执行 Perfmon 数据收集 | 可以使用 Logman 工具收集 Perfmon 数据(以帮助你了解基准性能)和获取迁移目标建议。 该工具使用 logman.exe 创建命令,该命令将创建、启动、停止和删除在远程 SQL Server 实例上设置的性能计数器。 |
数据 SQL 工程团队开发了这些资源。 此团队的核心章程是解锁和加速到 Microsoft 的 Azure 数据平台的数据平台迁移项目的复杂现代化进程。