培训
认证
Microsoft Certified: Azure Data Engineer Associate - Certifications
演示如何了解使用多种 Azure 服务在 Microsoft Azure 上实现和管理数据工程工作负荷的常见数据工程任务。
你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
本文帮助你使用成本管理中的导出功能定期导出大量数据。 建议通过导出的方式来检索未聚合的成本数据。 特别是当使用情况文件太大而无法使用成本详细信息 API 可靠地调用和下载时。 导出的数据置于你所选择的 Azure 存储帐户中。 因此,可以将其加载到你自己的系统中,并按需对其进行分析。 若要在 Azure 门户中配置导出,请参阅导出数据。
如果要在不同范围自动执行导出,可以首先了解下一部分的示例 API 请求。 可以使用导出 API 创建自动导出,作为常规环境配置的一部分。 自动导出有助于确保你拥有所需的数据。 扩展 Azure 用途时,可以在自己组织的系统中使用。
在创建第一个导出之前,请考虑你的方案和启用该方案所需的配置选项。 请考虑以下导出选项:
请求 URL:PUT https://management.azure.com/{scope}/providers/Microsoft.CostManagement/exports/{exportName}?api-version=2020-06-01
{
"properties": {
"schedule": {
"status": "Active",
"recurrence": "Daily",
"recurrencePeriod": {
"from": "2020-06-01T00:00:00Z",
"to": "2020-10-31T00:00:00Z"
}
},
"format": "Csv",
"deliveryInfo": {
"destination": {
"resourceId": "/subscriptions/aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e/resourceGroups/MYDEVTESTRG/providers/Microsoft.Storage/storageAccounts/{yourStorageAccount} ",
"container": "{yourContainer}",
"rootFolderPath": "{yourDirectory}"
}
},
"definition": {
"type": "ActualCost",
"timeframe": "MonthToDate",
"dataSet": {
"granularity": "Daily",
"configuration": {
"columns": [
"Date",
"MeterId",
"ResourceId",
"ResourceLocation",
"Quantity"
]
}
}
}
}
可以使用成本管理在 Azure 存储帐户中计划以 Blob 形式导出 Azure 使用情况详细信息。 生成的 Blob 大小可能超过数 GB。 成本管理团队已与 Azure 存储团队协作测试了大型 Azure 存储 Blob 的复制。 以下部分说明了这些结果。 将存储 Blob 从一个 Azure 区域复制到另一个 Azure 区域预期会产生类似的结果。
团队进行了一次性能测试,将 blob 从位于美国西部区域的存储帐户传输到同一区域和其他区域。 该团队测得的速度为:在同一区域中复制速度为每秒 2 GB,复制到“东南亚”区域中存储帐户的速度为每秒 150 MB。
为了测量 Blob 传输速度,该团队创建了一个简单的 .NET 控制台应用程序,该应用程序通过 NuGet 引用最新版本 (v2.0.1) 的 Azure 数据移动库 (DLM)。 DLM 是 Azure 存储团队提供的 SDK,它支持对其传输服务进行编程式访问。 然后,他们在多个区域中创建了标准 V2 存储帐户,并使用“美国西部”作为源区域。 他们在该区域的存储帐户中填充了容器,其中每个容器保存 10 个 2 GB 的块 Blob。 他们结合 CopyMethod. ServiceSideSyncCopy 选项使用 DLM 的 TransferManager.CopyDirectoryAsync() 方法将容器复制到了其他存储帐户。 测试是在一台运行 Windows 10 的计算机上进行的,该计算机配备 12 个核心和 1-GbE 网络。
使用的应用程序设置:
有关详细信息和示例代码,请参阅相关内容部分中的链接。
测试编号 | 目标区域 | Blob | 时间(秒) | MB/s | 注释 |
---|---|---|---|---|---|
1 | 美国西部 | 2 GB x 10 | 10 | 2,000 | |
2 | 美国西部 2 | 2 GB x 10 | 33 | 600 | |
3 | EastUS | 2 GB x 10 | 67 | 300 | |
4 | EastUS | 2 GB x 10 x 4 | 99 | 200 | 使用八个存储帐户进行四个并行传输:每个传输平均从四个西部存储帐户到四个东部存储帐户 |
6 | EastUS | 2 GB x 10 x 4 | 92 | 870 | 从一个存储帐户到另一个存储帐户的四个并行传输 |
5 | EastUS | 2 GB x 10 x 8 | 148 | 135 | 使用八个存储帐户进行八个并行传输:每个传输平均从四个西部存储帐户到四个东部存储帐户 |
7 | 东南亚 | 2 GB x 10 | 133 | 150 | |
8 | 东南亚 | 2 GB x 10 x 4 | 444 | 180 | 从一个存储帐户到另一个存储帐户的四个并行传输 |
下面是与 DML 配合使用的服务端同步传输的一些特征,这些特征与该传输形式的用法有关:
可以结合 CopyMethod.ServiceSideAsyncCopy 选项调用 TransferManager.CopyDirectoryAsync() 方法。 从客户端角度看,异步传输的工作原理与同步传输机制类似,不过操作时存在以下差异:
Azure Blob 存储凭借其服务端同步传输功能支持较高的全局传输速率。 在 .NET 应用程序中使用该功能的方法就是直截了当地使用数据移动库。 成本管理导出能够在一小时内,将数百 GB 的数据可靠地复制到位于任何位置的存储帐户。
培训
认证
Microsoft Certified: Azure Data Engineer Associate - Certifications
演示如何了解使用多种 Azure 服务在 Microsoft Azure 上实现和管理数据工程工作负荷的常见数据工程任务。
文档
按需获取小型成本数据集 - Microsoft Cost Management
本文介绍了如何使用成本详细信息 API 来获取与 Azure 账单对应的原始、未聚合的成本数据。
成本管理自动化概述 - Microsoft Cost Management
本文介绍成本管理自动化的常见方案以及根据你的情况提供的选项。
教程 - 从成本管理创建和管理导出的数据 - Microsoft Cost Management
本文介绍如何创建和管理导出的成本管理数据,以便在外部系统中使用。