你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

导出或删除机器学习服务工作区数据

在 Azure 机器学习中,可以使用门户图形界面或 Python SDK 导出或删除工作区数据。 本文介绍这两种选项。

注意

有关查看或删除个人数据的信息,请参阅 GDPR 的 Azure 数据使用者请求。 有关 GDPR 的详细信息,请参阅 Microsoft 信任中心的 GDPR 部分服务信任门户的 GDPR 部分

注意

本文介绍如何删除设备或服务中的个人数据,并且可用于为 GDPR 下的义务提供支持。 有关 GDPR 的常规信息,请参阅 Microsoft 信任中心的 GDPR 部分服务信任门户的 GDPR 部分

控制工作区数据

Azure 机器学习存储的产品内数据可用于导出和删除。 可以使用 Azure 机器学习工作室、CLI 和 SDK 导出和删除数据。 此外,还可以通过 Azure 隐私门户访问遥测数据。

在 Azure 机器学习中,个人数据包括作业历史记录文档中的用户信息。

Azure 工作区依赖于资源组来保存 Azure 解决方案的相关资源。 创建工作区时,可以使用现有资源组或创建新资源组。 若要详细了解 Azure 资源组,请参阅此页

使用门户删除高级资源

创建工作区时,Azure 在资源组中创建若干资源:

  • 工作区本身
  • 一个存储帐户
  • 容器注册表
  • Application Insights 实例
  • 密钥保管库

要删除这些资源,请从列表中选择它们,然后选择“删除”:

重要

如果资源配置为软删除,则实际上不会删除数据,除非选择永久删除资源。 有关详细信息,请参阅以下文章:

门户的屏幕截图,突出显示了“删除”图标。

此时会打开一个确认对话框,可在其中确认选择。

作业历史记录文档可能包含个人用户信息。 这些文档存储在 Blob 存储中的存储帐户中,位于 /azureml 子文件夹中。 可以从门户下载并删除数据。

在门户中的存储帐户中,Azure 机器学习目录的屏幕截图。

使用 Azure 机器学习工作室导出和删除机器学习资源

Azure 机器学习工作室提供机器学习资源 - 例如笔记本、数据资产、模型和作业的统一视图。 Azure 机器学习工作室强调保留数据和试验的记录。 可以在浏览器中删除计算性资源–管道和计算资源。 对于这些资源,请导航到相关资源然后选择“删除”。

可以注销数据资产和存档作业,但这些操作不会删除数据。 要完全删除数据,需要在存储级别删除数据资产和作业数据。 如前所述,在门户中进行存储级别删除。 Azure 机器学习工作室可以处理单个删除。 作业删除会删除该作业的数据。

Azure 机器学习工作室可以处理从试验作业下载的训练项目。 选择相关的“作业”。 选择“输出 + 日志”并导航到要下载的特定项目。 选择“...”和“下载”或选择“全部下载”。

要下载注册的模型,请导航到“模型”,然后选择“下载”。

工作室模型页的屏幕截图,突出显示了“下载”选项。

使用 Python SDK 导出和删除资源

可以使用以下内容来下载特定作业的输出:

# Retrieved from Azure Machine Learning web UI
run_id = 'aaaaaaaa-bbbb-cccc-dddd-0123456789AB'
experiment = ws.experiments['my-experiment']
run = next(run for run in ex.get_runs() if run.id == run_id)
metrics_output_port = run.get_pipeline_output('metrics_output')
model_output_port = run.get_pipeline_output('model_output')

metrics_output_port.download('.', show_progress=True)
model_output_port.download('.', show_progress=True)

可以使用 Python SDK 删除以下机器学习资源:

类型 函数调用 说明
Workspace delete 使用 delete-dependent-resources 来级联删除
Model delete
ComputeTarget delete
WebService delete

后续步骤

详细了解如何管理工作区