你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn

导出或删除机器学习服务工作区数据

在 Azure 机器学习中,可以使用门户图形界面或 Python SDK 导出或删除工作区数据。 本文介绍这两种选项。

注意

有关查看或删除个人数据的信息,请参阅 GDPR 的 Azure 数据使用者请求。 有关 GDPR 的详细信息,请参阅 Microsoft 信任中心的 GDPR 部分服务信任门户的 GDPR 部分

注意

本文介绍如何删除设备或服务中的个人数据,并且可用于为 GDPR 下的义务提供支持。 有关 GDPR 的常规信息,请参阅 Microsoft 信任中心的 GDPR 部分服务信任门户的 GDPR 部分

控制工作区数据

Azure 机器学习存储可供导出和删除的产品内数据。 可以使用 Azure 机器学习工作室、CLI 或 SDK 导出和删除数据。 此外,还可以通过 Azure 隐私门户访问遥测数据。

在 Azure 机器学习中,个人数据包括作业历史记录文档中的用户信息。

Azure 工作区依赖于资源组来保存 Azure 解决方案的相关资源。 创建工作区时,可以使用现有资源组,也可以创建新的资源组。 有关 Azure 资源组的详细信息,请访问此资源

使用门户删除高级资源

创建工作区时,Azure 在资源组中创建若干资源:

  • 工作区本身
  • 一个存储帐户
  • 容器注册表
  • Application Insights 实例
  • 密钥保管库

要删除这些资源,请从列表中选择它们,然后选择“删除”:

重要

如果资源配置为软删除,则实际上不会删除数据,除非选择永久删除资源。 有关详细信息,请参阅以下资源:

门户的屏幕截图,突出显示了“删除”图标。

此时会打开一个确认对话框,可在其中确认选择。

作业历史记录文档可能包含个人用户信息。 这些文档存储在 Blob 存储中的存储帐户中,位于 /azureml 子文件夹中。 可以从门户下载并删除数据。 首先,在 Azure 门户中选择“存储帐户”Azure 服务,如以下屏幕截图所示:

屏幕截图显示在 Azure 门户中选择“存储帐户”。

在“存储帐户”页上,选择相关的存储帐户,如以下屏幕截图所示:

屏幕截图显示选择特定存储帐户。

选择“容器”,如以下屏幕截图所示:

屏幕截图显示在存储帐户页中选择“容器”。

选择特定容器,如以下屏幕截图所示:

屏幕截图显示如何选择特定容器。

在该容器中,选择并删除要删除的资源,如以下屏幕截图所示:

屏幕截图显示如何删除特定资源。

使用 Azure 机器学习工作室导出和删除机器学习资源

Azure 机器学习工作室提供机器学习资源(如数据资产、模型、笔记本和作业)的统一视图。 Azure 机器学习工作室强调保留数据和试验的记录。 可以在浏览器中删除计算性资源–管道和计算资源。 对于这些资源,请导航到相关资源然后选择“删除”。

可以注销数据资产和存档作业,但这些操作不会删除数据。 若要完全删除数据,数据资产和作业数据需要在存储级别删除。 如前所述,在门户中进行存储级别删除。 Azure 机器学习工作室可以处理单个删除。 作业删除会删除该作业的数据。

作业的项目和日志下载

Azure 机器学习工作室可以处理试验作业中的训练项目和日志下载。 在 Azure 机器学习工作室主页上,选择“作业”,如以下屏幕截图所示:

屏幕截图显示在 Azure 机器学习工作室中选择“作业”。

若要显示可用作业,请选择“所有作业”选项卡,如以下屏幕截图所示:

屏幕截图显示选择“所有作业”选项卡。

选择特定作业,如以下屏幕截图所示:

屏幕截图显示选择特定作业。

选择“全部下载,如以下屏幕截图所示:

屏幕截图显示如何开始作业下载过程。

下载已注册的模型

若要下载已注册的模型,请选择“模型”以在 Azure 机器学习工作室中打开“模型列表”,然后选择特定模型,如以下屏幕截图所示:

屏幕截图显示如何选择特定模型。

选择“全部”以启动模型下载过程,如以下屏幕截图所示:

屏幕截图显示如何启动模型下载过程。

使用 Python SDK 导出和删除资源

可以使用以下内容来下载特定作业的输出:

# Retrieved from Azure Machine Learning web UI
run_id = 'aaaaaaaa-bbbb-cccc-dddd-0123456789AB'
experiment = ws.experiments['my-experiment']
run = next(run for run in ex.get_runs() if run.id == run_id)
metrics_output_port = run.get_pipeline_output('metrics_output')
model_output_port = run.get_pipeline_output('model_output')

metrics_output_port.download('.', show_progress=True)
model_output_port.download('.', show_progress=True)

可以使用 Python SDK 删除这些机器学习资源:

类型 函数调用 说明
Workspace delete 使用 delete-dependent-resources 来级联删除
Model delete
ComputeTarget delete
WebService delete

后续步骤

详细了解如何管理工作区