Machine Learning service のワークスペース データをエクスポートまたは削除する

Azure Machine Learning では、ポータルのグラフィカル インターフェイスまたは Python SDK を使用して、ワークスペース データをエクスポートまたは削除できます。 この記事では、両方のオプションについて説明します。

注意

個人データの表示または削除については、「GDPR のための Azure データ サブジェクト要求」を参照してください。 GDPR の詳細については、Microsoft Trust Center の GDPR に関するセクションおよび Service Trust Portal の GDPR に関するセクションをご覧ください。

Note

この記事は、デバイスまたはサービスから個人データを削除する手順について説明しており、GDPR の下で義務を果たすために使用できます。 GDPR に関する一般情報については、Microsoft Trust Center の GDPR に関するセクションおよび Service Trust Portal の GDPR に関するセクションをご覧ください。

ワークスペース データを制御する

Azure Machine Learning によって保存された製品内のデータは、エクスポートおよび削除することができます。 データのエクスポートと削除は、Azure Machine Learning Studio、CLI、および SDK を使用して行うことができます。 さらに、Azure プライバシー ポータルからテレメトリ データにアクセスできます。

Azure Machine Learning では、個人データはジョブ履歴ドキュメント内のユーザー情報で構成されます。

Azure ワークスペースは、リソース グループに依存して、Azure ソリューションの関連リソースを保持します。 ワークスペースを作成するときは、既存のリソース グループを使用したり、新しいリソース グループを作成したりできます。 Azure リソース グループの詳細については、このページを参照してください。

ポータルを使用して高レベル リソースを削除する

ワークスペースを作成すると、Azure によってリソース グループ内にいくつかのリソースが作成されます。

  • ワークスペース自体
  • ストレージ アカウント
  • コンテナー レジストリ
  • Application Insights インスタンス
  • キー コンテナー

これらのリソースを削除するには、以下の一覧からリソースを選択し、[削除] を選択します。

重要

リソースが論理的な削除用に構成されている場合、必要に応じてリソースを完全に削除することを選択しない限り、データは実際に削除されません。 詳細については、次の記事を参照してください。

削除アイコンが強調表示されているポータルのスクリーンショット。

確認ダイアログ ボックスが開き、選択内容を確認できます。

ジョブ履歴ドキュメントには、個人のユーザー情報が含まれている場合があります。 これらのドキュメントが、/azureml サブフォルダーの BLOB ストレージのストレージ アカウントに保存されます。 データは、ポータルからダウンロードおよび削除することができます。

ポータル内のストレージ アカウントの Azure Machine Learning ディレクトリのスクリーンショット。

Azure Machine Learning Studio を使用して機械学習リソースをエクスポートおよび削除する

Azure Machine Learning スタジオは、ノートブック、データ資産、モデル、ジョブなどの機械学習リソースの統合ビューを提供します。 Azure Machine Learning Studio では、データと実験の記録を保持することに注力しています。 ブラウザーの右側にあるパイプラインやコンピューティング リソースなどの計算リソースを削除できます。 これらのリソースについては、問題のリソースに移動し、[削除] を選択します。

データ資産とアーカイブ ジョブの登録を解除することはできますが、これらの操作ではデータは削除されません。 データを完全に削除するには、データ資産とジョブ データをストレージ レベルで削除する必要があります。 ストレージ レベルでの削除は、前に説明したようにポータルで行います。 Azure Machine Learning スタジオでは、個々の削除を処理できます。 ジョブを削除すると、そのジョブのデータが削除されます。

Azure Machine Learning スタジオでは、試験的なジョブからのトレーニング成果物のダウンロードを処理できます。 該当するジョブを選択します。 [Output + logs](出力とログ) を選択し、ダウンロードする特定の成果物に移動します。 [...][ダウンロード] を選択するか、[すべてダウンロード] を選択します。

登録済みモデルをダウンロードするには、[モデル] に移動し、[ダウンロード] を選択します。

[ダウンロード] オプションが強調表示されているスタジオ モデル ページのスクリーンショット。

Python SDK を使用してリソースをエクスポートおよび削除する

以下を使用して、特定のジョブの出力をダウンロードできます。

# Retrieved from Azure Machine Learning web UI
run_id = 'aaaaaaaa-bbbb-cccc-dddd-0123456789AB'
experiment = ws.experiments['my-experiment']
run = next(run for run in ex.get_runs() if run.id == run_id)
metrics_output_port = run.get_pipeline_output('metrics_output')
model_output_port = run.get_pipeline_output('model_output')

metrics_output_port.download('.', show_progress=True)
model_output_port.download('.', show_progress=True)

次の機械学習リソースは、Python SDK を使用して削除できます。

Type 関数呼び出し Notes
Workspace delete delete-dependent-resources を使用して削除を連鎖させる
Model delete
ComputeTarget delete
WebService delete

次のステップ

詳細については、ワークスペースの管理に関するページを参照してください。