共用方式為


生產環境中模型的數據收集

適用於:Azure CLI ml 延伸模組 v2 (目前)Python SDK azure-ai-ml v2 (目前)

在本文中,您將瞭解從部署至 Azure 機器學習 在線端點的模型收集數據。

Azure Machine Learning 資料收集器提供從部署到受控線上端點或 Kubernetes 線上端點的模型中輸入和輸出資料的即時記錄。 Azure Machine Learning 會將記錄的推斷資料儲存在 Azure Blob 儲存體中。 然後,即可將此資料順暢地用於模型監測、偵錯或稽核,進而讓您可檢視已部署模型的效能。

資料收集器提供:

  • 將推斷資料記錄到中央位置 (Azure Blob 儲存體)
  • 支援受控線上端點與 Kubernetes 線上端點
  • 部署層級的定義,允許對其組態進行最大變更
  • 支援承載和自訂記錄

記錄模式

資料收集器提供兩種記錄模式:承載記錄自訂記錄。 承載記錄可讓您從已部署的模型收集 HTTP 要求並回應承載資料。 Azure Machine Learning 會使用自訂記錄為您提供 Python SDK,讓您直接從評分指令碼記錄 pandas DataFrames。 除了任何資料轉換 (或前置處理) 之前、期間及之後的資料之外,您來可以使用自訂記錄 Python SDK 來記錄模型輸入和輸出資料。

資料收集器組態

您可以在部署層級設定資料收集器,並在部署時間指定組態。 您可以設定將接收所收集資料的 Azure Blob 儲存體目的地。 您也可以設定所要收集資料的取樣率 (範圍從 0 – 100%)。

限制

資料收集器具有下列限制:

  • 資料收集器僅支援記錄線上 (或即時) Azure Machine Learning 端點 (受控或 Kubernetes)。
  • 數據收集器 Python SDK 僅支援透過 pandas DataFrame 記錄表格式數據。