什麼是 Azure Machine Learning 工作區?

工作區是與同事共同作業的地方,可建立機器學習成品和群組相關工作。 例如,實驗、作業、資料集、模型、元件和推斷端點。 本文說明工作區、如何管理其存取權,以及如何用來組織您的工作。

準備開始了嗎? 建立工作區

在工作區內執行的工作

針對機器學習小組,工作區是組織其工作的地方。 以下是您可以從工作區開始的一些工作:

  • 建立作業 - 作業是您用來建置模型的定型回合。 您可以將作業分組為實驗來比較計量。
  • 作者管線 - 管線是可重複使用的工作流程,用於定型和重新定型您的模型。
  • 註冊資料資產 - 資料資產可協助您管理用於模型定型和管線建立的資料。
  • 註冊模型 - 當您擁有想要部署的模型之後,即可建立已註冊的模型。
  • 部署模型 - 使用已註冊的模型和評分指令碼以部署模型。

除了將機器學習結果分組之外,工作區也會裝載資源設定:

  • 計算目標用於執行您的實驗。
  • 資料存放區會定義您和其他人在使用資料資產時如何連線到資料來源。
  • 安全性設定 - 網路、身分識別與存取控制,以及加密設定。

組織工作區

針對機器學習小組負責人和系統管理員,工作區可作為存取管理、成本管理和數據隔離的容器。 以下是組織工作區的一些秘訣:

  • 使用使用者角色,用於使用者之間工作區中的權限管理。 例如,資料科學家、機器學習工程師或系統管理員。
  • 將存取權指派給使用者群組:藉由使用 Microsoft Entra 使用者群組,您不需要將個別使用者新增至每個工作區,相同群組的使用者需要存取權的其他資源也一樣。
  • 建立每個專案的工作區:雖然工作區可以用於多個專案,但將其限製為每個工作區一個專案可讓成本報告累算至專案層級。 也可讓您管理每個專案範圍內的資料存放區等設定。
  • 共用 Azure 資源:工作區會要求您建立數個相關聯的資源。 在工作區之間共用這些資源,以儲存重複的設定步驟。
  • 啟用自助:以IT系統管理員身分預先建立和保護 相關聯的資源 ,並使用 使用者角色 讓數據科學家自行建立工作區。
  • 共用資產:您可以使用 Azure Machine Learning 登錄在工作區之間共用資產。

我的內容如何儲存在工作區中?

您的工作區保留所有定型執行的歷程記錄,包括記錄、計量、輸出,資料譜系中繼資料以及指令碼的快照集。 當您在 Azure Machine Learning 中執行工作時,會產生成品。 其中繼資料和資料會儲存在工作區及其相關聯的資源上。

相關聯的資源

當您建立新的工作區時,必須攜帶其他 Azure 資源來儲存您的資料。 如果未由您提供,Azure 機器學習 會自動建立這些資源。

  • Azure 儲存體帳戶。 儲存機器學習成品,例如作業記錄。 根據預設,當您將資料上傳至工作區時,會使用此儲存體帳戶。 此處亦會儲存與 Azure Machine Learning 計算執行個體搭配使用的 Jupyter 筆記本。

    重要

    如果現有 Azure 儲存體 帳戶為下列專案,則無法使用

    • Blob 類型的帳戶 儲存體
    • 進階帳戶(進階版_LRS和 進階版_GRS)
    • 具有階層命名空間的帳戶(與 Azure Data Lake 儲存體 Gen2 搭配使用)。

    您可以藉由建立資料存放區,使用進階儲存體或階層命名空間作為額外儲存體。

    升級至一般用途 v2 之後,請勿在儲存體帳戶上啟用階層命名空間。

    如果您攜帶現有的一般用途 v1 儲存體帳戶,您可以在建立工作區之後,將其升級為一般用途 v2

  • Azure Container Registry (ACR)。 當您透過 Azure Machine Learning 建置自訂環境時,會儲存已建立的 Docker 容器。 部署 AutoML 模型和數據配置檔也會觸發建立自定義環境。

    如果您不需要建置自定義 Docker 容器,則可以在沒有 ACR 的情況下建立工作區作為相依性。 Azure 機器學習 可以從外部容器登錄讀取。

    當您建置自定義 Docker 映射時,會自動布建 ACR。 使用 Azure 角色型存取控制 (Azure RBAC) 來防止建置客戶 Docker 容器。

    重要

    如果您的訂用帳戶設定需要將標籤新增至其下的資源,Azure 機器學習 所建立的 ACR 將會失敗,因為我們無法將標籤設定為 ACR。

  • Azure Application Insights。 協助您從推斷端點監視和收集診斷資訊。

    如需詳細資訊,請參閱監視線上端點

  • Azure Key Vault。 儲存計算目標所使用的秘密,以及工作區所需的其他敏感性資訊。

建立工作區

有多種方式可建立新的工作區。 若要開始使用,請使用下列其中一個選項:

若要使用您慣用的安全性設定將工作區建立自動化:

  • 針對平台整合或是在 MLOps 工作流程中,直接在指令碼環境中使用 REST API

工作區互動和管理的工具

設定您的工作區之後,您可以透過下列方式與其互動:

下列工作區管理工作可在每個介面中使用。

工作區管理工作 入口網站 Studio Python SDK Azure CLI VS 程式碼
建立工作區
管理工作區存取
建立及管理計算資源
建立運算執行個體

警告

不支援將 Azure Machine Learning 工作區移至不同的訂用帳戶,或將擁有的訂用帳戶移至新租用戶。 這麼做可能會導致錯誤。

子資源

當您在 Azure Machine Learning 中建立計算叢集和計算執行個體時,會建立子資源。

  • VM:提供計算執行個體和計算叢集的運算能力,以供您用來執行作業。
  • Load Balancer:為每個計算執行個體和計算叢集建立網路負載平衡器以管理流量,即使計算執行個體/叢集已停止亦然。
  • 虛擬網路:可協助 Azure 資源與另一個資源、網際網路和其他內部部署網路進行通訊。
  • 頻寬:封裝跨區域的所有輸出資料傳輸。

下一步

如要深入瞭解如何針對組織的需求規劃工作區,請參閱組織和設定 Azure Machine Learning

若要開始使用 Azure Machine Learning,請參閱: