識別 Azure Machine Learning 資源

已完成

Azure Machine Learning 中的資源是指執行機器學習工作流程所需的基礎結構。 在理想情況下,您希望系統管理員之類的人員建立和管理資源。

Azure Machine Learning 中的資源包括:

  • 工作區
  • 計算資源
  • 資料存放區

建立及管理工作區

工作區是 Azure Machine Learning 的最上層資源。 資料科學家需要存取工作區來定型和追蹤模型,以及將模型部署至端點。

不過,您對於誰具有工作區的「完整」存取權很小心。 在計算資源和資料存放區的參考旁邊,您可以在工作區中找到程式碼的所有記錄、計量、輸出、模型和快照集。

建立及管理計算資源

定型或部署模型時,您需要的最重要資源之一是計算。 Azure Machine Learning 工作區中有五種類型的計算:

  • 計算執行個體:類似於雲端中的虛擬機器,並依工作區進行管理。 適合作為開發環境來執行 (Jupyter) 筆記本。
  • 計算叢集:雲端中 CPU 或 GPU 計算節點的隨選叢集 (依工作區進行管理)。 適合用於生產工作負載,因為其會自動調整以符合您的需求。
  • Kubernetes 叢集:可讓您建立或連結 Azure Kubernetes Service (AKS) 叢集。 適合於在生產案例中部署已定型的機器學習模型。
  • 附加的計算:可讓您將其他 Azure 計算資源連結至工作區,例如 Azure Databricks 或 Synapse Spark 集區。
  • 無伺服器計算:您可以用於定型作業的完全受控隨選計算。

注意

當 Azure Machine Learning 為您建立和管理無伺服器計算時,它不會列在工作室的計算頁面上。 深入了解如何使用無伺服器計算進行模型定型

雖然在處理機器學習工作負載時,計算是最重要的資源,但也可能是最耗費成本的資源。 因此,最佳做法是只允許系統管理員建立和管理計算資源。 不得允許資料科學家編輯計算,但只能使用可用的計算來執行其工作負載。

建立和管理資料存放區

工作區不會儲存任何資料本身。 然而,所有資料都會儲存在資料存放區中,也就是 Azure 資料服務的參考。 資料存放區所代表之資料服務的連線資訊會儲存在 Azure Key Vault 中。

建立工作區時,Azure 儲存體帳戶會隨之建立,且自動連線到工作區。 因此,您有四個已新增至工作區的兩個資料存放區:

  • workspaceartifactstore:連線到使用工作區建立之 Azure 儲存體帳戶的 azureml 容器。 用來在執行作業時儲存計算和實驗記錄。
  • workspaceworkingdirectory:連接到與工作室 Notebooks 區段所使用的工作區所建立的 Azure 儲存體帳戶檔案共用。 每當您上傳檔案或資料夾以從計算執行個體存取時,就會上傳至此檔案共用。
  • workspaceblobstore:連線到使用工作區建立之 Azure 儲存體帳戶的 Blob 儲存體。 特別是 azureml-blobstore-... 容器。 設定為預設資料存放區,這表示每當您建立資料資產並上傳資料時,就會儲存在此容器中。
  • workspacefilestore:連線到使用工作區建立之 Azure 儲存體帳戶的檔案共用。 特別是 azureml-filestore-... 檔案共用。

此外,您可以建立資料存放區以連線到其他 Azure 資料服務。 最常見的情況是,您的資料存放區會連線到 Azure 儲存體帳戶或 Azure Data Lake Storage (Gen2),因為這些資料服務最常用於資料科學專案中。