管理及增加 Azure Machine Learning 資源的配額
Azure 會使用限制和配額來防止因詐欺而導致的預算超支,並遵循 Azure 的容量條件約束。 當您對生產工作負載進行調整時,請考量這些限制。 在本文中,您會了解:
- 與 Azure Machine Learning 相關的 Azure 資源的預設限制。
- 建立工作區層級配額。
- 檢視您的配額和限制。
- 要求增加配額。
除了管理配額之外,您還可以了解如何規劃和管理 Azure Machine Learning 的成本,或了解 Azure Machine Learning 中的服務限制。
特殊考量
配額是一種信用限制,不是容量保證。 如果您有大規模的容量需求,請連絡 Azure 支援以增加配額。
配額會由訂用帳戶中的所有服務所共用,包括 Azure Machine Learning。 在評估容量時,請計算所有服務的使用量。
Azure Machine Learning 計算是例外。 該計算具有與核心計算配額不同的配額。
預設限制會因供應項目類別類型 (例如免費試用、隨用隨付) 和虛擬機器 (VM) 系列 (例如 Dv2、F、G) 而有所差異。
預設資源配額
在本節中,您會了解下列資源的預設和配額限制上限:
- Azure Machine Learning 資產
- Azure Machine Learning 計算
- Azure Machine Learning 受控線上端點
- Azure Machine Learning 管線
- 虛擬機器
- Azure Container Instances
- Azure 儲存體
重要
限制日後有可能會變更。 如需最新資訊,請參閱 Azure Machine Learning 中的服務限制。
Azure Machine Learning 資產
下列有關資產的限制適用於每個工作區。
資源 | 上限 |
---|---|
資料集 | 1000 萬 |
執行 | 1000 萬 |
模型 | 1000 萬 |
Artifacts | 1000 萬 |
此外,執行階段上限為 30 天,而每次執行記錄的計量數目上限為 100 萬個。
Azure Machine Learning Compute
Azure Machine Learning Compute 的核心數目 (依每個 VM 系列和累積的總核心數目分割),以及訂用帳戶中每個區域所允許的唯一計算資源數目具有預設配額限制。 此配額與上一節所列的 VM 核心配額不同,因為它只適用於 Azure Machine Learning 的受控計算資源。
要求增加配額,以針對此區段中不同 VM 系列的核心配額數、總訂用帳戶核心配額數、叢集配額數和資源數來提高其限制。
可用的資源:
根據您的訂用帳戶供應項目類型而定,每個區域的專用核心數預設限制為 24 到 300 個。 您可以為每個 VM 系列增加每個訂用帳戶的專用核心數目。 特製化的 VM 系列 (例如 NCv2、NCv3 或 ND 系列) 開頭會是預設的零個核心。 GPU 也預設為零核心。
根據您的訂用帳戶供應項目類型而定,每個區域的低優先順序核心數預設限制為 100 到 3,000 個。 您可以增加每個訂用帳戶的低優先順序核心數目,而這是跨 VM 系列的單一值。
每個區域的叢集數目都有 200 個的預設限制。 此限制由定型叢集、計算執行個體和 MIR 端點部署共用。 (就配額來說,計算執行個體算是單一節點叢集)。叢集配額最多可增加為指定訂用帳戶內每一區域 500 個。
提示
若要深入了解可要求增加配額的 VM 系列,請查看 Azure 中的虛擬機器大小。 例如,GPU VM 系列的系列名稱開頭為 "N" (例如:NCv3 series)
下表顯示平台中的其他限制。 透過 技術支援 票證連絡 Azure Machine Learning 產品小組,以要求例外狀況。
資源或動作 | 上限 |
---|---|
每個資源群組的工作區 | 800 |
單一 Azure Machine Learning Compute (AmlCompute) 叢集上的節點設定為非啟用通訊的集區 (亦即無法執行 MPI 作業) | 100 個節點,但可設定為最多 65,000 個節點 |
單一平行執行步驟中的節點會在 Azure Machine Learning Compute (AmlCompute) 叢集上執行 | 100 個節點,但如果您的叢集設定為根據上述比例調整,則最多可設定 65,000 個節點 |
單一 Azure Machine Learning Compute (AmlCompute) 叢集上的節點設定為已啟用通訊的集區 | 300 個節點,但可設定為最多 4000 個節點 |
單一 Azure Machine Learning Compute (AmlCompute) 叢集上的節點在已啟用 RDMA 的 VM 系列上設定為已啟用通訊的集區 | 100 個節點 |
單一 MPI 中的節點會在 Azure Machine Learning Compute (AmlCompute) 叢集上執行 | 100 個節點,但可以增加至 300 個節點 |
作業存留期 | 21 天1 |
低優先順序節點上的作業存留期 | 7 天2 |
每個節點的參數伺服器 | 1 |
1 最大存留期是作業開始和完成時之間的持續時間。 已完成的作業會無限期保存。 未在最長存留期內完成的作業資料無法存取。
2 如果有容量限制,則低優先順序節點上的作業可被先佔。 建議您在作業中實作檢查點。
Azure Machine Learning 受控線上端點
Azure Machine Learning 受控線上端點具有下表所述的限制。 這些是區域限制,這表示每個您使用的區域最多可以使用這些限制。
資源 | 限制 | 允許例外狀況 |
---|---|---|
端點名稱 | 端點名稱必須 |
- |
部署名稱 | 部署名稱必須 |
- |
每個訂用帳戶的端點數目 | 50 | 是 |
每個訂用帳戶的部署數目 | 200 | Yes |
每個端點的部署數目 | 20 | 是 |
每個部署的執行個體數目 | 20 2 | 是 |
端點層級的最大要求逾時 | 90 秒 | - |
所有部署的端點層級每秒要求總數 | 500 3 | 是 |
所有部署的端點層級每秒連線總數 | 500 3 | Yes |
所有部署的端點層級作用中連線總數 | 500 3 | Yes |
所有部署的端點層級總頻寬 | 5 MBPS 3 | 是 |
1 單一虛線 (例如,my-endpoint-name
) 在端點和部署名稱中可接受。
2 我們會保留 20% 的額外計算資源來執行升級。 例如,如果您在部署中要求 10 個執行個體,則必須有 12 個的配額。 否則,您會收到錯誤。
3 如果您要求增加限制,請務必計算可能需要的相關限制增加。 例如,如果您要求增加每秒要求的限制,您可能也會想要計算所需的連線和頻寬限制,並在相同要求中包含這些限制增加。
若要判斷端點目前的使用量,請檢視計量。
若要向 Azure Machine Learning 產品小組請求例外處理,請使用要求配額增加中的步驟。
Azure Machine Learning Kubernetes 線上端點
Azure Machine Learning Kubernetes 線上端點的限制如下表所述。
資源 | 限制 |
---|---|
端點名稱 | 與受控線上端點相同 |
部署名稱 | 與受控線上端點相同 |
每個訂用帳戶的端點數目 | 50 |
每個訂用帳戶的部署數目 | 200 |
每個端點的部署數目 | 20 |
端點層級的最大要求逾時 | 300 秒 |
每個訂用帳戶下 Kubernetes 線上端點和受控線上端點的總和不能超過 50 個。 同樣地,每個訂用帳戶下 Kubernetes 線上部署和受控線上部署的總和不能超過 200。
Azure Machine Learning 管線
Azure Machine Learning 管線有下列限制。
資源 | 限制 |
---|---|
管線中的步驟 | 30,000 |
每個資源群組的工作區 | 800 |
Azure Machine Learning 與 Synapse 整合
Azure Machine Learning 無伺服器 Spark 可讓您輕鬆存取分散式運算功能,以調整 Apache Spark 作業。 這會利用與 Azure Machine Learning Compute 相同的專用配額。 您可以提交支援票證並要求在「Machine Learning 服務:虛擬機器」類別下增加配額,以增加配額限制。
若要檢視配額使用量,請流覽至 Machine Learning Studio,然後選取您想要查看使用量的訂用帳戶名稱。 選取左側面板中的 [配額]。
虛擬機器
每個 Azure 訂用帳戶對於所有服務的虛擬機器數目都有限制。 虛擬機器核心有區域總限制和每個大小系列的區域限制。 這兩項限制會分別強制執行。
例如,請考慮美國東部訂用帳戶的總計 VM 核心限制為 30、A 系列核心限制為 30,和 D 系列核心限制為 30。 此訂用帳戶會允許部署 30 個 A1 VM、30 個 D1 VM,或是兩者的組合,總計不超過 30 個核心。
您無法將虛擬機器的限制提高至高於下表所顯示的值。
資源 | 限制 |
---|---|
與 Azure Active Directory 租使用者相關聯的 Azure 訂用帳戶 | 無限制 |
每個訂用帳戶的共同管理員 | 無限制 |
每個訂用帳戶的資源群組 | 980 |
Azure Resource Manager API 要求大小 | 4,194,304 個位元組 |
每個訂用帳戶的標記1 | 50 |
每個訂用帳戶的唯一標籤計算2 | 80,000 |
每個位置的訂用帳戶層級部署 | 8003 |
訂用帳戶層級部署的位置 | 10 |
1您可以直接將最多 50 個標記套用至一個訂用帳戶。 不過,該訂用帳戶可包含套用至訂用帳戶內資源群組和資源的標記數目不限。 每個資源或資源群組的標記數目受限於 50。
2只有當唯一標籤數目為 80,000 或更少時,資源管理員才會傳回訂用帳戶中標籤名稱和值的清單。 唯一標籤是由資源識別碼、標籤名稱和標籤值的組合所定義。 例如,具有相同標籤名稱和值的兩個資源會計算為兩個唯一標籤。 當數目超出 80,000 時,您仍然可以依照標記尋找資源。
3當記錄接近上限時,部署會自動從歷程記錄中刪除。 如需詳細資訊,請參閱 從部署歷程記錄自動刪除。
容器執行個體
如需詳細資訊,請參閱容器執行個體限制。
儲存體
Azure 儲存體的上限是每一訂用帳戶每個區域 250 個儲存體帳戶。 此限制包括 Standard 和 Premium 儲存體帳戶。
工作區層級配額
使用工作區層級配額來管理相同訂用帳戶中多個工作區之間的 Azure Machine Learning Compute 目標配置。
根據預設,所有工作區會共用與 VM 系列的訂用帳戶層級配額相同的配額。 不過,您可以在訂用帳戶中的工作區上設定個別 VM 系列的最大配額。 這可讓您共用容量,並避免資源爭用的問題。
- 移至您訂用帳戶中的任何工作區。
- 在左側窗格中,選取 [使用量 + 配額]。
- 選取 [設定配額] 索引標籤以檢視配額。
- 展開 VM 系列。
- 在該 VM 系列下所列的任何工作區上設定配額限制。
您無法設定負值或高於訂用帳戶層級配額的值。
注意
您需要訂用帳戶層級的權限,才能在工作區層級上設定配額。
在工作室中檢視配額
當您建立新的計算資源時,預設只會看到您已有配額要使用的 VM 大小。 將檢視切換為 [從所有選項選取]。
向下捲動,直到看到您沒有配額的 VM 大小清單為止。
使用連結直接前往線上客戶支援要求,以取得更多配額。
在 Azure 入口網站中檢視您的使用量和配額
若要檢視各種 Azure 資源 (例如虛擬機器、儲存體或網路) 的配額,請使用 Azure 入口網站:
在左窗格中,選取 [所有服務],然後選取 [一般] 類別底下的 [訂用帳戶]。
從訂用帳戶清單中,選取您要尋找其配額的訂用帳戶。
選取 [使用量 + 配額] 以檢視目前配額限制與使用量。 使用篩選來選取提供者和位置。
您可以與其他 Azure 配額分開管理訂用帳戶上的 Azure Machine Learning Compute 配額:
在 Azure 入口網站,移至您的 Azure Machine Learning 工作區。
在左側窗格刀鋒的 [支援 + 疑難排解] 區段下方,選取 [使用量 + 配額],以檢視目前配額限制與使用量。
選取訂用帳戶以檢視配額限制。 篩選至您感興趣的區域。
您可以在訂用帳戶層級檢視和工作區層級檢視之間切換。
要求增加配額
若要提高超過預設限制的限制或 VM 配額,請 免費開啟線上客戶支援要求 。
您無法將限制提高至高於前述表格中所顯示的上限值。 如果沒有上限,您就無法調整資源的限制。
要求增加配額時,請選取您要調整的服務。 例如,選取 [機器學習服務]、[容器執行個體] 或 [儲存體]。 針對 Azure Machine Learning 端點,您可以在檢視上述步驟中的配額時選取 [ 要求配額 ] 按鈕。
注意
免費試用訂用帳戶無法增加限制或配額。 如果您有免費試用訂用帳戶,您可以升級至隨用隨付訂用帳戶。 如需詳細資訊,請參閱將 Azure 免費試用版升級至隨用隨付和 Azure 免費帳戶常見問題集。
端點配額增加
要求增加配額時,請提供下列資訊:
開啟支援要求時,請選取 [Machine Learning 服務:端點限制] 作為 [配額類型]。
在 [其他詳細資料] 索引標籤上,選取 [輸入詳細資料],然後提供您想增加的配額和新值、配額增加要求的原因,以及需要增加配額的位置。 最後,選取 [儲存並繼續] 以便繼續。