針對已部署的 Machine Learning 工作室 (傳統) Web 服務建立端點

適用於:適用於。Machine Learning 工作室 (傳統) 不適用於。Azure Machine Learning

重要

Machine Learning 工作室 (傳統) 的支援將於 2024 年 8 月 31 日結束。 建議您在該日期之前轉換成 Azure Machine Learning

自 2021 年 12 月 1 日起,您將無法建立新的 Machine Learning 工作室 (傳統) 資源。 在 2024 年 8 月 31 日之前,您可以繼續使用現有的 Machine Learning 工作室 (傳統) 資源。

ML 工作室 (傳統) 文件即將淘汰,未來將不再更新。

部署 Web 服務之後,我們會建立該服務的預設端點。 該預設端點可使用其 API 金鑰進行呼叫。 您可以使用來自 Web 服務入口網站的其自有金鑰來新增更多端點。 Web 服務的每個端點都是個別定址、節流以及管理。 每個端點都是具有授權金鑰的唯一 URL,您可以將其散發給您的客戶。

將端點新增至 Web 服務

您可以使用 Machine Learning Web 服務入口網站將端點新增到 Web 服務。 建立端點之後,您就可以透過同步 API、批次 API 以及 Excel 工作表來取用該端點。

注意

如果您已在 Web 服務中新增額外的端點,就無法刪除預設端點。

  1. 在 Machine Learning 工作室 (傳統) 中,按一下左側的 [Web 服務]。
  2. 在 Web 服務儀表板底部,按一下 [管理端點]。 Machine Learning Web 服務 入口網站會開啟 Web 服務的端點頁面。
  3. 按一下 [新增]
  4. 輸入新端點的名稱和描述。 端點名稱長度不可超過 24 個字元,而且必須由小寫字母或數字組成。 選取記錄層級,以及是否啟用範例資料。 如需有關記錄的詳細資訊,請參閱 為 Machine Learning Web 服務啟用記錄

透過新增額外端點來調整 Web 服務規模

根據預設,系統將每個發佈的 Web 服務設定為支援 20 個並行要求,而且最多可達 200 個並行要求。 Machine Learning 工作室 (傳統) 會自動最佳化此設定,為您的 Web 服務提供最佳的效能,並忽略入口網站的值。

如果您打算以超過「並行呼叫數上限」值 200 可支援的負載來呼叫 API,則應該在相同的 Web 服務上建立多個端點。 然後,您就可以將負載隨機分配給所有端點。

調整 Web 服務規模一件常見的工作。 一些調整理由包括為了支援超過 200 個並行要求、透過多個端點提高可用性,或為 Web 服務提供個別的端點。 您可以透過 Machine Learning Web 服務入口網站新增更多端點來擴大同一個 Web 服務的規模。

請記住,如果您未以對應的高比例來呼叫 API,則使用較大的並行處理計數可能有害。 如果您將相對低的負載放在為高負載設定的 API,可能會看見延遲有零星的逾時及 (或) 突增情況。

通常在需要低度延遲的情況下,才會使用同步 API。 這裡所說的延遲意味著 API 完成一個要求所花費的時間,而未計入任何網路延遲的時間。 假設您有一個會延遲 50 毫秒的 API。 其節流層級為 [高] 且 [最大同時呼叫數目] 為 20,您必須每秒呼叫這個 API 20 * 1000 / 50 = 400 次,才能完全耗盡可用的容量。 再進一步延伸,假設會延遲 50 毫秒,則「並行呼叫數上限」200 可讓您每秒呼叫 API 4000 次。

後續步驟

如何使用 Machine Learning Web 服務