Azure Machine Learning Python SDK 版本資訊
本文說明 Azure Machine Learning Python SDK 的版本。 如需完整的 SDK 參考內容,請造訪 Azure Machine Learning 的適用於 Python 的主要 SDK 參考頁面。
RSS 摘要:將下列 URL 複製並貼上至您的摘要讀取器中,以在本頁更新時收到通知:https://learn.microsoft.com/api/search/rss?search=%22Azure+machine+learning+release+notes%22&locale=en-us
2023-05-20
適用于 Python 的 Azure Machine Learning SDK v1.51.0
- azureml-automl-core
- AutoML 預測工作現在支援滾動預測,以及階層式時間序列的分位數預測部分支援, (HTS) 。
- 不允許將非表格式資料集用於分類 (多類別和多標籤) 案例的客戶
- azureml-automl-dnn-nlp
- 不允許將非表格式資料集用於分類 (多類別和多標籤) 案例的客戶
- azureml-contrib-automl-pipeline-steps
- AutoML 預測工作現在支援滾動預測,以及階層式時間序列的分位數預測部分支援, (HTS) 。
- azureml-fsspec
- 以從 azureml-dataprep 匯入的自訂 UserErrorException 取代 MLTable & FSSpec 中的所有使用者造成錯誤。
- azureml-interpret
- 已更新 azureml-interpret 套件以解譯社群 0.29.*
- azureml-pipeline-core
- 修正
pipeline_version
呼叫pipeline_endpoint.submit()
時不會生效。
- 修正
- azureml-train-automl-client
- AutoML 預測工作現在支援滾動預測,以及階層式時間序列的分位數預測部分支援, (HTS) 。
- azureml-train-automl-runtime
- AutoML 預測工作現在支援滾動預測,以及階層式時間序列的分位數預測部分支援, (HTS) 。
- mltable
- 載入 MLTable 檔案時,現在支援類似
utf-8
的其他編碼變體。 - 以從 azureml-dataprep 匯入的自訂 UserErrorException 取代 MLTable & FSSpec 中的所有使用者造成錯誤。
- 載入 MLTable 檔案時,現在支援類似
2023-04-10
適用于 Python 的 Azure Machine Learning SDK v1.50.0
- azureml-contrib-automl-dnn-forecasting
- 已針對 TCN 模型新增預測的指定量子支援。
- azureml-responsibleai
- 已將 Common environment 和 azureml-responsibleai 套件更新為 raiwidgets 和 responsibleai 0.26.0
- azureml-train-automl-runtime
- 修正模型測試案例的 MLTable 處理
- azureml-training-tabular
- 在 forecast_quantile 方法中新增 quantiles 作為 參數。
2023-03-01
宣佈在 Azure Machine Learning SDK v1 套件中終止對 Python 3.7 的支援
- 功能淘汰
- 將 Python 3.7 取代為 SDK v1 套件支援的執行時間
- 在 2023 年 12 月 4 日,Azure Machine Learning 將正式停止支援適用于 SDK v1 套件的 Python 3.7,並將其取代為支援的執行時間。 如需詳細資訊,請參閱Azure SDK for Python 版本支援原則上的頁面
- 自 2023 年 12 月 4 日起,Azure Machine Learning SDK v1 套件將不再收到 Python 3.7 執行時間的安全性修補程式和其他更新。
- Azure Machine Learning SDK v1 目前的 Python 3.7 版本仍可運作。 不過,為了繼續接收安全性更新和剩餘的技術支援,Azure Machine Learning 強烈建議您將腳本和相依性移至支援的 Python 執行時間版本。
- 作為 Azure Machine Learning SDK v1 檔案的執行時間,我們建議使用 Python 3.8 版或更新版本。
- 此外,Python 3.7 型 Azure Machine Learning SDK v1 套件將不再符合技術協助的資格。
- 如果您有任何疑慮,請使用 Azure Machine Learning 支援與我們連絡。
- 將 Python 3.7 取代為 SDK v1 套件支援的執行時間
2023-13-02
適用于 Python 的 Azure Machine Learning SDK v1.49.0
- 重大變更
- 從 v1.49.0 和更新版本開始,不支援下列 AutoML 演算法。
- 回歸:FastLinearRegressor、OnlineGradientDescentRegressor
- 分類:AveragedPerceptronClassifier。
- 使用 v1.48.0 或更新版本繼續使用這些演算法。
- 從 v1.49.0 和更新版本開始,不支援下列 AutoML 演算法。
- 錯誤修正與改善項目
- azureml-automl-dnn-nlp
- 根據預設值和使用者指定的值,記錄來顯示套用至模型和超參數設定的最終值。
- azureml-contrib-automl-dnn-forecasting
- TCNForecaster 的非標準現在會反映來自最後一個 epoch 的值。
- 執行 TCN 訓練實驗時,現在可以使用訓練集和測試集的預測水準視覺效果。
- 執行不會再失敗,因為「無法計算 TCN 計量」錯誤。 警告訊息指出「預測計量計算導致錯誤,回報最差分數」仍會記錄。 相反地,當我們連續出現兩次以上的 inf/nan 驗證遺失,並出現「不正確模型,TCN 定型未交集」訊息時,就會引發例外狀況。 客戶需要注意載入的模型可能會在這項變更之後推斷時,傳回nan/inf 值做為預測。
- azureml-core
- Azure Machine Learning 工作區建立會利用 Log Analytics 型 Application Insights 來準備淘汰傳統 Application Insights。 想要使用傳統 Application Insights 資源的使用者可以在建立 Azure Machine Learning 工作區時指定自己的資源。
- azureml-interpret
- 已更新 azureml-interpret 套件以解譯社群 0.28.*
- azureml-mlflow
- 使用 MLflow 2.0 的初始支援更新 azureml-mlflow 用戶端
- azureml-responsibleai
- 已將 azureml-responsibleai 套件和筆記本更新為 raiwidgets 和 responsibleai v0.24.0
- azureml-sdk
- azureml-sdk 和 azureml-train-automl-client 現在支援 Python 3.10 版
- azureml-train-automl-client
- azureml-sdk 和 azureml-train-automl-client 現在支援 Python 3.10 版
- azureml-train-automl-runtime
- 在定型之前清除遺漏的 y
- 針對非串流案例清除目標資料行的nan 或空白值
- 測試集的預測水準視覺效果現在可在執行訓練實驗時使用。
- azureml-train-core
- 已將支援新增至客戶,以提供 Hyperdrive 執行的自訂執行識別碼
- azureml-train-restclients-hyperdrive
- 已將支援新增至客戶,以提供 Hyperdrive 執行的自訂執行識別碼
- azureml-automl-dnn-nlp
2022-12-05
適用于 Python 的 Azure Machine Learning SDK v1.48.0
重大變更
- Azure Machine Learning SDK 套件已淘汰 Python 3.6 支援。
錯誤修正與改善項目
- azureml-core
- 建立為工作區建立一部分的儲存體帳戶現在預設會設定要停用的 Blob 公用存取
- azureml-responsibleai
- 已將 azureml-responsibleai 套件和筆記本更新為 raiwidgets 和 responsibleai 套件 v0.23.0
- 已將模型序列化程式和 pyfunc 模型新增至 azureml 負責的套件,以便輕鬆地儲存和擷取模型
- azureml-train-automl-runtime
- 已新增 ManyModels 參數和階層式TimeSeries 參數的檔字串
- 已修正產生的程式碼無法正確定型/測試分割的錯誤。
- 已修正導致預測產生的程式碼定型作業失敗的錯誤。
- azureml-core
2022-10-25
適用於 Python 的 Azure Machine Learning SDK v1.47.0
- azureml-automl-dnn-nlp
- AutoML NLP 的執行階段變更,以考慮固定定型參數,作為新導入的模型掃掠和超參數微調的一部分。
- azureml-mlflow
- AZUREML_ARTIFACTS_DEFAULT_TIMEOUT 可用來控制成品上傳的逾時
- azureml-train-automl-runtime
- 許多模型和階層式時間序列定型現在會強制檢查逾時參數,在提交實驗以供執行之前偵測衝突。 這可防止在執行期間發生實驗失敗,方法是在提交實驗之前引發例外狀況。
- 客戶現在可以在許多模型推斷中使用滾動預測來控制步驟大小。
- 具有未分割表格式資料的 ManyModels 推斷現在支援 forecast_quantiles。
2022-09-26
適用於 Python 的 Azure Machine Learning SDK v1.46.0
- azureml-automl-dnn-nlp
- 客戶將不再允許在 CoNLL 中指定一行,其只包含權杖。 行必須一律是空的新行,或是只有一個語彙基元後面緊接著一個空格,後面接著一個標籤的行。
- azureml-contrib-automl-dnn-forecasting
- 在交叉驗證分割之後,樣本會縮減為 1,但sample_size仍然指向分割前的計數,因此在某些情況下,batch_size最後會超過樣本計數。 在此修正中,我們會在分割之後初始化 sample_size
- azureml-core
- 在推斷客戶使用 CLI/SDK v1 模型部署 API 來部署模型,以及 Python 版本為 3.6 和更少時,新增取代警告。
- 下列值
AZUREML_LOG_DEPRECATION_WARNING_ENABLED
會變更行為,如下所示:- 預設值 - 當客戶使用 Python 3.6 和更少且適用于 cli/sdk v1 時,會顯示警告。
True
- 在 azureml-sdk 套件上顯示 sdk v1 淘汰警告。False
- 在 azureml-sdk 套件上停用 sdk v1 淘汰警告。
- 設定環境變數以停用淘汰訊息時要執行的命令:
- Windows -
setx AZUREML_LOG_DEPRECATION_WARNING_ENABLED "False"
- Linux -
export AZUREML_LOG_DEPRECATION_WARNING_ENABLED="False"
- Windows -
- azureml-interpret
- 已將 azureml-interpret 套件更新為 interpret-community 0.27。*
- azureml-pipeline-core
- 將排程預設時區修正為 UTC。
- 修正在 DataTransfer 步驟中使用 SqlDataReference 時不正確的重複使用問題。
- azureml-responsibleai
- 將 azureml-responsibleai 套件及策展影像更新為 raiwidgets 和 responsibleai v0.22.0
- azureml-train-automl-runtime
- 已修正產生的指令碼中導致某些計量無法在 UI 中正確轉譯的錯誤 (bug)。
- 許多模型現在支援推斷的滾動預測。
- 支援在許多模型案例中傳回熱門
N
模型。
2022-08-29
適用於 Python 的 Azure Machine Learning SDK v1.45.0
- azureml-automl-runtime
- 已修正 sample_weight 資料行未正確驗證的錯誤。
- 已將 rolling_forecast() 公用方法新增至所有支援的預測模型預測管道包裝函式。 這個方法會取代已遭取代的 rolling_evaluation() 方法。
- 已修正 AutoML 迴歸工作可能會回復到模型評估的定型有效分割的問題,而 CV 本來是更合適的選擇。
- azureml-core
- 已新增新的雲端組態尾碼「aml_discovery_endpoint」。
- 已將廠商的 azure-storage 套件從第 2 版更新為第 12 版。
- azureml-mlflow
- 已新增新的雲端組態尾碼「aml_discovery_endpoint」。
- azureml-responsibleai
- 將 azureml-responsibleai 套件及策展影像更新為 raiwidgets 和 responsibleai 0.21.0
- azureml-sdk
- azureml-sdk 套件現在允許 Python 3.9。
2022-08-01
適用於 Python 的 Azure Machine Learning SDK v1.44.0
- azureml-automl-dnn-nlp
- 加權正確性和馬修斯相關係數 (MCC) 將不再是 NLP 多標籤分類計算計量上顯示的計量。
- azureml-automl-dnn-vision
- 提供不正確註釋格式時引發使用者錯誤
- azureml-cli-common
- 已更新 v1 CLI 描述
- azureml-contrib-automl-dnn-forecasting
- 修正了驗證資料集中不同時間序列時,導致 TCNForecaster 的「無法計算 TCN 計量」問題。
- 已新增 DNN 預測模型的自動時間序列識別碼偵測,例如 TCNForecaster。
- 已修正預測 TCN 模型的錯誤,即當使用者提供驗證集時,驗證資料在某些情況下可能會損毀。
- azureml-core
- 允許從執行下載成品時設定 timeout_seconds 參數
- 已新增警告訊息 - Azure Machine Learning CLI v1 將于 2025-09-淘汰。 建議使用者採用 CLI v2。
- 修正提交至非 AmlComputes 擲回例外狀況。
- 已新增環境的 docker 內容支援
- azureml-interpret
- 增加 AutoML 套件的 numpy 版本
- azureml-pipeline-core
- 修正提交管道時 regenerate_outputs=True 未生效。
- azureml-train-automl-runtime
- 增加 AutoML 套件的 numpy 版本
- 啟用視覺和 nlp 的程式碼產生
- 建立粒紋的原始資料行會作為 predictions.csv 的一部分新增
2022-07-21
宣佈在 Azure Machine Learning SDK v1 套件中終止對 Python 3.6 的支援
- 功能淘汰
- 將 Python 3.6 取代為 SDK v1 套件支援的執行階段
- 在 2022 年 12 月 5 日,Azure Machine Learning 會將 Python 3.6 取代為支援的執行時間,正式結束對 SDK v1 套件的 Python 3.6 支援。
- 從 2022 年 12 月 5 日淘汰日期起,Azure Machine Learning 將不再將安全性修補程式和其他更新套用至 Azure Machine Learning SDK v1 套件所使用的 Python 3.6 執行時間。
- 具有 Python 3.6 的現有 Azure Machine Learning SDK v1 套件仍會繼續執行。 不過,Azure Machine Learning 強烈建議您將腳本和相依性移轉至支援的 Python 執行時間版本,以便您繼續收到安全性修補程式,並仍符合技術支援資格。
- 我們建議使用 Python 3.8 版本作為 Azure Machine Learning SDK v1 套件的執行時間。
- 此外,使用 Python 3.6 的 Azure Machine Learning SDK v1 套件將不再符合技術支援資格。
- 若您還有任何疑問,請透過 AML 支援連絡我們。
- 將 Python 3.6 取代為 SDK v1 套件支援的執行階段
2022-06-27
- azureml-automl-dnn-nlp
- 從多標籤預測中移除重複的標籤資料行
- azureml-contrib-automl-pipeline-steps
- 現在許多模型也提供以 CSV 格式產生預測輸出的功能。 - 許多模型預測現在會在輸出檔案中包含資料行名稱,以防 csv 檔案格式。
- azureml-core
- Active Directory 驗證程式庫 (ADAL) 現在已遭取代,而且所有驗證類別現在皆會使用 MSAL 驗證。 安裝 azure-cli > =2.30.0,以在使用 AzureCliAuthentication 類別時利用 MSAL 型驗證。
- 已新增修正程式,在
Environment.build(workspace)
時強制環境註冊。 當環境自其他執行個體複製或繼承時,此修正程式解決了構建的最新環境,而非要求環境的混淆。 - SDK 警告訊息,在 2022 年 5 月 31 日之前重新啟動計算執行個體 (如果是在 2021 年 9 月 19 日前建立的計算執行個體)
- azureml-interpret
- 已將 azureml-interpret 封裝更新為 interpret-community 0.26.*
- 在 azureml-interpret 封裝中,新增從評分解譯器取得原始名稱和工程設計功能名稱的能力。 此外,將範例新增至評分筆記本,從評分解譯器取得功能名稱,並新增原始名稱和工程設計功能名稱的相關文件。
- azureml-mlflow
- azureml-core 作為 azureml-mlflow 的相依性已遭移除。 - MLflow 專案和本機部署需要 azureml-core,且必須個別安裝。
- 新增建立端點並透過 MLflow 用戶端外掛程式部署至端點的支援。
- azureml-responsibleai
- 已將 azureml-responsibleai 封裝和環境映像更新為最新的 responsibleai 和 raiwidgets 0.19.0 版本
- azureml-train-automl-client
- 現在支援 OutputDatasetConfig 作為 MM/HTS 準銷售案源建立器的輸入。 對應為:1) OutputTabularDatasetConfig:將 > 視為未分割的表格式資料集。 2) OutputFileDatasetConfig:將 > 視為已歸檔的資料集。
- azureml-train-automl-runtime
- 已新增資料驗證,要求資料集中的少數類別範例數目至少與所要求的 CV 摺疊數目相同。
- 自動交叉驗證參數設定現在可供 AutoML 預測工作使用。 使用者現在可以為 n_cross_validations 和 cv_step_size 指定「自動」,或將其保留空白,而 AutoML 會根據您的資料提供這些設定。 不過,啟用 TCN 時目前不支援此功能。
- 許多模型和階層時間序列中的預測參數現在可以透過物件傳遞,而非使用字典中的個別參數。
- 已啟用在 Power BI 中使用分位數支援的預測模型端點。
- 已將 AutoML scipy 的相依性界限從 1.5.2 更新為 1.5.3
2022-04-25
適用於 Python 的 Azure Machine Learning SDK v1.41.0
重大變更警告
此重大變更來自 6 月發行的 azureml-inference-server-http
。 在 azureml-inference-server-http
6 月版本 (v0.9.0) 中,已卸載 Python 3.6 支援。 由於 azureml-defaults
相依 azureml-inference-server-http
于 ,此變更會傳播至 azureml-defaults
。 如果您未使用 azureml-defaults
推斷,請隨意使用 azureml-core
或任何其他 Azure Machine Learning SDK 套件,而不是安裝 azureml-defaults
。
- azureml-automl-dnn-nlp
- 預設會開啟長範圍文字功能。
- azureml-automl-dnn-vision
- 將 ObjectAnnotation 類別類型從物件變更為 「data object」。
- azureml-core
- 此版本會更新 Keyvault 類別,而客戶會使用此類別,讓他們可在使用 SDK 建立秘密時提供 keyvault 內容類型。 此版本也會更新 SDK,以包含可讓客戶從特定秘密中擷取內容類型值的新函式。
- azureml-interpret
- 已將 azureml-interpret 套件更新為 interpret-community 0.25.0
- azureml-pipeline-core
- 若使用
pipeline_run.wait_for_completion
,請勿再列印執行詳細資料show_output=False
- 若使用
- azureml-train-automl-runtime
- 修正當定型環境中存在 azureml-contrib-automl-dnn-forecasting 套件時,會導致無法產生程式碼的錯誤 (bug)。
- 使用不含標籤資料行的測試資料集搭配 AutoML 模型測試時發生的錯誤。
2022-03-28
適用於 Python 的 Azure Machine Learning SDK v1.40.0
- azureml-automl-dnn-nlp
- 我們會使長範圍文字功能成為選擇性功能,而且只有在客戶明確選擇該功能時,才能使用 kwarg "enable_long_range_text"
- 針對多重類別分類案例新增資料驗證層,其會套用與通用驗證的多重標籤相同的基類,並針對更多工作特定的資料驗證檢查套用衍生類別。
- azureml-automl-dnn-vision
- 修正計算類別權數時發生的 KeyError。
- azureml-contrib-reinforcementlearning
- 即將淘汰 RL 服務的 SDK 警告訊息
- azureml-core
-
- 傳回新執行階段在執行物件上呼叫任何 get logs 函式 (包括
run.get_details
、run.get_all_logs
等等) 時所經歷的執行記錄。
- 傳回新執行階段在執行物件上呼叫任何 get logs 函式 (包括
- 已新增實驗方法 Datastore.register_onpremises_hdfs,以允許使用者建立指向內部部署 HDFS 資源的資料存放區。
- 更新 help 命令中的 CLI 文件
-
- azureml-interpret
- 針對 azureml-interpret 套件,利用封裝更新來移除形狀鎖定。 在 CE env 更新之後移除 numba 和 numpy 鎖定。
- azureml-mlflow
- 未提供設定物件時,MLflow 部署用戶端 run_local 失敗的錯誤 (bug) 修正程式。
- azureml-pipeline-steps
- 移除所取代管線 EstimatorStep 的中斷連結
- azureml-responsibleai
- 將 azureml-responsibleai 套件更新為 raiwidgets 和 responsibleai 0.17.0 版
- azureml-train-automl-runtime
- 自動化 ML 的程式碼產生現在支援 ForecastTCN 模型 (實驗性)。
- 透過程式碼產生建立的模型現在具有預設計算的所有計量 (除了正規化的平均值絕對誤差、正規化的中位數絕對誤差、正規化的 RMSE,以及在預測模型時正規化的 RMSLE)。 您可以編輯
get_metrics_names()
的傳回值,來變更要計算的計量清單。 交叉驗證現在預設將用於預測透過程式碼產生所建立的模型。
- azureml-training-tabular
- 您可以編輯
get_metrics_names()
的傳回值,來變更要計算的計量清單。 交叉驗證現在預設將用於預測透過程式碼產生所建立的模型。 - 將十進位類型 y-test 轉換成 float,以允許計量計算繼續進行,而不會發生錯誤。
- 您可以編輯
2022-02-28
適用於 Python 的 Azure Machine Learning SDK v1.39.0
- azureml-automl-core
- 修正 PBI 中顯示的不正確格式,以便可與 AutoML 迴歸模型整合
- 新增 min-label-classs 會檢查是否有這兩個分類工作 (多類別和多標籤)。 如果輸入訓練資料集中的唯一類別數目少於 2,就會擲回客戶的執行錯誤。 在少於兩個類別上執行分類是無意義的。
- azureml-automl-runtime
- 將十進位類型 y-test 轉換成 float,以允許計量計算繼續進行,而不會發生錯誤。
- AutoML 定型現在支援 numpy 1.8 版。
- azureml-contrib-automl-dnn-forecasting
- 已修正 TCNForecaster 模型中的錯誤 (bug),其中在提供交叉驗證設定時,並不會使用所有定型資料。
- TCNForecaster 包裝函式的預測方法,其會損毀推斷時間預測。 也修正了下列問題:預測方法不會在定型有效案例中使用最新內容資料。
- azureml-interpret
- 針對 azureml-interpret 套件,利用封裝更新來移除形狀鎖定。 在 CE env 更新之後移除 numba 和 numpy 鎖定。
- azureml-responsibleai
- 將 azureml-responsibleai 套件更新為 raiwidgets 和 responsibleai 0.17.0 版
- azureml-synapse
- 修正魔術小工具消失的問題。
- azureml-train-automl-runtime
- 更新 AutoML 相依性以支援 Python 3.8。 這項變更會中斷與使用 SDK 1.37 或更新版本定型的模型相容性,因為較新的 Pandas 介面會儲存在模型中。
- AutoML 定型現在支援 numpy 1.19 版
- 修正 automl_setup_model_explanations API 中整體模型的 AutoML 重設索引邏輯
- 在 AutoML 中,於最新的 lightgbm 版本升級之後,請針對疏鬆案例使用 lightgbm 代理模型,而不是線性代理模型
- AutoML 所產生的所有內部中繼成品現在會以透明方式儲存在父執行上 (而不是傳送至預設工作區 Blob 存放區)。 使用者應該可以在父執行的
outputs/
目錄下看到 AutoML 產生的成品。
2022-01-24
適用於 Python 的 Azure Machine Learning SDK v1.38.0
- azureml-automl-core
- AutoML 中的 Tabnet 迴歸輸入變數和 Tabnet 分類器支援
- 將資料轉換程式儲存在父執行輸出中,這可以重複使用以產生相同的特徵化資料集,在實驗執行期間使用
- 支援在 get_primary_metrics API 中取得用於預測工作的主要計量。
- 已將 v2 評分指令碼中的第二個選擇性參數重新命名為 GlobalParameters
- azureml-automl-dnn-vision
- 已在計量 UI 中新增評分計量
- azureml-automl-runtime
- 下列情況的錯誤 (bug) 修正程式:NimbusML 模型的演算法名稱可能會在 ML 工作室或主控台輸出上顯示為空字串。
- azureml-core
- 已在 azureml.core.webservice.aks.AksWebservice.deploy_configuration 中新增參數 blobfuse_enabled。 當此參數為 true 時,會使用 blobfuse 下載模型和評分檔案,而不是 Blob 儲存體 API。
- azureml-interpret
- 已將 azureml-interpret 更新為 interpret-community 0.24.0
- 在 azureml-interpret 更新評分解釋器中,支援具有疏鬆 TreeExplainer 的最新版 lightgbm
- 將 azureml-interpret 更新為 interpret-community 0.23.*
- azureml-pipeline-core
- 在 pipelinedata 中新增附註,建議使用者改用管線輸出資料集。
- azureml-pipeline-steps
- 將
environment_variables
新增至 ParallelRunConfig,執行階段環境變數可由此參數傳遞,而且會在使用者指令碼執行所在的流程上進行設定。
- 將
- azureml-train-automl-client
- AutoML 中的 Tabnet 迴歸輸入變數和 Tabnet 分類器支援
- azureml-train-automl-runtime
- 將資料轉換程式儲存在父執行輸出中,這可以重複使用以產生相同的特徵化資料集,在實驗執行期間使用
- azureml-train-core
- 在 Hyperdrive 中啟用早期終止貝氏最佳化的支援
- 貝氏和 GridParameterSampling 物件現在可以傳遞屬性
2021-12-13
適用於 Python 的 Azure Machine Learning SDK v1.37.0
重大變更
- azureml-core
- 從 1.37.0 版開始,Azure Machine Learning SDK 會使用 MSAL 作為基礎驗證程式庫。 MSAL 使用 Azure Active Directory (Azure AD) v2.0 驗證流程來提供更多功能,並提高權杖快取的安全性。 如需更多詳細資訊,請參閱 Microsoft 驗證程式庫 (MSAL) 概觀。
- 將 AML SDK 相依性更新至適用於 Python 的最新版 Azure 資源管理用戶端程式庫 (azure-mgmt-resource>=15.0.0,<20.0.0) & 採用 track2 SDK。
- 從版本 1.37.0 開始,azure-ml-cli 擴充功能應該與最新版的 Azure CLI >=2.30.0 相容。
- 在管線中使用 Azure CLI (例如 Azure DevOps) 時,請確定所有的工作/階段都是針對 MSAL 型 Azure CLI 使用 v2.30.0 以上的 Azure CLI 版本。 Azure CLI 2.30.0 與舊版不相容,而且在使用不相容的版本時,會擲回錯誤。 若要搭配 Azure Machine Learning SDK 使用 Azure CLI 認證,應將 Azure CLI 安裝為 pip 套件。
- azureml-core
錯誤修正與改善項目
- azureml-core
- 已從 Kubernetes 計算的附加工作流程中移除執行個體類型。 現在可以直接在 Kubernetes 叢集中設定執行個體類型。 如需詳細資訊,請造訪 aka.ms/amlarc/doc。
- azureml-interpret
- 已更新 azureml-interpret 為 interpret-community 0.22.*
- azureml-pipeline-steps
- 修正了在 AutoMLStep 提交管線時,可能會建立實驗 "placeholder" 的錯誤 (bug)。
- azureml-responsibleai
- 將 azureml-responsibleai 和計算執行個體環境更新為 responsibleai 和 raiwidgets 0.15.0 版本
- 將 azureml responsibleai 套件更新為最新的 responsibleai 0.14.0。
- azureml-tensorboard
- 您現在可以使用
Tensorboard(runs, use_display_name=True)
,將 TensorBoard 記錄掛接到名稱為run.display_name/run.id
的資料夾,而不是run.id
。
- 您現在可以使用
- azureml-train-automl-client
- 修正了在 AutoMLStep 提交管線時,可能會建立實驗 "placeholder" 的錯誤 (bug)。
- 更新 AutoMLConfig test_data 和 test_size docs 以反映預覽狀態。
- azureml-train-automl-runtime
- 新增了新功能,可讓使用者傳遞具有一個唯一值的時間序列粒紋。
- 在某些情況下,AutoML 模型可以預測 NaN。 在測試回合中計算計量之前,將會從測試資料集和預測中移除對應至這些 NaN 預測的資料列。
- azureml-core
2021-11-08
適用於 Python 的 Azure Machine Learning SDK v1.36.0
- 錯誤修正與改善項目
- azureml-automl-dnn-vision
- 修正一些錯誤訊息中的次要打字錯誤。
- azureml-contrib-reinforcementlearning
- 不再支援使用模擬器的增強式學習執行。
- azureml-core
- 已新增資料分割進階 Blob 的支援。
- 不再支援指定非公用雲端進行受控識別驗證。
- 使用者可以將 AKS Web 服務移轉至線上端點和部署,這是由 CLI (v2) 所管理。
- Kubernetes 計算目標上定型作業的執行個體類型現在可以透過 RunConfiguration 屬性設定: run_config.kubernetescompute.instance_type。
- azureml-defaults
- 移除多餘的相依性,例如 gunicorn 和 werkzeug
- azureml-interpret
- azureml-interpret 套件已更新為 interpret-community 0.21.* 版本
- azureml-pipeline-steps
- 取代 MpiStep 可讓您使用 CommandStep 來執行 ML 定型 (包括管線中的分散式定型)。
- azureml-train-automl-rutime
- 更新 AutoML 模型測試預測輸出格式檔。
- 已新增 Naive 、SeasonalNaive、Average 和 SeasonalAverage 預測模型的 docstring 描述。
- 特徵化摘要現在會在執行上儲存為成品 (並在 [輸出] 資料夾下檢查名為 'featurization_summary.json' 的檔案)
- 啟用 Tabnet 學習模組的類別指示器支援。
- 將縮減取樣參數新增至 automl_setup_model_explanations,可讓使用者透過將此參數設定為 false,來取得所有資料的說明,而無需進行縮減。
- azureml-automl-dnn-vision
2021-10-11
適用於 Python 的 Azure Machine Learning SDK v1.35.0
- 錯誤修正與改善項目
- azureml-automl-core
- 啟用二元計量計算
- azureml-contrib-fairness
- 改善儀表板下載失敗時的錯誤訊息
- azureml-core
- 不再支援指定非公用雲端進行受控識別驗證。
- 現在已移除 Dataset.File.upload_directory() 和 Dataset.Tabular.register_pandas_dataframe() 實驗旗標。
- 現在會移除 TabularDataset 類別 partition_by() 方法中的實驗旗標。
- azureml-pipeline-steps
- 現在已針對 ParallelRunConfig 類別的
partition_keys
參數移除實驗旗標。
- 現在已針對 ParallelRunConfig 類別的
- azureml-interpret
- azureml-interpret 套件已更新為 intepret-community 0.20.*
- azureml-mlflow
- 可以使用子目錄以 MLflow 記錄成品和影像
- azureml-responsibleai
- 改善儀表板下載失敗時的錯誤訊息
- azureml-train-automl-client
- 新增電腦視覺工作的支援,例如影像分類、物件偵測和執行個體分割。 如需詳細檔,請參閱: 使用 Python (v1) 設定 AutoML 來定型電腦視覺模型 。
- 啟用二元計量計算
- azureml-train-automl-runtime
- 將 TCNForecaster 支援新增至模型測試回合。
- 更新 predictions.csv 輸出格式的模型測試。 輸出資料行現在包含原始目標值和傳入測試回合的功能。 您可以設定
AutoMLConfig
中的test_include_predictions_only=True
,或設定ModelProxy.test()
中的include_predictions_only=True
來關閉這項功能。 如果使用者要求只包含預測,則輸出格式看起來像 (預測與回歸) 相同:分類 = > [預測值] [機率] 回歸 = [預測值] 回歸 = [預測值],否則 (預設) :分類 = >> [原始測試資料標籤] [預測值] [probabilities] [features] 回歸 = > [原始測試資料標籤] [功能] 資料[predicted values]
行名稱 =[label column name] + "_predicted"
。[probabilities]
資料行名稱 =[class name] + "_predicted_proba"
。 如果未傳入任何目標資料行做為測試回合的輸入,則[original test data labels]
不會出現在輸出中。
- azureml-automl-core
2021-09-07
適用於 Python 的 Azure Machine Learning SDK v1.34.0
- 錯誤修正與改善項目
- azureml-automl-core
- 已新增重新學習先前定型預測管線的支援。
- 已新增在定型資料上取得預測的功能 (樣本內預測)。
- azureml-automl-runtime
- 新增支援,以從 AutoML 分類器模型的已部署端點傳回預測機率。
- 為使用者新增預測選項,以指定所有預測都應為整數。
- 移除目標資料行名稱,使其成為本機實驗 training_data_label_column_name 的模型說明功能名稱的一部分,並
- 作為資料集輸入。
- 已新增重新學習先前定型預測管線的支援。
- 已新增在定型資料上取得預測的功能 (樣本內預測)。
- azureml-core
- 已新增在表格式資料集中設定資料流程資料行類型、掛接及下載資料流程資料行的支援。
- 新增至 Kubernetes.attach_configuration (identity_type = None 的選擇性欄位,identity_ids = None) 允許附加具有 SystemAssigned 或 UserAssigned 身分識別的 KubernetesCompute。 呼叫 print (compute_target) 或 compute_target.serialize () 時會包含新的識別欄位:identity_type、identity_id、principal_id和tenant_id/client_id。
- azureml-dataprep
- 已新增設定表格式資料集之資料流程資料行類型的支援。 已新增在表格式資料集中掛接和下載資料流程資料行的支援。
- azureml-defaults
- 相依性
azureml-inference-server-http==0.3.1
已新增至azureml-defaults
。
- 相依性
- azureml-mlflow
- 藉由新增
max_results
和page_token
選擇性參數,允許 LIST_EXPERIMENTS API 的分頁。 如需文件,請參閱 MLflow 官方文件。
- 藉由新增
- azureml-sdk
- 已取代 azureml-sdk 中的已淘汰套件 (azureml-train) 相依性。
- 將 azureml-responsibleai 新增至 azureml-sdk 額外項目
- azureml-train-automl-client
- 公開
AutoMLConfig
中的test_data
和test_size
參數。 這些參數可以用來在模型 - 定型階段完成之後,自動啟動測試回合。 測試會使用最佳模型來計算預測,並產生這些預測的計量。
- 公開
- azureml-automl-core
2021-08-24
Azure Machine Learning 測試使用者介面
- 執行刪除
- 執行刪除是一項新功能,可讓使用者從工作區中刪除一或多個執行。
- 這項功能可協助使用者從 UI 定期直接刪除執行和實驗,以降低儲存體成本及管理儲存體容量。
- 批次取消執行
- 批次取消執行是新的功能,可讓使用者從其執行清單中選取一或多個執行來取消。
- 這項功能可協助使用者取消多個已排入佇列的執行,並釋放叢集空間。
2021-08-18
Azure Machine Learning 測試使用者介面
- 執行顯示名稱
- 執行顯示名稱是可以指派給執行的新顯示名稱,以及可編輯和選擇性的顯示名稱。
- 此名稱有助於更有效地追蹤、組織及探索執行。
- 執行顯示名稱預設為 adjective_noun_guid 格式 (範例:awesome_watch_2i3uns)。
- 您可以將此預設名稱編輯成更容易自訂的名稱。 您可以從 Azure Machine Learning 工作室使用者介面的執行詳細資料頁面進行編輯。
2021-08-02
適用於 Python 的 Azure Machine Learning SDK v1.33.0
- 錯誤修正與改善項目
- azureml-automl-core
- 改進 XGBoost 模型擷取的錯誤處理。
- 已新增將預測從浮點數轉換成整數以進行預測和迴歸工作的可能性。
- 已將 AutoMLConfig 中 enable_early_stopping 的預設值更新為 True。
- azureml-automl-runtime
- 已新增將預測從浮點數轉換成整數以進行預測和迴歸工作的可能性。
- 已將 AutoMLConfig 中 enable_early_stopping 的預設值更新為 True。
- azureml-contrib-automl-pipeline-steps
- 已啟用階層式時間序列 (HTS),透過管線進行預測工作。
- 新增推斷的表格式資料集支援
- 可以為推斷資料指定自訂路徑
- azureml-contrib-reinforcementlearning
azureml.core.environment.DockerSection
中的某些屬性已被取代,例如增強式學習作業中的 Ray 工作者所使用的shm_size
屬性。 您現在可以改為在azureml.contrib.train.rl.WorkerConfiguration
中指定這個屬性。
- azureml-core
- 修正
ScriptRunConfig.distributed_job_config
文件中的超連結 - 您現在可以在與工作區不同的位置中建立 Azure Machine Learning 計算叢集。 這適用於在無需建立更多工作區的情況下,有效運用閒置容量配置,並跨不同位置管理配額使用率;只需使用配額,並在特定位置建立計算叢集。 如需詳細資訊,請參閱建立 Azure Machine Learning 計算叢集。
- 將 display_name 新增為 Run 物件的可變動名稱欄位。
- 資料集 from_files 現在支援略過大型輸入資料的資料延伸模組
- 修正
- azureml-dataprep
- 修正因競爭條件而導致 to_dask_dataframe 失敗的錯誤 (bug)。
- 資料集 from_files 現在支援略過大型輸入資料的資料延伸模組
- azureml-defaults
- 我們正在從 azureml-defaults 中移除相依性 azureml-model-management-sdk==1.0.1b6.post1。
- azureml-interpret
- 已將 azureml-interpret 更新為 interpret-community 0.19.*
- azureml-pipeline-core
- 已啟用階層式時間序列 (HTS),透過管線進行預測工作。
- azureml-train-automl-client
- 切換至使用 Blob 存放區,以在自動化 ML 中進行快取。
- 已啟用階層式時間序列 (HTS),透過管線進行預測工作。
- 改進 XGBoost 模型擷取的錯誤處理。
- 已將 AutoMLConfig 中 enable_early_stopping 的預設值更新為 True。
- azureml-train-automl-runtime
- 切換至使用 Blob 存放區,以在自動化 ML 中進行快取。
- 已啟用階層式時間序列 (HTS),透過管線進行預測工作。
- 已將 AutoMLConfig 中 enable_early_stopping 的預設值更新為 True。
- azureml-automl-core
2021-07-06
適用於 Python 的 Azure Machine Learning SDK v1.32.0
- 錯誤修正與改善項目
- azureml-core
- 公開 SDK/CLI 中的診斷工作區健康情況
- azureml-defaults
- 已將
opencensus-ext-azure==1.0.8
相依性新增至 azureml-defaults
- 已將
- azureml-pipeline-core
- 已更新 AutoMLStep,以在作業提交的環境符合預設環境時使用預建映像
- azureml-responsibleai
- 已將新增的錯誤分析用戶端新增至上傳、下載及列出錯誤分析報表中
- 確定
raiwidgets
與responsibleai
套件的版本已同步處理
- azureml-train-automl-runtime
- 設定配置用來在各種特徵化策略之間動態搜尋的時間,最多可設定為整體實驗逾時的四分之一
- azureml-core
2021-06-21
適用於 Python 的 Azure Machine Learning SDK v1.31.0
- 錯誤修正與改善項目
- azureml-core
- 改進環境類別上平台屬性的文件
- 已將預設 AML 計算節點縮小時間從 120 秒變更為1800 秒
- 已更新入口網站上顯示的預設疑難排解連結,以針對失敗的執行進行疑難排解:https://aka.ms/azureml-run-troubleshooting
- azureml-automl-runtime
- 資料清理:在特徵化和/或模型定型之前,將會卸載 [None, "", "nan", np.nan] 中具有目標值的範例
- azureml-interpret
- 藉由增加逾時,防止遠端 Azure Machine Learning 執行的排清工作佇列錯誤
- azureml-pipeline-core
- 將 jar 參數新增至 synapse 步驟
- azureml-train-automl-runtime
- 修正高基數成立條件以與文件更一致
- azureml-core
2021-06-07
適用於 Python 的 Azure Machine Learning SDK v1.30.0
- 錯誤修正與改善項目
- azureml-core
- 將相依性
ruamel-yaml
釘選到 < 0.17.5,因為已在0.17.5 中發行中斷性變更。 aml_k8s_config
屬性已由KubernetesCompute
附加的namespace
、default_instance_type
和instance_types
參數取代。- 工作區同步金鑰已變更為長時間執行的作業。
- 將相依性
- azureml-automl-runtime
- 修正
Elements of y_test cannot be NaN
具有大型資料執行的問題可能會失敗。
- 修正
- azureml-mlflow
- MLFlow 部署外掛程式錯誤修正,適用於沒有簽章的模型。
- azureml-pipeline-steps
- ParallelRunConfig:更新 process_count_per_node 的文件。
- azureml-train-automl-runtime
- 在 MM 推斷期間支援自訂定義的分位數
- 支援批次推斷期間的 forecast_quantiles。
- azureml-contrib-automl-pipeline-steps
- 在 MM 推斷期間支援自訂定義的分位數
- 支援批次推斷期間的 forecast_quantiles。
- azureml-core
2021-05-25
宣告 Azure Machine Learning 的 CLI (v2)
Azure CLI 的 ml
延伸模組是 Azure Machine Learning 的新一代介面。 其可讓您從命令列進行模型的定型和部署,並有功能可讓您在追蹤模型生命週期時加速擴大資料科學。 安裝並設定 CLI (v2) 。
適用於 Python 的 Azure Machine Learning SDK v1.29.0
- 錯誤修正與改善項目
- 重大變更
- 已停止 Python 3.5 的支援。
- azureml-automl-runtime
- 修正當時間序列長度比季節性短時,STLFeaturizer 會失敗的錯誤 (bug)。 此錯誤會以 IndexError 的形式出現。 雖然 STL 的季節性元件在此案例中只會包含零,但系統現在會處理此案例,而不會發生錯誤。
- azureml-contrib-automl-dnn-vision
- 已針對批次推斷新增具有檔案路徑的方法。
- azureml-contrib-gbdt
- azureml-contrib-gbdt 套件已淘汰,可能不會收到未來的更新,並且將會從散發套件中完全移除。
- azureml-core
- 更正 Datastore.register_azure_blob_container 中參數 create_if_not_exists 的說明。
- 已將範例程式碼新增至 DatasetConsumptionConfig 類別。
- 已針對 run.log() 中的純量計量值新增作為替代軸的支援步驟
- azureml-dataprep
- 將接受的資料
_with_partition_size()
分割大小限制為 2 GB
- 將接受的資料
- azureml-interpret
- 將 azureml-interpret 更新至最新的 interpret-core 套件版本
- 已捨棄 SHAP 0.36.0 中已淘汰的 SHAP DenseData 支援。
- 啟用
ExplanationClient
以上傳至使用者指定的資料存放區。
- azureml-mlflow
- 將 azureml-mlflow 移至 mlflow-skinny,以降低相依性的使用量,同時維持完整外掛程式支援
- azureml-pipeline-core
- 參考文件中的 PipelineParameter 程式碼範例已更新為使用正確的參數。
- 重大變更
2021-05-10
適用於 Python 的 Azure Machine Learning SDK v1.28.0
- 錯誤修正與改善項目
- azureml-automl-runtime
- 改進 AutoML 評分指令碼,以便與設計工具一致
- 如果在舊版 SDK 上定型,則使用 Prophet 模型進行預測時,會擲回「遺漏資料行」錯誤的修補錯誤 (bug)。
- 已將 ARIMAX 模型新增至 AutoML SDK 的公開、預測支援模型清單。 在這裡,ARIMAX 是具有 ARIMA 錯誤的迴歸,以及由 Box 和 Jenkins 所開發的傳送函式模型的特殊案例。 如需這兩種方法有何不同的討論,請參閱 ARIMAX 模型 muddle。 不同於使用自動產生且時間相依功能的其餘多變數模型 (一天中的時間、一年中的哪一天等),此模型只會使用使用者所提供的功能,並可讓您輕鬆地解讀系數。
- azureml-contrib-dataset
- 已更新文件描述,指出應在使用掛接時安裝 libfuse。
- azureml-core
- 預設的 CPU 策展映像現為 mcr.microsoft.com/azureml/openmpi3.1.2-ubuntu18.04。 預設的 CPU 策展映像現為 mcr.microsoft.com/azureml/openmpi3.1.2-cuda10.2-cudnn8-ubuntu18.04
- Run.fail() 現在已被取代,請使用 Run.tag() 將執行標示為失敗,或使用 Run.cancel() 將執行標示為已取消。
- 已更新文件中 libfuse 應該在裝載檔案資料集時安裝的注意事項。
- 將實驗性 register_dask_dataframe() 支援新增至表格式資料集。
- 支援以 Azure Blob/ADL 作為輸入/輸出的 DatabricksStep,並公開參數 permit_cluster_restart,讓客戶決定當 i/o 存取設定需要新增至叢集時,AML 是否可以重新啟動叢集
- azureml-dataset-runtime
- azureml-dataset-runtime 現在支援 pyarrow < 4.0.0 的版本
- azureml-mlflow
- 已新增透過 MLFlow 外掛程式部署至 Azure Machine Learning 的支援。
- azureml-pipeline-steps
- 支援以 Azure Blob/ADL 作為輸入/輸出的 DatabricksStep,並公開參數 permit_cluster_restart,讓客戶決定當 i/o 存取設定需要新增至叢集時,AML 是否可以重新啟動叢集
- azureml-synapse
- 在 msi 驗證中啟用適用對象
- azureml-train-automl-client
- 新增了計算目的文件的已變更連結
- azureml-automl-runtime
2021-04-19
適用於 Python 的 Azure Machine Learning SDK v1.27.0
- 錯誤修正與改善項目
- azureml-core
- 已新增透過 "AZUREML_ARTIFACTS_DEFAULT_TIMEOUT" 環境變數覆寫成品上傳之預設逾時值的功能。
- 修正了未遵守 ScriptRunConfig 上 Environment 物件中的 Docker 設定的錯誤。
- 允許將資料集複製到目的地時進行分割。
- 已將自訂模式新增至 OutputDatasetConfig,以啟用透過連結函數在管線中傳遞建立的資料集。 這些支援增強功能是用來啟用 PRS 的表格式分割。
- 已將新的 KubernetesCompute 計算類型新增至 azureml-core。
- azureml-pipeline-core
- 將自訂模式新增至 OutputDatasetConfig,並讓使用者透過連結函式在管線中傳遞已建立的資料集。 檔案路徑目的地支援預留位置。 這些支援增強功能是用來啟用 PRS 的表格式分割。
- 將新的 KubernetesCompute 計算類型新增至 azureml-core。
- azureml-pipeline-steps
- 將新的 KubernetesCompute 計算類型新增至 azureml-core。
- azureml-synapse
- 更新 azureml synapse 小工具中的 spark UI URL
- azureml-train-automl-client
- 預測工作的 STL 功能器現在會根據時間序列的頻率,使用更健全的季節性偵測。
- azureml-train-core
- 修正了不遵守環境物件中 docker 設定的錯誤 (bug)。
- 將新的 KubernetesCompute 計算類型新增至 azureml-core。
- azureml-core
2021-04-05
適用於 Python 的 Azure Machine Learning SDK v1.26.0
- 錯誤修正與改善項目
- azureml-automl-core
- 修正了在 AutoMLStep 回合中建議使用貝氏模型,並使延遲或滾動時間範圍功能失敗的問題。 設定目標延隔時間或目標滾動視窗大小時,不建議使用這些模型。
- 變更了提交 AutoML 執行時的主控台輸出,以顯示執行的入口網站連結。
- azureml-core
- 已在文件中新增 HDFS 模式。
- 已新增支援,以了解以 glob 結構為基礎的檔案資料分割。
- 已新增與 Azure Machine Learning 工作區相關聯的更新容器登錄支援。
- DockerSection 下的已淘汰環境屬性 -"enabled"、"shared_volume" 和 "arguments" 現在是 RunConfiguration 中 DockerConfiguration 的一部分。
- 已更新管線 CLI 複製文件
- 已更新入口網站 URI 以包含驗證的租用戶
- 已從執行 URU 移除實驗名稱,以避免重新導向
- 已更新實驗 URO 以使用實驗識別碼。
- 使用 Azure Machine Learning CLI 附加遠端計算的錯誤修正。
- 已更新入口網站 URI 以包含驗證的租用戶。
- 已更新實驗 URI 以使用實驗識別碼。
- azureml-interpret
- 已更新 azureml-interpret 以使用 interpret-community 0.17.0
- azureml-opendatasets
- 輸入開始日期和結束日期類型驗證,以及非日期時間類型的錯誤指示。
- azureml-parallel-run
- [實驗性功能] 將
partition_keys
參數加入至 ParallelRunConfig;若已指定,則輸入資料集會依其所指定的索引鍵分割為多個迷你批次。 這需要所有輸入資料集都必須是分割資料集。
- [實驗性功能] 將
- azureml-pipeline-steps
- 錯誤修正 - 在將資料集設定傳遞為下載時支援 path_on_compute。
- 取代 RScriptStep 可讓您在管線中使用 CommandStep 來執行 R 指令碼。
- 取代 EstimatorStep 可讓您使用 CommandStep 來執行 ML 定型 (包括管線中的分散式定型)。
- azureml-sdk
- 針對 azureml-sdk 將 python_requires 更新為 < 3.9
- azureml-train-automl-client
- 變更了提交 AutoML 執行時的主控台輸出,以顯示執行的入口網站連結。
- azureml-train-core
- 已淘汰 DockerSection 的 'enabled'、 'shared_volume' 和 'arguments' 屬性,以便使用 DockerConfiguration 搭配 ScriptRunConfig。
- 使用 MNIST 資料集的 Azure 開放資料集
- 已更新 Hyperdrive 錯誤訊息。
- azureml-automl-core
2021-03-22
適用於 Python 的 Azure Machine Learning SDK v1.25.0
- 錯誤修正與改善項目
- azureml-automl-core
- 變更了提交 AutoML 執行時的主控台輸出,以顯示執行的入口網站連結。
- azureml-core
- 開始支援在 SDK 和 CLI 中更新工作區的容器登錄
- 已淘汰 DockerSection 的 'enabled'、 'shared_volume' 和 'arguments' 屬性,以便使用 DockerConfiguration 搭配 ScriptRunConfig。
- 已更新管線 CLI 複製文件
- 已更新入口網站 URI 以包含驗證的租用戶
- 已從執行 URU 移除實驗名稱,以避免重新導向
- 已更新實驗 URO 以使用實驗識別碼。
- 使用 az CLI 附加遠端計算的錯誤 (bug) 修正
- 已更新入口網站 URI 以包含驗證的租用戶。
- 已新增支援,以了解以 glob 結構為基礎的檔案資料分割。
- azureml-interpret
- 已更新 azureml-interpret 以使用 interpret-community 0.17.0
- azureml-opendatasets
- 輸入開始日期和結束日期類型驗證,以及非日期時間類型的錯誤指示。
- azureml-pipeline-core
- 錯誤修正 - 在將資料集設定傳遞為下載時支援 path_on_compute。
- azureml-pipeline-steps
- 錯誤修正 - 在將資料集設定傳遞為下載時支援 path_on_compute。
- 取代 RScriptStep 可讓您在管線中使用 CommandStep 來執行 R 指令碼。
- 取代 EstimatorStep 可讓您使用 CommandStep 來執行 ML 定型 (包括管線中的分散式定型)。
- azureml-train-automl-runtime
- 變更了提交 AutoML 執行時的主控台輸出,以顯示執行的入口網站連結。
- azureml-train-core
- 已淘汰 DockerSection 的 'enabled'、 'shared_volume' 和 'arguments' 屬性,以便使用 DockerConfiguration 搭配 ScriptRunConfig。
- 使用 MNIST 資料集的 Azure 開放資料集
- 已更新 Hyperdrive 錯誤訊息。
- azureml-automl-core
2021-03-31
Azure Machine Learning 工作室 Notebooks 體驗 (3 月更新)
新功能
- 轉譯 CSV/TSV。 使用者能夠以格線格式轉譯和 TSV/CSV 檔案,以方便資料分析。
- 適用於計算執行個體的 SSO 驗證。 使用者現在可以輕鬆地在 Notebook UI 中直接驗證任何新的計算實例,讓您更輕鬆地在 Azure Machine Learning 中驗證及使用 Azure SDK。
- 計算執行個體計量。 使用者可以透過終端機檢視計算計量,例如 CPU 使用量和記憶體。
- 檔案詳細資料。 使用者現在可以按一下檔案旁的三個點來查看檔案詳細資料,包括上次修改的時間和檔案大小。
錯誤修正與改善項目
- 改善的頁面載入時間。
- 增強效能。
- 提升速度和核心可靠性。
- 藉由永久移動 Notebook 檔案窗格來取得垂直的房地產。
- 現在可在終端機中按一下連結
- 改善的 Intellisense 效能
2021-03-08
適用於 Python 的 Azure Machine Learning SDK v1.24.0
- 錯誤修正與改善項目
- azureml-automl-core
- 已從
azureml.automl.core.shared
移除與舊版相容的匯入項目。 從azureml.automl.runtime.shared
匯入,可以解析azureml.automl.core.shared
命名空間中找不到模組的錯誤。
- 已從
- azureml-contrib-automl-dnn-vision
- 公開的物件偵測 yolo 模型。
- azureml-contrib-dataset
- 新增了依中繼資料資料行值和檔案資料集篩選表格式資料集的功能。
- azureml-contrib-fairness
- 在滾輪中針對
azureml-contrib-fairness
包含 JSON 架構
- 在滾輪中針對
- azureml-contrib-mir
- 當部署模型時,將 show_output 設定為 True,將會重新執行推斷設定和部署設定,然後才將要求傳送至伺服器。
- azureml-core
- 新增了依中繼資料資料行值和檔案資料集篩選表格式資料集的功能。
- 先前,使用者可能要為 ComputeTarget 建立布建設定,但不符合欄位 (的密碼強度需求
admin_user_password
,也就是說,他們至少必須包含下列其中 3 個:一個小寫字母、一個大寫字母、一位數,以及下列集合中的一個特殊字元:\`~!@#$%^&*()=+_[]{}|;:./'",<>?
) 。 如果使用者使用弱式密碼建立了設定,並且使用該設定來執行作業,則作業會在執行時間失敗。 現在,呼叫AmlCompute.provisioning_configuration
會ComputeTargetException
擲回 ,並出現隨附的錯誤訊息,說明密碼強度需求。 - 此外,在某些情況下,您也可以使用負數的最大節點數目來指定設定。 無法再執行此動作。 現在,如果引數是負整數,
AmlCompute.provisioning_configuration
則會max_nodes
擲回ComputeTargetException
。 - 當部署模型時,將 show_output 設定為 True,將會重新執行推斷設定和部署設定,然後才將要求傳送至伺服器。
- 當等候模型部署完成時,將 show_output 設定為 True,就會顯示部署作業的進度。
- 允許客戶透過環境變數指定 Azure Machine Learning 驗證設定目錄:AZUREML_AUTH_CONFIG_DIR
- 先前,您可以建立最小節點計數小於節點計數上限的佈建設定。 作業會在執行時間執行,但會失敗。 這個錯誤 (Bug) 現在已修正。 如果您現在嘗試使用
min_nodes < max_nodes
SDK 建立布建組態會ComputeTargetException
引發 。
- azureml-interpret
- 修正說明儀表板未顯示適用於稀疏工程說明的彙總總功能重要性
- azureml-interpret 套件中的 ExplanationClient 優化記憶體使用量
- azureml-train-automl-client
- 已修正 show_output=False,以在使用 spark 執行時將控制權交還給使用者。
- azureml-automl-core
2021-02-28
Azure Machine Learning 工作室 Notebooks 體驗 (2 月更新)
新功能
- 原生終端 (GA)。 使用者現在可透過整合式終端機存取整合式終端機和 Git 作業。
- 筆記本片段 (預覽)。 常見的 Azure Machine Learning 程式碼摘錄現在可在您的指尖取得。 瀏覽至程式碼片段面板 (可透過工具列存取),或使用 Ctrl + 空格鍵來啟用程式碼程式碼片段功能表。
- 鍵盤快速鍵。 與 Jupyter 中可使用的鍵盤快速鍵完全相同。
- 表示儲存格參數。 顯示筆記本中的哪些資料格是參數資料格,而且可以在計算實例上透過 \Papermill 執行參數化的筆記本。
- 終端機和核心會話管理員:使用者能夠管理在其計算上執行的所有核心和終端機會話。
- 共用按鈕。 使用者現在可以滑鼠右鍵按一下檔案並使用 [共用] 按鈕,在筆記本檔案總管中共用任何檔案。
錯誤修正與改善項目
- 改善的頁面載入時間
- 提升效能
- 提升速度和核心可靠性
- 已新增旋轉輪,以顯示所有進行中的計算執行個體作業的進度。
- 在檔案總管中按右鍵。 以滑鼠右鍵按一下任何檔案現在將會開啟檔案作業。
2021-02-16
適用於 Python 的 Azure Machine Learning SDK v1.23.0
- 錯誤修正與改善項目
- azureml-core
- [實驗性功能] 新增將 synapse 工作區連結至 AML 作為連結服務的支援
- [實驗性功能] 新增將 synapse spark 集區附加至 AML 作為計算的支援
- [實驗性功能] 新增以身分識別為基礎的資料存取支援。 使用者無須提供認證,即可註冊資料存放區或資料集。 在這種情況下,會使用使用者的 Azure AD 權杖或計算目標的受控識別來進行驗證。 若要深入了解,請參閱使用身分識別型資料存取連線至儲存體。
- azureml-pipeline-steps
- [實驗性功能] 新增對 SynapseSparkStep 的支援
- azureml-synapse
- [實驗性功能] 新增 spark 魔術的支援,以在 synapse spark 集區中執行互動式工作階段。
- azureml-core
- 錯誤修正與改善項目
- azureml-automl-runtime
- 在此更新中,我們新增了霍爾特-溫特方法指數指數平滑法,以預測 AutoML SDK 的工具箱。 指定時間序列之後,AICc (更正 Akaike 的資訊準則)會選取最佳模型並傳回。
- AutoML 現在會產生兩個記錄檔,而不是一個。 記錄語句會根據產生記錄語句的進程,移至其中一個或另一個。
- 使用交叉驗證在模型定型期間移除不必要的範例中預測。 在某些情況下,這可能會降低模型定型時間,特別是針對時間序列預測模型。
- azureml-contrib-fairness
- 新增 dashboardDictionary 上傳的 JSON 架構。
- azureml-contrib-interpret
- 更新了 azureml-contrib-interpret 讀我檔案,以反映從 10 月起淘汰的套件將在下一個更新中移除,請改用 azureml-interpret 套件
- azureml-core
- 先前,您可以建立最小節點計數小於節點計數上限的佈建設定。 此方法現在已停用。 如果您現在嘗試使用
min_nodes < max_nodes
SDK 建立布建組態將會引發ComputeTargetException
。 - 修正 AmlCompute 中wait_for_completion錯誤,導致函式在作業實際完成之前傳回控制流程
- Run.fail() 現在已被取代,請使用 Run.tag() 將執行標示為失敗,或使用 Run.cancel() 將執行標示為已取消。
- 當提供的環境名稱不是字串時,顯示錯誤訊息「環境名稱必須是 str, {} 找到」。
- 先前,您可以建立最小節點計數小於節點計數上限的佈建設定。 此方法現在已停用。 如果您現在嘗試使用
- azureml-train-automl-client
- 已修正導致無法在 Azure Databricks 叢集上執行 AutoML 實驗的錯誤 (bug)。
- azureml-automl-runtime
2021-02-09
適用於 Python 的 Azure Machine Learning SDK v1.22.0
- 錯誤修正與改善項目
- azureml-automl-core
- 修正將額外的 pip 相依性新增至視覺模型的 conda yml 檔案中的錯誤 (bug)。
- azureml-automl-runtime
- 修正了傳統預測模型 (的錯誤,例如,AutoArima) 可能會接收定型資料,其中含有插補目標值的資料列不存在。 這違反了這些模型的資料合約。 *在時間序列延遲運算子中修正了各項錯誤 (bug),以及延遲的行為。 先前,依延遲作業未正確標示所有插補的資料列,因此不一定會產生正確的出現延遲值。 同時也修正了延遲運算子和輪流視窗運算子之間的一些相容性問題,以及出現延遲的行為。 這先前會導致輪流視窗運算子從定型資料中卸載某些應該要使用的資料列。
- azureml-core
- 新增使用者對權杖驗證的支援。
- 將
process_count
新增至 PyTorchConfiguration,以支援多個流程的多重節點 PyTorch 作業。
- azureml-pipeline-steps
CommandStep 現已正式發行,不再是實驗版本。
ParallelRunConfig:加入引數 allowed_failed_count 和 allowed_failed_percent 以檢查迷你批次層級上的錯誤臨界值。 錯誤臨界值目前有三種:
- error_threshold - 允許的失敗迷你批次項目數;
- allowed_failed_count - 允許的失敗迷你批次數;
- allowed_failed_count - 允許的失敗迷你批次。
如果超過其中任何一項作業,作業就會停止。 需要 error_threshold 才能保持回溯相容性。 將值設定為 -1 則會加以忽略。
修正 AutoMLStep 名稱中的空白字元處理。
HyperDriveStep 現在支援 ScriptRunConfig
- azureml-train-core
- 從 ScriptRun 叫用的 HyperDrive 執行現在會視為子執行。
- 將
process_count
新增至 PyTorchConfiguration,以支援多個流程的多重節點 PyTorch 作業。
- azureml-widgets
- 新增小工具 ParallelRunStepDetails 來視覺化 ParallelRunStep 的狀態。
- 可讓使用者在平行座標圖上查看座標軸,顯示對應至每個子回合之每組超參數的計量值。
- azureml-automl-core
2021-01-31
Azure Machine Learning 工作室 Notebooks 體驗 (1 月更新)
新功能
- Azure Machine Learning 中的原生 Markdown 編輯器。 使用者現在可以在 Azure Machine Learning Studio 中原生轉譯和編輯 Markdown 檔案。
- 指令碼 (.py、.R 以及 .sh) 的執行按鈕。 使用者現在可以輕鬆地在 Azure Machine Learning 中執行 Python、R 和 Bash 腳本
- 變數總管。 在快顯面板中探索變數和資料框架的內容。 使用者可以輕鬆地檢查資料類型、大小及內容。
- 目錄。 瀏覽到筆記本的區段 (由 Markdown 標頭指示)。
- 將 Notebook 匯出為 Latex/HTML/Py。 匯出為 LaTeX、HTML 或 .py Intellicode,建立易於共用的筆記本檔案
- 。 ML 支援的結果會提供增強的智慧型自動完成體驗。
錯誤修正與改善項目
- 改善的頁面載入時間
- 提升效能
- 提升速度和核心可靠性
2021-01-25
適用於 Python 的 Azure Machine Learning SDK v1.21.0
- 錯誤修正與改善項目
- azure-cli-ml
- 修正搭配 UserAssigned Identity 使用 AmlCompute 時的 CLI 解說文字
- azureml-contrib-automl-dnn-vision
- 針對 AutoML 視覺執行,部署和下載按鈕會變得可見,而且模型可以部署或下載,類似于其他 AutoML 執行。 有兩個新的檔案 (scoring_file_v_1_0_0.py 和 conda_env_v_1_0_0.yml) 其中包含執行推斷的指令碼和 yml 檔案,以重新建立 conda 環境。 'model.pth' 檔案也已重新命名為使用 '.pt' 延伸模組。
- azureml-core
- 適用於 azure-cli-ml 的 MSI 支援
- 使用者指派的受控識別支援。
- 有了這項變更,客戶就應該能夠提供使用者指派的身分識別,用來從客戶金鑰保存庫提取金鑰以進行靜態加密。
- 修正大型檔案設定檔的row_count=0 - 針對空白字元填補的分隔值修正雙轉換錯誤
- 移除輸出資料集 GA 的實驗旗標
- 如何提取特定模型版本的更新文件
- 允許在私人連結中更新混合模式存取的工作區
- 修正以移除資料存放區上的另一個註冊以繼續執行功能
- 已新增 CLI/SDK 支援,以更新工作區的主要使用者指派身分識別
- azureml-interpret
- 已將 azureml-interpret 更新為 interpret-community 0.16.0
- azureml-interpret 中的說明用戶端記憶體最佳化
- azureml-train-automl-runtime
- 啟用 ADB 執行的串流
- azureml-train-core
- 修正以移除資料存放區上的另一個註冊以繼續執行功能
- azureml-widgets
- 客戶不應使用小工具看到現有執行資料視覺效果的變更,而且如果客戶選擇性地使用條件式超參數,現在將支援。
- 目前使用者執行小工具包含執行排入佇列狀態的詳細說明。
- azure-cli-ml
2021-01-11
適用於 Python 的 Azure Machine Learning SDK v1.20.0
- 錯誤修正與改善項目
- azure-cli-ml
- 在 OptimizationConfig 中新增了 framework_version。 當模型向 Framework MULTI 註冊時,就會使用它。
- azureml-contrib-optimization
- 在 OptimizationConfig 中新增了 framework_version。 當模型向 Framework MULTI 註冊時,就會使用它。
- azureml-pipeline-steps
- CommandStep 簡介,這會採取命令來處理。 命令可包含可執行檔、shell 命令、指令碼等。
- azureml-core
- 現在工作區建立支援使用者指派的身分識別。 從 SDK/CLI 新增 uai 支援
- 已修正 service.reload() 的問題,以在本機部署中取得 score.py 的變更。
run.get_details()
有一個名為 「submittedBy」 的額外欄位,其會顯示此回合的作者名稱。- 編輯了 Model.register 方法文件,以提及如何直接從執行中註冊模型
- 修正了 IOT-Server 連線狀態變更處理問題。
- azure-cli-ml
2020-12-31
Azure Machine Learning 工作室 Notebooks 體驗 (12 月更新)
新功能
- 使用者檔名搜尋。 使用者現在可以搜尋儲存在工作區中的所有檔案。
- 每個筆記本資料格均支援並排檢視 Markdown。 使用者現在可在筆記本儲存格中選擇是否要並排檢視轉譯的 Markdown 和 Markdown 語法。
- 資料格狀態列。 狀態列會指出代碼儲存格處於的狀態、執行儲存格是否成功,以及執行所花費的時間。
錯誤修正與改善項目
- 改善的頁面載入時間
- 提升效能
- 提升速度和核心可靠性
2020-12-07
適用於 Python 的 Azure Machine Learning SDK v1.19.0
- 錯誤修正與改善項目
- azureml-automl-core
- 已將測試資料的實驗性支援新增至 AutoMLStep。
- 已新增測試集內嵌功能的初始核心執行。
- 已將參考移至 sklearn.externals.joblib,以直接相依於 joblib。
- 引進新的 "image-instance-segmentation" AutoML 工作類型。
- azureml-automl-runtime
- 已新增測試集內嵌功能的初始核心執行。
- 當文字資料行中的所有字串都只有一個字元的長度時,TfIdf word-gram featurizer 將無法運作,因為其 Tokenizer 會忽略少於兩個字元的字串。 目前的程式碼變更可讓 AutoML 處理此使用案例。
- 引進新的 "image-instance-segmentation" AutoML 工作類型。
- azureml-contrib-automl-dnn-nlp
- 新 dnn-nlp 套件的初始 PR
- azureml-contrib-automl-dnn-vision
- 引進新的 "image-instance-segmentation" AutoML 工作類型。
- azureml-contrib-automl-pipeline-steps
- 這個新的套件負責建立許多模型定型/推斷案例所需的步驟。 -同時也會將定型/推斷程式碼移至 azureml.train.automl.runtime 套件,以便任何未來的修正都會透過策劃環境版本自動提供。
- azureml-contrib-dataset
- 引進新的 "image-instance-segmentation" AutoML 工作類型。
- azureml-core
- 已新增測試集內嵌功能的初始核心執行。
- 修正 azureml-core 套件中文件的 xref 警告
- SDK 中命令支援功能的文件字串修正
- 正將命令屬性加入至 RunConfiguration。 此功能可讓使用者透過 Azure Machine Learning SDK 在計算上執行實際的命令或可執行檔。
- 使用者可以在指定該實驗的識別碼時,刪除空的實驗。
- azureml-dataprep
- 已新增使用 Scala 2.12 建立之 Spark 的資料集支援。 這會新增至現有的 2.11 支援。
- azureml-mlflow
- AzureML-MLflow 新增遠端指令碼的安全防護,以避免提交的執行提早終止。
- azureml-pipeline-core
- 修正針對透過 UI 所建立的管線端點設定預設管線時的錯誤 (bug)
- azureml-pipeline-steps
- 已將測試資料的實驗性支援新增至 AutoMLStep。
- azureml-tensorboard
- 修正 azureml-core 套件中文件的 xref 警告
- azureml-train-automl-client
- 已將測試資料的實驗性支援新增至 AutoMLStep。
- 已新增測試集內嵌功能的初始核心執行。
- 引進新的 "image-instance-segmentation" AutoML 工作類型。
- azureml-train-automl-runtime
- 已新增測試集內嵌功能的初始核心執行。
- 如果使用 validation_size 設定來定型 AutoML 模型,請修正最佳 AutoML 模型的原始說明的計算。
- 已將參考移至 sklearn.externals.joblib,以直接相依於 joblib。
- azureml-train-core
現在 HyperDriveRun.get_children_sorted_by_primary_metric() 應該會更快完成
改進 HyperDrive SDK 中的錯誤處理。
已淘汰所有的估算器類別,以利使用 ScriptRunConfig 來設定實驗執行。 已淘汰的類別包括:
- MMLBase
- 評估工具
- PyTorch
- TensorFlow
- Chainer
- SKLearn
已淘汰使用 Nccl 和 Gloo 作為估算器類別的有效輸入類型,以配合使用 PyTorchConfiguration 與 ScriptRunConfig。
已淘汰使用 Mpi 作為估算器類別的有效輸入類型,以配合使用 MpiConfiguration 與 ScriptRunConfig。
新增命令屬性以執行組態。 此功能可讓使用者透過 Azure Machine Learning SDK 在計算上執行實際的命令或可執行檔。
已淘汰所有的估算器類別,以利使用 ScriptRunConfig 來設定實驗執行。 已淘汰的類別包括:+ MMLBaseEstimator + 估算器 + PyTorch + TensorFlow + Chainer + SKLearn
已淘汰使用 Nccl 和 Gloo 作為估算器類別的有效輸入類型,以配合使用 PyTorchConfiguration 與 ScriptRunConfig。
已淘汰使用 Mpi 作為估算器類別的有效輸入類型,以配合使用 MpiConfiguration 與 ScriptRunConfig。
- azureml-automl-core
2020-11-30
Azure Machine Learning 工作室 Notebooks 體驗 (11 月更新)
新功能
- 原生終端。 使用者現在可透過整合式終端機存取整合式終端機和 Git 作業 。
- 複製資料夾
- 計算下拉式清單的成本
- 離線計算 Pylance
錯誤修正與改善項目
- 改善的頁面載入時間
- 提升效能
- 提升速度和核心可靠性
- 大型檔案上傳。 您現在可以上傳檔案 > 95 mb
2020-11-09
適用於 Python 的 Azure Machine Learning SDK v1.18.0
- 錯誤修正與改善項目
- azureml-automl-core
- 藉由允許以高斯雜訊填補,來改善短時間序列的處理。
- azureml-automl-runtime
- 如果 DateTime 資料行具有 OutOfBoundsDatetime 值,則擲回 ConfigException
- 藉由允許以高斯雜訊填補,來改善短時間序列的處理。
- 確定每個文字資料行都可以根據該文字資料行中的字串長度,搭配 n-gram 範圍使用 char-gram 轉換
- 針對在使用者本機計算上執行的 AutoML 實驗,提供最佳模式的原始功能說明
- azureml-core
- 釘選套件:pyjwt,以避免在即將推出的版本中提取中斷。
- 如果這類實驗存在或新的實驗,建立實驗會傳回具有相同指定名稱的作用中或最後一個封存實驗。
- 依名稱呼叫get_experiment會傳回具有該指定名稱的作用中或最後一個封存實驗。
- 使用者無法在重新啟用實驗時重新命名。
- 改善的錯誤訊息,以在資料集未正確傳遞至實驗 (時包含潛在修正程式,例如 ScriptRunConfig) 。
OutputDatasetConfig.register_on_complete
的改進檔,包括名稱已存在時會發生的行為。- 指定可能與常見環境變數衝突的資料集輸入和輸出名稱,現在會產生警告
- 註冊資料存放區時的重新用途
grant_workspace_access
參數。 將它設定為True
,以從 Machine Learning 工作室存取虛擬網路背後的資料。 深入了解 - 已調整連結服務 API。 我們不會提供資源識別碼,而是有三個不同的參數sub_id、rg 和組態中定義的名稱。
- 為了讓客戶能夠自行解決權杖損毀問題,請啟用工作區權杖同步處理為公用方法。
- 這種變更可讓您使用空字串做為 script_param 的值
- azureml-train-automl-client
- 藉由允許以高斯雜訊填補,來改善短時間序列的處理。
- azureml-train-automl-runtime
- 如果 DateTime 資料行具有 OutOfBoundsDatetime 值,則擲回 ConfigException
- 新增了針對在使用者本機計算上執行的 AutoML 實驗,提供最佳模式原始功能說明的支援
- 藉由允許以高斯雜訊填補,來改善短時間序列的處理。
- azureml-train-core
- 這種變更可讓您使用空字串做為 script_param 的值
- azureml-train-restclients-hyperdrive
- 讀我檔案已變更為提供更多內容
- azureml-widgets
- 針對小工具將字串支援新增至圖表/平行座標程式庫。
- azureml-automl-core
2020-11-05
影像執行個體分割的資料標記 (多邊形注釋) (預覽)
現在可以使用資料標籤中的影像執行個體分割 (多邊形注釋) 專案類型,讓使用者可以在影像中物件的輪廓周圍繪製和標注多邊形。 使用者可以將類別和多邊形指派給影像內感興趣的每個物件。
深入了解影像執行個體分割標記。
2020-10-26
適用於 Python 的 Azure Machine Learning SDK v1.17.0
- 新範例
- 提供範例的新社群導向存放庫,網址為:https://github.com/Azure/azureml-examples
- 錯誤修正與改善項目
- azureml-automl-core
- 修正 get_output 可能引發 XGBoostError 的問題。
- azureml-automl-runtime
- AutoML 所建立的時間/行事曆功能現在會有前置詞。
- 已修正在針對分類資料集定型 StackEnsemble 時,已啟用大量類別和子取樣時發生的 IndexError。
- 修正 VotingRegressor 預測在重新符合模型之後可能不正確的問題。
- azureml-core
- 更多有關 AKS 部署組態與Azure Kubernetes Service概念之間關聯性的詳細資料。
- 支援環境用戶端標籤。 使用者可以加上標籤,並依標籤參考環境。
- azureml-dataprep
- 使用目前不支援的 Spark 搭配 Scala 2.12 時,顯示更完善 的錯誤訊息。
- azureml-explain-model
- azureml-explain-model 套件已正式淘汰
- azureml-mlflow
- 已針對未正確處理 Finalizing 狀態的 azureml 後端,解決 mlflow.projects.run 中的 Bug。
- azureml-pipeline-core
- 新增支援以建立、列出及取得以管線端點為基礎的管線排程。
- 使用不正確使用範例改善了 PipelineData.as_dataset 的文件 - 不正確地使用 PipelineData.as_dataset,現在會導致擲回 ValueException
- 已將 HyperDriveStep 管線筆記本變更為直接在 HyperDriveStep 執行之後,在 PipelineStep 中註冊最佳模型。
- azureml-pipeline-steps
- 已將 HyperDriveStep 管線筆記本變更為直接在 HyperDriveStep 執行之後,在 PipelineStep 中註冊最佳模型。
- azureml-train-automl-client
- 修正 get_output 可能引發 XGBoostError 的問題。
- azureml-automl-core
Azure Machine Learning 工作室 Notebooks 體驗 (10 月更新)
2020-10-12
適用於 Python 的 Azure Machine Learning SDK v1.16.0
- 錯誤修正與改善項目
- azure-cli-ml
- AKSWebservice 和 AKSEndpoints 現在支援 pod 層級的 CPU 和記憶體資源限制。 在適用的 CLI 呼叫中,可以使用這些選擇性限制設定
--cpu-cores-limit
和--memory-gb-limit
旗標
- AKSWebservice 和 AKSEndpoints 現在支援 pod 層級的 CPU 和記憶體資源限制。 在適用的 CLI 呼叫中,可以使用這些選擇性限制設定
- azureml-core
- 釘選 azureml-core 直接相依性的主要版本
- AKSWebservice 和 AKSEndpoints 現在支援 pod 層級的 CPU 和記憶體資源限制。 Kubernetes 資源和限制的詳細資訊
- 已更新 run.log_table,以允許記錄個別資料列。
- 已新增靜態方法
Run.get(workspace, run_id)
,以便只使用工作區擷取執行 - 已新增執行個體方法
Workspace.get_run(run_id)
,以便在工作區中擷取執行 - 執行組態中的命令屬性簡介,可讓使用者提交命令,而不是腳本 & 引數。
- azureml-interpret
- 修正了 azureml-interpret 中用戶端 is_raw 旗標行為的說明
- azureml-sdk
azureml-sdk
正式支援 Python 3.8。
- azureml-train-core
- 新增 TensorFlow 2.3 策劃環境
- 執行組態中的命令屬性簡介,可讓使用者提交命令,而不是腳本 & 引數。
- azureml-widgets
- 重新設計的指令碼執行小工具介面。
- azure-cli-ml
2020-09-28
適用於 Python 的 Azure Machine Learning SDK v1.15.0
- 錯誤修正與改善項目
- azureml-contrib-interpret
- 從 azureml-contrib-interpret 移至 interpret-community 套件的 LIME 說明工具,以及從 azureml-contrib-interpret 移除的影像說明工具
- 從 azureml-contrib-interpret 移除的視覺效果儀表板、移至 azureml-interpret 套件的說明用戶端,以及在 azureml-contrib-interpret 中淘汰的說明用戶端和更新的筆記本,反映改進的 API
- 修正 azureml-interpret、azureml-explain-model、azureml-contrib-interpret 和 azureml-tensorboard 的 pypi 套件描述
- azureml-contrib-notebook
- 將 nbcovert 相依性釘選到 < 6,讓 papermill 1.x 繼續運作。
- azureml-core
- 已將參數新增至 TensorflowConfiguration 和 MpiConfiguration 的函式,以啟用更簡化的類別屬性初始化,而不需要使用者設定每個個別的屬性。 已新增 PyTorchConfiguration 類別,以便在 ScriptRunConfig 中設定分散式 PyTorch 工作。
- 釘選 azure 管理資源的版本,以修正驗證錯誤。
- 支援 Triton 無程式碼部署
- 在互動式案例中使用執行時,現在會追蹤 Run.start_logging() 中指定的輸出目錄。 在呼叫 Run.complete () 時,ML Studio 上會顯示追蹤的檔案
- 檔案編碼現在可在使用
Dataset.Tabular.from_delimited_files
和Dataset.Tabular.from_json_lines_files
傳遞引數的資料集建立期間指定encoding
。 支援的編碼為 'utf8'、'iso88591'、'latin1'、'ascii'、'utf16'、'utf32'、'utf8bom' 和 'windows1252'。 - 當環境物件未傳遞至 ScriptRunConfig 建構函式時,修正錯誤。
- 已更新 Run.cancel(),以允許從另一部電腦取消本機執行。
- azureml-dataprep
- 修正資料集掛接逾時問題。
- azureml-explain-model
- 修正 azureml-interpret、azureml-explain-model、azureml-contrib-interpret 和 azureml-tensorboard 的 pypi 套件描述
- azureml-interpret
- 從 azureml-contrib-interpret 移除的視覺效果儀表板、移至 azureml-interpret 套件的說明用戶端,以及在 azureml-contrib-interpret 中淘汰的說明用戶端和更新的筆記本,反映改進的 API
- azureml-interpret 套件已更新為相依 interpret-community 0.15.0
- 修正 azureml-interpret、azureml-explain-model、azureml-contrib-interpret 和 azureml-tensorboard 的 pypi 套件描述
- azureml-pipeline-core
- 修正將
name
參數設為預先存在的資料集名稱呼叫register_on_complete
時,系統可能會停止回應OutputFileDatasetConfig
的管線問題。
- 修正將
- azureml-pipeline-steps
- 已移除過時的 Databricks 筆記本。
- azureml-tensorboard
- 修正 azureml-interpret、azureml-explain-model、azureml-contrib-interpret 和 azureml-tensorboard 的 pypi 套件描述
- azureml-train-automl-runtime
- 從 azureml-contrib-interpret 移除的視覺效果儀表板、移至 azureml-interpret 套件的說明用戶端,以及在 azureml-contrib-interpret 中淘汰的說明用戶端和更新的筆記本,反映改進的 API
- azureml-widgets
- 從 azureml-contrib-interpret 移除的視覺效果儀表板、移至 azureml-interpret 套件的說明用戶端,以及在 azureml-contrib-interpret 中淘汰的說明用戶端和更新的筆記本,反映改進的 API
- azureml-contrib-interpret
2020-09-21
適用於 Python 的 Azure Machine Learning SDK v1.14.0
- 錯誤修正與改善項目
azure-cli-ml
- 已從 SDK 移除方格分析,且不再受到支援。
azureml-accel-models
- azureml-accel-models 套件現在支援 TensorFlow 2.x
azureml-automl-core
- 針對 pandas/sklearn 本機版本不符合定型期間使用的情況,在 get_output 中新增錯誤處理
azureml-automl-runtime
- 修正了 AutoArima 反覆項目會失敗並出現 PredictionException 和「預測期間發生無訊息失敗」的錯誤 (bug) 訊息。
azureml-cli-common
- 已從 SDK 移除方格分析,且不再受到支援。
azureml-contrib-server
- 更新 pypi 概觀頁面的套件描述。
azureml-core
- 格線分析已從 SDK 中移除,且不再受到支援。
- 減少工作區抓取失敗時的錯誤訊息數目。
- 提取中繼資料失敗時不要顯示警告
- 新的 Kusto 步驟和 Kusto 計算目標。
- 更新 SKU 參數的文件。 在 CLI 和 SDK 的工作區更新功能中移除 SKU。
- 更新 pypi 概觀頁面的套件描述。
- 已更新 Azure Machine Learning 環境的檔。
- 公開 SDK 中 AML 工作區的服務受控資源設定。
azureml-dataprep
- 啟用資料集裝載之檔案的執行權限。
azureml-mlflow
- 已更新 Azure Machine Learning MLflow 檔和筆記本範例
- 使用 Azure Machine Learning 後端的 MLflow 專案的新支援
- MLflow 模型登錄支援
- 已新增 AzureML-MLflow 作業的 Azure RBAC 支援
azureml-pipeline-core
- 改良 PipelineOutputFileDataset.parse_* 方法的文件。
- 新的 Kusto 步驟和 Kusto 計算目標。
- 透過該使用者提供的管線端點實體的 Swaggerurl 屬性,可以看到已發佈管線端點的架構定義。
azureml-pipeline-steps
- 新的 Kusto 步驟和 Kusto 計算目標。
azureml-telemetry
- 更新 pypi 概觀頁面的套件描述。
azureml-train
- 更新 pypi 概觀頁面的套件描述。
azureml-train-automl-client
- 針對 pandas/sklearn 本機版本不符合定型期間使用的情況,在 get_output 中新增錯誤處理
azureml-train-core
- 更新 pypi 概觀頁面的套件描述。
2020-08-31
適用於 Python 的 Azure Machine Learning SDK v1.13.0
預覽功能
- azureml-core 有了新的輸出資料集功能,您可以回寫到雲端儲存體,包括 Blob、ADLS Gen 1、ADLS Gen 2 和檔案共用。 您可以設定輸出資料的位置、如何透過裝載或上傳來輸出資料、是否註冊輸出資料以供未來重複使用,以及在管線步驟之間順暢地傳遞中繼資料。 這可帶來重現性、共用、防止資料重複,並產生成本效益和提升生產力。 了解其使用方式
錯誤修正與改善項目
- azureml-automl-core
- 已新增 validated_{platform}_requirements.txt 檔案,以釘選 AutoML 的所有 pip 相依性。
- 此版本支援大於 4GB 的模型。
- 升級的 AutoML 相依性:
scikit-learn
(現為 0.22.1),pandas
(現為 0.25.1),numpy
(現為 1.18.2)。
- azureml-automl-runtime
- 將文字 DNN 的 Borovod 設定為一律使用 fp16 壓縮。
- 此版本支援大於 4GB 的模型。
- 修正了 AutoML 因 ImportError 而失敗的問題:無法匯入名稱
RollingOriginValidator
。 - 升級的 AutoML 相依性:
scikit-learn
(現為 0.22.1),pandas
(現為 0.25.1),numpy
(現為 1.18.2)。
- azureml-contrib-automl-dnn-forecasting
- 升級的 AutoML 相依性:
scikit-learn
(現為 0.22.1),pandas
(現為 0.25.1),numpy
(現為 1.18.2)。
- 升級的 AutoML 相依性:
- azureml-contrib-fairness
- 提供 azureml-contrib-fairness 的簡短描述。
- azureml-contrib-pipeline-steps
- 已新增訊息,指出此套件已被取代,而使用者應該改用 azureml-pipeline-steps。
- azureml-core
- 已新增工作區的清單金鑰命令。
- 在工作區 SDK 和 CLI 中新增標記參數。
- 已修正提交具有資料集之子執行失敗的 Bug,原因為
TypeError: can't pickle _thread.RLock objects
。 - 加入Model list() 的 page_count default/documentation。
- 修改 CLI & SDK 以採用 adbworkspace 參數,並新增工作區 adb lin/unlink 執行器。
- 修正資料集中的錯誤 (bug),這會更新導致最新資料集版本更新,而不是呼叫資料集更新的版本。
- 修正 Dataset.get_by_name 中的錯誤 (bug),即使已抓取特定的舊版本,也會顯示最新資料集版本的標記。
- azureml-interpret
- 已根據來自原始說明工具的 shap_values_output 參數來,將機率輸出新增至 azureml-interpret 中的 shap 計分。
- azureml-pipeline-core
- 經過改善的
PipelineOutputAbstractDataset.register
文件。
- 經過改善的
- azureml-train-automl-client
- 升級的 AutoML 相依性:
scikit-learn
(現為 0.22.1),pandas
(現為 0.25.1),numpy
(現為 1.18.2)。
- 升級的 AutoML 相依性:
- azureml-train-automl-runtime
- 升級的 AutoML 相依性:
scikit-learn
(現為 0.22.1),pandas
(現為 0.25.1),numpy
(現為 1.18.2)。
- 升級的 AutoML 相依性:
- azureml-train-core
- 建立 HyperDriveConfig 時,使用者現在必須提供有效的 hyperparameter_sampling arg。 此外,也已編輯 HyperDriveRunConfig 的文件,以通知使用者已淘汰 HyperDriveRunConfig。
- 將 PyTorch 預設版本還原為 1.4。
- 新增 PyTorch 1.6 & TensorFlow 2.2 映像和策劃環境。
- azureml-automl-core
Azure Machine Learning 工作室 Notebooks 體驗 (8 月更新)
新功能
- 新增開始使用登陸頁面
預覽功能
- 在 Notebooks 中收集功能。 使用 Gather 功能,使用者現在可以輕鬆地清理筆記本,這個功能使用筆記本的自動化相依性分析,以確保會保留基本程式碼,但移除任何不相關的部分。
錯誤修正與改善項目
- 改進速度和可靠性
- 已修正深色模式錯誤 (bug)
- 已修正輸出滾動錯誤 (bug)
- 範例搜尋現在會搜尋 Azure Machine Learning 範例筆記本存放庫中所有檔案的所有內容
- 現在可執行多行 R 資料格
- 「我信任這個檔案的內容」現在會在第一次後自動檢查
- 改進衝突解決對話方塊,並提供新的「製作複本」選項
2020-08-17
適用於 Python 的 Azure Machine Learning SDK v1.12.0
- 錯誤修正與改善項目
- azure-cli-ml
- 將 image_name 和 image_label 參數新增至 Model.package() 以啟用重新命名建立的套件映像。
- azureml-automl-core
- 當內容在讀取期間遭到修改時,AutoML 會從 dataprep 引發新的錯誤碼。
- azureml-automl-runtime
- 當資料包含遺漏值但關閉特徵化時,新增使用者警示。
- 修正當資料包含 nan 和特徵化關閉時的子執行失敗。
- 當內容在讀取期間遭到修改時,AutoML 會從 dataprep 引發新的錯誤碼。
- 已更新正規化,以依資料精細度進行預測計量。
- 改進預測分位數在回顧功能停用時的計算。
- 修正 AutoML 之後計算說明時的布林疏鬆陣列處理。
- azureml-core
- 新的方法
run.get_detailed_status()
現在會顯示目前執行狀態的詳細說明。 它目前只會顯示狀態的說明Queued
。 - 將 image_name 和 image_label 參數新增至 Model.package() 以啟用重新命名建立的套件映像。
- 在
CondaDependencies
中一次設定整個 pip 區段的新方法set_pip_requirements()
。 - 啟用註冊無認證 ADLS Gen2 資料存放區。
- 改善嘗試下載或掛接不正確的資料集類型時的錯誤訊息。
- 更新時間序列資料集篩選範例筆記本,並提供更多可提供篩選最佳化的 partition_timestamp 範例。
- 在刪除私人端點連線時,變更 sdk 和 CLI 以接受 subscriptionId、resourceGroup、workspaceName、peConnectionName 作為參數,而不是 ArmResourceId。
- 實驗性裝飾項目會顯示類別名稱,以方便識別。
- 模型內的資產描述不會再根據執行自動產生。
- 新的方法
- azureml-datadrift
- 將 DataDriftDetector 中的 create_from_model API 標記為即將淘汰。
- azureml-dataprep
- 改善嘗試下載或掛接不正確的資料集類型時的錯誤訊息。
- azureml-pipeline-core
- 修正還原序列化包含已註冊資料集的管線圖形時的錯誤 (bug)。
- azureml-pipeline-steps
- RScriptStep 支援從 azureml.core.environment 進行 RSection。
- 從公用 API 中移除 passthru_automl_config 參數
AutoMLStep
,並將其轉換為僅供內部使用的參數。
- azureml-train-automl-client
- 從 AutoML 中移除本機非同步受控環境。 所有本機執行都會在啟動執行所在的環境中執行。
- 修正提交 AutoML 執行時沒有使用者提供之指令碼的快照集問題。
- 修正當資料包含 nan 和特徵化關閉時的子執行失敗。
- azureml-train-automl-runtime
- 當內容在讀取期間遭到修改時,AutoML 會從 dataprep 引發新的錯誤碼。
- 修正提交 AutoML 執行時沒有使用者提供之指令碼的快照集問題。
- 修正當資料包含 nan 和特徵化關閉時的子執行失敗。
- azureml-train-core
- 已新增指定 pip 選項 (的支援,例如,在傳遞至參數
Estimator
pip_requirements_file
的 pip 需求檔案中) extra-index-url。
- 已新增指定 pip 選項 (的支援,例如,在傳遞至參數
- azure-cli-ml
2020-08-03
適用於 Python 的 Azure Machine Learning SDK v1.11.0
- 錯誤修正與改善項目
- azure-cli-ml
- 修正在 CLI 模型登錄路徑中未傳遞至執行物件的模型架構和模型架構
- 修正 CLI amlcompute identity show 命令以顯示租用戶識別碼和主體識別碼
- azureml-train-automl-client
- 已將 get_best_child () 新增至 AutoMLRun,以取得 AutoML 執行的最佳子執行,而不需要下載相關聯的模型。
- 新增 ModelProxy 物件,允許在遠端定型環境上執行預測或預測,而不需要在本機下載模型。
- AutoML 中未處理的例外狀況現在會指向已知問題的 HTTP 頁面,而您可以在其中找到錯誤的詳細資訊。
- azureml-core
- 模型名稱的上限為 255 個字元。
- Environment.get_image_details() 傳回的物件類型已變更。
dict
已取代類別DockerImageDetails
,可從新的類別屬性取得影像詳細資料。 變更與舊版相容。 - 修正 Environment.from_pip_requirements() 的錯誤 (bug) 以保留相依性結構
- 修正當相同清單中包含了 int 和 double 時,log_list 會失敗的錯誤 (bug)。
- 在現有工作區上啟用私人連結時,請注意,如果有與工作區相關聯的計算目標,如果這些目標不是與工作區私人端點位於相同的虛擬網路後方,這些目標將無法運作。
- 在實驗中使用資料集,並將
as_mount
和as_download
加入至FileDataset
時,as_named_input
會成為選擇性的。 如果as_mount
呼叫 或as_download
,則會自動產生輸入名稱。
- azureml-automl-core
- AutoML 中未處理的例外狀況現在會指向已知問題的 HTTP 頁面,而您可以在其中找到錯誤的詳細資訊。
- 已將 get_best_child () 新增至 AutoMLRun,以取得 AutoML 執行的最佳子執行,而不需要下載相關聯的模型。
- 新增 ModelProxy 物件,允許在遠端定型環境上執行預測或預測,而不需要在本機下載模型。
- azureml-pipeline-steps
- 已將
enable_default_model_output
和enable_default_metrics_output
旗標新增至AutoMLStep
。 這些旗標可用來啟用/停用預設輸出。
- 已將
- azure-cli-ml
2020-07-20
適用於 Python 的 Azure Machine Learning SDK v1.10.0
- 錯誤修正與改善項目
- azureml-automl-core
- 使用 AutoML 時,如果路徑傳遞至 AutoMLConfig 物件且不存在,則會自動建立它。
- 使用者現在可以使用
freq
參數來指定預測工作的時間序列頻率。
- azureml-automl-runtime
- 使用 AutoML 時,如果路徑傳遞至 AutoMLConfig 物件且不存在,則會自動建立它。
- 使用者現在可以使用
freq
參數來指定預測工作的時間序列頻率。 - AutoML 預測現在支援輪流評估,其適用於測試或驗證集長度超過輸入範圍的使用案例,而且已知的 y_pred 值會作為預測內容使用。
- azureml-core
- 如果在執行時未從資料存放區下載任何檔案,則會列印警告訊息。
- 已將
skip_validation
的文件新增至Datastore.register_azure_sql_database method
。 - 使用者必須升級至 SDK v 1.10.0 或更新版本,才能建立自動核准的私人端點。 這包括可在 VNet 後方使用的 Notebook 資源。
- 在 get 工作區的回應中公開 NotebookInfo。
- 變更以列出計算目標,並在遠端執行成功取得計算目標。 取得計算目標和清單工作區計算目標的 SDK 函式現在將可在遠端執行中運作。
- 將取代訊息新增至 azureml.core.image 類別的類別描述。
- 如果工作區私人端點建立失敗,則擲回例外狀況,並清除工作區和相依的資源。
- 在工作區更新方法中支援工作區 SKU 升級。
- azureml-datadrift
- 將 matplotlib 版本從 3.0.2 更新為 3.2.1 以支援 Python 3.8。
- azureml-dataprep
- 已新增
Range
或Head
要求的 Web URL 資料來源支援。 - 改進檔案資料集掛接和下載的穩定性。
- 已新增
- azureml-train-automl-client
- 修正從 setuptools 移除
RequirementParseError
的相關問題。 - 針對使用 "compute_target='local'" 提交的本機執行,使用 docker 而非 conda
- 已更正列印到主控台的反覆項目持續時間。 先前反覆項目的持續時間有時會列印為執行結束時間減去執行建立時間。 已更正為等於執行結束時間減去開始執行時間。
- 使用 AutoML 時,如果路徑傳遞至 AutoMLConfig 物件且不存在,則會自動建立它。
- 使用者現在可以使用
freq
參數來指定預測工作的時間序列頻率。
- 修正從 setuptools 移除
- azureml-train-automl-runtime
- 改進了最佳模型說明失敗時的主控台輸出。
- 將輸入參數重新命名為 "blocked_models",以移除敏感性詞彙。
- 將輸入參數重新命名為 "allowed_models",以移除敏感性詞彙。
- 使用者現在可以使用
freq
參數來指定預測工作的時間序列頻率。
- azureml-automl-core
2020-07-06
適用於 Python 的 Azure Machine Learning SDK v1.9.0
- 錯誤修正與改善項目
- azureml-automl-core
- 以 AutoML 自動產生的評分指令碼中的 AZUREML_MODEL_DIR 環境變數取代 get_model_path()。 也已新增遙測,以在 init() 期間追蹤失敗。
- 已移除在 AutoMLConfig 中指定
enable_cache
的功能 - 修正在特定預測執行期間,執行可能會失敗並發生服務錯誤的錯誤 (bug)
- 改進在
get_output
中的特定模型處理 - 已修正使用 y 轉換程式呼叫 fitted_model.fit(X, y)
- 啟用預測工作的自訂向前填滿估算
- 會使用新的 ForecastingParameters 類別,而不是以聽寫格式預測參數
- 改善的目標延遲時間偵測
- 使用 BERT 新增了多重節點、多重 GPU 分散式特徵化的有限可用性
- azureml-automl-runtime
- Prophet 現在會執行相加季節性模型,而不是相乘。
- 修正了短粒紋時,頻率與長粒紋不同而導致執行失敗的問題。
- azureml-contrib-automl-dnn-vision
- 收集定型和評分的系統/GPU 統計資料和記錄平均值
- azureml-contrib-mir
- 在 ManagedInferencing 中新增了 enable-app-insights 旗標的支援
- azureml-core
- 當無法從目前的計算存取資料來源時,允許略過驗證,以驗證這些 API 的參數。
- TabularDataset.time_before(end_time, include_boundary=True, validate=True)
- TabularDataset.time_after(start_time, include_boundary=True, validate=True)
- TabularDataset.time_recent(time_delta, include_boundary=True, validate=True)
- TabularDataset.time_between(start_time, end_time, include_boundary=True, validate=True)
- 已新增模型清單的架構篩選支援,並在筆記本中新增 NCD AutoML 範例
- 針對 Datastore.register_azure_blob_container 和 Datastore.register_azure_file_share (只有支援 SAS 權杖) 的選項,我們已更新
sas_token
欄位的 doc 字串,以包含一般讀取和寫入案例的最低權限需求。 - ws.get_mlflow_tracking_uri() 中的 Deprecating _with_auth param
- 當無法從目前的計算存取資料來源時,允許略過驗證,以驗證這些 API 的參數。
- azureml-mlflow
- 新增使用 AzureML-MLflow 部署本機 file:// 模型的支援
- ws.get_mlflow_tracking_uri() 中的 Deprecating _with_auth param
- azureml-opendatasets
- 最近發佈的 Covid-19 追蹤資料集現在可透過 SDK 使用
- azureml-pipeline-core
- 當 "azureml-defaults" 未包含為 pip 相依性的一部分時,即會出現登出警告
- 改善附註轉譯。
- 已新增將分隔的檔案剖析為 PipelineOutputFileDataset 時,對引號換行的支援。
- PipelineDataset 類別已被取代。 如需詳細資訊,請參閱https://aka.ms/dataset-deprecation。 了解如何使用具有管線的資料集,請參閱 https://aka.ms/pipeline-with-dataset。
- azureml-pipeline-steps
- azureml-pipeline-steps 的文件更新。
- 已新增 ParallelRunConfig 的
load_yaml()
支援,可讓使用者定義以 rest 設定或個別檔案內嵌的環境
- azureml-train-automl-client.
- 已移除在 AutoMLConfig 中指定
enable_cache
的功能
- 已移除在 AutoMLConfig 中指定
- azureml-train-automl-runtime
- 使用 BERT 新增了多重節點、多重 GPU 分散式特徵化的有限可用性。
- 在以 ADB 為基礎的自動化機器學習回合中,新增了不相容套件的錯誤處理。
- azureml-widgets
- azureml-widgets 的文件更新。
- azureml-automl-core
2020-06-22
適用於 Python 的 Azure Machine Learning SDK v1.8.0
預覽功能
- azureml-contrib-fairness 此
azureml-contrib-fairness
套件提供開放原始碼公平性評量與不公平性緩和套件 Fairlearn 和 Azure Machine Learning 工作室之間的整合。 特別是,套件可讓模型公平性評估儀表板上傳為 Azure Machine Learning 回合的一部分,並出現在Azure Machine Learning 工作室
- azureml-contrib-fairness 此
錯誤修正與改善項目
- azure-cli-ml
- 支援取得 init 容器的記錄。
- 已新增 CLI 命令來管理 ComputeInstance
- azureml-automl-core
- 使用者現在可以對時間序列工作啟用 Stack 反覆運算,但有可能會出現過度學習的警告。
- 加入新的使用者例外狀況類型,如果快取存放區內容已遭修改,則會引發
- azureml-automl-runtime
- 如果使用者停用特徵化,將無法再啟用類別平衡掃掠。
- azureml-contrib-notebook
- azureml-contrib-notebook 套件的文件改進。
- azureml-contrib-pipeline-steps
- azureml-contrib--pipeline-steps 套件的文件改進。
- azureml-core
- 新增 set_connection、get_connection list_connections、delete_connection 函式以供客戶在工作區連線資源上運作
- azureml-coore/azureml.exceptions 套件 的文件更新。
- azureml-core 套件的文件更新。
- ComputeInstance 類別的文件更新。
- azureml-core/azureml.core.compute 套件的文件改進。
- azureml-core 中 webservice 相關類別的文件改進。
- 支援使用者選取的資料存放區來儲存程式碼剖析資料
- 已新增模型清單 API 的展開和 page_count 屬性
- 已修正移除 overwrite 屬性會導致提交的執行失敗併發生還原序列化錯誤的錯誤。
- 修正當下載或掛接參考單一檔案的 FileDataset 時,不一致的資料夾結構。
- 現在可更快地將 to_spark_dataframe 載入 parquet 檔案的資料集,並支援所有 parquet 和 spark SQL 資料類型。
- 支援取得 init 容器的記錄。
- AutoML 回合現在會標示為執行平行執行步驟的子回合。
- azureml-datadrift
- azureml-contrib-notebook 套件的文件改進。
- azureml-dataprep
- 現在可更快地將 to_spark_dataframe 載入 parquet 檔案的資料集,並支援所有 parquet 和 spark SQL 資料類型。
- 更完善地處理 To_pandas_dataframe 的 OutOfMemory 問題。
- azureml-interpret
- 已升級 azureml-interpret 以使用 interpret-community version 0.12.*
- azureml-mlflow
- azureml-mlflow 的文件改進。
- 使用 MLFlow 新增對 AML 模型登錄的支援。
- azureml-opendatasets
- 新增了 Python 3.8 的支援
- azureml-pipeline-core
- 更新
PipelineDataset
的文,以便清楚地成為內部類別。 - ParallelRunStep 更新以接受一個引數的多個值,例如: "--group_column_names"、"Col1"、"Col2"、"Col3"
- 已移除 Pipelines 中使用 AutoMLStep 的 passthru_automl_config 需求。
- 更新
- azureml-pipeline-steps
- azureml-pipeline-steps 套件的文件改進。
- 已移除 Pipelines 中使用 AutoMLStep 的 passthru_automl_config 需求。
- azureml-telemetry
- azureml-telemetry 的文件改進。
- azureml-train-automl-client
- 修正在
AutoMLConfig
物件上呼叫兩次experiment.submit()
會導致不同行為的錯誤 (bug)。 - 使用者現在可以對時間序列工作啟用 Stack 反覆運算,但有可能會出現過度學習的警告。
- 已變更 AutoML 執行行為,以在服務擲回使用者錯誤時引發 UserErrorException
- 修正在遠端計算目標上執行 AutoML 實驗時,azureml_automl.log 導致無法產生或遺失記錄檔的錯誤 (bug)。
- 對於具有不平衡類別的分類資料集,如果功能掃掠器判斷子取樣資料的分類資料集,加權平衡會根據特定臨界值來改善分類工作的效能。
- AutoML 回合現在會標示為執行平行執行步驟的子回合。
- 修正在
- azureml-train-automl-runtime
- 已變更 AutoML 執行行為,以在服務擲回使用者錯誤時引發 UserErrorException
- AutoML 回合現在會標示為執行平行執行步驟的子回合。
- azure-cli-ml
2020-06-08
適用於 Python 的 Azure Machine Learning SDK v1.7.0
- 錯誤修正與改善項目
- azure-cli-ml
- 藉由清除 CLI 命令和套件相依性來完成從 mir contrib 中移除模型分析,可在核心中取得模型分析。
- 將最小 Azure CLI版本升級至 2.3.0
- azureml-automl-core
- 由於自訂轉換器參數的緣故,讓特徵化步驟 fit_transform() 的例外狀況訊息更加完善。
- 針對深度學習轉換器模型 (例如自動化 ML 中的 BERT) 新增多種語言的支援。
- 從文件中移除已淘汰的 lag_length 參數。
- 預測參數文件已獲得改善。 lag_length 的參數已被取代。
- azureml-automl-runtime
- 修正當預測/測試時間中的其中一個類別目錄資料行是空的時,所引發的錯誤。
- 修正在啟用回顧功能且資料包含短精細度時所發生的執行失敗。
- 修正當延後或滾動視窗設定為「自動」時,重複的時間索引錯誤訊息的問題。
- 修正了 Prophet 和 Arima 模型在包含回顧功能的資料集上的問題。
- 已新增在 1677-09-21 之前或 2262-04-11 之後資料行中的日期,在預測工作中的日期時間以外的資料行支援。 改善錯誤訊息。
- 預測參數文件已獲得改善。 lag_length 的參數已被取代。
- 由於自訂轉換器參數的緣故,讓特徵化步驟 fit_transform() 的例外狀況訊息更加完善。
- 針對深度學習轉換器模型 (例如自動化 ML 中的 BERT) 新增多種語言的支援。
- 導致某些 OSErrors 的快取作業會引發使用者錯誤。
- 新增檢查以確保定型和驗證資料具有相同的資料行數目和集合
- 修正當資料包含引號時,自動產生的 AutoML 評分指令碼問題
- 啟用 AutoML 一文和內含新式模型之整合模型的說明。
- 最新的客戶問題揭示了即時網站的錯誤,即使類別平衡邏輯未正確啟用,我們仍會在類別平衡的情況下記錄訊息。 使用此 PR 移除這些記錄/訊息。
- azureml-cli-common
- 藉由清除 CLI 命令和套件相依性來完成從 mir contrib 中移除模型分析,可在核心中取得模型分析。
- azureml-contrib-reinforcementlearning
- 負載測試工具
- azureml-core
- Script_run_config.py 上的文件變更
- 修正列印執行 submit-pipeline CLI 輸出的錯誤 (bug)
- azureml-core/azureml.data 的文件改進。
- 修正使用 hdfs getconf 命令抓取儲存體帳戶的問題
- 改良的 register_azure_blob_container 和 register_azure_file_share 文件
- azureml-datadrift
- 改善停用和啟用資料集漂移監視器的實作
- azureml-interpret
- 在說明用戶端中,從成品上傳後,移除 JSON 序列化之前的 Nan 或 Inf
- 更新為最新版本的 interpret-community,以改善具有許多功能和類別的全域說明的記憶體不足錯誤
- 將true_ys選擇性參數新增至說明上傳,以在 Studio UI 中啟用更多功能
- 改善 download_model_explanations() 和 list_model_explanations() 效能
- 筆記本微調,以協助進行偵錯
- azureml-opendatasets
- azureml-opendatasets 需要 azureml-dataprep 1.4.0 版或更高版本。 新增了在偵測到較低版本時的警告
- azureml-pipeline-core
- 這種變更可讓使用者在呼叫 module.Publish_python_script 時,提供選擇性的 runconfig 給 moduleVersion。
- azureml.pipeline.steps 中的 ParallelRunStep,啟用可以是管線參數的節點帳戶
- azureml-pipeline-steps
- 這種變更可讓使用者在呼叫 module.Publish_python_script 時,提供選擇性的 runconfig 給 moduleVersion。
- azureml-train-automl-client
- 針對深度學習轉換器模型 (例如自動化 ML 中的 BERT) 新增多種語言的支援。
- 從文件中移除已淘汰的 lag_length 參數。
- 預測參數文件已獲得改善。 lag_length 的參數已被取代。
- azureml-train-automl-runtime
- 啟用 AutoML 一文和內含新式模型之整合模型的說明。
- azureml-train-automl-* 套件的文件更新。
- azureml-train-core
- 在 PyTorch 估算器中支援 TensorFlow 2.1 版
- azureml-train-core 套件的增強功能。
- azure-cli-ml
2020-05-26
適用於 Python 的 Azure Machine Learning SDK v1.6.0
新功能
azureml-automl-runtime
- AutoML 預測現在可支援客戶在預先指定的最大範圍之外進行預測,而不需要重新定型模型。 當預測目的地比指定的最大範圍更多時,forecast() 函式仍會使用遞迴作業模式,將點預測轉換成未來日期。 如需新功能的圖例,請參閱「預測-預測-函式」筆記本 資料夾中的「在最大範圍內進行預測」一節。
azureml-pipeline-steps
- ParallelRunStep 現已發行,而且是 azureml-pipeline-steps 套件的一部分。 -azureml-contrib-pipeline-steps 套件中的現有 ParallelRunStep 已淘汰。 公開預覽版本的變更:
- 已新增
run_max_try
選擇性的可設定參數,以控制任何指定批次的最大呼叫執行方法,預設值為3。 - 不會再自動產生任何 PipelineParameters。 可以明確地將下列可設定的值設定為 PipelineParameter。
- mini_batch_size
- node_count
- process_count_per_node
- logging_level
- run_invocation_timeout
- run_max_try
- process_count_per_node 的預設值已變更為 1。 使用者應調整此值,以獲得更好的效能。 最佳做法是將設定為 GPU 或 CPU 節點的數目。
- ParallelRunStep 不會插入任何套件,使用者需要在環境定義中包含 azureml-core 和 azureml-dataprep[pandas, fuse] 套件。 如果自訂 Docker 映射與user_managed_dependencies搭配使用,則使用者必須在映射上安裝 conda。
- 已新增
- ParallelRunStep 現已發行,而且是 azureml-pipeline-steps 套件的一部分。 -azureml-contrib-pipeline-steps 套件中的現有 ParallelRunStep 已淘汰。 公開預覽版本的變更:
重大變更
- azureml-pipeline-steps
- 已淘汰使用 azureml.dprep.Dataflow 作為 AutoMLConfig 的有效輸入類型
- azureml-train-automl-client
- 已淘汰使用 azureml.dprep.Dataflow 作為 AutoMLConfig 的有效輸入類型
- azureml-pipeline-steps
錯誤修正與改善項目
- azureml-automl-core
- 修正在
get_output
要求使用者降級用戶端時,可能會列印警告的錯誤 (bug)。 - 更新 Mac 以依賴 cudatoolkit=9.0,因為在第 10 版尚未提供。
- 在遠端計算上定型時,移除對 Prophet 和 xgboost 模型的限制。
- 改進 AutoML 中的記錄
- 已改善預測工作中自訂特徵化的錯誤處理。
- 已新增功能,可讓使用者包含延遲功能來產生預測。
- 錯誤訊息的更新,以正確顯示使用者錯誤。
- 支援搭配使用 cv_split_column_names 和 training_data
- 更新記錄例外狀況訊息和追溯。
- 修正在
- azureml-automl-runtime
- 啟用護欄來預測遺漏值插補。
- 改進 AutoML 中的記錄
- 新增資料準備例外狀況的細微錯誤處理
- 在遠端計算上定型時,移除對 Prophet 和 xgboost 模型的限制。
azureml-train-automl-runtime
和azureml-automl-runtime
已更新pytorch
、scipy
和cudatoolkit
的相依性。 我們現在支援pytorch==1.4.0
、scipy>=1.0.0,<=1.3.1
和cudatoolkit==10.1.243
。- 已改善預測工作中自訂特徵化的錯誤處理。
- 已改善預測資料集頻率偵測機制。
- 修正了某些資料集上 Prophet 模型定型的問題。
- 預測期間的最大範圍自動偵測已獲得改善。
- 已新增功能,可讓使用者包含延遲功能來產生預測。
- 在預測函數中新增功能,以在未重新定型預測模型的情況下,提供超過定型範圍的預測。
- 支援搭配使用 cv_split_column_names 和 training_data
- azureml-contrib-automl-dnn-forecasting
- 改進 AutoML 中的記錄
- azureml-contrib-mir
- 已在 ManagedInferencing 中新增 Windows 服務的支援
- 移除舊的 MIR 工作流程,例如附加 MIR 計算、SingleModelMirWebservice 類別 - 清除 contrib-mir 套件中的模型分析
- azureml-contrib-pipeline-steps
- YAML 支援的次要修正
- ParallelRunStep 已正式發行 - azureml.contrib.pipeline.steps 有淘汰通知,並移至 azureml.pipeline.steps
- azureml-contrib-reinforcementlearning
- RL 負載測試工具
- RL 估算器具有智慧型預設值
- azureml-core
- 移除舊的 MIR 工作流程,例如附加 MIR 計算、SingleModelMirWebservice 類別 - 清除 contrib-mir 套件中的模型分析
- 已修正在分析失敗時提供給使用者的資訊:包含的要求識別碼,並重新將訊息重新建立為更有意義的訊息。 已將新的分析工作流程新增至分析進行程式碼剖析
- 改善資料集執行失敗中的錯誤文字。
- 已新增工作區 private link CLI 支援。
- 在中加入選擇性
invalid_lines
參數Dataset.Tabular.from_json_lines_files
,可讓您指定如何處理包含無效 JSON 的程式程式碼。 - 在下一版中,我們將淘汰以執行為基礎的計算建立。 建議您建立實際的 Amlcompute 叢集做為持續性計算目標,並使用叢集名稱作為執行設定中的計算目標。 請參閱這裡的範例筆記本: aka.ms/amlcomputenb
- 改善資料集執行失敗中的錯誤訊息。
- azureml-dataprep
- 發出警告以更明確地升級 pyarrow 版本。
- 改善在無法執行資料流程時傳回的錯誤處理和訊息。
- azureml-interpret
- Azureml 的檔更新-解讀套件。
- 已修正可解譯性套件和筆記本以與最新的 sklearn 更新相容
- azureml-opendatasets
- 沒有傳回任何資料時,就會傳回 None。
- 提升 to_pandas_dataframe 的效能。
- azureml-pipeline-core
- ParallelRunStep 從 YAML 載入中斷的快速修正
- ParallelRunStep 已正式發行 - azureml.contrib.pipeline.steps 有淘汰通知,並移至 azureml.pipeline.steps - 新功能包括: 1. >pipelineparameter 2 的資料集。 Run_max_retry 3 的新參數。 可設定的 append_row 輸出檔名稱
- azureml-pipeline-steps
- 已淘汰的 azureml. >iris.dprep 是輸入資料的有效類型。
- ParallelRunStep 從 YAML 載入中斷的快速修正
- ParallelRunStep 已正式發行 - azureml.contrib.pipeline.steps 有淘汰通知,並移至 azureml.pipeline.steps - 新功能包括:
- 作為pipelineparameter 的資料集
- Run_max_retry 3 的新參數
- 可設定的 append_row 輸出檔名稱
- azureml-telemetry
- 更新記錄例外狀況訊息和追溯。
- azureml-train-automl-client
- 改進 AutoML 中的記錄
- 錯誤訊息的更新,以正確顯示使用者錯誤。
- 支援搭配使用 cv_split_column_names 和 training_data
- 已淘汰的 azureml. >iris.dprep 是輸入資料的有效類型。
- 更新 Mac 以依賴 cudatoolkit=9.0,因為在第 10 版尚未提供。
- 在遠端計算上定型時,移除對 Prophet 和 xgboost 模型的限制。
azureml-train-automl-runtime
和azureml-automl-runtime
已更新pytorch
、scipy
和cudatoolkit
的相依性。 我們現在支援pytorch==1.4.0
、scipy>=1.0.0,<=1.3.1
和cudatoolkit==10.1.243
。- 已新增功能,可讓使用者包含延遲功能來產生預測。
- azureml-train-automl-runtime
- 改進 AutoML 中的記錄
- 新增資料準備例外狀況的細微錯誤處理
- 在遠端計算上定型時,移除對 Prophet 和 xgboost 模型的限制。
azureml-train-automl-runtime
和azureml-automl-runtime
已更新pytorch
、scipy
和cudatoolkit
的相依性。 我們現在支援pytorch==1.4.0
、scipy>=1.0.0,<=1.3.1
和cudatoolkit==10.1.243
。- 錯誤訊息的更新,以正確顯示使用者錯誤。
- 支援搭配使用 cv_split_column_names 和 training_data
- azureml-train-core
- 新增一組新的 HyperDrive 特定例外狀況。 hyperdrive 現在會擲回詳細的例外狀況。
- azureml-widgets
- Azure Machine Learning Widget 未顯示在 JupyterLab 中
- azureml-automl-core
2020-05-11
適用於 Python 的 Azure Machine Learning SDK v1.5.0
新功能
- 預覽功能
- azureml-contrib-reinforcementlearning
- Azure Machine Learning 正在使用光線架構來發行增強式學習的預覽支援。
ReinforcementLearningEstimator
可在 Azure Machine Learning 的 GPU 和 CPU 計算目標上定型增強式學習代理程式。
- Azure Machine Learning 正在使用光線架構來發行增強式學習的預覽支援。
- azureml-contrib-reinforcementlearning
- 預覽功能
錯誤修正與改善項目
- azure-cli-ml
- 修正先前的 PR 中不小心留下的警告記錄。 記錄檔是用來進行偵錯工具,並意外留下。
- Bug 修正:通知用戶端在分析期間發生部分失敗
- azureml-automl-core
- 當資料集有多個時間序列時,可啟用時間序列的平行管,以加速 AutoML 預測中的先知/AutoArima 模型。 為了受益于這項新功能,建議您設定「max_cores_per_iteration =-1」(也就是使用 AutoMLConfig 中所有可用的 cpu 核心)。
- 修正主控台介面中的列印護欄 KeyError
- 已修正 experimentation_timeout_hours 的錯誤訊息
- 適用于 AutoML 的已淘汰 TensorFlow 模型。
- azureml-automl-runtime
- 已修正 experimentation_timeout_hours 的錯誤訊息
- 修正嘗試從快取存放區還原序列化時發生的非分類例外狀況
- 當資料集有多個時間序列時,可啟用時間序列的平行管,以加速 AutoML 預測中的先知/AutoArima 模型。
- 修正了在資料集上已啟用滾動視窗的預測,其中測試/預測集不包含定型集中的其中一個粒紋。
- 改進遺失資料的處理
- 已修正在預測資料集 (包含時間序列) 時預測間隔的問題,這些資料集不會在時間內對齊。
- 針對預測工作新增更好的資料圖形驗證。
- 已改善頻率偵測。
- 如果無法產生預測工作的交叉驗證折迭,就會建立更好的錯誤訊息。
- 修正主控台介面,以正確地列印遺漏的值 guardrail。
- 針對 AutoMLConfig 中的 cv_split_indices 輸入強制執行資料類型檢查。
- azureml-cli-common
- Bug 修正:通知用戶端在分析期間發生部分失敗
- azureml-contrib-mir
- 新增類別 azureml.contrib.mir.RevisionStatus,此類別會轉寄目前部署的 MIR 修訂和使用者所指定的最新版本的相關資訊。 這個類別包含在 MirWebservice 物件的 ' deployment_status ' 屬性下。
- 在 Webservices 類型的 MirWebservice 及其子類別 SingleModelMirWebservice 上啟用更新。
- azureml-contrib-reinforcementlearning
- 已新增 Ray 0.8.3 的支援
- AmlWindowsCompute 只支援以掛接的儲存空間 Azure 檔案儲存體
- 將 health_check_timeout 重新命名為 health_check_timeout_seconds
- 修正了一些類別/方法的描述。
- azureml-core
- 已啟用 WASB- > Azure Government 和中國雲端中的 Blob 轉換。
- 修正錯誤,以允許讀者角色使用 az ml run CLI 命令來取得執行資訊
- 已移除使用輸入資料集執行 Azure Machine Learning 遠端執行期間不必要的記錄。
- RCranPackage 現在支援 CRAN 套件版本的 "version" 參數。
- Bug 修正:通知用戶端在分析期間發生部分失敗
- 已新增適用于 azureml 核心的歐洲樣式浮點數處理。
- Azure Machine Learning sdk 中已啟用工作區私人連結功能。
- 使用
from_delimited_files
建立 TabularDataset 時,您可以設定布林值引數empty_as_string
,以指定空值是否應該載入為 None 或空字串。 - 新增資料集的歐洲樣式浮點數處理。
- 改進資料集掛接失敗的錯誤訊息。
- azureml-datadrift
- 從 SDK 產生的資料漂移結果查詢有一個錯誤,不區分最小值、最大值和平均特徵度量,而導致重複的值。 我們已藉由在計量名稱前面加上目標或基準來修正此錯誤。 之前:重複的最小值、最大值、平均值。 之後:target_min、target_max、target_mean、baseline_min、baseline_max、baseline_mean。
- azureml-dataprep
- 改善寫入受限制 Python 環境的處理,同時確保資料傳遞所需的 .NET 相依性。
- 已修正具有前置空白記錄之檔案的資料流程建立。
- 已新增類似的錯誤處理選項
to_partition_iterator
to_pandas_dataframe
。
- azureml-interpret
- 減少說明路徑長度限制,以降低超越 Windows 限制的可能性
- 錯誤修正使用線性代理模型,利用模仿說明建立的稀疏說明。
- azureml-opendatasets
- MNIST 的資料行修正問題會以字串的形式剖析,這應該是 int。
- azureml-pipeline-core
- 使用內嵌在 ModuleStep 中的模組時,允許選項 regenerate_outputs。
- azureml-train-automl-client
- 適用于 AutoML 的已淘汰 TensorFlow 模型。
- 修正使用者允許在原生模式中列出不支援的演算法
- AutoMLConfig 的 Doc 修正。
- 針對 AutoMLConfig 中的 cv_split_indices 輸入強制執行資料類型檢查。
- 修正 show_output 中的 AutoML 執行失敗的問題
- azureml-train-automl-runtime
- 修正集團反覆運算中的錯誤,這會導致無法成功地從開始模型下載超時。
- azureml-train-core
- 修正 azureml 中的打字錯誤。 dnn. Nccl 類別。
- 在 PyTorch 估算器中支援 TensorFlow 1.5 版
- 修正使用定型架構估算器時,無法在 Azure Government 區域中提取 framework 映射的問題
- azure-cli-ml
2020-05-04
新的 Notebook 體驗
您現在可以直接在 Azure Machine Learning 的 studio web 體驗內建立、編輯和共用機器學習筆記本和檔案。 您可以從這些筆記本內使用 Azure Machine Learning Python SDK 提供的所有類別和方法。 若要開始,請造訪在您的工作區中執行 Jupyter Notebook 一文。
引進的功能:
- 改善的編輯器 (Visual Studio Code使用的)
- UI/UX 改進
- 儲存格工具列
- 新 Notebook 工具列和計算控制項
- Notebook 狀態列
- 內嵌核心切換
- R 支援
- 協助工具和當地語系化的改進
- 命令選擇區
- 其他鍵盤快速鍵
- [自動儲存]
- 改善效能與可靠性
從工作室存取下列以網頁為基礎的編寫工具:
以 Web 為基礎的工具 | Description |
---|---|
Azure Machine Learning Studio Notebooks | Notebook 檔案的第一個類別內撰寫,並支援 Azure Machine Learning Python SDK 中所有可用的作業。 |
2020-04-27
適用於 Python 的 Azure Machine Learning SDK v1.4.0
新功能
- AmlCompute 叢集現在支援在布建時于叢集上設定受控識別。 只要指定您是否要使用系統指派的身分識別或使用者指派的身分識別,並針對後者傳遞 identityId。 然後,您可以設定許可權來存取各種資源 (例如儲存體或 ACR),以使用計算的身分識別來安全地存取資料,而不是 AmlCompute 目前採用的權杖型方法。 如需參數的詳細資訊,請參閱我們的 SDK 參考。
重大變更
- AmlCompute 叢集支援以執行為基礎之建立的預覽功能,我們將在兩周內規劃淘汰。 您可以使用 Amlcompute 類別繼續建立持續性計算目標,但指定識別碼 「amlcompute」 的特定方法,因為執行組態中的計算目標很快就會受到支援。
錯誤修正與改善項目
- azureml-automl-runtime
- 在計算資料行中的唯一值數目時,啟用 unhashable 類型的支援。
- azureml-core
- 改善使用 TabularDataset 從 Azure Blob 儲存體讀取時的穩定性。
Datastore.register_azure_blob_store
的grant_workspace_msi
參數改善文件。- 修正了錯誤,
datastore.upload
以支援src_dir
結束於/
或\
的引數。 - 在嘗試上傳至沒有存取金鑰或 SAS 權杖的 Azure Blob 儲存體資料存放區時,已新增可採取動作的錯誤訊息。
- azureml-interpret
- 已針對上傳的說明,將視覺效果資料的上限新增至檔案大小。
- azureml-train-automl-client
- 明確檢查 AutoMLConfig 的 label_column_name & weight_column_name 參數是否為字串類型。
- azureml-contrib-pipeline-steps
- ParallelRunStep 現在支援資料集做為管線參數。 使用者可以使用範例資料集來建立管線,並且可以變更相同類型的輸入資料集 (檔案或表格式) 來執行新的管線。
- azureml-automl-runtime
2020-04-13
適用於 Python 的 Azure Machine Learning SDK v1.3.0
- 錯誤修正與改善項目
- azureml-automl-core
- 新增更多有關定型後作業的遙測。
- 使用平方的條件加總來加速自動 ARIMA 定型, (CSS) 長度超過100的系列定型。 使用的長度會儲存為常數 ARIMA_TRIGGER_CSS_TRAINING_LENGTH w/in TimeSeriesInternal 類別,位於/src/azureml-automl-core/azureml/automl/core/shared/constants.py
- 已改善使用者記錄的預測執行,現在記錄中會顯示目前正在執行之階段的詳細資訊
- 不允許的 target_rolling_window_size 設定為小於2的值
- azureml-automl-runtime
- 已改善在找到重複的時間戳記時所顯示的錯誤訊息。
- 不允許的 target_rolling_window_size 設定為小於 2 的值。
- 修正延遲插補失敗。 此問題是因為季節性分解數列所需的觀察數目不足所造成。 「Seasonalized」資料可用來計算部分 autocorrelation 函數 (PACF) 來判斷延隔時間長度。
- 啟用的資料行目的特徵化由特徵化設定進行預測工作的自訂。現在支援以數值和類別作為預測工作的資料行用途。
- 啟用的 drop column 特徵化自訂依特徵化設定的預測工作。
- 藉由特徵化設定為預測工作啟用插補自訂。現在支援目標資料行的常數值插補,以及定型資料的 mean、中位數、most_frequent 和常數值插補。
- azureml-contrib-pipeline-steps
- 接受要傳遞給 ParallelRunConfig 的字串計算名稱
- azureml-core
- 已新增 Environment.clone(new_name) API 以建立環境物件的複本
- Environment.docker.base_dockerfile 接受 filepath。 如果能夠解析檔案,則會將內容讀入base_dockerfile環境屬性
- 當使用者在環境中以手動方式設定值時,會自動重設 base_image 和 base_dockerfile 的互斥值
- 已在 RSection 中新增user_managed旗標,指出環境是由使用者或 Azure Machine Learning 管理。
- 資料集:如果資料路徑包含 unicode 字元,則修正資料集下載失敗。
- 資料集:改良的資料集裝載快取機制,以尊重 Azure Machine Learning Compute 中的最小磁碟空間需求,這可避免讓節點無法使用,並導致取消作業。
- 資料集:當您存取時間序列資料集做為 pandas 資料框架時,我們會加入時間序列資料行的索引,用來加速存取以時間序列為基礎的資料存取。 先前,索引的名稱與時間戳記資料行的名稱相同,因此混淆的使用者是實際的時間戳記資料行,而是索引。 我們現在不會將任何特定名稱提供給索引,因為它不應該當做資料行使用。
- 資料集:已修正主權雲端中的資料集驗證問題。
- 資料集:已修正從 Azure 在 postgresql 資料存放區建立的資料集
Dataset.to_spark_dataframe
失敗。
- azureml-interpret
- 在本機重要性值為稀疏時,將全域分數新增至視覺效果
- 已將 azureml-interpret 更新為 interpret-community 0.9.*
- 修正了下載具有稀疏評估資料之說明的問題
- 在 AutoML 中新增了說明物件的稀疏格式支援
- azureml-pipeline-core
- 在管線中支援 ComputeInstance 作為計算目標
- azureml-train-automl-client
- 新增更多有關定型後作業的遙測。
- 修正提早停止的回歸
- 已淘汰的 azureml. >iris.dprep 是輸入資料的有效類型。
- 將預設 AutoML 實驗逾時變更為六天。
- azureml-train-automl-runtime
- 新增更多有關定型後作業的遙測。
- 已新增稀疏 AutoML 端對端支援
- azureml-opendatasets
- 已新增另一個用於服務監視器的遙測。
- 啟用 Blob 的前門以提高穩定性
- azureml-automl-core
2020-03-23
適用於 Python 的 Azure Machine Learning SDK v1.2.0
重大變更
- 卸除 Python 2.7 的支援
錯誤修正與改善項目
- azure-cli-ml
- 將 "--subscription-id" 新增至
az ml model/computetarget/service
CLI 中的命令 - 新增支援將客戶管理的金鑰傳遞 (CMK) vault_url、key_name 和 key_version 進行 ACI 部署
- 將 "--subscription-id" 新增至
- azureml-automl-core
- 為 X 和 y 資料預測工作啟用了具有常數值的自訂插補。
- 修正中的問題,並向使用者顯示錯誤訊息。
- azureml-automl-runtime
- 修正了在資料集上進行預測的問題,其中包含只有一個資料列的粒紋
- 減少預測工作所需的記憶體數量。
- 如果時間資料行的格式不正確,則新增更好的錯誤訊息。
- 為 X 和 y 資料預測工作啟用了具有常數值的自訂插補。
- azureml-core
- 已新增從環境變數載入 ServicePrincipal 的支援: AZUREML_SERVICE_PRINCIPAL_ID、AZUREML_SERVICE_PRINCIPAL_TENANT_ID 和 AZUREML_SERVICE_PRINCIPAL_PASSWORD
- 導入了新的參數
support_multi_line
Dataset.Tabular.from_delimited_files
:根據預設 (support_multi_line=False
) ,所有分行符號 (包括以引號括住的域值) 都會被視為記錄中斷。 以這種方式讀取資料,更快且更適合在多個 CPU 核心上平行執行。 不過,它可能會導致以無訊息模式產生更多具有未對齊域值的記錄。 如果有分隔的檔案包含加上引號的分行符號,則應該設定為True
。 - 已新增在 Azure Machine Learning CLI 中註冊 ADLS Gen2 的功能
- 已將參數 ' fine_grain_timestamp ' 重新命名為 ' timestamp ',並將參數 ' coarse_grain_timestamp ' 重新命名為 TabularDataset 中 with_timestamp_columns () 方法的 ' partition_timestamp ',以更妥善地反映參數的使用方式。
- 將最大實驗名稱長度增加至 255。
- azureml-interpret
- 已將 azureml-interpret 更新為 interpret-community 0.7.*
- azureml-sdk
- 變更為具有相容版本的相依性,以支援發行前版本和穩定版本中的修補。
- azure-cli-ml
2020-03-11
適用於 Python 的 Azure Machine Learning SDK v1.1.5
功能淘汰
- Python 2.7
- 支援 Python 2.7 的最後版本
- Python 2.7
重大變更
- 語意化版本控制系統 2.0.0 \(英文\)
- 從 1.1 版開始,Azure Machine Learning Python SDK 採用 語意版本設定 2.0.0。 所有後續版本都遵循新的編號配置和語意版本控制合約。
- 語意化版本控制系統 2.0.0 \(英文\)
錯誤修正與改善項目
- azure-cli-ml
- 將端點 CLI 命令名稱從 'az ml endpoint aks' 變更為 'az ml endpoint real time' 以保持一致性。
- 更新穩定和實驗性分支 CLI 的 CLI 安裝指示
- 已修正單一執行個體分析以產生建議,並可在 core sdk 中取得。
- azureml-automl-core
- 已啟用批次模式推斷 (在 AutoML ONNX 模型中) 一次就接受多個資料列
- 改善資料集的頻率偵測、缺少資料或包含異常資料點
- 已新增移除資料點但不符合主要頻率的功能。
- 變更函式的輸入,以取得套用對應資料行之插補選項的選項清單。
- 錯誤記錄已獲得改善。
- azureml-automl-runtime
- 修正當測試集內出現不在定型集中的細微性時,所擲回錯誤的問題
- 在預測服務的評分期間移除 y_query 需求
- 修正當資料集包含長時間間距的短粒紋時的預測問題。
- 修正自動大範圍開啟時的問題,以及日期資料行以字串形式包含日期。 不可能轉換為日期時,已新增適當的轉換和錯誤訊息
- 使用原生 NumPy 和 SciPy 來序列化和還原序列化用於本機 AutoML 執行之 FileCacheStore (的中繼資料)
- 修正失敗的子回合可能停滯在執行中狀態的錯誤 (bug)。
- 提升特徵化速度。
- 修正評分期間的頻率檢查,現在預測工作不需要定型和測試集之間嚴格的頻率相等。
- 變更函式的輸入,以取得套用對應資料行之插補選項的選項清單。
- 修正與 lag 類型選取相關的錯誤。
- 修正資料集上引發的非分類錯誤,具有單一資料列的粒紋
- 修正了頻率偵測緩慢的問題。
- 修正 AutoML 例外狀況處理中的錯誤,此錯誤會造成定型失敗的實際原因被 AttributeError 取代。
- azureml-cli-common
- 已修正單一執行個體分析以產生建議,並可在 core sdk 中取得。
- azureml-contrib-mir
- 在 MirWebservice 類別中新增功能以取得存取權杖
- 在 MirWebservice 期間,預設會使用 MirWebservice 的 token 驗證。如果呼叫失敗,請執行 () 僅呼叫重新整理
- Mir webservice 部署現在需要適當的 Sku [Standard_DS2_v2、Standard_F16 Standard_A2_v2],而不是分別是 [Ds2v2、A2v2 和 F16]。
- azureml-contrib-pipeline-steps
- 選擇性參數 side_inputs 新增至 ParallelRunStep。 此參數可用於在容器上掛接資料夾。 目前支援的類型為 DataReference 和 PipelineData。
- 現在傳遞管線參數可以覆寫 ParallelRunConfig 中傳遞的參數。 支援 aml_mini_batch_size、aml_error_threshold、aml_logging_level、aml_run_invocation_timeout (aml_node_count 和 aml_process_count_per_node 的新管線參數已是舊版) 的一部分。
- azureml-core
- 已部署的 Azure Machine Learning Web 服務現在預設為
INFO
記錄。 這可以藉由在已部署的服務中設定AZUREML_LOG_LEVEL
環境變數來控制。 - Python sdk 使用探索服務來使用「api」端點,而不是「管線」。
- 切換至所有 SDK 呼叫中的新路由。
- 將 ModelManagementService 呼叫的路由變更為新的整合結構。
- 讓工作區更新方法可公開使用。
- 在工作區更新方法中新增 image_build_compute 參數,以允許使用者更新映射組建的計算。
- 已將取代訊息新增至舊的分析工作流程。 修正分析 CPU 和記憶體限制。
- 新增 RSection 作為環境的一部分,以執行 R 作業。
- 已將驗證新增至
Dataset.mount
,以在資料集的來源無法存取或未包含任何資料時引發錯誤。 - 新增
--grant-workspace-msi-access
為數據存放區 CLI 的另一個參數,以註冊 Azure Blob 容器,可讓您註冊位於 VNet 後方的 Blob 容器。 - 已修正單一執行個體分析以產生建議,並可在 core sdk 中取得。
- 修正了 aks.py _deploy 的問題。
- 驗證所上傳模型的完整性,以避免無訊息儲存失敗。
- 使用者現在可以在重新產生 webservices 的金鑰時,為驗證金鑰指定一個值。
- 修正無法使用大寫字母作為資料集之輸入名稱的 bug。
- 已部署的 Azure Machine Learning Web 服務現在預設為
- azureml-defaults
azureml-dataprep
現在將會安裝為azureml-defaults
的一部分。 您不再需要在計算目標上手動安裝資料 prep[fuse] 來裝載資料集。
- azureml-interpret
- 已將 azureml-interpret 更新為 interpret-community 0.6.*
- 已將 azureml-interpret 更新為 interpret-community 0.5.0
- 已將 azureml-style 的例外狀況新增至 azureml-interpret
- 已修正 keras 模型的 DeepScoringExplainer 序列化
- azureml-mlflow
- 將主權 cloud 的支援新增至 azureml.mlflow
- azureml-pipeline-core
- 管線批次評分筆記本現在使用 ParallelRunStep
- 修正儘管變更引數清單,PythonScriptStep 結果可能不正確重複使用的錯誤 (bug)
- 新增在
PipelineOutputFileDataset
上呼叫 parse_* 方法時,設定資料行類型的功能
- azureml-pipeline-steps
- 已將
AutoMLStep
移至azureml-pipeline-steps
套件。 取代azureml-train-automl-runtime
中的AutoMLStep
命令。 - 已新增資料集的檔範例作為 PythonScriptStep 輸入
- 已將
- azureml-tensorboard
- 已更新 azureml-tensorboard 以支援 TensorFlow 2.0
- 使用計算執行個體上的自訂 TensorBoard 連接埠時,顯示正確的連接埠號碼
- azureml-train-automl-client
- 修正了某些套件可能在遠端執行上的版本不正確的問題。
- 已修正 FeaturizationConfig 覆寫篩選自訂特徵化設定的問題。
- azureml-train-automl-runtime
- 修正遠端執行中的頻率偵測問題
- 已將
AutoMLStep
移至azureml-pipeline-steps
套件。 取代azureml-train-automl-runtime
中的AutoMLStep
命令。
- azureml-train-core
- 在 PyTorch 估算器中支援 PyTorch 1.4 版
- azure-cli-ml
2020-03-02
Azure Machine Learning SDK for Python v1.1.2rc0 (發行前版本)
- 錯誤修正與改善項目
- azureml-automl-core
- 已啟用批次模式推斷 (在 AutoML ONNX 模型中) 一次就接受多個資料列
- 改善資料集的頻率偵測、缺少資料或包含異常資料點
- 已新增移除資料點但不符合主要頻率的功能。
- azureml-automl-runtime
- 修正當測試集內出現不在定型集中的細微性時,所擲回錯誤的問題
- 在預測服務的評分期間移除 y_query 需求
- azureml-contrib-mir
- 在 MirWebservice 類別中新增功能以取得存取權杖
- azureml-core
- 已部署的 Azure Machine Learning Web 服務現在預設為
INFO
記錄。 這可以藉由在已部署的服務中設定AZUREML_LOG_LEVEL
環境變數來控制。 - 修正
Dataset.get_all
上的反覆運算,以傳回所有已向工作區註冊的資料集。 - 當傳遞不正確類型給資料集建立 API 的
path
引數時,改善錯誤訊息。 - Python sdk 使用探索服務來使用「api」端點,而不是「管線」。
- 切換至所有 SDK 呼叫中的新路由
- 將 ModelManagementService 呼叫的路由變更為新的整合結構
- 讓工作區更新方法可公開使用。
- 在工作區更新方法中新增 image_build_compute 參數,以允許使用者更新映射組建的計算
- 已將取代訊息新增至舊的分析工作流程。 修正分析 CPU 和記憶體限制
- 已部署的 Azure Machine Learning Web 服務現在預設為
- azureml-interpret
- 已將 azureml-interpret 更新為 interpret-community 0.6.*
- azureml-mlflow
- 將主權 cloud 的支援新增至 azureml.mlflow
- azureml-pipeline-steps
- 已將
AutoMLStep
移至azureml-pipeline-steps package
套件。 取代azureml-train-automl-runtime
中的AutoMLStep
命令。
- 已將
- azureml-train-automl-client
- 修正了某些套件可能在遠端執行上的版本不正確的問題。
- azureml-train-automl-runtime
- 修正遠端執行中的頻率偵測問題
- 已將
AutoMLStep
移至azureml-pipeline-steps package
套件。 取代azureml-train-automl-runtime
中的AutoMLStep
命令。
- azureml-train-core
- 已將
AutoMLStep
移至azureml-pipeline-steps package
套件。 取代azureml-train-automl-runtime
中的AutoMLStep
命令。
- 已將
- azureml-automl-core
2020-02-18
Azure Machine Learning SDK for Python v1.1.1rc0 (發行前版本)
- 錯誤修正與改善項目
- azure-cli-ml
- 已修正單一執行個體分析以產生建議,並可在 core sdk 中取得。
- azureml-automl-core
- 錯誤記錄已獲得改善。
- azureml-automl-runtime
- 修正當資料集包含長時間間距的短粒紋時的預測問題。
- 修正自動大範圍開啟時的問題,以及日期資料行以字串形式包含日期。 如果無法轉換為日期,我們新增了適當的轉換和合理的錯誤
- 使用原生 NumPy 和 SciPy 來序列化和還原序列化用於本機 AutoML 執行之 FileCacheStore (的中繼資料)
- 修正失敗的子回合可能停滯在執行中狀態的錯誤 (bug)。
- azureml-cli-common
- 已修正單一執行個體分析以產生建議,並可在 core sdk 中取得。
- azureml-core
- 新增
--grant-workspace-msi-access
為數據存放區 CLI 的另一個參數,以註冊 Azure Blob 容器,可讓您註冊位於 VNet 後方的 Blob 容器 - 已修正單一執行個體分析以產生建議,並可在 core sdk 中取得。
- 修正了 aks.py _deploy 的問題
- 驗證所上傳模型的完整性,以避免無訊息儲存失敗。
- 新增
- azureml-interpret
- 已將 azureml-style 的例外狀況新增至 azureml-interpret
- 已修正 keras 模型的 DeepScoringExplainer 序列化
- azureml-pipeline-core
- 管線批次評分筆記本現在使用 ParallelRunStep
- azureml-pipeline-steps
- 已將
AutoMLStep
移至azureml-pipeline-steps
套件。 取代azureml-train-automl-runtime
中的AutoMLStep
命令。
- 已將
- azureml-contrib-pipeline-steps
- 選擇性參數 side_inputs 新增至 ParallelRunStep。 此參數可用於在容器上掛接資料夾。 目前支援的類型為 DataReference 和 PipelineData。
- azureml-tensorboard
- 已更新 azureml-tensorboard 以支援 TensorFlow 2.0
- azureml-train-automl-client
- 已修正 FeaturizationConfig 覆寫篩選自訂特徵化設定的問題。
- azureml-train-automl-runtime
- 已將
AutoMLStep
移至azureml-pipeline-steps
套件。 取代azureml-train-automl-runtime
中的AutoMLStep
命令。
- 已將
- azureml-train-core
- 在 PyTorch 估算器中支援 PyTorch 1.4 版
- azure-cli-ml
2020-02-04
Azure Machine Learning SDK for Python v1.1.0rc0 (發行前版本)
重大變更
- 語意化版本控制系統 2.0.0 \(英文\)
- 從 1.1 版開始,Azure Machine Learning Python SDK 採用 語意版本設定 2.0.0。 所有後續版本都遵循新的編號配置和語意版本控制合約。
- 語意化版本控制系統 2.0.0 \(英文\)
錯誤修正與改善項目
- azureml-automl-runtime
- 提升特徵化速度。
- 修正評分期間的頻率檢查,現在預測工作不需要定型和測試集之間嚴格的頻率相等。
- azureml-core
- 使用者現在可以在重新產生 webservices 的金鑰時,為驗證金鑰指定一個值。
- azureml-interpret
- 已將 azureml-interpret 更新為 interpret-community 0.5.0
- azureml-pipeline-core
- 修正儘管變更引數清單,PythonScriptStep 結果可能不正確重複使用的錯誤 (bug)
- azureml-pipeline-steps
- 已新增資料集的檔範例作為 PythonScriptStep 輸入
- azureml-contrib-pipeline-steps
- 現在傳遞管線參數可以覆寫 ParallelRunConfig 中傳遞的參數。 支援 aml_mini_batch_size、aml_error_threshold、aml_logging_level、aml_run_invocation_timeout (aml_node_count 和 aml_process_count_per_node 的新管線參數已是舊版) 的一部分。
- azureml-automl-runtime
2020-01-21
適用於 Python 的 Azure Machine Learning SDK v1.0.85
新功能
azureml-core
- 取得在指定的工作區和訂用帳戶中 AmlCompute 資源目前的核心使用量和配額限制
azureml-contrib-pipeline-steps
- 讓使用者將表格式資料集作為前一個步驟的中繼結果傳遞給 parallelrunstep
錯誤修正與改善項目
- azureml-automl-runtime
- 已將要求中 y_query 資料行的需求,移除至已部署的預測服務。
- 已從 Dominick 的橙色柳橙汁筆記本服務要求區段中移除 ' y_query '。
- 修正 bug:在具有日期時間資料行的資料集上操作的已部署模型上,無法進行預測。
- 將馬修斯相互關聯係數新增為二元和多元分類的分類度量。
- azureml-contrib-interpret
- 移除 explainers 自 azureml 的文字-contrib-解讀為文字說明已移至即將發行的解讀文字存放庫。
- azureml-core
- 資料集:檔案資料集的使用量不再相依於要安裝在 Python env 中的 numpy 和 pandas。
- 已變更 LocalWebservice.wait_for_deployment () 在嘗試 ping 其健康情況端點之前檢查本機 Docker 容器的狀態,大幅減少回報失敗部署所需的時間量。
- 修正 LocalWebservice 中使用的內部屬性初始化 (使用 LocalWebservice() 的函式從現有的部署建立服務物件時)。
- 已編輯錯誤訊息以供澄清。
- 將名為 get_access_token() 的新方法新增至 >akswebservice,這個方法會傳回 AksServiceAccessToken 物件,其中包含存取權杖、時間戳記之後的重新整理、時間戳記的到期日和權杖類型。
- 因為新方法會傳回這個方法所傳回的所有資訊,所以 AksWebservice 中已取代現有的 get_token() 方法。
- 已修改 az ml 服務取得存取權杖命令的輸出。 將 token 重新命名為 accessToken,並將 refreshBy 重新命名為 refreshAfter。 已新增 expiryOn 和 tokenType 屬性。
- 已修正 get_active_runs
- azureml-explain-model
- 已將 shap 更新為 0.33.0,並將 interpret-community 更新為 0.4.*
- azureml-interpret
- 已將 shap 更新為 0.33.0,並將 interpret-community 更新為 0.4.*
- azureml-train-automl-runtime
- 將馬修斯相互關聯係數新增為二元和多元分類的分類度量。
- 預設會開啟程式碼中的取代前置處理旗標,並取代為特徵化 -featurization
- azureml-automl-runtime
2020-01-06
適用於 Python 的 Azure Machine Learning SDK v1.0.83
新功能
- 資料集:加入兩個
on_error
選項out_of_range_datetime
,to_pandas_dataframe
如果資料有錯誤值而不是以None
填滿,則會失敗。 - 工作區:新增具有機密資料的工作區
hbi_workspace
旗標,可進一步加密並停用工作區上的進階診斷。 此外,我們也新增了在建立工作區時,藉由指定cmk_keyvault
和resource_cmk_uri
參數來為相關聯的 Azure Cosmos DB 執行個體提供您自己的金鑰的支援,這會在佈建您的工作區時,在訂用帳戶中建立 Azure Cosmos DB 執行個體。 若要深入了解,請參閱資料加密一文的 Azure Cosmos DB 一節。
- 資料集:加入兩個
錯誤修正與改善項目
- azureml-automl-runtime
- 修正在 Python 版本下方執行 AutoML 的3.5.4 時,造成 TypeError 引發的迴歸。
- azureml-core
datastore.upload_files
中的修正錯誤是無法使用開頭為./
的相對路徑。- 已新增所有映像類別程式碼路徑的取代訊息
- 已修正 Azure China 21Vianet 地區的模型管理 URL 結構。
- 已修正使用 source_dir 的模型無法封裝 Azure Functions 的問題。
- 已將選項新增至 Environment.build_local () ,將映射推送至 Azure Machine Learning 工作區容器登錄
- 已更新 SDK,以便在 Azure synapse 上以回溯相容的方式使用新的權杖程式庫。
- azureml-interpret
- 修正未提供任何說明可供下載時,未傳回任何的錯誤 (bug)。 現在會引發例外狀況,並在其他地方比對行為。
- azureml-pipeline-steps
- 當
Estimator
將在EstimatorStep
中使用時,不允許將DatasetConsumptionConfig
傳遞至Estimator
的inputs
參數。
- 當
- azureml-sdk
- 已將 AutoML 用戶端新增至 azureml sdk 套件,以在不安裝完整 AutoML 套件的情況下提交遠端 AutoML 執行。
- azureml-train-automl-client
- 更正 AutoML 執行的主控台輸出對齊
- 修正了可能會在遠端 amlcompute 上安裝不正確版本之 pandas 的錯誤 (bug)。
- azureml-automl-runtime
2019-12-23
適用於 Python 的 Azure Machine Learning SDK v1.0.81
- 錯誤修正與改善項目
- azureml-contrib-interpret
- 將 shap 相依性延遲至 azureml-interpret
- azureml-core
- 您現在可以將計算目標指定為對應部署設定物件的參數。 這是要部署的計算目標名稱,而不是 SDK 物件。
- 將 CreatedBy 資訊新增至模型和服務物件。 可以存取 through.created_by
- 已修正 ContainerImage.run(),但未正確設定 Docker 容器的 HTTP 連接埠。
- 針對
az ml dataset register
CLI 命令將azureml-dataprep
設為選用 - 已修正錯誤,其中
TabularDataset.to_pandas_dataframe
會不正確地回復為替代讀取器並列印警告。
- azureml-explain-model
- 將 shap 相依性延遲至 azureml-interpret
- azureml-pipeline-core
- 已加入新的管線步驟
NotebookRunnerStep
,以在管線中執行本機筆記本。 - 已移除 PublishedPipelines、Schedules 和 PipelineEndpoints 的已淘汰 get_all 函式
- 已加入新的管線步驟
- azureml-train-automl-client
- 已開始將 data_script 取代為 AutoML 的輸入。
- azureml-contrib-interpret
2019-12-09
適用於 Python 的 Azure Machine Learning SDK v1.0.79
- 錯誤修正與改善項目
- azureml-automl-core
- 已移除要記錄的 featurizationConfig
- 已將記錄更新為只記錄 "auto"/"off"/"customized"。
- 已移除要記錄的 featurizationConfig
- azureml-automl-runtime
- 已新增 pandas 的支援。 序列和 pandas。 用於偵測資料行資料類型的類別。 先前只支援 numpy.ndarray
- 已新增相關的程式碼變更,以正確地處理類別 dtype。
- 已改善預測函數介面:y_pred 參數已設為選擇性。 -docstrings 已改善。
- 已新增 pandas 的支援。 序列和 pandas。 用於偵測資料行資料類型的類別。 先前只支援 numpy.ndarray
- azureml-contrib-dataset
- 修正無法裝載標記資料集的錯誤 (bug)。
- azureml-core
- 修正
Environment.from_existing_conda_environment(name, conda_environment_name)
的錯誤。 使用者可以建立環境的執行個體,該執行個體是本機環境的精確複本 - 預設會將時間序列相關的資料集方法變更為
include_boundary=True
。
- 修正
- azureml-train-automl-client
- 修正當 [顯示輸出] 設定為 [false] 時,不會列印驗證結果的問題。
- azureml-automl-core
2019-11-25
適用於 Python 的 Azure Machine Learning SDK v1.0.76
重大變更
- Azureml-Train-AutoML 升級問題
- 升級至 azureml-train-automl>=1.0.76 from azureml-train-automl<1.0.76 可能會導致部分安裝,導致某些 AutoML 匯入失敗。 若要解決此問題,您可以執行在 https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/automated-machine-learning/automl_setup.cmd 中找到的安裝指令碼。 或者,如果直接使用 pip,您可以:
- "pip install --upgrade azureml-train-automl"
- "pip install --ignore-installed azureml-train-automl-client"
- 或者,您可以在升級之前先卸載舊版本
- "pip uninstall azureml-train-automl"
- "pip install azureml-train-automl"
- 升級至 azureml-train-automl>=1.0.76 from azureml-train-automl<1.0.76 可能會導致部分安裝,導致某些 AutoML 匯入失敗。 若要解決此問題,您可以執行在 https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/automated-machine-learning/automl_setup.cmd 中找到的安裝指令碼。 或者,如果直接使用 pip,您可以:
- Azureml-Train-AutoML 升級問題
錯誤修正與改善項目
- azureml-automl-runtime
- 在計算二元分類工作的平均純量計量時,AutoML 現在會考慮 true 和 false 類別。
- 將 AutoML 核心中的機器學習和定型程式碼移至新的套件 AzureML-AutoML-Runtime。
- azureml-contrib-dataset
- 在具有下載選項的已加上標籤資料集上呼叫
to_pandas_dataframe
時,您現在可以指定是否要覆寫現有的檔案。 - 呼叫
keep_columns
或drop_columns
導致卸載時間序列、標籤或影像資料行時,也會卸載資料集的對應功能。 - 修正了物件偵測工作的 pytorch 載入器問題。
- 在具有下載選項的已加上標籤資料集上呼叫
- azureml-contrib-interpret
- 已從 azureml-contrib-interpret 移除說明儀表板 小工具說明、變更的套件,以參考 interpret_community 中的新套件
- 將 interpret-community 更新為 0.2.0 的版本
- azureml-core
- 改善
workspace.datasets
的效能 - 新增了利用使用者名稱和密碼驗證註冊 Azure SQL Database 資料存放區的功能
- 從相對路徑載入 RunConfigurations 的修正。
- 呼叫
keep_columns
或drop_columns
導致卸載時間序列資料行時,也會卸載資料集的對應功能。
- 改善
- azureml-interpret
- 將 interpret-community 更新為 0.2.0 的版本
- azureml-pipeline-steps
- 針對 Azure Machine Learning 管線步驟的
runconfig_pipeline_params
所記載的支援值。
- 針對 Azure Machine Learning 管線步驟的
- azureml-pipeline-core
- 已新增 CLI 選項,以下載管線命令的 json 格式輸出。
- azureml-train-automl
- 將 AzureML-Train-AutoML 分割成兩個套件:用戶端套件 AzureML-Train-AutoML-Client 和 ML 定型套件 AzureML-Train-AutoML-Runtime
- azureml-train-automl-client
- 已新增小用戶端來提交 AutoML 實驗,而不需要在本機安裝任何機器學習相依性。
- 修正在遠端執行中自動偵測延遲、滾動視窗大小和最大水平的記錄。
- azureml-train-automl-runtime
- 新增了新的 AutoML 套件,以將機器學習服務和執行時間元件與用戶端隔離。
- azureml-contrib-train-rl
- SDK 中已新增增強式學習支援。
- 已新增 RL SDK 中的 AmlWindowsCompute 支援。
- azureml-automl-runtime
2019-11-11
適用於 Python 的 Azure Machine Learning SDK v1.0.74
預覽功能
- azureml-contrib-dataset
- 匯入 azureml-contrib-dataset 之後,您可以呼叫
Dataset.Labeled.from_json_lines
而不是建立已加上._Labeled
標籤的資料集。 - 在具有下載選項的已加上標籤資料集上呼叫
to_pandas_dataframe
時,您現在可以指定是否要覆寫現有的檔案。 - 呼叫
keep_columns
或drop_columns
導致卸載時間序列、標籤或影像資料行時,也會卸載資料集的對應功能。 - 修正呼叫
dataset.to_torchvision()
時 PyTorch 載入器的問題。
- 匯入 azureml-contrib-dataset 之後,您可以呼叫
- azureml-contrib-dataset
錯誤修正與改善項目
- azure-cli-ml
- 已將模型分析新增至預覽 CLI。
- 修正 Azure 儲存體中的重大變更,導致 Azure Machine Learning CLI 失敗。
- 已將 Load Balancer 類型新增至 AKS 類型的 MLC
- azureml-automl-core
- 修正了在時間序列上偵測到最大範圍、具有遺漏值和多個粒紋的問題。
- 修正在產生跨驗證分割時失敗的問題。
- 將此區段取代為 markdown 格式的訊息,以顯示在版本資訊中:-改善預測資料集中短粒紋的處理。
- 修正在記錄期間遮罩某些使用者資訊的問題。 -改進預測執行期間的錯誤記錄。
- 將 psutil 做為 conda 相依性新增至自動產生的 yml 部署檔案。
- azureml-contrib-mir
- 修正 Azure 儲存體中的重大變更,導致 Azure Machine Learning CLI 失敗。
- azureml-core
- 修正導致在 Azure Functions 上部署模型產生 500 秒的 Bug。
- 修正了 amlignore 檔案未套用在快照集上的問題。
- 已加入新的 API amlcompute.get_active_runs,其會傳回在指定的 amlcompute 上執行和已排入佇列的產生器。
- 已將 Load Balancer 類型新增至 AKS 類型的 MLC。
- 已將 append_prefix bool 參數新增至 artifacts_client 中的 run.py 和 download_artifacts_from_prefix download_files。 此旗標是用來選擇性地壓平合併原始檔案路徑,因此只會將檔案或資料夾名稱新增至 output_directory
- 修正
run_config.yml
資料集使用方式的還原序列化問題。 - 呼叫
keep_columns
或drop_columns
導致卸載時間序列資料行時,也會卸載資料集的對應功能。
- azureml-interpret
- 將 interpret-community 版本更新為 0.1.0.3
- azureml-train-automl
- 修正 automl_step 可能無法列印驗證問題的問題。
- 已修正 register_model 即使模型的環境在本機遺失相依性,也會成功。
- 修正了某些遠端執行未啟用 docker 的問題。
- 加入導致本機執行失敗的例外狀況記錄。
- azureml-train-core
- 請考慮 resume_from 在自動超參數微調最佳子執行的計算中執行。
- azureml-pipeline-core
- 修正管線引數結構中的參數處理。
- 已新增管線描述和步驟類型 yaml 參數。
- 新的管線步驟 yaml 格式,並新增舊格式的淘汰警告。
- azure-cli-ml
2019-11-04
Web 體驗
https://ml.azure.com 中的共同作業工作區登陸頁面已增強,並更名為 Azure Machine Learning 工作室。
您可以從工作室定型、測試、部署和管理 Azure Machine Learning 的資產,例如資料集、管線、模型、端點等等。
從工作室存取下列以網頁為基礎的編寫工具:
以 Web 為基礎的工具 | Description |
---|---|
筆記本 VM (預覽) | 完全受控的雲端式工作站 |
自動化機器學習 (預覽) | 自動化機器學習模型開發的程式碼體驗 |
設計工具 | 拖放機器學習模型工具先前稱為視覺化介面 |
Azure Machine Learning 設計工具範例
- 先前稱為視覺化介面
- 11 個新模組,包括建議工具、分類器和定型公用程式,包括特徵工程、交叉驗證和資料轉換。
R SDK
資料科學家和 AI 開發人員可使用 Azure Machine Learning 搭配適用於 Python 的 Azure Machine Learning SDK,來建置及執行機器學習工作流程。
SDK 會使用 reticulate
套件來繫結至 Azure Machine Learning 的 Python SDK。 藉由直接系結至 Python,適用於 R 的 SDK 可讓您從任何您選擇的 R 環境,存取 Python SDK 中所執行的核心物件和方法。
SDK 的主要功能包括:
- 管理用來對您的機器學習實驗進行監視、記錄及組織的雲端資源。
- 在本機或使用雲端資源 (包括 GPU 加速模型定型) 定型模型。
- 將您的模型部署為 Azure 容器執行個體上的 webservices (ACI) 和 Azure Kubernetes Service (AKS)。
如需完整文件,請參閱套件網站。
Azure Machine Learning 與事件方格整合
Azure Machine Learning 現在是事件方格的資源提供者,您可以透過 Azure 入口網站或 Azure CLI 來設定機器學習事件。 使用者可以建立執行完成的事件、模型註冊、模型部署,以及偵測到的資料漂移。 這些事件可以路由傳送至事件方格所支援的事件處理常式,以供取用。 如需詳細資訊,請參閱機器學習事件架構和教學課程文章。
2019-10-31
適用於 Python 的 Azure Machine Learning SDK v1.0.72
新功能
透過 azureml-datadrift 套件新增了資料集監視器,可讓您監視時間序列資料集的資料漂移或其他統計變更。 如果偵測到漂移或符合其他條件的資料,就可以觸發警示和事件。 如需詳細資料,請參閱我們的文件。
宣佈兩個新版本 (也稱為可在 Azure Machine Learning 交換) 的 SKU。 在此版本中,您現在可以建立基本或 Enterprise Azure Machine Learning 工作區。 所有現有的工作區預設為 Basic 版本,您可以移至 Azure 入口網站 或 Studio 隨時升級工作區。 您可以從 Azure 入口網站建立基本或 Enterprise 工作區。 如需詳細資訊,請閱讀我們的文件。 從 SDK 中,您可以使用工作區物件的 "sku" 屬性來決定您的工作區版本。
我們也增強了 Azure Machine Learning Compute - 您現在可以在 Azure 監視器中查看叢集的計量 (例如節點總計、執行中節點、核心配額) 總計,除了可讓您流覽診斷記錄以進行偵測。 此外,您也可以在叢集上查看目前執行中或已排入佇列的回合,以及詳細資料,例如叢集中各種節點的 Ip。 您可以在入口網站中或使用 SDK 或 CLI 中的對應函式來查看這些功能。
預覽功能
- 在 Azure Machine Learning Compute 中,我們會發行您本機 SSD 的磁片加密預覽支援。 提出技術支援票證,讓您的訂用帳戶允許清單使用此功能。
- Azure Machine Learning 批次推斷的公開預覽。 Azure Machine Learning 批次推斷會以不區分時間的大型推斷作業為目標。 批次預測 (或批次評分) 會針對非同步的應用程式,利用獨特的輸送量來提供符合成本效益的推斷。 最適用於大型資料集合的高輸送量、火災和遺忘推斷。
- azureml-contrib-dataset
- 已標記資料集的已啟用功能
import azureml.core from azureml.core import Workspace, Datastore, Dataset import azureml.contrib.dataset from azureml.contrib.dataset import FileHandlingOption, LabeledDatasetTask # create a labeled dataset by passing in your JSON lines file dataset = Dataset._Labeled.from_json_lines(datastore.path('path/to/file.jsonl'), LabeledDatasetTask.IMAGE_CLASSIFICATION) # download or mount the files in the `image_url` column dataset.download() dataset.mount() # get a pandas dataframe from azureml.data.dataset_type_definitions import FileHandlingOption dataset.to_pandas_dataframe(FileHandlingOption.DOWNLOAD) dataset.to_pandas_dataframe(FileHandlingOption.MOUNT) # get a Torchvision dataset dataset.to_torchvision()
錯誤修正與改善項目
- azure-cli-ml
- CLI 現在支援模型封裝。
- 已新增資料集 CLI。 如需詳細資訊:
az ml dataset --help
- 已新增支援部署和封裝支援的模型 (ONNX、scikit-learn-學習和 TensorFlow),而不需要 InferenceConfig 執行個體。
- 已新增在 SDK 和 CLI (ACI 和 AKS) 的服務部署覆寫旗標。 如果有提供,將會覆寫現有的服務 (如果已有同名的服務)。 如果服務不存在,將會建立新的服務。
- 您可以使用兩個新架構 (Onnx 和 TensorFlow) 來註冊模型。 - 模型註冊可接受範例輸入資料、範例輸出資料和模型的資源設定。
- azureml-automl-core
- 只有在設定執行時間條件約束時,定型反覆運算才會在子處理序執行。
- 新增預測工作的護欄,以檢查指定的max_horizon是否會導致指定電腦上的記憶體問題。 如果將會顯示護欄訊息。
- 新增複雜頻率的支援,例如兩年和一個月。 -如果無法判斷頻率,則新增了理解錯誤訊息。
- 新增 azureml-defaults 為自動產生的 conda env,以解決模型部署失敗
- 允許 Azure Machine Learning 管線中的中繼資料轉換成表格式資料集,並在
AutoMLStep
中使用。 - 已針對串流處理資料行目的更新。
- 針對串流處理 Imputer 和 HashOneHotEncoder 所執行的轉換器參數更新。
- 將目前的資料大小和所需的最小資料大小新增至驗證錯誤訊息。
- 已更新交叉驗證所需的最小資料大小,以保證每個驗證折迭中至少有兩個樣本。
- azureml-cli-common
- CLI 現在支援模型封裝。
- 您可以使用兩個新架構 (Onnx 和 TensorFlow) 來註冊模型。
- 模型註冊可接受範例輸入資料、範例輸出資料和模型的資源設定。
- azureml-contrib-gbdt
- 已修正筆記本的發行頻道
- 針對不支援的非 AmlCompute 計算目標新增警告
- 已將 LightGMB 估算器新增至 azureml-contrib-gbdt 套件
- azureml-core
- CLI 現在支援模型封裝。
- 針對已淘汰的資料集 API 新增淘汰警告。 請參閱 https://aka.ms/tabular-dataset 中的資料集 API 變更通知。
- 如果已註冊資料集,將
Dataset.get_by_id
變更為傳回註冊名稱和版本。 - 修正無法重複使用資料集做為引數來提交實驗執行的錯誤 (bug)。
- 在執行期間抓取的資料集會進行追蹤,並可在執行詳細資料頁面中看到,或在執行完成之後呼叫
run.get_details()
。 - 允許 Azure Machine Learning 管線中的中繼資料轉換成表格式資料集,並在
AutoMLStep
中使用。 - 已新增支援部署和封裝支援的模型 (ONNX、scikit-learn-學習和 TensorFlow),而不需要 InferenceConfig 執行個體。
- 已新增在 SDK 和 CLI (ACI 和 AKS) 的服務部署覆寫旗標。 如果有提供,將會覆寫現有的服務 (如果已有同名的服務)。 如果服務不存在,將會建立新的服務。
- 您可以使用兩個新架構 (Onnx 和 TensorFlow) 來註冊模型。 模型註冊可接受範例輸入資料、範例輸出資料和模型的資源設定。
- 已新增適用於 MySQL 的 Azure 資料庫的新資料存放區。 已新增在 Azure Machine Learning Pipelines 的 DataTransferStep 中使用適用於 MySQL 的 Azure 資料庫的範例。
- 新增了新增和移除實驗標記的功能,從執行中移除標記
- 已新增在 SDK 和 CLI (ACI 和 AKS) 的服務部署覆寫旗標。 如果有提供,將會覆寫現有的服務 (如果已有同名的服務)。 如果服務不存在,將會建立新的服務。
- azureml-datadrift
- 從
azureml-contrib-datadrift
移至azureml-datadrift
- 已針對漂移和其他統計量值新增監視時間序列資料集的支援
DataDriftDetector
類別的新方法create_from_model()
以及create_from_dataset()
。 方法create()
已被取代。- 調整 Azure Machine Learning 工作室中 Python 和 UI 的視覺效果。
- 除了每日資料集監視器之外,還支援每週和每月監視排程。
- 支援資料監視器度量的回填,以分析資料集監視器的歷程記錄資料。
- 各種 Bug 修正
- 從
- azureml-pipeline-core
- azureml-dataprep 不再需要從管線
yaml
檔案提交 Azure Machine Learning 管線執行。
- azureml-dataprep 不再需要從管線
- azureml-train-automl
- 新增 azureml-defaults 為自動產生的 conda env,以解決模型部署失敗
- AutoML 遠端定型現在包含 azureml-defaults,以允許重複使用定型環境進行推斷。
- azureml-train-core
- 在
PyTorch
估算器中新增 PyTorch 1.3 支援
- 在
- azure-cli-ml
2019-10-21
視覺化介面 (預覽)
Azure Machine Learning 的視覺化介面 (預覽) 已改為在 Azure Machine Learning 管線上執行。 Pipelines (在視覺化介面中撰寫的實驗),現在已完全與核心 Azure Machine Learning 經驗整合。
- 使用 SDK 資產的整合管理體驗
- 視覺化介面模型、管線和端點的版本控制和追蹤
- 重新設計的 UI
- 已新增批次推斷部署
- 已新增 Azure Kubernetes Service (AKS) 推斷計算目標的支援
- 新的 Python-step 管線撰寫工作流程
- Visual 製作工具的新登陸頁面
新模組
- 套用數學運算
- 套用 SQL 轉換
- 剪輯值
- 摘要資料
- 從 SQL Database 匯入
2019-10-14
適用於 Python 的 Azure Machine Learning SDK v1.0.69
- 錯誤修正與改善項目
- azureml-automl-core
- 將模型說明限制為最佳執行,而不是計算每次執行的說明。 進行本機、遠端和 ADB 的這種行為變更。
- 新增 UI 的隨選模型說明支援
- 將 psutil 新增為
automl
的 conda 相依性,並將 psutil 納入 amlcompute 中的 conda 相依性。 - 修正預測資料集上的啟發式延遲和滾動時間範圍大小的問題,其中某些系列可能會導致線性代數錯誤
- 新增預測回合中啟發學習判斷參數的列印。
- azureml-contrib-datadrift
- 如果資料集層級漂移不在第一節中,則會在建立輸出計量時新增保護。
- azureml-contrib-interpret
- azureml-contrib-explain-model 套件已重新命名為 azureml-contrib-interpret
- azureml-core
- 已新增用來取消註冊資料集的 API。
dataset.unregister_all_versions()
- azureml-contrib-explain-model 套件已重新命名為 azureml-contrib-interpret。
- 已新增用來取消註冊資料集的 API。
- azureml-core
- 已新增用來取消註冊資料集的 API。 資料集。unregister_all_versions()。
- 已新增資料集 API 以檢查資料變更時間。
dataset.data_changed_time
. - 能夠在 Azure Machine Learning 管線中使用
FileDataset
和TabularDataset
做為PythonScriptStep
、EstimatorStep
和HyperDriveStep
的輸入 FileDataset.mount
的效能已針對具有大量檔案的資料夾改善- 能夠使用FileDataset和TabularDataset做為 Azure Machine Learning 管線中PythonScriptStep、 EstimatorStep和HyperDriveStep的輸入。
- FileDataset 的效能。mount() 已針對具有大量檔案的資料夾改善
- 在 [執行詳細資料] 中,將 URL 新增至已知的錯誤建議。
- 修正 run.get_metrics 中,如果執行的子系太多,要求會失敗的錯誤 (bug)
- 修正 run.get_metrics 中,如果執行的子系太多,要求會失敗的錯誤 (bug)
- 在 Arcadia 叢集上新增了驗證支援。
- 建立實驗物件會取得或建立 Azure Machine Learning 工作區中的實驗,以進行執行歷程記錄追蹤。 實驗識別碼和封存時間會在建立時填入實驗物件中。 範例:experiment = Experiment(workspace, "New Experiment") experiment_id = experiment.id archive() 和 reactivate() 是可在實驗上呼叫的函式,可隱藏和還原實驗,使其不會顯示在 UX 中,或依預設在清單實驗的呼叫中傳回。 如果使用與封存實驗相同的名稱建立新的實驗,您可以藉由傳遞新名稱重新啟用封存的實驗。 只能有一個使用中的實驗具有指定的名稱。 範例:experiment1 = Experiment(workspace, "Active Experiment") experiment1.archive() # 建立新的作用中實驗,與封存的名稱相同。 experiment2。 = Experiment(workspace, "Active Experiment") experiment1.reactivate(new_name="Previous Active Experiment") 實驗上的靜態方法 list() 可以採用名稱篩選和 ViewType 篩選。 ViewType 值為 「ACTIVE_ONLY」、「ARCHIVED_ONLY」 和 「ALL」 範例:archived_experiments = Experiment.list ( workspace, view_type=「ARCHIVED_ONLY」) all_first_experiments = Experiment.list (workspace, name=「First Experiment」, view_type=「ALL」)
- 支援使用環境進行模型部署和服務更新
- azureml-datadrift
- DataDriftDector 類別的 show 屬性不再支援選擇性引數 'with_details'。 Show 屬性只會顯示資料漂移係數和特徵資料行的資料漂移比重。
- DataDriftDetector 屬性 'get_output' 行為變更:
- 輸入參數 start_time,end_time 是選擇性的,而不是強制性;
- 輸入特定 start_time 及/或在相同叫用中具有特定 run_id 的 end_time 將會導致值錯誤例外狀況,因為它們是互斥的
- 藉由輸入特定 start_time 及/或 end_time,只會傳回已排程執行的結果;
- 參數 'daily_latest_only' 已被取代。
- 支援抓取以資料集為基礎的資料漂移輸出。
- azureml-explain-model
- 將 AzureML-explain-model 套件重新命名為 AzureML-interpret,讓舊的封裝立即提供回溯相容性
- 已修正從 ExplanationClient 下載時,原始說明設定為分類工作而非回歸的
automl
錯誤 (bug) - 新增可直接使用
MimicWrapper
建立的ScoringExplainer
支援
- azureml-pipeline-core
- 改善大型管線建立的效能
- azureml-train-core
- 已在 TensorFlow 估算器中新增 TensorFlow 2.0 支援
- azureml-train-automl
建立實驗物件會取得或建立 Azure Machine Learning 工作區中的實驗,以進行執行歷程記錄追蹤。 實驗識別碼和封存時間會在建立時填入實驗物件中。 範例:
experiment = Experiment(workspace, "New Experiment") experiment_id = experiment.id
archive() 和 reactivate() 是可在實驗上呼叫的函式,可隱藏和還原實驗,使其不會顯示在 UX 中,或依預設在清單實驗的呼叫中傳回。 如果使用與封存實驗相同的名稱建立新的實驗,您可以藉由傳遞新名稱重新啟用封存的實驗。 只能有一個使用中的實驗具有指定的名稱。 範例:
experiment1 = Experiment(workspace, "Active Experiment") experiment1.archive() # Create new active experiment with the same name as the archived. experiment2 = Experiment(workspace, "Active Experiment") experiment1.reactivate(new_name="Previous Active Experiment")
實驗的靜態方法 list() 可以採用名稱篩選和 ViewType 篩選。 ViewType 值為 "ACTIVE_ONLY"、"ARCHIVED_ONLY" 和 "ALL"。 範例:
archived_experiments = Experiment.list(workspace, view_type="ARCHIVED_ONLY") all_first_experiments = Experiment.list(workspace, name="First Experiment", view_type="ALL")
支援使用環境進行模型部署和服務更新。
- azureml-datadrift
- DataDriftDector 類別的 show 屬性不再支援選擇性引數 'with_details'。 Show 屬性只會顯示資料漂移係數和特徵資料行的資料漂移比重。
- DataDriftDetector 函式 [get_output]python/api/azureml-datadrift/azureml.datadrift.datadriftdetector.datadriftdetector#get-output-start-time-none--end-time-none--run-id-none-) 行為變更:
- 輸入參數 start_time,end_time 是選擇性的,而不是強制性;
- 輸入特定 start_time 及/或在相同叫用中具有特定 run_id 的 end_time 將會導致值錯誤例外狀況,因為它們是互斥的;
- 藉由輸入特定 start_time 及/或 end_time,只會傳回已排程執行的結果;
- 參數 'daily_latest_only' 已被取代。
- 支援抓取以資料集為基礎的資料漂移輸出。
- azureml-explain-model
- 新增使用 MimicWrapper 直接建立的 ScoringExplainer 支援
- azureml-pipeline-core
- 改善大型管線建立的效能。
- azureml-train-core
- 已在 TensorFlow 估算器中新增 TensorFlow 2.0 支援。
- azureml-train-automl
- 當安裝程式反覆運算失敗時,父執行將不再失敗,因為協調流程已經負責處理。
- 已新增 conda AutoML 實驗的本機 docker 和本機支援
- 已新增 conda AutoML 實驗的本機 docker 和本機支援。
- azureml-automl-core
2019-10-08
新的 Web 體驗 (預覽) 適用於 Azure Machine Learning 工作區
新工作區入口網站中的 [實驗] 索引標籤已更新,因此資料科學家可以更有效地監視實驗。 您可以探索下列功能:
- 實驗中繼資料來輕鬆篩選和排序您的實驗清單
- 簡化且高效能的實驗詳細資料頁面,可讓您將執行視覺化並加以比較
- 執行詳細資料頁面的新設計,以瞭解及監視定型回合
2019-09-30
適用於 Python 的 Azure Machine Learning SDK v1.0.65
新功能
- 新增了策劃的環境。 這些環境已預先設定適用於一般機器學習工作的程式庫,並已預先建立並快取為 Docker 映像,以加快執行速度。 預設會顯示在工作區的環境清單中,首碼為 "AzureML"。
- 新增了策劃的環境。 這些環境已預先設定適用於一般機器學習工作的程式庫,並已預先建立並快取為 Docker 映像,以加快執行速度。 預設會顯示在工作區的環境清單中,首碼為 "AzureML"。
azureml-train-automl
-
- 已新增 ADB 和 HDI 的 ONNX 轉換支援
預覽功能
azureml-train-automl
-
- 支援 BERT 和 BiLSTM 做為文字 featurizer (僅限預覽)
- 資料行用途和轉換器參數的支援特徵化自訂 (僅限預覽)
- 當使用者在定型 (預覽期間僅啟用模型說明時,所支援的原始說明)
- 已將預測的
timeseries
Prophet 新增為可定型管線 (僅限預覽)
azureml-contrib-datadrift
- 封裝從 azureml-contrib-datadrift 重新置放至 azureml-datadrift;未來的版本將移除此
contrib
套件
- 封裝從 azureml-contrib-datadrift 重新置放至 azureml-datadrift;未來的版本將移除此
錯誤修正與改善項目
- azureml-automl-core
- 引進 FeaturizationConfig 至 AutoMLConfig 和 AutoMLBaseSettings
- 引進 FeaturizationConfig 至 AutoMLConfig 和 AutoMLBaseSettings
- 使用指定的資料行和功能類型覆寫特徵化的資料行用途
- 覆寫轉換器參數
- 已新增 explain_model() 和 retrieve_model_explanations() 的取代訊息
- 已將先知新增為可定型管線 (僅限預覽)
- 已新增 explain_model() 和 retrieve_model_explanations() 的取代訊息。
- 已將先知新增為可定型管線 (僅限預覽)。
- 新增了自動偵測目標延遲、滾動視窗大小及最大範圍的支援。 如果 target_lags、target_rolling_window_size 或 max_horizon 的其中一個設定為 'auto',則會套用啟發學習法,以根據定型資料來估計對應參數的值。
- 修正當資料集包含一個資料細微性資料行時,此資料細微性為數數值型別,而且定型和測試集之間有間距的情況
- 修正了遠端執行的預測工作中重複索引的錯誤訊息
- 修正當資料集包含一個資料細微性資料行時,此資料細微性為數數值型別,而且定型和測試集之間有間距的情況。
- 修正了遠端執行的預測工作中,重複索引的相關錯誤訊息。
- 已新增 guardrail 來檢查資料集是否為不平衡。 如果是,則會將 guardrail 訊息寫入主控台。
- azureml-core
- 已新增可透過模型物件,在儲存體中將 SAS URL 取出至模型的功能。 例如:model.get_sas_url()
- 引進
run.get_details()['datasets']
以取得與已提交執行相關聯的資料集 - 新增 API
Dataset.Tabular.from_json_lines_files
,以從 JSON 行檔案建立 TabularDataset。 若要了解 TabularDataset 上的 JSON 行檔案中的表格式資料,請造訪這篇文章以取得文件。 - 已將 OS 磁片 (其他 VM 大小欄位、) GPU 數目新增至 supported_vmsizes () 函式
- 已將更多欄位新增至 list_nodes () 函式,以顯示執行、私用和公用 IP、埠等。
- 能夠在叢集布建期間指定新的欄位 --remotelogin_port_public_access,視您想要在建立叢集時讓 SSH 埠保持開啟或關閉,可以設定為啟用或停用。 如果您未指定,服務會智慧地或關閉連接埠,這取決於您是否要在 VNet 內部署叢集。
- azureml-explain-model
- azureml-core
- 已新增可透過模型物件,在儲存體中將 SAS URL 取出至模型的功能。 例如:model.get_sas_url()
- 引進 以取得與已提交執行相關聯的資料集
- 新增 API
Dataset.Tabular
,以從 JSON 行檔案建立 TabularDataset。 若要了解 TabularDataset 上的 JSON 行檔案中的表格式資料,請造訪https://aka.ms/azureml-data以取得文件。 - 已將其他 VM 大小欄位 (OS 磁片、) 的 GPU 數目新增至 supported_vmsizes () 函式
- 已將其他欄位新增至 list_nodes () 函式,以顯示執行、私用和公用 IP、埠等。
- 在叢集佈建期間指定新欄位的能力,可設定為 [啟用] 或 [停用],取決於您是否要在建立叢集時讓 SSH 連接埠保持開啟或關閉。 如果您未指定,服務會智慧地或關閉連接埠,這取決於您是否要在 VNet 內部署叢集。
- azureml-explain-model
- 改進了分類案例中的說明輸出檔案。
- 已新增在評估範例的說明上傳預測 y 值的功能。 解除鎖定更有用的視覺效果。
- 已將說明屬性新增至 MimicWrapper,以允許取得基礎 MimicExplainer。
- azureml-pipeline-core
- 新增筆記本以描述 Module、ModuleVersion 和 ModuleStep
- azureml-pipeline-steps
- 已新增 RScriptStep,以支援透過 AML 管線執行 R 指令碼。
- 修正 azurebatchstep 中的已修正中繼資料參數剖析,這會導致出現錯誤訊息「未指定參數 SubscriptionId 的指派。」
- azureml-train-automl
- 支援的 training_data、validation_data、label_column_name weight_column_name 作為資料輸入格式
- 已新增 explain_model() 和 retrieve_model_explanations() 的取代訊息
- azureml-pipeline-core
- 新增筆記本以描述 Module、[ModuleVersion 和 ModuleStep。
- azureml-pipeline-steps
- 已新增 RScriptStep,以支援透過 AML 管線執行 R 指令碼。
- 修正 azurebatchstep 中的已修正中繼資料參數剖析,這會導致出現錯誤訊息「未指定參數 SubscriptionId 的指派。」
- azureml-train-automl
- 支援的 training_data、validation_data、label_column_name weight_column_name 作為資料輸入格式。
- 已新增 explain_model() 和 retrieve_model_explanations() 的取代訊息。
- azureml-automl-core
2019-09-16
適用於 Python 的 Azure Machine Learning SDK v1.0.62
新功能
在 TabularDataset 上引進了
timeseries
特性。 這項特性可讓您輕鬆地篩選資料的 TabularDataset,例如在一段時間內或最新的資料之間取得所有資料。 針對範例筆記本的 https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/work-with-data/datasets-tutorial/timeseries-datasets/tabular-timeseries-dataset-filtering.ipynb。使用 TabularDataset 和 FileDataset 啟用定型。
azureml-train-core
- 在 PyTorch 估算器中新增了
Nccl
和Gloo
支援
- 在 PyTorch 估算器中新增了
錯誤修正與改善項目
- azureml-automl-core
- 已淘汰 AutoML 設定 'lag_length' 和 LaggingTransformer。
- 修正輸入資料以資料流程格式指定時的正確驗證
- 修改了 fit_pipeline.py,以產生圖形 json 並上傳至成品。
- 使用
Cytoscape
將圖形轉譯至userrun
下。
- azureml-core
- 修改 ADB 程式碼中的例外狀況處理,並根據新的錯誤處理進行變更
- 已新增 Notebook VM 的自動 MSI 驗證。
- 修正因重試失敗而無法上傳損毀或空白模型的錯誤 (bug)。
- 修正
DataReference
當DataReference
模式變更 (例如,呼叫as_upload
、as_download
或as_mount
) 時,名稱變更的錯誤 (bug)。 - 將
mount_point
變更為選用項目,以用於target_path
、FileDataset.mount
和FileDataset.download
。 - 如果呼叫時間序列相關 API,而沒有指派的時間戳記資料行或卸載指派的時間戳記資料行,則找不到時間戳記資料行的例外狀況。
- 應使用類型為日期的資料行來指派時間序列資料行,否則應為例外狀況
- 指派 API 'with_timestamp_columns' 的時間序列資料行,不能採用任何值的微調/粗略時間戳記資料行名稱,這會清除先前指派的時間戳記資料行。
- 捨棄粗略的資料細微性或精細的時間戳記資料行時,將會擲回例外狀況,並指出使用者可以在卸載清單中排除時間戳記資料行或呼叫 with_time_stamp (沒有值以釋出時間戳記資料行) 之後完成刪除
- 捨棄粗略的資料細微性或精細的時間戳記資料行時,將會擲回例外狀況,並指出使用者可以在卸載清單中排除時間戳記資料行或呼叫 with_time_stamp (沒有值以釋出時間戳記資料行) 之後完成刪除。
- 已針對已註冊模型的大小新增記錄。
- azureml-explain-model
- 修正「封裝」Python 套件未安裝時,已將警告列印到主控台:「使用早於支援的 lightgbm 版本,請升級至 2.2.1 以上的版本」
- 修正了具有許多功能的全域說明的分區化下載模型說明
- 修正了說明輸出說明時遺漏初始化範例
- 使用兩種不同類型的模型,以說明用戶端上傳時,修正 set 屬性上的不可變錯誤
- 已將 get_raw param 新增至 explainer.explain(),讓評分說明可以傳回工程和原始值。
- azureml-train-automl
- 從 AutoML 導入了公用 API,以從
automl
說明將 AutoML 特徵化分離 SDK - 較新的支援 AutoML 說明的方式,並說明來自 azureml 說明 sdk For AutoML 模型的 Sdk 整合式原始說明支援。 - 從遠端定型環境中移除 azureml-defaults。
- 已將預設快取存放區位置從以 FileCacheStore 為基礎的位置變更為 AzureFileCacheStore,Azure Databricks 程式碼路徑上的 AutoML。
- 修正輸入資料以資料流程格式指定時的正確驗證
- 從 AutoML 導入了公用 API,以從
- azureml-train-core
已還原 source_directory_data_store 淘汰。
已新增覆寫 azureml 已安裝套件版本的功能。
已在估算器中新增
environment_definition
參數的 dockerfile 支援。簡化了估算器中的分散式定型參數。
from azureml.train.dnn import TensorFlow, Mpi, ParameterServer
- azureml-automl-core
2019-09-09
新的 Web 體驗 (預覽) 適用於 Azure Machine Learning 工作區
新的 Web 體驗可讓資料科學家和資料工程師完成其端對端機器學習服務生命週期,從準備並將資料視覺化,以在單一位置定型及部署模型。
重要功能:
使用這個新的 Azure Machine Learning 介面,您現在可以:
- 管理您的筆記本或連結到 Jupyter
- 執行自動化 ML 實驗
- 從本機檔案、資料存放區、&web 檔案建立資料集
- 探索 & 準備建立模型的資料集
- 監視模型的資料漂移
- 從儀表板查看最近的資源
在此版本中,支援下列瀏覽器: Chrome、Firefox、Safari 和 Microsoft Edge 預覽。
已知問題
如果您看到「發生問題,請重新整理您的瀏覽器! 部署正在進行時載入區塊檔案時發生錯誤。
無法刪除或重新命名筆記本和檔案中的檔案。 在公開預覽期間,您可以在 Notebook VM 中使用 Jupyter UI 或終端機來執行更新檔案作業。 因為這是已掛接的網路檔案系統所有變更,所以您在 Notebook VM 上進行的變更會立即反映在 [Notebook] 工作區中。
若要透過 SSH 連線到 Notebook VM:
- 尋找在 VM 設定期間所建立的 SSH 金鑰。 或者,在 Azure Machine Learning 工作區的 [開啟計算] 索引標籤中尋找金鑰,在 >> 清單中找到 [Notebook VM], > 開啟其屬性:從對話方塊複製金鑰。
- 將這些公用和私人 SSH 金鑰匯入本機電腦。
- 若要透過 SSH 連線到 Notebook VM:
2019-09-03
適用於 Python 的 Azure Machine Learning SDK v1.0.60
新功能
- 引進了 FileDataset,它會參考資料存放區或公用 url 中的單一或多個檔案。 檔案可以是任何格式。 FileDataset 讓您將檔案下載或掛接至您的計算。
- 已新增 PythonScript 步驟、Adla 步驟、Databricks 步驟、DataTransferStep 和 AzureBatch 步驟的管線 Yaml 支援
錯誤修正與改善項目
azureml-automl-core
- AutoArima 現在是僅供預覽的 suggestable 管線。
- 改進了預測的錯誤報表。
- 使用自訂例外狀況 (而不是預測工作中的泛型) 來改善記錄。
- 已移除 max_concurrent_iterations 的檢查,以減少反覆運算總數。
- AutoML 模型現在會傳回 AutoMLExceptions
- 此版本可改善自動化機器學習本機執行的執行效能。
azureml-core
- 引進 Dataset.get_all (工作區),它會傳回以
TabularDataset
其註冊名稱做為索引鍵的和物件的字典FileDataset
。
workspace = Workspace.from_config() all_datasets = Dataset.get_all(workspace) mydata = all_datasets['my-data']
將
parition_format
引進Dataset.Tabular.from_delimited_files
和Dataset.Tabular.from_parquet.files
作為變數。 系統會根據指定的格式,將每個資料路徑的分割區資訊解壓縮至資料行中。 '{column_name}' 建立了字串資料行,而 '{column_name:yyyy/MM/dd/HH/mm/ss}' 建立了 datetime 資料行,其中 'yyyy'、'MM'、'dd'、'HH'、'mm' 和 'ss' 是用來將 datetime 類型的年、月、日、小時、分鐘和秒解壓縮。 Partition_format 應從第一個分割區索引鍵的位置開始,直到檔路徑結束為止。 例如,指定路徑 '.。/USA/2019/01/01/data.csv' ,其中分割區依國家/地區和時間,partition_format='/{Country}/{PartitionDate:yyyy/MM/dd}/data.csv' 會建立字串資料行 'Country',其值為 'USA',而 datetime 資料行 'PartitionDate' 的值為 '2019-01-01'。workspace = Workspace.from_config() all_datasets = Dataset.get_all(workspace) mydata = all_datasets['my-data']
將
partition_format
引進Dataset.Tabular.from_delimited_files
和Dataset.Tabular.from_parquet.files
作為變數。 系統會根據指定的格式,將每個資料路徑的分割區資訊解壓縮至資料行中。 '{column_name}' 建立了字串資料行,而 '{column_name:yyyy/MM/dd/HH/mm/ss}' 建立了 datetime 資料行,其中 'yyyy'、'MM'、'dd'、'HH'、'mm' 和 'ss' 是用來將 datetime 類型的年、月、日、小時、分鐘和秒解壓縮。 Partition_format 應從第一個分割區索引鍵的位置開始,直到檔路徑結束為止。 例如,指定路徑 '.。/USA/2019/01/01/data.csv' ,其中分割區依國家/地區和時間,partition_format='/{Country}/{PartitionDate:yyyy/MM/dd}/data.csv' 會建立字串資料行 'Country',其值為 'USA',而 datetime 資料行 'PartitionDate' 的值為 '2019-01-01'。to_csv_files
和to_parquet_files
方法已加入至TabularDataset
。 這些方法會將資料轉換成指定格式的檔案,以啟用TabularDataset
與FileDataset
之間的轉換。Model.package() 所產生的 Dockerfile 時,自動登入基底映像登錄。
不再需要 'gpu_support';AML 現在會自動偵測並使用 nvidia docker 延伸模組 (如果有)。 未來的版本將予以移除。
已新增建立、更新和使用 PipelineDrafts 的支援。
此版本可改善自動化機器學習本機執行的執行效能。
使用者可以依名稱查詢執行歷程記錄中的計量。
使用自訂例外狀況 (而不是預測工作中的泛型) 來改善記錄。
- 引進 Dataset.get_all (工作區),它會傳回以
azureml-explain-model
- 已將 feature_maps 參數新增至新的 MimicWrapper,可讓使用者取得原始的功能說明。
- 資料集上傳現在預設為關閉以進行說明上傳,而且可以使用 upload_datasets=True 重新啟用
- 已新增 "is_law" 篩選參數來說明清單和下載功能。
- 將
get_raw_explanation(feature_maps)
方法新增至全域和本機說明物件。 - 已將版本檢查新增至 lightgbm,並在低於支援的版本時進行列印警告
- 批次處理說明時的最佳化記憶體使用量
- AutoML 模型現在會傳回 AutoMLExceptions
azureml-pipeline-core
- 新增了建立、更新和使用 PipelineDrafts 的支援-可用來維護可變動的管線定義,並以互動方式使用它們來執行
azureml-train-automl
- 已建立功能來安裝具有 gpu 功能的特定版本 pytorch v 1.1.0、cuda 工具組 9.0、pytorch-transformers,這是在遠端 Python 執行時間環境中啟用 BERT/XLNet 所需的功能。
azureml-train-core
- 直接在 SDK 中 (而不是伺服器端) 發生某些超參數空間定義錯誤的早期失敗。
Azure Machine Learning 資料準備 SDK v1.1.14
- 錯誤修正與改善項目
- 啟用使用原始路徑和認證寫入至 ADLS/ADLSGen2。
- 修正導致
include_path=True
無法針對read_parquet
運作的錯誤 (bug)。 - 修正例外狀況「不正確屬性值: hostSecret」所造成的
to_pandas_dataframe()
失敗。 - 修正了在 Spark 模式的 DBFS 上無法讀取檔案的錯誤 (bug)。
2019-08-19
適用於 Python 的 Azure Machine Learning SDK v1.0.57
新功能
- 啟用
TabularDataset
以供 AutomatedML 使用。 深入了解TabularDataset
,請造訪 https://aka.ms/azureml/howto/createdatasets.
- 啟用
錯誤修正與改善項目
- azure-cli-ml
- 您現在可以針對 Microsoft 所產生和客戶憑證的 AKS 叢集上部署的評分端點,更新 TLS/SSL 憑證。
- azureml-automl-core
- 已修正 AutoML 中遺漏標籤的資料列未正確移除的問題。
- 改進了 AutoML 中的錯誤記錄:完整的錯誤訊息現在一律會寫入記錄檔中。
- AutoML 已更新其封裝釘選,以包含
azureml-defaults
、azureml-explain-model
和azureml-dataprep
。 AutoML 不會再對套件不符發出警告 (除非azureml-train-automl
套件)。 - 修正
timeseries
中 cv 分割的大小不相等,導致 bin 計算失敗的問題。 - 針對交叉驗證定型類型執行集團反復專案時,如果我們在下載針對整個資料集定型的模型時遇到問題,我們會在模型加權和正在送至投票集團的模型之間產生不一致的情況。
- 修正了定型和/或驗證標籤 (y 和 y_valid) 以 pandas 資料框架的形式提供,而不是 numpy 陣列時,所引發的錯誤。
- 修正了在輸入資料表的布林資料行中找不到任何情況時,預測工作的問題。
- 允許 AutoML 使用者卸載預測時不夠長的訓練系列。 -允許 AutoML 使用者從測試集中卸載不存在於定型集中的粒紋。
- azureml-core
- 修正了 blob_cache_timeout 參數順序的問題。
- 已將外部大小和轉換例外狀況類型新增至系統錯誤。
- 新增遠端執行 Key Vault 秘密的支援。 新增
azureml.core.keyvault.Keyvault
類別,以新增、取得及列出與您工作區相關聯金鑰保存庫的祕密。 支援的作業為:- azureml.core.workspace.Workspace.get_default_keyvault()
- azureml.core.keyvault.Keyvault.set_secret(name, value)
- azureml.core.keyvault.Keyvault.set_secrets(secrets_dict)
- azureml.core.keyvault.Keyvault.get_secret(name)
- azureml.core.keyvault.Keyvault.get_secrets(secrets_list)
- azureml.core.keyvault.Keyvault.list_secrets()
- 在遠端執行期間取得預設 keyvault 並取得秘密的更多方法:
- azureml.core.workspace.Workspace.get_default_keyvault()
- azureml.core.run.Run.get_secret(name)
- azureml.core.run.Run.get_secrets(secrets_list)
- 已將其他覆寫參數新增至 submit-hyperdrive CLI 命令。
- 提高 API 呼叫的可靠性,將重試擴充至常見的要求程式庫例外狀況。
- 新增從提交的執行提交執行的支援。
- 已修正 FileWatcher 中即將到期的 SAS 權杖問題,這會導致檔案在初始權杖到期後停止上傳。
- 支援匯入資料集 Python SDK 中的 HTTP csv/tsv 檔案。
- 已淘汰 Workspace.setup() 方法。 向使用者顯示的警告訊息會建議您改為使用 create() 或 get()/from_config()。
- 已新增 Environment.add_private_pip_wheel() ,可讓您將私人自訂 Python 套件
whl
上傳到工作區,並安全地用來建立/具體化環境。 - 您現在可以針對 Microsoft 所產生和客戶憑證的 AKS 叢集上部署的評分端點,更新 TLS/SSL 憑證。
- azureml-explain-model
- 已新增參數,將模型識別碼新增至上傳的說明。
- 已將
is_raw
標記新增至記憶體中的說明並上傳。 - 已新增 azureml-explain-model 套件的 pytorch 支援和測試。
- azureml-opendatasets
- 支援偵測和記錄自動測試環境。
- 已新增類別,以依縣市和郵遞區號取得美國人口。
- azureml-pipeline-core
- 已將標籤屬性新增至輸入和輸出連接埠定義。
- azureml-telemetry
- 已修正不正確的遙測設定。
- azureml-train-automl
- 修正安裝程式失敗時的錯誤 (錯誤未記錄在安裝程式執行的「錯誤」欄位中),因此不會儲存在父代執行「錯誤」中。
- 已修正 AutoML 中遺漏標籤的資料列未正確移除的問題。
- 允許 AutoML 的使用者卸載在預測時不夠長的定型系列。
- 允許 AutoML 使用者從測試集中卸載不存在於定型集中的粒紋。
- 現在 AutoMLStep 會將
automl
config 傳遞給後端,以避免變更或新增設定參數時發生任何問題。 - AutoML 資料 Guardrail 現已進入公開預覽階段。 使用者會看到「資料 Guardrail 報表」 (分類/迴歸工作) 在定型之後,也可以透過 SDK API 來存取。
- azureml-train-core
- 已在 PyTorch 估算器中新增 torch 1.2 支援。
- azureml-widgets
- 改善分類定型的混淆矩陣圖表。
- azure-cli-ml
Azure Machine Learning 資料準備 SDK v1.1.12
新功能
- 您現在可以將字串清單當作輸入傳遞給
read_*
方法。
- 您現在可以將字串清單當作輸入傳遞給
錯誤修正與改善項目
- 在 Spark 中執行時,
read_parquet
的效能已獲得改善。 - 已修正單一資料行中失敗且具有模棱兩可日期格式的問題
column_type_builder
。
- 在 Spark 中執行時,
Azure 入口網站
- 預覽功能
- 記錄檔和輸出檔案串流現在可用於執行詳細資料頁面。 開啟預覽切換時,檔案串流會即時更新。
- 在工作區層級設定配額的功能會以預覽形式發行。 AmlCompute 配額是在訂用帳戶層級進行配置,但我們現在可讓您在工作區之間散發該配額,並將其配置給公平的共用和治理。 只需按一下工作區左側導覽列中的 [使用方式+配額] 分頁,然後選取 [設定配額] 索引標籤。您必須是訂用帳戶管理員,才能在工作區層級設定配額,因為這是跨工作區的操作。
2019-08-05
適用於 Python 的 Azure Machine Learning SDK v1.0.55
新功能
- 針對部署在 AKS 上的評分端點進行的呼叫,現在支援以權杖為基礎的驗證。 我們會繼續支援目前的金鑰型驗證,而且使用者可以一次使用其中一種驗證機制。
- 可以在虛擬網路後方登錄 Blob 儲存體 (VNet) 作為資料存放區。
錯誤修正與改善項目
- azureml-automl-core
- 修正 CV 分割驗證大小很小的錯誤 (bug),並產生不正確的預測與實際迴歸和預測圖表。
- 遠端執行上的預測工作記錄已改進,現在使用者會在執行失敗時提供完整的錯誤訊息。
- 修正
Timeseries
了如果前置處理旗標為 True 時失敗。 - 使某些預測資料驗證錯誤訊息更具可採取動作。
- 減少 AutoML 執行的記憶體耗用量,方法是卸載和/或消極式載入資料集,特別是在流程產生之間
- azureml-contrib-explain-model
- 已將 model_task 旗標新增至說明工具,以允許使用者覆寫模型類型的預設自動推斷邏輯
- Widget 變更:自動安裝
contrib
時,不會有全域功能重要性的nbextension
安裝/啟用支援說明 (例如 Permutative) - 儀表板變更:- 除了在摘要頁面上繪製之外
beeswarm
,還有方塊繪圖和視覺化繪圖 - 在 'Top -k' 滑杆變更上更快速重新呈現beeswarm
繪圖 - 說明如何計算 top-k 的實用訊息 - 在未提供資料時可自訂的可自訂訊息取代圖表
- azureml-core
- 已新增 Model.package() 方法,以建立可封裝模型及其相依性的 Docker 映像和 Dockerfile。
- 已更新本機 webservices,以接受包含環境物件的 InferenceConfigs。
- 已修正當目前目錄的 '.' 作為 model_path 參數傳遞時,Model.register() 產生不正確模型。
- 新增 Run.submit_child,這項功能會鏡像實驗。將執行指定為已提交子執行的父系時,請提交。
- 從模型支援設定選項。在 Run.register_model 中註冊。
- 在現有的叢集上執行 JAR 作業的能力。
- 現在支援 instance_pool_id 和 cluster_log_dbfs_path 參數。
- 已新增在將模型部署至 Webservice 時使用環境物件的支援。 現在可以提供環境物件做為 InferenceConfig 物件的一部分。
- 為新區域新增 appinsifht 對應 - centralus - westus - northcentralus
- 已針對所有資料存放區類別中的所有屬性新增檔。
- 已將 blob_cache_timeout 參數加入至
Datastore.register_azure_blob_container
。 - 已將 save_to_directory 和 load_from_directory 方法新增至 azureml.core.environment.Environment。
- 已將 "az ml environment download" 和 "az ml environment register" 命令新增至 CLI。
- 已新增 Environment.add_private_pip_wheel 方法。
- azureml-explain-model
- 將資料集追蹤新增至使用資料集服務 (預覽) 的說明。
- 從 10K 到 100 串流全域說明時,已減少預設批次大小。
- 已將 model_task 旗標新增至說明工具,以允許使用者覆寫模型類型的預設自動推斷邏輯。
- azureml-mlflow
- 已修正 mlflow.azureml.build_image 中會忽略嵌套目錄的錯誤 (bug)。
- azureml-pipeline-steps
- 已新增在現有 Azure Databricks 叢集上執行 JAR 作業的功能。
- 已新增 DatabricksStep 步驟的支援 instance_pool_id 和 cluster_log_dbfs_path 參數。
- 在 DatabricksStep 步驟中新增管線參數的支援。
- azureml-train-automl
- 針對整體相關檔案新增了
docstrings
。 - 已將文件更新為適用於
max_cores_per_iteration
和max_concurrent_iterations
的更適當語言 - 遠端執行上的預測工作記錄已改進,現在使用者會在執行失敗時提供完整的錯誤訊息。
- 已從管線
automlstep
筆記本中移除 get_data。 - 開始支援
automlstep
中的dataprep
。
- 針對整體相關檔案新增了
- azureml-automl-core
Azure Machine Learning 資料準備 SDK v1.1.10
- 新功能
- 您現在可以在特定資料行上要求執行特定的偵測器 (例如,長條圖、散佈圖等)。
- 已將平行處理引數加入至
append_columns
。 如果為 True,資料會載入記憶體,但執行會平行執行;如果為 False,則執行是串流處理,但單一執行緒。
2019-07-23
適用於 Python 的 Azure Machine Learning SDK v1.0.53
新功能
- 自動機器學習現在支援在遠端計算目標上定型 ONNX 模型
- Azure Machine Learning 現在可讓您從先前的執行、檢查點或模型檔案繼續定型。
- 了解如何使用估算器從先前的執行繼續定型
錯誤修正與改善項目
- azure-cli-ml
- CLI 命令「模型部署」和「服務更新」現在接受參數、設定檔或這兩者的組合。 參數的優先順序高於檔案中的屬性。
- 現在可在註冊之後更新模型描述
- azureml-automl-core
- 將 NimbusML 相依性更新為 1.2.0 版本 (目前最新版)。
- 新增要在 AutoML 估算器中使用之 NimbusML 估算器 & 管線的支援。
- 修正集團選取程式中的錯誤 (bug),即使分數保持不變,也不必要成長產生。
- 啟用跨 CV 分割的部分功能化,以進行預測工作。 如此一來,就能加速安裝程式執行時間,方法是將成本功能化 (例如延隔和變換視窗) 視為 n_cross_validations 的因素。
- 當時間超出 pandas 支援的時間範圍時,解決問題。 如果時間小於 pd.Timestamp.min 或大於 pd.Timestamp.max,我們現在會引發 DataException
- 預測現在可讓定型和測試集中有不同的頻率 (如果可以調整)。 例如,「每季開始於一月」和「每季從十月開始」都可以調整。
- 已將屬性 "parameters" 新增至 TimeSeriesTransformer。
- 移除舊的例外狀況類別。
- 在預測工作中,
target_lags
參數現在接受單一整數值或整數清單。 如果已提供整數,則只會建立一個延遲。 如果有提供清單,將會取得延遲的唯一值。 target_lags=[1, 2, 2, 4] 將建立一、二和四個期間的延遲時間。 - 修正轉換 (錯誤連結之後遺失資料行類型的錯誤) ;
- 在
model.forecast(X, y_query)
中 ,允許 y_query 為物件類型,此物件類型在開始 (#459519) 時,包含 None。 - 將預期值新增至
automl
輸出
- azureml-contrib-datadrift
- 增強了範例筆記本的功能,包括切換至 azureml-opendatasets,而不是 azureml-contrib-opendatasets,以及在擴充資料時的效能改進
- azureml-contrib-explain-model
- 已修正 azureml-contrib-explain-model 套件中原始特徵重要性的 LIME 說明工具轉換引數
- 已將 segmentations 新增至說明中的影像說明,以進行 AzureML-contrib-explain-model 套件
- 新增 LimeExplainer 的 scipy 稀疏支援
- 已將
batch_size
新增至模仿說明的時機include_local=False
,以串流全域說明以改善 DecisionTreeExplainableModel 的執行時間
- azureml-contrib-featureengineering
- 修正呼叫 set_featurizer_timeseries_params(): dict 實值型別變更和 null 檢查 - 新增
timeseries
功能化的筆記本 - 將 NimbusML 相依性更新為 1.2.0 版本 (目前最新版)。
- 修正呼叫 set_featurizer_timeseries_params(): dict 實值型別變更和 null 檢查 - 新增
- azureml-core
- 新增在 Azure Machine Learning CLI 中附加 DBFS 資料存放區的功能
- 修正了資料存放區上傳的錯誤,其中建立了空的資料夾 (若
target_path
開頭為/
) - 修正了
deepcopy
ServicePrincipalAuthentication 中的問題。 - 已將 "az ml environment show" 和 "az ml environment list" 命令新增至 CLI。
- 環境現在支援將 base_dockerfile 指定為已建立的 base_image 的替代方案。
- 未使用的 RunConfiguration 設定 auto_prepare_environment 已標示為已淘汰。
- 現在可在註冊之後更新模型描述
- 錯誤修正:模型和映像刪除現在提供詳細資訊,說明如何在由於上游相依性而刪除失敗時,取得相依於這些物件的上游物件。
- 修正針對在某些環境中建立工作區時所發生的部署,所列印的空白持續時間的錯誤 (bug)。
- 改善工作區建立的失敗例外狀況。 如此一來,使用者就看不到「無法建立工作區。 找不到...」做為訊息,並改為查看實際的建立失敗。
- 在 AKS webservices 中新增對權杖驗證的支援。
- 將
get_token()
方法新增至Webservice
物件。 - 已新增 CLI 支援來管理 machine learning 資料集。
Datastore.register_azure_blob_container
現在可選擇性地接受blob_cache_timeout
值 (秒) 這會設定 blobfuse 的掛接參數,以啟用此資料存放區的快取到期時間。 預設值不會逾時,例如讀取 Blob 時,它會保留在本機快取中,直到作業完成為止。 大部分的作業都偏好此設定,但某些作業需要從大型資料集讀取更多資料,而不是符合其節點上的資料。 針對這些作業,微調此參數可協助它們成功。 微調此參數時請小心:將值設得太低可能會導致效能不佳,因為 epoch 中使用的資料可能會在重新使用之前過期。 所有讀取都是從 Blob 儲存體/網路完成,而不是本機快取,這會對定型時間造成負面影響。- 現在可在註冊之後更新模型描述
- 模型和映射刪除現在提供相依于這些物件的詳細資訊,導致刪除失敗
- 使用 azureml mlflow 來改善遠端執行的資源使用率。
- azureml-explain-model
- 已修正 azureml-contrib-explain-model 套件中原始特徵重要性的 LIME 說明工具轉換引數
- 新增 LimeExplainer 的 scipy 稀疏支援
- 已新增圖形線性解譯器包裝函式,並將另一個層級新增至表格式解譯器,以說明線性模型
- 如需模擬模型程式庫中的模仿說明,請修正針對稀疏資料輸入 include_local = False 時的錯誤
- 將預期值新增至
automl
輸出 - 當提供轉換引數以取得原始功能重要性時,已修正排列功能重要性
- 已將
batch_size
新增至模仿說明的時機include_local=False
,以串流全域說明以改善 DecisionTreeExplainableModel 的執行時間 - 針對模型可解釋性程式庫,已修正黑箱說明工具,其中需要 pandas 資料框架輸入以進行預測
- 修正了
explanation.expected_values
有時會傳回浮點數的錯誤,而不是其中包含 float 的清單。
- azureml-mlflow
- 改善 mlflow.set_experiment (experiment_name 的效能)
- 修正使用 InteractiveLoginAuthentication 進行 mlflow tracking_uri 的錯誤 (bug)
- 使用 azureml mlflow 來改善遠端執行的資源使用率。
- 改善 azureml-mlflow 套件的文件
- 修補錯誤 (bug),其中 mlflow.log_artifacts("my_dir") 會將構件儲存在
my_dir/<artifact-paths>
下,而不是<artifact-paths>
- azureml-opendatasets
- 由於新引進的記憶體問題,將
opendatasets
的pyarrow
釘選至舊版本 (<0.14.0)。 - 將 azureml-contrib-opendatasets 移至 azureml-opendatasets。
- 允許開放資料集類別註冊至 Azure Machine Learning 工作區,並順暢地使用 AML 資料集功能。
- 大幅改善非 SPARK 版本的 NoaaIsdWeather 效能。
- 由於新引進的記憶體問題,將
- azureml-pipeline-steps
- DatabricksStep 中的輸入和輸出現在支援 DBFS 資料存放區。
- 已更新有關輸入/輸出之Azure Batch步驟的檔。
- 在 AzureBatchStep 中:已將 delete_batch_job_after_finish 預設值變更為 true。
- azureml-telemetry
- 將 azureml-contrib-opendatasets 移至 azureml-opendatasets。
- 允許開放資料集類別註冊至 Azure Machine Learning 工作區,並順暢地使用 AML 資料集功能。
- 大幅改善非 SPARK 版本的 NoaaIsdWeather 效能。
- azureml-train-automl
- 已更新get_output檔以反映實際的傳回類型,並提供擷取索引鍵屬性的其他注意事項。
- 將 NimbusML 相依性更新為 1.2.0 版本 (目前最新版)。
- 將預期值新增至
automl
輸出
- azureml-train-core
- 現在接受字串作為自動超參數微調的計算目標
- 未使用的 RunConfiguration 設定 auto_prepare_environment 已標示為已淘汰。
- azure-cli-ml
Azure Machine Learning 資料準備 SDK v1.1.9
新功能
- 已新增直接從 HTTP 或 HTTPs url 讀取檔案的支援。
錯誤修正與改善項目
- 在嘗試從遠端來源讀取 Parquet 資料集時,已改善的錯誤訊息 (目前) 不支援此功能。
- 修正在 ADLS Gen 2 中寫入 Parquet 檔案格式的錯誤,並在路徑中更新 ADLS Gen 2 容器名稱。
2019-07-09
視覺化介面
- 預覽功能
- 在視覺化介面中新增了 [執行 R 指令碼] 模組。
適用於 Python 的 Azure Machine Learning SDK v1.0.48
新功能
- azureml-opendatasets
- azureml-contrib-opendatasets 現在改為 azureml-opendatasets 並可供使用。 舊的套件仍可運作,但我們建議您使用 azureml opendatasets,以取得更豐富的功能和增強功能。
- 這個新套件可讓您在 Azure Machine Learning 工作區中將開啟的資料集註冊為資料集,並使用資料集提供的任何功能。
- 它也包含現有的功能,例如取用開啟的資料集做為 Pandas/SPARK 資料框架,以及某些資料集 (例如天氣) 的位置聯結。
- azureml-opendatasets
預覽功能
- HyperDriveConfig 現在可以接受管線物件做為參數,以支援使用管線的超參數微調。
錯誤修正與改善項目
- azureml-train-automl
- 修正轉換 (錯誤連結之後遺失資料行類型的錯誤)。
- 修正一開始允許 y_query 為物件類型,此物件類型在開始 (#459519) 時,包含 None 的錯誤 (bug)。
- 修正集團選取程式中的問題,即使分數保持不變,也不必要成長產生。
- 修正了在 AutoMLStep 中允許 list_models 和封鎖 list_models 設定的問題。
- 已修正在 Azure Machine Learning 管線內容中使用 AutoML 時,導致無法使用前置處理的問題。
- azureml-opendatasets
- 將 azureml-contrib-opendatasets 移至 azureml-opendatasets。
- 允許開放資料集類別註冊至 Azure Machine Learning 工作區,並順暢地使用 AML 資料集功能。
- 大幅改善非 SPARK 版本的 NoaaIsdWeather 效能。
- azureml-explain-model
- 已更新可解譯性物件的線上文件。
- 已將
batch_size
新增至模仿說明的時機include_local=False
,以串流全域說明以改善 DecisionTreeExplainableModel 的執行時間。 - 修正了
explanation.expected_values
有時會傳回浮點數的錯誤,而不是其中包含 float 的清單。 - 在說明模型程式庫中,將預期值新增至模仿說明的
automl
輸出。 - 當提供轉換引數以取得原始功能重要性時,已修正排列功能重要性。
- azureml-core
- 新增在 Azure Machine Learning CLI 中附加 DBFS 資料存放區的功能。
- 修正了資料存放區上傳的問題,其中建立了空的資料夾 (若
target_path
開頭為/
)。 - 啟用兩個資料集的比較。
- 模型和映像刪除現在提供詳細資訊,說明如何在由於上游相依性而刪除失敗時,取得相依於這些物件的上游物件。
- 已淘汰 auto_prepare_environment 中未使用的 RunConfiguration 設定。
- azureml-mlflow
- 改善使用 azureml. mlflow 的遠端執行的資源使用率。
- 改善 azureml-mlflow 套件的文件。
- 修正 mlflow.log_artifacts("my_dir") 會將成品儲存在 "my_dir/artifact-paths" 下,而不是 "artifact-paths" 的問題。
- azureml-pipeline-core
- 所有管線步驟的參數 hash_paths 已被取代,未來將會移除。 根據預設,source_directory 的內容會雜湊 (除了
.amlignore
或.gitignore
) 中列出的檔案之外 - 持續改善模組和 ModuleStep,以支援計算類型專屬的模組,以準備進行 RunConfiguration 整合和其他變更,以在管線中解除鎖定計算類型特定的模組使用。
- 所有管線步驟的參數 hash_paths 已被取代,未來將會移除。 根據預設,source_directory 的內容會雜湊 (除了
- azureml-pipeline-steps
- AzureBatchStep:改善有關輸入/輸出的檔。
- 在 AzureBatchStep 中:已將 預設值變更為 true。
- azureml-train-core
- 現在接受字串作為自動超參數微調的計算目標。
- 已淘汰 auto_prepare_environment 中未使用的 RunConfiguration 設定。
- 已淘汰
conda_dependencies_file_path
的參數,而且也會pip_requirements_file_path
優先使用conda_dependencies_file
pip_requirements_file
。
- azureml-opendatasets
- 大幅改善非 SPARK 版本的 NoaaIsdWeather 效能。
- azureml-train-automl
2019-04-26
適用於 Python 的 Azure Machine Learning SDK v1.0.33 已發行。
- 正式推出 FPGA 上的 Azure Machine Learning 硬體加速模型。
- 您現在可以 使用 azureml accel 模型套件:
- 定型受支援深度類神經網路的權數 (ResNet 50、ResNet 152、Densenet-121-121、VGG-16-16 和 SSD VGG-16)
- 搭配支援的 DNN 使用傳輸學習
- 向模型管理服務註冊模型,並將模型
- 使用 Azure Kubernetes Service (AKS) 叢集中的 FPGA,將模型部署至 Azure VM
- 將容器部署至 Azure Stack Edge 伺服器裝置
- 使用此範例以 gRPC 端點為您的資料評分
- 您現在可以 使用 azureml accel 模型套件:
自動化 Machine Learning
功能整理可動態新增以 featurizers 進行效能最佳化。 新 featurizers:工作內嵌、辨識項權數、目標編碼、文字目標編碼、叢集距離
智慧型 CV 可處理自動化 ML 內的定型/有效分割
少數記憶體最佳化變更和執行時間效能改進
效能改善模型說明
本機執行的 ONNX 模型轉換
已新增次取樣支援
未定義結束準則時的智慧型停止
堆疊整體
時間序列預測
- 新的預測預測函數
- 您現在可以使用時間序列資料的輪流來源交叉驗證
- 新增至設定時間序列延遲的新功能
- 新增功能以支援滾動時間範圍彙總功能
- 在實驗設定中定義國家/地區代碼時,新的假日偵測和特徵化程式
Azure Databricks
- 啟用時間序列預測和模型可解釋性/可解譯性功能
- 您現在可以取消並繼續自動化 ML 實驗
- 已新增多核心處理的支援
MLOps
本機部署&評分容器偵錯
您現在可以在本機部署 ML 模型,並快速地逐一查看評分檔案和相依性,以確保其行為如預期般運作。引進了 InferenceConfig & Model.deploy()
模型部署現在支援指定具有輸入腳本的源資料夾,與 RunConfig 相同。 此外,模型部署已簡化為單一命令。Git 參考追蹤
客戶已要求基本的 Git 整合功能一段時間,因為它有助於維護完整的審核記錄。 我們已在 Azure Machine Learning 中針對 Git 相關中繼資料實作追蹤, (存放庫、認可、清除狀態) 。 SDK 和 CLI 會自動收集此資訊。模型分析&驗證服務
客戶通常會抱怨如何適當地調整與推斷服務相關聯的計算。 透過我們的模型分析服務,客戶可以提供範例輸入,並跨 16 個不同的 CPU/記憶體組態進行分析,以判斷部署的最佳大小。攜帶您自己的基底映像以進行推斷
另一個常見的問題是,從實驗移至推斷時,不會重新共用相依性。 有了新的基底映像共用功能,您現在可以重複使用您的實驗基礎映像、相依性和全部來進行推斷。 這應該會加速部署,並減少從內部到外部迴圈的間隔。改良的 Swagger 架構產生體驗
先前的 swagger 產生方法發生錯誤,且無法自動化。 我們有新的逐行方式,可透過裝飾項目從任何 Python 函數產生 swagger 架構。 我們已開放原始碼此程式碼,且架構產生通訊協定不會與 Azure Machine Learning 平臺結合。Azure Machine Learning CLI 正式推出 (GA)
現在可以使用單一 CLI 命令來部署模型。 我們獲得了一項常見的客戶意見反應,也就是沒有人從 Jupyter 筆記本部署 ML 模型。 CLI 參考文件已更新。
2019-04-22
適用於 Python 的 Azure Machine Learning SDK v1.0.30 已發行。
引進了在維護相同端點的情況下新增發行管線的新版本 PipelineEndpoint
。
2019-04-15
Azure 入口網站
- 您現在可以在現有的遠端計算叢集上重新提交現有的指令碼執行。
- 您現在可以在 [Pipelines] 索引標籤上,使用新的參數來執行已發佈的管線。
- [執行詳細資料] 現在支援新的快照集檔案檢視器。 您可以在提交特定執行時,查看目錄的快照集。 您也可以下載提交來開始執行的筆記本。
- 您現在可以從 Azure 入口網站取消父執行。
2019-04-08
適用於 Python 的 Azure Machine Learning SDK v1.0.23
- 新功能
- Azure Machine Learning SDK 現在支援 Python 3.7。
- Azure Machine Learning DNN 估算器現在提供內建的多版本支援。 例如,
TensorFlow
估算器現在接受framework_version
參數,使用者可以指定 '1.10' 或 '1.12' 版。 如需目前 SDK 版本所支援的版本清單,請在所需的架構類別上呼叫get_supported_versions()
(例如TensorFlow.get_supported_versions()
)。 如需最新 SDK 版本所支援的版本清單,請參閱 DNN 估算器文件。
2019-03-25
適用於 Python 的 Azure Machine Learning SDK v1.0.21
- 新功能
- Azureml.core.Run.create_children 方法可讓您透過單一呼叫,以低延遲的方式建立多個子執行。
2019-03-11
適用於 Python 的 Azure Machine Learning SDK v1.0.18
- 變更
- Azureml tensorboard 套件會取代 azureml-contrib-tensorboard。
- 在此版本中,您可以在您的受控計算叢集 (amlcompute) 上設定使用者帳戶,並建立該帳戶。 這可以藉由在佈建設定中傳遞這些屬性來完成。 您可以在 SDK 參考文件中找到更多詳細資料。
Azure Machine Learning 資料準備 SDK v1.0.17
新功能
- 現在支援加入兩個數值資料行,以使用運算式語言來產生結果資料行。
錯誤修正與改善項目
- 改進了 random_split 的文件和參數檢查。
2019-02-27
Azure Machine Learning 資料準備 SDK v1.0.16
- 錯誤 (bug) 修正
- 修正了 API 變更所造成的服務主體驗證問題。
2019-02-25
適用於 Python 的 Azure Machine Learning SDK v1.0.17
新功能
錯誤修正與改善項目
- 我們已在 Azure Machine Learning 管線中新增了支援,以將 source_directory_data_store 屬性設定為所需的資料存放區 (例如提供給 PythonScriptStep 之 RunConfigurations 上的 Blob 儲存體)。 依預設,步驟會使用 Azure 檔案存放區做為備份資料存放區,這可能會在多個步驟同時執行時遇到節流問題。
Azure 入口網站
- 新功能
- 報表的新拖放表編輯器體驗。 使用者可以將資料行從適當的資料行拖曳到資料表區域,以顯示資料表的預覽。 您可以重新排列資料行。
- 新記錄檔檢視器
- [活動] 索引標籤中的實驗執行、計算、模型、映像和部署的連結
後續步驟
閱讀 Azure Machine Learning 概觀。