共用方式為


在 Microsoft Fabric 中使用端對端 AI 範例

Synapse Data Science 軟體即服務 (SaaS) 體驗是 Microsoft Fabric 的一部分。 其可協助機器學習專業人員建置、部署及運作其機器學習模型。 Synapse 數據科學軟體會在單一分析平台中運作,但會同時與其他重要角色共同作業。 本文說明 Synapse 數據科學體驗的功能,以及機器學習模型如何解決常見的商務問題。

安裝 Python 程式庫

某些端對端 AI 範例需要其他程式庫,才能進行機器學習模型開發或特定資料分析。 您可以選擇其中一個選項,快速安裝 Apache Spark 工作階段的程式庫。

使用內嵌安裝功能進行安裝

在您的筆記本中,使用 Python 內嵌安裝功能 - 例如 %pip%conda - 來安裝新的函式庫。 此選項只會在目前的筆記本中安裝函式庫。 它不會在工作區中安裝函式庫。 使用下列程式碼片段來安裝程式庫。 將 <library name> 替換為您的函式庫名稱:imblearnwordcloud

# Use pip to install libraries
%pip install <library name>

# Use conda to install libraries
%conda install <library name>

設定工作區的預設程式庫

使用 Fabric 環境 來啟用您的函式庫以供工作區筆記本使用。 您可以建立環境、在其中安裝連結庫,而 您的工作區系統管理員可以 將環境附加至工作區作為其默認環境。 如需設定工作區默認連結庫的詳細資訊,請造訪 管理員設定工作區資源的默認連結庫

重要

不再支援工作區設定的程式庫管理。 如需將現有工作區連結庫移轉至環境,以及選取預設工作區環境的詳細資訊,請流覽 「將工作區連結庫和Spark屬性移轉至預設環境」

依照教學課程建立機器學習模型

這些教學課程提供了常見案例的端對端範例。

客戶流失

建置模型來預測銀行客戶的流失率。 流失率,也稱為離職率,是指客戶停止與銀行往來的比率。

遵循 預測客戶流失 教學課程中的指示。

建議

一家線上書店想要提供自訂建議來增加銷售額。 透過客戶書籍評等資料,您可以開發和部署建議模型來進行預測。

請參閱 訓練零售推薦模型 教程。

詐騙偵測

隨著未經授權的交易增加,即時信用卡詐騙偵測可協助金融機構更快解決客戶投訴。 詐騙偵測模型包括預處理、訓練、模型儲存體和推斷。 訓練階段會檢閱多個可解決特定挑戰的模型和方法,例如應對不平衡情況的方法、在偽陽性和偽陰性之間的取捨等。

遵循 詐騙偵測 教學課程中的指示。

預測

利用歷史紐約市房地產銷售數據和Facebook先知,建立具有趨勢和季節性資訊的時間序列模型,以預測未來周期的銷售。

跟隨 時間序列預測 教學課程。

文字分類

根據書籍元數據,使用 Word2vec 和線性回歸模型套用文字分類,以在 Spark 中預測英國圖書館書籍是否為虛構或非小說。

按照 文字分類教學 進行。

提升模型

使用提升模型來估計特定醫療處置對個人行為的因果影響。 在這些模組中觸控四個核心區域:

  • 數據處理模組:擷取特徵、處理和標籤
  • 訓練課程模組:使用傳統機器學習模型來預測個人在處理和未處理時的行為差異 - 例如 LightGBM
  • 預測模組:呼叫提升模型來預測測試數據
  • 評估模組:評估提升模型對測試數據的影響

在醫療治療的因果影響教學課程中進行學習。

預測性維護

在歷史數據上訓練多個模型,以預測機械故障——例如,涉及工藝溫度或工具旋轉速度的故障。 然後,判斷哪一個模型最適合用來預測未來的失敗。

請參考 預測性維護 教學課程。

銷售趨勢預測

預測超市產品類別的未來銷售。 根據歷程記錄資料訓練模型來執行此動作。

遵循 銷售預測教學 課程中的指示。