Synapse Data Science 軟體即服務 (SaaS) 體驗是 Microsoft Fabric 的一部分。 其可協助機器學習專業人員建置、部署及運作其機器學習模型。 Synapse 數據科學軟體會在單一分析平台中運作,但會同時與其他重要角色共同作業。 本文說明 Synapse 數據科學體驗的功能,以及機器學習模型如何解決常見的商務問題。
安裝 Python 程式庫
某些端對端 AI 範例需要其他程式庫,才能進行機器學習模型開發或特定資料分析。 您可以選擇其中一個選項,快速安裝 Apache Spark 工作階段的程式庫。
使用內嵌安裝功能進行安裝
在您的筆記本中,使用 Python 內嵌安裝功能 - 例如 %pip 或 %conda - 來安裝新的函式庫。 此選項只會在目前的筆記本中安裝函式庫。 它不會在工作區中安裝函式庫。 使用下列程式碼片段來安裝程式庫。 將 <library name> 替換為您的函式庫名稱:imblearn 或 wordcloud。
# Use pip to install libraries
%pip install <library name>
# Use conda to install libraries
%conda install <library name>
設定工作區的預設程式庫
使用 Fabric 環境 來啟用您的函式庫以供工作區筆記本使用。 您可以建立環境、在其中安裝連結庫,而 您的工作區系統管理員可以 將環境附加至工作區作為其默認環境。 如需設定工作區默認連結庫的詳細資訊,請造訪 管理員設定工作區資源的默認連結庫 。
重要
不再支援工作區設定的程式庫管理。 如需將現有工作區連結庫移轉至環境,以及選取預設工作區環境的詳細資訊,請流覽 「將工作區連結庫和Spark屬性移轉至預設環境」 。
依照教學課程建立機器學習模型
這些教學課程提供了常見案例的端對端範例。
客戶流失
建置模型來預測銀行客戶的流失率。 流失率,也稱為離職率,是指客戶停止與銀行往來的比率。
遵循 預測客戶流失 教學課程中的指示。
建議
一家線上書店想要提供自訂建議來增加銷售額。 透過客戶書籍評等資料,您可以開發和部署建議模型來進行預測。
請參閱 訓練零售推薦模型 教程。
詐騙偵測
隨著未經授權的交易增加,即時信用卡詐騙偵測可協助金融機構更快解決客戶投訴。 詐騙偵測模型包括預處理、訓練、模型儲存體和推斷。 訓練階段會檢閱多個可解決特定挑戰的模型和方法,例如應對不平衡情況的方法、在偽陽性和偽陰性之間的取捨等。
遵循 詐騙偵測 教學課程中的指示。
預測
利用歷史紐約市房地產銷售數據和Facebook先知,建立具有趨勢和季節性資訊的時間序列模型,以預測未來周期的銷售。
跟隨 時間序列預測 教學課程。
文字分類
根據書籍元數據,使用 Word2vec 和線性回歸模型套用文字分類,以在 Spark 中預測英國圖書館書籍是否為虛構或非小說。
按照 文字分類教學 進行。
提升模型
使用提升模型來估計特定醫療處置對個人行為的因果影響。 在這些模組中觸控四個核心區域:
- 數據處理模組:擷取特徵、處理和標籤
- 訓練課程模組:使用傳統機器學習模型來預測個人在處理和未處理時的行為差異 - 例如 LightGBM
- 預測模組:呼叫提升模型來預測測試數據
- 評估模組:評估提升模型對測試數據的影響
在醫療治療的因果影響教學課程中進行學習。
預測性維護
在歷史數據上訓練多個模型,以預測機械故障——例如,涉及工藝溫度或工具旋轉速度的故障。 然後,判斷哪一個模型最適合用來預測未來的失敗。
請參考 預測性維護 教學課程。
銷售趨勢預測
預測超市產品類別的未來銷售。 根據歷程記錄資料訓練模型來執行此動作。
遵循 銷售預測教學 課程中的指示。