Visual Studio 中的資料科學與分析應用程式工作負載

Visual Studio 中的資料科學與分析應用程式工作負載結合數種語言及其各自執行階段發行版本:

Python 是用於資料科學的主要指令碼語言。 Python 很容易學習,且支援多種套件生態系統。 這些套件處理各種案例 (例如資料取得、清理、模型訓練、部署和繪製)。 F# 也是一種功能強大的功能優先 .NET 語言,適用於各種資料處理工作。

顯示 Visual Studio 中的 R、Python 和 F# 程式碼專案的螢幕擷取畫面。

工作負載安裝

資料科學和分析應用程式工作負載可在 [工作負載]>[其他工具組] 下的 [Visual Studio 安裝程式中使用:

顯示如何在 Visual Studio 安裝程式 2022 中選取資料科學和分析應用程式工作負載的螢幕擷取畫面。

顯示如何在 Visual Studio 安裝程式 2019 中選取資料科學和分析應用程式工作負載的螢幕擷取畫面。

根據預設,工作負載會安裝下列選項,而您可以在 Visual Studio 安裝程式中工作負載的 [摘要] 區段內對其進行修改:

  • F# 桌面語言支援
  • Python:
    • Python 語言支援
    • Python Web 支援
    • Python 原生開發工具

SQL Server 整合

SQL Server 支援使用 Python,以直接在 SQL Server 內執行進階分析。 SQL Server 2017 CTP 2.0 和更新版本提供 Python 支援。

執行已有資料的程式碼將會有下列優點:

  • 不需要移動資料:您可以在資料庫中建置應用程式,而不需要將資料從資料庫移至應用程式或模型。 此功能可消除安全性障礙、合規性、控管、完整性,以及移動大量資料相關類似問題的主機。 您也可以使用未放入用戶端電腦記憶體的資料集。

  • 輕鬆部署:模型準備就緒之後,您只要在 T-SQL 指令碼中嵌入它,便能輕鬆將它部署至生產環境。 以任何語言撰寫的任何 SQL 用戶端應用程式接著可以透過預存程序呼叫來運用模型和智慧。 不需要任何特定的語言整合。

  • 企業級效能和規模:您可以使用 SQL Server 的進階功能,例如具有 RevoScale 套件中高效能可擴充 API 的記憶體中資料表和資料行存放區索引。 不需要移動資料也表示在您的資料成長或您想要增加應用程式效能時,避免用戶端記憶體條件約束。

  • 豐富的擴充性:您可以在 SQL Server 上安裝和執行任何最新的開放原始碼套件,以對 SQL Server 中的大量資料建置深度學習和 AI 應用程式。 在 SQL Server 中安裝套件,就像在本機電腦上安裝套件一樣簡單。

  • 不需額外成本的多可用性:所有 SQL Server 2017 和更新版本都提供語言整合 (包含 Express Edition)。

SQL Server 整合安裝

若要完整利用 SQL Server 整合,請使用 Visual Studio 安裝程式,來安裝 [工作負載]>[其他工具組]>[資料儲存和處理] 工作負載。 選取 [SQL Server Data Tools] 選項,以啟用 SQL IntelliSense、語法醒目提示和部署:

顯示如何在 Visual Studio 安裝程式 2022 中選取資料儲存和處理工作負載的螢幕擷取畫面。

顯示如何在 Visual Studio 安裝程式 2019 中選取資料儲存和處理工作負載的螢幕擷取畫面。

如需詳細資訊,請參閱 SQL Server 2017 中的 Python:增強式資料庫中機器學習 (部落格)

其他服務和 SDK

除了資料科學與分析應用程式工作負載中的直接內容之外,Visual Studio Code 中的 Notebooks 中和 Azure SDK for Python 也適用於資料科學。

Azure SDK for Python 可讓您更輕鬆地從 Windows、Mac 和 Linux 上所執行的應用程式使用及管理 Microsoft Azure 服務。 如需詳細資訊,請參閱適用於 Python 開發人員的 Azure

您可以將 Jupyter 延伸模組與 Visual Studio Code 中的 Notebooks 結合,以支援 Jupyter 開發,並使用額外的語言延伸模組增強專案。 此服務會在 Python、R 和 F# 中包含範例筆記本,協助您開始使用。 如需詳細資訊,請參閱來自 Microsoft 和 GitHub 的 Notebooks 體驗

顯示如何在 R 範例簡介中搭配使用 Jupyter 和 Notebooks 的螢幕擷取畫面。