分享方式:


適用於 Linux 和 Windows 的 Azure 資料科學虛擬機器是什麼?

資料科學虛擬機器 (DSVM) 是 Azure 雲端平台上提供的自訂 VM 映像,可處理資料科學。 這已預先安裝和預先設定許多常用的資料科學工具,可開始建置智慧型手機應用程式以進行進階分析。

下列項目有提供 DSVM:

  • Windows Server 2019
  • Windows Server 2022
  • Ubuntu 20.04 LTS

此外,我們提供 Azure DSVM for PyTorch,這是來自 Azure Marketplace 專為大型分散式深度學習工作負載最佳化的 Ubuntu 20.04 映像。 此預先安裝的 DSVM 經過最新的 PyTorch 版本驗證,以降低設定成本並加速實現價值。 其隨附各種最佳化功能:

  • ONNX Runtime​
  • DeepSpeed​
  • MSCCL​
  • ORTMoE​
  • Fairscale​
  • Nvidia Apex​
  • 具有 Ubuntu、Python、PyTorch 和 CUDA 最新相容版本的最新堆疊

與 Azure Machine Learning 比較

DSVM 是資料科學的自訂 VM 映像,但 Azure Machine Learning 是一種端對端平台,其中包含:

  • 完全受控的計算
    • 計算執行個體
    • 分散式 ML 工作的計算叢集
    • 用於即時評分的推斷叢集
  • 資料存放區 (例如 Blob、ADLS Gen2、SQL DB)
  • 實驗追蹤
  • 模型管理
  • Notebooks
  • 環境 (管理 Conda 和 R 相依性)
  • 加上標籤
  • 管線 (自動執行端對端資料科學工作流程)

與 Azure Machine Learning 計算執行個體的比較

Azure Machine Learning Compute 執行個體是完全經過設定和受控的 VM 映像,DSVM 則是非受控 VM。

DSVM 與 Azure Machine Learning 計算執行個體的主要差異如下:

功能 資料科學
VM
Azure Machine Learning
計算執行個體
完全受控 No Yes
語言支援 Python、R、Julia、SQL、C#、
Java、Node.js、F#
Python 和 R
作業系統 Ubuntu \(英文\)
Windows
Ubuntu
已預先設定的 GPU 選項 Yes Yes
擴大選項 Yes Yes
SSH 存取 Yes Yes
RDP 存取 No
內建
裝載的 Notebook
No
(需要進行其他設定)
Yes
內建 SSO
(需要進行其他設定)
Yes
內建共同作業 No Yes
預先安裝的工具 Jupyter (lab)、VS Code、
Visual Studio、PyCharm、Juno、
Power BI Desktop、SSMS、
Microsoft Office 365、Apache Drill
Jupyter(lab)

範例 DSVM 客戶使用案例

短期實驗和評估

DSVM 可以評估或學習新的資料科學工具。 請嘗試我們發佈的一些範例和逐步解說

使用 GPU 進行深度學習

在 DSVM 中,您的定型模型可以在圖形處理器 (GPU) 型硬體上使用深度學習演算法。 如果您利用 Azure 平台的 VM 規模調整功能,DSVM 可協助您根據需求在雲端中使用 GPU 型硬體。 當定型大型模型或需要高速計算同時保留相同的 OS 磁碟時,您可以切換到 GPU 型 VM。 您可以選擇任何已啟用 GPU 且含有 DSVM 的 N 系列虛擬機器 SKU。 Azure 免費帳戶不支援已啟用 GPU 的虛擬機器 SKU。

Windows 版 DSVM 預先安裝了 GPU 驅動程式、架構和 GPU 版本的深度學習架構。 在 Linux 版本上,GPU 的深度學習會在 Ubuntu DSVM 上啟用。

您也可以將 Ubuntu 或 Windows DSVM 版本部署到非 GPU 型的 Azure 虛擬機器。 在此情況下,所有深度學習架構都會回復為 CPU 模式。

深入了解可用的深度學習和 AI 架構

資料科學訓練和教育

教導資料科學課程的企業講師和授課者通常會提供虛擬機器映像。 此映像可確保他們的學生擁有一致的設定且範例如預期般運作。

DSVM 會建立具有一致設定的隨選環境,以緩解支援和不相容性挑戰。 在需要頻繁建置這些環境的情況下,特別是對於較短的訓練課程,可以大大受益。

DSVM 包含哪些工具?

如需詳細資訊,請參閱這份完整的 Windows 和 Linux DSVM 工具清單

下一步

如需詳細資訊,請瀏覽下列資源: