適用於 Linux 和 Windows 的 Azure 資料科學虛擬機器是什麼?
資料科學虛擬機器 (DSVM) 是 Azure 雲端平台上提供的自訂 VM 映像,可處理資料科學。 這已預先安裝和預先設定許多常用的資料科學工具,可開始建置智慧型手機應用程式以進行進階分析。
下列項目有提供 DSVM:
- Windows Server 2019
- Windows Server 2022
- Ubuntu 20.04 LTS
此外,我們提供 Azure DSVM for PyTorch,這是來自 Azure Marketplace 專為大型分散式深度學習工作負載最佳化的 Ubuntu 20.04 映像。 此預先安裝的 DSVM 經過最新的 PyTorch 版本驗證,以降低設定成本並加速實現價值。 其隨附各種最佳化功能:
- ONNX Runtime
- DeepSpeed
- MSCCL
- ORTMoE
- Fairscale
- Nvidia Apex
- 具有 Ubuntu、Python、PyTorch 和 CUDA 最新相容版本的最新堆疊
與 Azure Machine Learning 比較
DSVM 是資料科學的自訂 VM 映像,但 Azure Machine Learning 是一種端對端平台,其中包含:
- 完全受控的計算
- 計算執行個體
- 分散式 ML 工作的計算叢集
- 用於即時評分的推斷叢集
- 資料存放區 (例如 Blob、ADLS Gen2、SQL DB)
- 實驗追蹤
- 模型管理
- Notebooks
- 環境 (管理 Conda 和 R 相依性)
- 加上標籤
- 管線 (自動執行端對端資料科學工作流程)
與 Azure Machine Learning 計算執行個體的比較
Azure Machine Learning Compute 執行個體是完全經過設定和受控的 VM 映像,DSVM 則是非受控 VM。
DSVM 與 Azure Machine Learning 計算執行個體的主要差異如下:
功能 | 資料科學 VM |
Azure Machine Learning 計算執行個體 |
---|---|---|
完全受控 | No | Yes |
語言支援 | Python、R、Julia、SQL、C#、 Java、Node.js、F# |
Python 和 R |
作業系統 | Ubuntu \(英文\) Windows |
Ubuntu |
已預先設定的 GPU 選項 | Yes | Yes |
擴大選項 | Yes | Yes |
SSH 存取 | Yes | Yes |
RDP 存取 | 是 | No |
內建 裝載的 Notebook |
No (需要進行其他設定) |
Yes |
內建 SSO | 否 (需要進行其他設定) |
Yes |
內建共同作業 | No | Yes |
預先安裝的工具 | Jupyter (lab)、VS Code、 Visual Studio、PyCharm、Juno、 Power BI Desktop、SSMS、 Microsoft Office 365、Apache Drill |
Jupyter(lab) |
範例 DSVM 客戶使用案例
短期實驗和評估
DSVM 可以評估或學習新的資料科學工具。 請嘗試我們發佈的一些範例和逐步解說。
使用 GPU 進行深度學習
在 DSVM 中,您的定型模型可以在圖形處理器 (GPU) 型硬體上使用深度學習演算法。 如果您利用 Azure 平台的 VM 規模調整功能,DSVM 可協助您根據需求在雲端中使用 GPU 型硬體。 當定型大型模型或需要高速計算同時保留相同的 OS 磁碟時,您可以切換到 GPU 型 VM。 您可以選擇任何已啟用 GPU 且含有 DSVM 的 N 系列虛擬機器 SKU。 Azure 免費帳戶不支援已啟用 GPU 的虛擬機器 SKU。
Windows 版 DSVM 預先安裝了 GPU 驅動程式、架構和 GPU 版本的深度學習架構。 在 Linux 版本上,GPU 的深度學習會在 Ubuntu DSVM 上啟用。
您也可以將 Ubuntu 或 Windows DSVM 版本部署到非 GPU 型的 Azure 虛擬機器。 在此情況下,所有深度學習架構都會回復為 CPU 模式。
資料科學訓練和教育
教導資料科學課程的企業講師和授課者通常會提供虛擬機器映像。 此映像可確保他們的學生擁有一致的設定且範例如預期般運作。
DSVM 會建立具有一致設定的隨選環境,以緩解支援和不相容性挑戰。 在需要頻繁建置這些環境的情況下,特別是對於較短的訓練課程,可以大大受益。
DSVM 包含哪些工具?
如需詳細資訊,請參閱這份完整的 Windows 和 Linux DSVM 工具清單。
下一步
如需詳細資訊,請瀏覽下列資源:
Windows:
Linux: