PolyBase 簡介
- 8 分鐘
PolyBase 是 SQL Server 用來啟用數據虛擬化概念的功能。 PolyBase 最初是在 SQL Server 2016 中發行,並在每一個更新版本的 SQL Server 中有所改善。 但在不需要複製資料的情況下遠端存取資料的一般概念,可追溯到引入連結伺服器的 SQL Server 7.0。
下表列出支持各種 PolyBase 功能的第一個 SQL Server 版本。
| SQL Server 2016 | SQL Server 2017 | SQL Server 2019 | SQL Server 2025 |
|---|---|---|---|
| • Hadoop • Azure Blob 儲存體 |
• OPENROWSET 增強功能 • 適用於 Azure Blob 記憶體的 CSV • 資料庫範圍認證 |
• SQL 伺服器 • 甲骨文 • Azure Cosmos DB • MongoDB • 泰拉數據 • Linux 支援 • 通用 ODBC |
• 新的連接器架構 • 物件記憶體整合 • CSV 檔案 • Parquet •三角洲 • CETAS |
如需PolyBase的詳細資訊,請參閱 PolyBase功能和限制。
SQL Server 2025 中的 PolyBase 增強功能
對 CSV、Parquet 和 Delta 1 的原生支援:使用 OPENROWSET、CREATE EXTERNAL TABLE 或 CREATE EXTERNAL TABLE AS SELECT 來處理以下類型的外部資料時,不再需要安裝「適用於外部資料的 PolyBase 查詢服務」:Parquet、Delta、Azure Blob 儲存體 (ABS)、Azure Data Lake Storage (ADLS) 或 S3 相容的物件儲存體。
在 Linux 上使用泛型 ODBC 資料來源:如需詳細資訊,請參閱 設定 PolyBase 以使用 ODBC 泛型類型存取外部資料。
TDS 8.0 支援:使用適用於 SQL Server 的 Microsoft ODBC 驅動程式 18 時,SQL Server 不支援 TDS 8.0 作為外部資料來源。
S3 相容的物件儲存體
SQL Server 2025 支援 S3 相容的物件儲存體。 若要啟用此整合,SQL Server 2025 會使用遵循 S3 架構的 REST API 連接器架構架構。 任何支援 S3 架構的物件儲存體也可與 SQL Server 2025 搭配使用。 S3 相容的物件記憶體解決方案可以在本機、網路、雲端或混合式環境中執行。
物件儲存,也稱為物件導向儲存,是一種策略,可管理和操作數據儲存作為獨立的單位,稱為物件。 這些物件會保留在單一存放庫中,而且不會根深蒂固在其他資料夾內的檔案中。 相反地,物件記憶體會結合組成檔案的數據片段、將所有相關元數據新增至該檔案,並附加自定義標識符。
相較於傳統檔案系統,物件記憶體的一些主要功能包括:
- 將元數據內嵌在檔案中。
- 讓檔案具有類似標籤的屬性。
- 提升經濟效益,更便於擴展和維護。
- 針對大量數據進行優化,例如巨量數據、物聯網(IoT)、AI、機器學習和分析。
- 不建議用於高交易式或在線事務處理 (OLTP) 工作負載。
您也可以使用 BACKUP TO URL 命令,針對備份和還原案例使用 S3 相容的物件記憶體。 如需詳細資訊,請參閱使用與 S3 相容的物件儲存體來進行 SQL Server 備份及還原。
Amazon Web Services (AWS) 建立了 S3 標準架構,以及 Cloudian、Dell、MinIO 和 PureStorage 等主要儲存提供者,現在提供 S3 相容的物件記憶體解決方案。 如果解決方案提供與 S3 REST API 的相容性,則它與 SQL Server 2025 相容。
如需物件記憶體優點、安裝和測試的詳細資訊,請參閱下列記憶體合作夥伴檔。 如需更多物件儲存提供者,請參閱 S3 相容物件記憶體的提供者。
- Cloudian HyperStore
- 戴爾 Isildon OneFS
- 戴爾 ECS 社群版
- 日立 Hitachi 內容平台 (HCP)
- MinIO 多雲端物件記憶體
- Pure Storage Pure FlashBlade。
某些物件記憶體合作夥伴可讓您以軟體的形式執行其解決方案,以虛擬化您目前的記憶體。 您可以在自己的機器或虛擬機器 (VM) 上安裝並試用這些解決方案。
PolyBase 服務與 PolyBase REST API 功能
若要使用 PolyBase,您必須安裝 PolyBase 外部資料查詢服務,並在實例層級使用 sp_configure 啟用 PolyBase。 PolyBase 安裝程式會安裝兩個 PolyBase 服務:SQL Server PolyBase 引擎 和 SQL Server PolyBase 數據移動。
SQL Server PolyBase 引擎
- 服務可執行檔:
mpdwsvc.exe -dweng - 剖析查詢。
- 產生查詢計劃。
- 將工作散發至計算節點 (SQL Server 2019)。
- 處理計算節點結果,並將結果傳回用戶端(SQL Server 2019)。
- 服務可執行檔:
SQL Server PolyBase 資料移動
- 服務可執行檔:
mpdwsvc.exe -dms - 在外部數據源與 PolyBase 前端與計算節點之間傳輸數據(SQL Server 2019)。
- 將數據插入其他數據源,例如 Azure 記憶體。
- 服務可執行檔:
SQL Server、Oracle、MongoDB 或 ODBC 型來源等數據源會使用這些 PolyBase 服務。 使用 SQL Server 2025 REST API 架構的資料來源不需要執行或設定這些服務,但仍必須安裝並啟用 外部資料的 PolyBase 查詢服務 。
您可以使用 PolyBase REST API 來存取 Azure Data Lake Storage、Azure Blob 記憶體、任何 S3 相容的物件記憶體,以及 Parquet、Delta 和 CSV 檔案等檔格式。 先前支持的數據源仍然使用 SQL Server PolyBase 引擎 和 SQL Server PolyBase 數據行動 服務。
| 數據源 | PolyBase 服務 | PolyBase REST API 功能 |
|---|---|---|
| Azure Blob 儲存體 |
|
|
| Azure Data Lake Storage |
|
|
| S3 相容的物件儲存體 |
|
|
| SQL Server |
|
|
| Oracle公司 |
|
|
| Teradata |
|
|
| MongoDB 或適用於 MongoDB 的 Cosmos DB API |
|
|
| 一般開放式資料庫連線能力 (ODBC) |
|
|
| 大量作業 |
|
|