Úvod do PolyBase
- 8 min
PolyBase je funkce, kterou SQL Server používá k povolení konceptu virtualizace dat. PolyBase byl původně vydán v SQL Serveru 2016 a je vylepšen v každé novější verzi SQL Serveru. Obecný koncept vzdáleného přístupu k datům bez nutnosti kopírovat data pochází ze zavedení propojeného serveru v SQL Serveru 7.0.
Následující tabulka uvádí první verzi SQL Serveru, která podporuje různé funkce PolyBase.
| SQL Server 2016 | SQL Server 2017 | SQL Server 2019 | SQL Server 2025 |
|---|---|---|---|
| • Hadoop • Azure Blob Storage |
• Vylepšení OPENROWSET • CSV pro Azure Blob Storage • Pověření s vymezeným oborem databáze |
• SQL Server • Oracle • Azure Cosmos DB • MongoDB •Teradata • Podpora Linuxu • Obecná rozhraní ODBC |
• Nová architektura konektoru • Integrace úložiště objektů •CSV •Parkety •Delta • CETAS |
Další informace o PolyBase naleznete v tématu Funkce a omezení PolyBase.
Vylepšení PolyBase v SQL Serveru 2025
Nativní podpora pro CSV, Parquet a Delta 1: Instalace služby PolyBase Query Service pro externí data už nevyžaduje použití OPENROWSET, CREATE EXTERNAL TABLE nebo CREATE EXTERNAL TABLE AS SELECT s následujícími typy externích dat: Parquet, Delta, Azure Blob Storage (ABS), Azure Data Lake Storage (ADLS) nebo S3-Compatible Object Storage.
Použití obecných zdrojů dat ODBC v Linuxu: Další informace najdete v tématu Konfigurace PolyBase pro přístup k externím datům pomocí obecných typů ODBC.
Podpora TDS 8.0: Při použití ovladače Microsoft ODBC 18 pro SQL Server se TDS 8.0 nepodporuje pro SQL Server jako externí zdroj dat.
Úložiště objektů kompatibilní s S3
SQL Server 2025 podporuje úložiště objektů kompatibilní s S3. K povolení této integrace používá SQL Server 2025 architekturu konektoru REST API, která se řídí architekturou S3. Jakékoli úložiště objektů, které podporuje architekturu S3, funguje také s SQL Serverem 2025. Řešení úložiště objektů kompatibilní s S3 můžou běžet místně, v síti, v cloudu nebo v hybridním prostředí.
Úložiště objektů, označované také jako úložiště založené na objektech, je strategie, která spravuje a manipuluje s úložištěm dat jako jedinečné jednotky, označované jako objekty. Tyto objekty se uchovávají v jediném úložišti a nejsou zachované v souborech uvnitř jiných složek. Místo toho úložiště objektů kombinuje části dat, které tvoří soubor, přidá do tohoto souboru všechna relevantní metadata a připojí vlastní identifikátor.
Mezi hlavní funkce úložiště objektů v porovnání s tradičním systémem souborů patří:
- Uchovává metadata vložená do souboru.
- Umožňuje souborům mít atributy, jako jsou značky.
- Nákladově efektivnější škálování a snadnější údržba.
- Optimalizované pro velké objemy dat, jako jsou velké objemy dat, Internet věcí (IoT), AI, Machine Learning a analýzy.
- Nedoporučuje se pro úlohy vysoce transakční zátěže nebo OLTP.
Úložiště objektů kompatibilní s S3 můžete použít také pro scénáře zálohování a obnovení pomocí příkazu BACKUP TO URL. Další informace najdete v tématu zálohování a obnovení SQL Serveru súložiště objektů kompatibilní s S3 .
Standardní architektura S3 je široce přijímaná a mnoho hlavních poskytovatelů úložiště nyní nabízí řešení úložiště kompatibilní s S3. Pokud řešení nabízí kompatibilitu s rozhraními REST API S3, je kompatibilní s SQL Serverem 2025. Seznam podporovaných poskytovatelů úložiště objektů najdete v tématu Poskytovatelé úložiště objektů kompatibilního s S3.
Někteří partneři úložiště objektů nabízejí možnost spouštět své řešení jako software schopný virtualizovat aktuální úložiště. Tato řešení můžete nainstalovat a vyzkoušet na vlastním počítači nebo virtuálním počítači.
Služby PolyBase vs. funkce rozhraní Rest API PolyBase
Chcete-li použít PolyBase, musíte nainstalovat PolyBase Query Service pro externí data a povolit PolyBase na úrovni instance pomocí sp_configure. Instalace PolyBase nainstaluje dvě služby PolyBase, SQL Server PolyBase Engine a SQL Server PolyBase Data Movement.
PolyBase Engine SQL Serveru
- Spustitelný soubor služby:
mpdwsvc.exe -dweng - Analyzuje dotazy.
- Generuje plány dotazů.
- Distribuuje práci do výpočetních uzlů (SQL Server 2019).
- Zpracovává výsledky výpočetního uzlu a vrací výsledky zpět ke klientovi (SQL Server 2019).
- Spustitelný soubor služby:
přesunu dat PolyBase SQL Serveru
- Spustitelný soubor služby:
mpdwsvc.exe -dms - Přenáší data mezi externími zdroji dat a mezi hlavními a výpočetními uzly PolyBase (SQL Server 2019).
- Vloží data do jiných zdrojů dat, jako je Azure Storage.
- Spustitelný soubor služby:
Zdroje dat, jako jsou SQL Server, Oracle, MongoDB nebo zdroje založené na rozhraní ODBC, používají tyto služby PolyBase. Zdroje dat, které používají architekturu PolyBase založenou na rozhraní REST API sql Serveru 2025, nevyžadují, aby byly tyto služby spuštěné nebo nakonfigurované, ale služba PolyBase Query Service pro externí data musí být stále nainstalovaná a povolená.
Rozhraní PolyBase REST API můžete použít pro přístup ke službě Azure Data Lake Storage, Azure Blob Storage, libovolnému úložišti objektů kompatibilním s S3 a formátům souborů, jako jsou soubory Parquet, Delta a CSV. Dříve podporované zdroje dat stále používají SQL Server PolyBase Engine a SQL Server PolyBase Data Movement služby.
| Zdroj dat | Služby PolyBase | Funkce rozhraní REST API PolyBase |
|---|---|---|
| Azure Blob Storage |
|
|
| Azure Data Lake Storage |
|
|
| Úložiště objektů kompatibilní s S3 |
|
|
| SQL Server |
|
|
| Oracle |
|
|
| Teradata |
|
|
| MongoDB nebo rozhraní API služby Azure Cosmos DB pro MongoDB |
|
|
| Obecné připojení k open database (ODBC) |
|
|
| Hromadné operace |
|
|