Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
platí pro: SQL Server
Azure SQL Database
Azure Synapse Analytics
Analytics Platform System (PDW)
PolyBase umožňuje virtualizaci dat pro SQL Server.
Co je PolyBase?
PolyBase umožňuje instanci SQL Serveru dotazovat data pomocí Transact-SQL (T-SQL) přímo z SQL Serveru, Oracle, Teradata, MongoDB, clusterů Hadoop, Cosmos DB a úložiště objektů kompatibilních s S3 bez samostatné instalace softwaru pro připojení klienta. Obecný konektor ODBC můžete také použít k připojení k dalším poskytovatelům pomocí ovladačů ODBC třetích stran. PolyBase umožňuje dotazům T-SQL spojit data z externích zdrojů do relačních tabulek v instanci SQL Serveru.
PolyBase také podporuje dotazování částečně strukturovaných a strukturovaných datových formátů, jako jsou soubory CSV, Parquet, JSON a Delta Lake. To umožňuje bezproblémovou integraci dat založených na souborech do pracovních postupů T-SQL.
Klíčovým případem použití virtualizace dat pomocí funkce PolyBase je umožnit, aby data zůstala v původním umístění a formátu. Externí data můžete virtualizovat prostřednictvím instance SQL Serveru, aby se na ni bylo možné dotazovat stejně jako na jakoukoli jinou tabulku v SQL Serveru. Tento proces minimalizuje potřebu procesů ETL pro přesun dat. Tento scénář virtualizace dat je možný s využitím konektorů PolyBase.
Podporované produkty a služby SQL
PolyBase poskytuje tyto stejné funkce pro následující produkty SQL od Microsoftu:
SQL Server 2016 (13.x) a novější verze (Windows)
SQL Server 2019 (15.x) a novější verze (Windows a Linux)
Podrobnosti o virtualizaci dat pomocí služby Azure SQL Managed Instance najdete v Azure SQL Managed Instance.
Podrobnosti najdete v Azure SQL Database v tématu Virtualizace dat s využitím Azure SQL Database (Preview).
SQL Server Analytics Platform System (PDW)
Azure Synapse Analytics (pro vyhrazené fondy SQL)
- Virtualizace dat ve službě Azure Synapse Analytics je dostupná ve dvou režimech: PolyBase a nativní. Další informace najdete v tématu Použití externích tabulek se službou Synapse SQL.
Vylepšení SQL Serveru 2025 PolyBase
| Novinka systému SQL Server 2025 (17.x) | Podrobnosti |
|---|---|
| Nativní podpora pro CSV, Parquet a Delta 1 | Služba PolyBase Query Service pro externí data se už nevyžaduje k použití OPENROWSET, CREATE EXTERNAL TABLEnebo CREATE EXTERNAL TABLE AS SELECT s následujícími typy externích dat: Parquet, Delta, Azure Blob Storage (ABS), Azure Data Lake Storage (ADLS) nebo S3-Compatible Object Storage. |
| Použití obecných zdrojů dat ODBC v Linuxu | Další informace naleznete v tématu Konfigurace PolyBase pro přístup k externím datům pomocí obecných typů ODBC. |
| Podpora TDS 8.0 | PolyBase používá ve výchozím nastavení zabezpečenou konfiguraci s ovladačem ODBC pro SQL Server verze 18 a Encrypt=Yes (povinné). Na rozdíl od jiných SQL Server funkcí umožňuje PolyBase TrustServerCertificate=True použití vlastnoručně podepsaných certifikátů. Pokud chcete vynutit šifrování TLS 1.3 a striktní šifrování pomocí TDS 8.0, nastavte Encrypt=Strict a TrustServerCertificate=No. Další informace naleznete v tématu VYTVOŘENÍ EXTERNÍHO ZDROJE DAT – CONNECTION_OPTIONS. Projděte si zásadní změny funkcí databázového stroje v SQL Serveru 2025. |
| Spravovaná identita | Spravovaná identita je k dispozici pro SQL Server s podporou Azure Arc a SQL Serveru 2025 na virtuálních počítačích Azure. |
1 V SYSTÉMU SQL Server 2025 (17.x) je služba PolyBase Query Service pro externí data stále nutná pro připojení k jiným databázím. Příklad: SQL Server, Oracle, DB2, Teradata, MongoDB nebo ODBC.
Vylepšení SQL Serveru 2022 PolyBase
| Novinka systému SQL Server 2022 (16.x) | Podrobnosti |
|---|---|
| Úložiště objektů kompatibilní s S3 | SQL Server 2022 (16.x) přidává nové konektory, úložiště objektů kompatibilní s S3 pomocí rozhraní REST API S3. K dotazování datových souborů v úložišti objektů kompatibilních s S3 můžete použít OPENROWSET i CREATE EXTERNAL TABLE . |
| Některé konektory oddělené od služeb PolyBase | Konektor úložiště objektů kompatibilní s S3, ADSL Gen2 a Azure Blob Storage už nejsou závislé na službách PolyBase. Služby PolyBase musí pořád běžet, aby podporovaly připojení s Oracle, Teradata, MongoDB a generickým rozhraním ODBC. Funkce PolyBase musí být stále nainstalovaná v instanci SQL Serveru. |
| Formát souboru Parquet | PolyBase teď dokáže dotazovat data ze souborů Parquet uložených v úložišti objektů kompatibilním s S3. Další informace naleznete v tématu Virtualizace Parquet souboru v S3-kompatibilním objektovém úložišti pomocí PolyBase. |
| Formát tabulky Delta | PolyBase teď dokáže dotazovat (jen pro čtení) data z formátu Tabulky Delta uloženého v úložišti objektů kompatibilních s S3, účtu Azure Storage V2 a Azure Data Lake Storage Gen2. Další informace najdete v tématu Virtualizace tabulky Delta pomocí PolyBase |
| Vytvoření externí tabulky pomocí SELECT (CETAS) | PolyBase teď může použít CETAS k vytvoření externí tabulky a následnému paralelnímu exportu výsledku příkazu Transact-SQL SELECT do azure Data Lake Storage Gen2, účtu služby Azure Storage V2 a úložiště objektů kompatibilního s S3. Další informace najdete v tématu CREATE EXTERNAL TABLE AS SELECT (CETAS). |
Další nové funkce SYSTÉMU SQL Server 2022 (16.x) najdete v tématu Co je nového v SYSTÉMU SQL Server 2022.
Návod
Kurz funkcí a možností PolyBase v SQL Serveru 2022 (16.x) najdete v tématu Začínáme s PolyBase v SQL Serveru 2022.
Konektory PolyBase
Funkce PolyBase poskytuje připojení k následujícím externím zdrojům dat:
| Externí zdroje dat | SQL Server 2016–2019 s PolyBase | SQL Server verze 2022 (16.x) s PolyBase | APS PDW | Azure Synapse Analytics |
|---|---|---|---|---|
| Oracle, MongoDB, Teradata | Čti | Čti | Ne | Ne |
| Obecné ODBC | Čtení (pouze Windows) | Čtení (pouze Windows) | Ne | Ne |
| Azure Storage | Čtení a zápis | Čtení a zápis | Čtení a zápis | Čtení a zápis |
| Hadoop | Čtení a zápis | Ne | Čtení a zápis | Ne |
| SQL Server | Čti | Čti | Ne | Ne |
| Úložiště objektů kompatibilní s S3 | Ne | Čtení a zápis | Ne | Ne |
- SQL Server 2022 (16.x) a novější verze nepodporují Hadoop.
- SQL Server 2016 (13.x) zavedl PolyBase s podporou připojení k Hadoopu a Azure Blob Storage.
- SQL Server 2019 (15.x) zavedl další konektory, včetně SQL Serveru, Oracle, Teradata a MongoDB.
- SQL Server 2022 (16.x) zavedl konektor úložiště kompatibilní s S3.
- Kumulativní aktualizace SQL Serveru 2019 (15.x) 19 zavedla podporu pro Oracle TNS.
- Kumulativní aktualizace SQL Serveru 2022 (16.x) 2 zavedla podporu pro Oracle TNS.
Mezi příklady externích konektorů patří:
1 PolyBase podporuje dva poskytovatele Hadoopu, Hortonworks Data Platform (HDP) a Cloudera Distributed Hadoop (CDH) až SQL Server 2019. Podpora SQL Serveru pro externí zdroje dat HDFS Cloudera (CDP) a Hortonworks (HDP) byla vyřazena a není součástí SQL Serveru 2022 (16.x) a novějších verzí. Další informace najdete v tématu možnosti velkých objemů dat na platformě Microsoft SQL Server.
Použití PolyBase v instanci SQL Serveru:
- Nainstalujte PolyBase ve Windows nebo nainstalujte PolyBase v Linuxu.
- Počínaje SQL Serverem 2019 (15.x) povolte PolyBase v případě potřeby v sp_configure.
- Vytvořte externí zdroj dat.
- Vytvořte externí tabulku.
Integrace Azure
Díky základní pomoci PolyBase můžou dotazy T-SQL také importovat a exportovat data ze služby Azure Blob Storage. PolyBase navíc umožňuje službě Azure Synapse Analytics importovat a exportovat data z Azure Data Lake Store a ze služby Azure Blob Storage.
Proč používat PolyBase?
PolyBase umožňuje spojit data z instance SQL Serveru s externími daty. Než PolyBase povolila připojení dat k externím zdrojům dat, mohli byste:
- Přeneste polovinu dat tak, aby všechna data byla v jednom umístění.
- Dotazování obou zdrojů dat a následné zápis vlastní logiky dotazu pro spojení a integraci dat na úrovni klienta.
PolyBase umožňuje použít Transact-SQL ke spojení dat.
PolyBase nevyžaduje instalaci dalšího softwaru do prostředí Hadoop. Dotazujete se na externí data pomocí stejné syntaxe T-SQL, která se používá k dotazování na tabulku databáze. Všechny akce podpory implementované PolyBase probíhají transparentně. Autor dotazu nepotřebuje žádné znalosti o externím zdroji.
PolyBase používá
PolyBase umožňuje v SQL Serveru následující scénáře:
- Bezproblémový přístup k datům: Dotazování na jiné rdBM nebo externí soubory, jako jsou tabulky CSV, Parquet a Delta Lake, pomocí T-SQL, jako by šlo o nativní tabulky.
- Nenačítá se studená data: Přitom je snadno přístupný.
- Vyšší produktivita: Zkraťte čas a úsilí potřebné k integraci a analýze dat z více zdrojů.
- Nákladová efektivita: Minimalizujte potřebu replikace dat a nákladů na úložiště spojených s tradičními metodami integrace dat.
- Přehledy v reálném čase: Povolte dotazování a přehledy dat v reálném čase bez zpoždění způsobených přesunem nebo synchronizací dat.
- Bezpečnost: Funkce zabezpečení SQL Serveru slouží k podrobným oprávněním, správě přihlašovacích údajů a řízení.
Výkon
Počet souborů nebo množství dat, které je možné dotazovat, není nijak omezený. Výkon dotazů závisí na množství dat, formátu dat, způsobu uspořádání dat a složitosti dotazů a spojení.
Další informace o pokynech k výkonu a doporučeních pro PolyBase najdete v tématu Aspekty výkonu v PolyBase pro SQL Server.
Upgrade na SQL Server 2022
Od verze SQL Server 2022 (16.x) Hortonworks Data Platform (HDP) a Cloudera Distributed Hadoop (CDH) se už nepodporují. Kvůli těmto změnám musíte před migrací na SQL Server 2022 (16.x) nebo novější ručně odstranit externí zdroje dat PolyBase vytvořené v předchozích verzích SQL Serveru, které používají TYPE = HADOOP nebo Azure Storage. Vyřazení externích zdrojů dat také vyžaduje vyřazení přidružených databázových objektů, jako jsou přihlašovací údaje v oboru databáze a externí tabulky.
Konektory azure Storage je potřeba změnit na základě následující referenční tabulky:
| Externí zdroj dat | Od | Na |
|---|---|---|
| Azure Blob Storage | wasb[s] |
abs |
| ADLS Gen2 | abfs[s] |
adls |
Začínáme
Před použitím PolyBase musíte nainstalovat PolyBase ve Windows nebo nainstalovat PolyBase v Linuxu a v případě potřeby povolit PolyBase v sp_configure .
Kurz funkcí a možností PolyBase najdete v tématu Začínáme s PolyBase v SQL Serveru 2022.
Další kurzy o různých externích zdrojích dat najdete v následujících kurzech:
- Hadoop
- Azure Blob Storage
- SQL Server
- Věštírna
- Teradata
- MongoDB
- Obecné typy ODBC
- Úložiště objektů kompatibilní s S3
- Soubor CSV
- Soubor Parquet
- Tabulka Delta
Virtualizace dat na jiných platformách
Funkce virtualizace dat jsou k dispozici také na jiných platformách:
- Použití externích tabulek se službou Synapse SQL
- Virtualizace dat s využitím služby Azure SQL Managed Instance
- Virtualizace dat pomocí Azure SQL Database (Preview)
Související obsah
- Začínáme s PolyBase v SQL Serveru 2022
- OPENROWSET (Transact-SQL)
- VYTVOŘIT EXTERNÍ TABULKU (Transact-SQL)
- VYTVOŘIT VNĚJŠÍ TABULKU JAKO VÝBĚR (CETAS) (Transact-SQL)
- Aspekty výkonu v PolyBase pro SQL Server
- Nejčastější dotazy k PolyBase
- Sledování a řešení potíží s PolyBase
- Transact-SQL PolyBase