Sdílet prostřednictvím


Nejčastější dotazy k PolyBase

platí pro: SQL Server 2016 (13.x) a novější verze

PolyBase vs. propojené servery

Následující tabulka uvádí rozdíly mezi funkcemi PolyBase a odkazovaného serveru:

PolyBase Propojené servery
Objekt s vymezeným oborem databáze Objekt s vymezeným oborem instance
Používá ovladače ODBC. Používá zprostředkovatele OLEDB.
Podporuje operace jen pro čtení pro všechny zdroje dat a zápis do některých externích zdrojů dat. Podporuje operace čtení i zápisu.
Dotazy na vzdálený zdroj dat z jednoho připojení lze distribuovat a škálovat horizontálně. Dotazy na vzdálený datový zdroj z jednoho připojení nelze škálovat vodorovně.
Podporuje se nabízení predikátů. Je podporováno predikátové filtrování.
Pro skupinu dostupnosti není potřeba žádná samostatná konfigurace. Samostatná konfigurace potřebná pro každou instanci ve skupině dostupnosti
Pouze základní ověřování Základní a integrované ověřování
Vhodné pro analytické dotazy zpracovávající velký počet řádků Vhodné pro dotazy OLTP vracející jeden nebo několik řádků
Dotazy používající externí tabulku se nemůžou účastnit distribuovaných transakcí Distribuované dotazy se mohou účastnit distribuovaných transakcí.

Co je nového v PolyBase v SQL Serveru 2022?

SQL Server 2022 (16.x) teď podporuje soubory CSV, Parquet a Delta uložené v účtu služby Azure Storage verze 2, Azure Data Lake Storage Gen2 nebo libovolné úložiště objektů kompatibilní s S3 pomocí rozhraní REST API S3, místního prostředí nebo cloudu.

SQL Server 2022 (16.x) teď může používat funkci CREATE EXTERNAL TABLE as SELECT (CETAS) společně s příkazy, jako jsou OPENROWSET, CREATE EXTERNAL TABLE (CET) a všechna nová vylepšení T-SQL.

V současné době byla v SQL Serveru 2022 (16.x) odebrána podpora externích zdrojů dat Hadoop.

Kumulativní aktualizace SQL Serveru 2022 (16.x) 2 nyní zavádí podporu pro soubory Oracle TNS. Další informace a ukázky najdete v tématu VYTVOŘENÍ EXTERNÍHO ZDROJE DAT.

Přečtěte si další informace o virtualizaci dat pomocí PolyBase pro SQL Server 2022 a projděte si vylepšení SQL Serveru 2022 PolyBase.

Co je nového v PolyBase v SQL Serveru 2019?

PolyBase v SQL Serveru 2019 (15.x) teď může číst data z větší řady zdrojů dat. Data z těchto externích zdrojů dat se dají uložit jako externí tabulky na SQL Serveru. PolyBase také podporuje pushdown výpočty do těchto externích zdrojů dat, s výjimkou obecných typů ODBC.

Kompatibilní zdroje dat

  • SQL Server
  • Oracle
  • Teradata
  • MongoDB
  • Kompatibilní obecné typy ODBC

Kumulativní aktualizace SQL Serveru 2019 (15.x) 19 nyní zavádí podporu pro soubory Oracle TNS. Další informace a ukázky najdete v tématu VYTVOŘENÍ EXTERNÍHO ZDROJE DAT.

Note

PolyBase může povolit připojení k externím zdrojům dat pomocí ovladačů ODBC třetích stran. Tyto ovladače nejsou k dispozici společně s PolyBase a nemusí fungovat podle očekávání. Další informace naleznete v tématu Konfigurace PolyBase pro přístup k externím datům pomocí obecných typů ODBC.

Jaké CONNECTION_OPTIONS můžu zadat pro připojení ke zdrojům dat třetích stran?

Prozkoumejte CREATE EXTERNAL DATA SOURCE (Transact-SQL) CONNECTION_OPTIONS pro informace o podporovaných možnostech připojení poskytovatele dat pro SQL Server, Oracle, Teradata, MongoDB API pro Cosmos DB a obecné zprostředkovatele dat ODBC.

Jak můžu zobrazit plán provádění vzdáleného dotazu pro výpočty PolyBase pushdown?

To je možné prostřednictvím několika metod v závislosti na verzi SQL Serveru. Viz Řešení potíží s PolyBase – zobrazení plánu dotazů PolyBase.

Jak mohu zjistit, zda se provádí výpočet v PolyBase?

Podporuje se PolyBase ve službě Azure SQL Database?

Ne, ale můžete dotazovat data v souborech umístěných ve službě Azure Blob Storage pomocí funkce OPENROWSET nebo pomocí příkazu CREATE EXTERNAL TABLE číst z bezserverového fondu SQL ve službě Synapse Analytics. Další informace najdete v tématu Azure SQL může číst soubory Azure Data Lake Storage pomocí externích tabulek Synapse SQL.

Podporuje se PolyBase ve službě Azure SQL Managed Instance?

Azure SQL Managed Instance má své vlastní možnosti virtualizace dat pro Azure Data Lake Storage (ADLS) a Azure Blob Storage jako zdroje dat. Další informace najdete v tématu Virtualizace dat se službou Azure SQL Managed Instance.

Které porty mám povolit přes bránu firewall pro PolyBase?

Pro samotný PolyBase nejsou potřeba žádné další porty, kromě skupiny rozšiřovacího nasazení PolyBase. Bez skupiny horizontálního navýšení kapacity by samotná služba PolyBase neměla vyžadovat žádné pravidlo firewallu.

Na serverech s Windows bude PolyBase využívat porty používané SQL Serverem v části IPAll nastavení protokolu TCP/IP v nástroji SQL Server Configuration Manager. Další informace naleznete v tématu Vlastnosti protokolu TCP/IP. Na serverech s Linuxem bude PolyBase využívat nastavení network.tcpport . Další informace naleznete v tématu Port TCP.

Informace o portech v další otázce najdete v případě skupin s horizontálním navýšením kapacity PolyBase na více serverů s Windows.

Musíte ale povolit komunikaci s různými externími zdroji dat používanými PolyBase jinými porty. Projděte si dokumentaci ke konfiguraci ODBC, konfiguraci prostředků Azure nebo konkrétní dokumentaci ke zdroji dat. Například:

Zdrojová platforma Reference
Microsoft SQL Server Porty používané SQL Serverem
Hortonworks HDP Správa HDFS
Cloudera CDH Porty používané komponentami CDH

Jaké porty se používají pro škálovanou skupinu PolyBase?

Ve výchozím nastavení se služba přesunu dat PolyBase připojuje k hlavnímu uzlu škálovací skupiny přes rozsah portů TCP 16450-16460, obvykle pomocí 16450-16453 a portu 17001. Tyto porty se používají jen v případě, že je nakonfigurována skupina se škálováním PolyBase a měly by být povoleny serverovými firewally. Instalační program SQL Serveru by měl při instalaci funkce automaticky vytvořit místní pravidlo brány firewall umožňující těmto portům. Další informace naleznete v tématu Konfigurace škálování skupin PolyBase na Windows.

Note

Skupiny pro škálování Microsoft SQL Server PolyBase budou vyřazeny. Funkčnost škálovacích skupin bude odstraněna z produktu v SQL Serveru 2022 (16.x).

PolyBase v clusterech s velkými objemy dat vs. PolyBase v samostatných instancích

Další informace o připojeních pomocí obecného konektoru ODBC najdete v průvodci konfigurací obecných typů ODBC.

Následující tabulka obsahuje funkce PolyBase dostupné v samostatné instalaci SQL Serveru 2019 (15.x) a clusteru s velkými objemy dat SQL Serveru 2019 (15.x):

Feature Cluster s velkými objemy dat Samostatná instance
Vytvoření externího zdroje dat pro SQL Server, Oracle, Teradata a Mongo DB X X
Vytvoření externího zdroje dat pomocí kompatibilního ovladače ODBC jiného výrobce X
Vytvoření externího zdroje dat pro zdroj dat HADOOP X X
Vytvoření externího zdroje dat pro Azure Blob Storage X X
Vytvoření externí tabulky ve fondu dat SQL Serveru X
Vytvoření externí tabulky ve fondu úložiště SQL Serveru X
Horizontální navýšení kapacity provádění dotazů X X (jenom Windows)

Important

Clustery Microsoft SQL Serveru 2019 pro velké objemy dat jsou vyřazené. Podrobnosti najdete v oznamovacím blogovém příspěvku a možnostech velkých dat na platformě Microsoft SQL Server.