Sdílet prostřednictvím


Nejčastější dotazy k PolyBase

platí pro: SQL Server 2016 (13.x) a novější verze

PolyBase vs. propojené servery

Následující tabulka uvádí rozdíly mezi funkcemi PolyBase a odkazovaného serveru:

PolyBase Linked Servers
Objekt s vymezeným oborem databáze Objekt s vymezeným oborem instance
Používá ovladače ODBC. Používá zprostředkovatele OLEDB.
Podporuje operace jen pro čtení pro všechny zdroje dat a zápis do některých externích zdrojů dat. Podporuje operace čtení i zápisu.
Dotazy na vzdálený zdroj dat z jednoho připojení je možné škálovat na více instancí. Dotazy na vzdálený zdroj dat z jednoho připojení nelze škálovat na více instancí.
Podporuje se nabízení predikátů. Podporuje se nabízení predikátů.
Pro skupinu dostupnosti není potřeba žádná samostatná konfigurace. Samostatná konfigurace potřebná pro každou instanci ve skupině dostupnosti
Pouze základní ověřování Základní a integrované ověřování
Vhodné pro analytické dotazy zpracovávající velký počet řádků Vhodné pro dotazy OLTP vracející jeden nebo několik řádků
Dotazy používající externí tabulku se nemůžou účastnit distribuovaných transakcí Distribuované dotazy se mohou účastnit distribuovaných transakcí.

Co je nového v PolyBase v SQL Serveru 2022?

SQL Server 2022 (16.x) teď podporuje soubory CSV, Parquet a Delta uložené v účtu služby Azure Storage verze 2, Azure Data Lake Storage Gen2 nebo libovolné úložiště objektů kompatibilní s S3 pomocí rozhraní REST API S3, místního prostředí nebo cloudu.

SQL Server 2022 (16.x) teď může používat funkci CREATE EXTERNAL TABLE as SELECT (CETAS) společně s příkazy, jako jsou OPENROWSET, CREATE EXTERNAL TABLE (CET) a všechna nová vylepšení T-SQL.

V současné době byla v SQL Serveru 2022 (16.x) odebrána podpora externích zdrojů dat Hadoop.

Kumulativní aktualizace SQL Serveru 2022 (16.x) 2 nyní zavádí podporu pro soubory Oracle TNS. Další informace a ukázky najdete v tématu VYTVOŘENÍ EXTERNÍHO ZDROJE DAT.

Přečtěte si další informace o virtualizaci dat pomocí PolyBase pro SQL Server 2022 a projděte si vylepšení SQL Serveru 2022 PolyBase.

Co je nového v PolyBase v SQL Serveru 2019?

PolyBase v SQL Serveru 2019 (15.x) teď může číst data z větší řady zdrojů dat. Data z těchto externích zdrojů dat se dají uložit jako externí tabulky na SQL Serveru. PolyBase také podporuje výpočet odsdílení změn do těchto externích zdrojů dat s výjimkou obecných typů ODBC.

Kompatibilní zdroje dat

  • SQL Server
  • Oracle
  • Teradata
  • MongoDB
  • Kompatibilní obecné typy ODBC

Kumulativní aktualizace SQL Serveru 2019 (15.x) 19 nyní zavádí podporu pro soubory Oracle TNS. Další informace a ukázky najdete v tématu VYTVOŘENÍ EXTERNÍHO ZDROJE DAT.

Note

PolyBase může povolit připojení k externím zdrojům dat pomocí ovladačů ODBC třetích stran. Tyto ovladače nejsou k dispozici společně s PolyBase a nemusí fungovat podle očekávání. Další informace naleznete v tématu Konfigurace PolyBase pro přístup k externím datům pomocí obecných typů ODBC.

Jaké CONNECTION_OPTIONS můžu zadat pro připojení ke zdrojům dat třetích stran?

Informace o podporovaných možnostech připojení poskytovatele dat pro SQL Server, Oracle, Teradata, Rozhraní MongoDB API pro Cosmos DB a obecné zprostředkovatele dat ODBC najdete v tématu CREATE EXTERNAL DATA SOURCE (Transact-SQL) CONNECTION_OPTIONS.

Jak můžu zobrazit plán vzdáleného spouštění dotazů výpočtu PolyBase pushdownu?

To je možné prostřednictvím několika metod v závislosti na verzi SQL Serveru. Viz Řešení potíží s PolyBase – zobrazení plánu dotazů PolyBase.

Jak zjistím, jestli dochází k výpočtu posunu funkce PolyBase?

Podporuje se PolyBase ve službě Azure SQL Database?

Ne, ale můžete dotazovat data v souborech umístěných ve službě Azure Blob Storage pomocí funkce OPENROWSET nebo pomocí příkazu CREATE EXTERNAL TABLE číst z bezserverového fondu SQL ve službě Synapse Analytics. Další informace najdete v tématu Azure SQL, který může číst soubory azure Data Lake Storage pomocí externích tabulek Synapse SQL.

Podporuje se PolyBase ve službě Azure SQL Managed Instance?

Azure SQL Managed Instance má své vlastní možnosti virtualizace dat pro Azure Data Lake Storage (ADLS) a Azure Blob Storage jako zdroje dat. Další informace najdete v tématu Virtualizace dat se službou Azure SQL Managed Instance.

Které porty mám povolit přes bránu firewall pro PolyBase?

Pro samotný PolyBase nejsou potřeba žádné další porty, s výjimkou skupiny horizontálního navýšení kapacity PolyBase. Bez skupiny horizontálního navýšení kapacity by samotná služba PolyBase neměla vyžadovat žádné pravidlo brány firewall.

Na serverech s Windows bude PolyBase využívat porty používané SQL Serverem v části IPAll nastavení protokolu TCP/IP v nástroji SQL Server Configuration Manager. Další informace naleznete v tématu Vlastnosti protokolu TCP/IP. Na serverech s Linuxem bude PolyBase využívat nastavení network.tcpport . Další informace naleznete v tématu Port TCP.

Informace o portech v další otázce najdete v případě skupin s horizontálním navýšením kapacity PolyBase na více serverů s Windows.

Musíte ale povolit komunikaci s různými externími zdroji dat používanými PolyBase jinými porty. Projděte si dokumentaci ke konfiguraci ODBC, konfiguraci prostředků Azure nebo konkrétní dokumentaci ke zdroji dat. For example:

Source platform Reference
Microsoft SQL Server Porty používané SQL Serverem
Hortonworks HDP Administering HDFS
Cloudera CDH Porty používané komponentami CDH

Jaké porty se používají pro skupinu s horizontálním navýšením kapacity PolyBase?

Ve výchozím nastavení se služba přesunu dat PolyBase připojuje k hlavnímu uzlu skupiny horizontálního navýšení kapacity přes rozsah portů od TCP 16450-16460, obvykle pomocí 16450-16453 a portu 17001. Tyto porty se používají jenom v případě, že je nakonfigurovaná skupina s horizontálním navýšením kapacity PolyBase a měla by být povolena prostřednictvím bran firewall serveru. Instalační program SQL Serveru by měl automaticky vytvořit místní pravidlo brány firewall, které těmto portům umožní při instalaci funkce. Další informace naleznete v tématu Konfigurace skupin s horizontálním navýšením kapacity PolyBase ve Windows.

Note

Skupiny s horizontálním navýšením kapacity pro Microsoft SQL Server PolyBase budou vyřazeny. Funkce skupiny se škálováním na více systémů se odeberou z produktu v SQL Serveru 2022 (16.x).

PolyBase v clusterech s velkými objemy dat vs. PolyBase v samostatných instancích

Další informace o připojeních pomocí obecného konektoru ODBC najdete v průvodci konfigurací obecných typů ODBC.

Následující tabulka obsahuje funkce PolyBase dostupné v samostatné instalaci SQL Serveru 2019 (15.x) a clusteru s velkými objemy dat SQL Serveru 2019 (15.x):

Feature Cluster s velkými objemy dat Samostatná instance
Vytvoření externího zdroje dat pro SQL Server, Oracle, Teradata a Mongo DB X X
Vytvoření externího zdroje dat pomocí kompatibilního ovladače ODBC jiného výrobce X
Vytvoření externího zdroje dat pro zdroj dat HADOOP X X
Vytvoření externího zdroje dat pro Azure Blob Storage X X
Vytvoření externí tabulky ve fondu dat SQL Serveru X
Vytvoření externí tabulky ve fondu úložiště SQL Serveru X
Horizontální navýšení kapacity provádění dotazů X X (jenom Windows)

Important

Clustery Microsoft SQL Serveru 2019 pro velké objemy dat jsou vyřazené. Podrobnosti najdete v oznamovacím blogovém příspěvku a možnostech velkých dat na platformě Microsoft SQL Server.