Sdílet prostřednictvím


Funkce a omezení PolyBase

Platí pro: SQL Server 2016 (13.x) a novější verze Azure SQL DatabaseAzure Synapse AnalyticsAnalytics Platform System (PDW)

Tento článek obsahuje souhrn funkcí PolyBase dostupných pro produkty a služby SQL Serveru.

Souhrn funkcí pro vydané verze produktů

Tato tabulka uvádí klíčové funkce pro PolyBase a produkty, ve kterých jsou k dispozici.

Funkce SQL Server (od roku 2016) Azure SQL databáze Azure Synapse Analytics paralelního datového skladu
Dotazování dat Hadoopu pomocí Transact-SQL Ano Ne Ne Ano
Import dat z Hadoopu Ano Ne Ne Ano
Export dat do Hadoopu Ano Ne Ne Ano
Dotazování, import z, export do Služby Azure HDInsight Ne Ne Ne Ne
Převod výpočtů dotazů do Hadoopu Ano Ne Ne Ano
Import dat ze služby Azure Blob Storage Ano Ano 1 Ano Ano
Export dat do služby Azure Blob Storage Ano Ne Ano Ano
Import dat z Azure Data Lake Store Ne Ne Ano Ne
Exportovat data do Azure Data Lake Store Ne Ne Ano Ne
Spouštění dotazů PolyBase z nástrojů Microsoft BI Ano Ne Ano Ano

1 zavedený v SQL Serveru 2017 (14.x), viz Příklady hromadného přístupu k datům ve službě Azure Blob Storage.

Známá omezení

PolyBase má následující omezení:

  • Před SQL Serverem 2019 (15.x) nesmí maximální možná velikost řádku, která zahrnuje celou délku sloupců s proměnlivou délkou, překročit 32 kB v SQL Serveru nebo 1 MB v Azure Synapse Analytics. V SQL Serveru 2019 (15.x) a novějších verzích se toto omezení zvedne. Limit zůstává pro zdroje dat Hadoop 1 MB, ale je omezen pouze maximálním limitem SQL Serveru pro jiné zdroje dat.

  • Při exportu dat do formátu souboru ORC z SQL Serveru nebo Azure Synapse Analytics může být textově náročné sloupce omezené. Z důvodu chybových zpráv o nedostatku paměti v Javě můžou být omezené na maximálně 50 sloupců. Pokud chcete tento problém obejít, exportujte pouze podmnožinu sloupců.

  • PolyBase se nemůže připojit k žádné instanci Hadoopu, pokud je povolená knox.

  • Pokud používáte tabulky Hive s transakčním = true, PolyBase nemá přístup k datům v adresáři tabulky Hive.

  • Služby PolyBase vyžadují, aby služba SQL Serveru měla povolený síťový protokol TCP/IP, aby fungoval správně. Kromě toho, pokud je nastavení konfigurace protokolu TCP/IP Naslouchat Všem nastaveno na Ne, jsou vyžadovány následující konfigurace protokolu TCP/IP:

    • Položka pro správný port naslouchání TCP v části IPAllbuď v dynamických portech TCP, nebo portech TCP. To je nutné kvůli způsobu, jakým služby PolyBase řeší port naslouchacího procesu modulu SQL Serveru.
    • Povolte požadované IP adresy v vlastnostech protokolu TCP/IP > IP adresy; jinak modul SQL Serveru nepřijme žádná připojení TCP/IP a služby PolyBase se stále nebudou moci připojit k modulu SQL Serveru.
  • PolyBase na SQL Serveru v Linuxu nefunguje, pokud je v jádru zakázaný protokol IPv6. Další informace najdete v tématu SQL Serveru v Linuxu: Známé problémy.

  • Služby PolyBase vyžadují, aby správně fungoval protokol sdílené paměti.

  • Pokud máte výchozí instanci SQL Serveru, která je nakonfigurovaná tak, aby naslouchala na jiném portu TCP než 1433, nemůžete ji použít jako hlavní uzel ve skupině s horizontálním navýšením kapacity PolyBase. Když spustíte sp_polybase_join_group, pokud jako název instance předáte MSSQLSERVER, SQL Server předpokládá, že port 1433 je port naslouchacího procesu, takže při spuštění se služba přesunu dat nemůže připojit k hlavnímu uzlu.

  • Synonyma Oracle nejsou podporována pro použití s PolyBase.

  • Kolace UTF-8 nejsou podporovány pro externí zdroje dat Hadoop.

  • Hadoop se už nepodporuje v SQL Serveru 2022 (16.x) a novějších verzích.

  • Délka názvu serveru je vázána omezením délky názvu rozhraní NetBIOS o délce 15 znaků. Pokud název serveru po vytvoření změníte na 16 znaků nebo déle, služba PolyBase Data Movement se nespustí.

  • Horizontálně rozšiřovatelné skupiny PolyBase nejsou podporovány ve skupinách dostupnosti Always On.

  • Databáze, které se instalují pomocí PolyBase (DWConfiguration, DWDiagnostics, DWQueue), musí být v režimu čtení i zápisu, aby polyBase fungovala a aby instalace kumulativní aktualizace uspěly. Proto není podporováno, aby tyto databáze byly ve skupině dostupnosti.