Freigeben über


Features und Einschränkungen von PolyBase

Gilt für: SQL Server 2016 (13.x) und höhere Versionen Azure SQL-Datenbank Azure Synapse Analytics Analytics Platform System (PDW)

In diesem Artikel werden die PolyBase-Features zusammengefasst, die für SQL Server-Produkte und -Dienste verfügbar sind.

Zusammenfassung der Features einzelner Produktreleases

In dieser Tabelle werden die wichtigsten Features für PolyBase sowie die Produkte aufgeführt, in denen diese verfügbar sind.

Feature SQL Server (ab SQL Server 2016) Azure SQL-Datenbank Azure Synapse Analytics Parallel Data Warehouse
Abfragen von Hadoop-Daten mit Transact-SQL Ja Nr. Nr. Ja
Daten aus Hadoop importieren Ja Nr. Nr. Ja
Daten für Hadoop exportieren Ja Nr. Nr. Ja
Abfragen von, Importieren aus und Exportieren in Microsoft Azure HDInsights Nr. Nr. Nr. Nr.
Abfrageberechnungen auf Hadoop verlagern Ja Nr. Nr. Ja
Daten aus Azure Blob Storage importieren Ja Ja1 Ja Ja
Daten aus Azure Blob Storage exportieren Ja Nr. Ja Ja
Daten aus Azure Data Lake Store importieren Nr. Nr. Ja Nr.
Daten für Azure Data Lake Store exportieren Nr. Nr. Ja Nr.
PolyBase-Abfragen über Microsoft BI-Tools ausführen Ja Nr. Ja Ja

1 Eingeführt in SQL Server 2017 (14.x). Weitere Informationen finden Sie unter Beispiele für Massenzugriff auf Daten in Azure Blob Storage.

Bekannte Einschränkungen

PolyBase weist folgende Einschränkungen auf:

  • Vor SQL Server 2019 (15.x), darf die maximale Zeilengröße, einschließlich der vollständigen Länge der Spalten mit variabler Länge, in SQL Server nicht mehr als 32 KB und in Azure Synapse Analytics nicht mehr als 1 MB betragen. In SQL Server 2019 (15.x) und späteren Versionen ist diese Einschränkung aufgehoben. Die Limit bleibt für Hadoop-Datenquellen bei 1 MB, jedoch wird dieses nur durch den maximalen Grenzwert von SQL Server für andere Datenquellen beschränkt.

  • Wenn Daten aus SQL Server oder Azure Synapse Analytics in ein ORC-Dateiformat exportiert werden, wird die Anzahl an Spalten mit viel Text möglicherweise eingeschränkt. Es dürfen aufgrund von Java-Fehlermeldungen zu nicht genügend Arbeitsspeicher ggf. nur 50 Spalten vorhanden sein. Exportieren Sie nur eine Teilmenge der Spalten, um dieses Problem zu umgehen.

  • PolyBase kann keine Verbindung mit einer Hadoop-Instanz herstellen, wenn Knox aktiviert ist.

  • Wenn Sie Hive-Tabellen mit „transactional = true“ verwenden, kann PolyBase nicht auf die Daten im Verzeichnis der Hive-Tabelle zugreifen.

  • PolyBase-Dienste erfordern es, dass das TCP/IP-Netzwerkprotokoll beim SQL Server-Dienst aktiviert ist, damit sie einwandfrei funktionieren. Wenn die Einstellung für die TCP/IP-Protokollkonfiguration "Alle überwachen" auf "Nein" festgelegt ist, sind außerdem die folgenden TCP/IP-Konfigurationen erforderlich:

    • Ein Eintrag für den richtigen Listenerport in TCP Dynamic Ports oder TCP Ports unter IPAll. Dies ist aufgrund der Art und Weise erforderlich, in der PolyBase-Dienste den Listenerport der SQL Server-Engine auflösen.
    • Aktivieren Sie die gewünschte IP-Adresse(en) in TCP/IP-Eigenschaften-IP-Adressen>. Andernfalls akzeptiert das SQL Server-Modul keine TCP/IP-Verbindungen, und PolyBase-Dienste können weiterhin keine Verbindung mit dem SQL Server-Modul herstellen.
  • PolyBase unter SQL Server für Linux funktioniert nicht, wenn IPv6 im Kernel deaktiviert ist. Weitere Informationen finden Sie unter SQL Server unter Linux: Bekannte Probleme..

  • Für PolyBase-Dienste muss das Shared Memory-Protokoll aktiviert sein, damit sie ordnungsgemäß funktionieren.

  • Wenn Sie eine standardmäßige SQL Server-Instanz haben, die so konfiguriert ist, dass sie an einem anderen TCP-Port als 1433 lauscht, können Sie sie in einer PolyBase-Erweiterungsgruppe nicht als Hauptknoten verwenden. Wenn Sie beim Ausführen von sp_polybase_join_group als Instanznamen MSSQLSERVER übergeben, geht SQL Server davon aus, dass Port 1433 der Listenerport ist, sodass sich der Datenverschiebungsdienst beim Start nicht mit dem Hauptknoten verbinden kann.

  • Oracle-Synonyme werden für die Verwendung mit PolyBase nicht unterstützt.

  • UTF-8-Sortierungen werden für externe Hadoop-Datenquellen nicht unterstützt.

  • Hadoop wird in SQL Server 2022 (16.x) und späteren Versionen nicht mehr unterstützt.

  • PolyBase-Erweiterungsgruppen werden mit Always On-Verfügbarkeitsgruppen nicht unterstützt.

  • Die Länge des Servernamens unterliegt der 15 Zeichen langen NetBIOS-Namensbeschränkung. Wenn Sie den Servernamen nach dem Erstellen auf 16 Zeichen oder länger ändern, wird der PolyBase Data Movement-Dienst nicht gestartet.