Hinweis
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, sich anzumelden oder das Verzeichnis zu wechseln.
Für den Zugriff auf diese Seite ist eine Autorisierung erforderlich. Sie können versuchen, das Verzeichnis zu wechseln.
Gilt für:SQL Server
Azure Synapse Analytics
Analytics Platform System (PDW)
PolyBase ermöglicht die Datenvirtualisierung für SQL Server.
Was ist PolyBase?
PolyBase ermöglicht Es Ihrer SQL Server-Instanz, Daten mit Transact-SQL (T-SQL) direkt aus SQL Server, Oracle, Teradata, MongoDB, Hadoop-Clustern, Cosmos DB und S3-kompatiblem Objektspeicher abzufragen, ohne die Clientverbindungssoftware separat zu installieren. Sie können auch den generischen ODBC-Connector verwenden, um eine Verbindung mit weiteren Anbietern über ODBC-Treiber von Drittanbietern herzustellen. PolyBase ermöglicht T-SQL-Abfragen, Daten aus externen Quellen mit relationalen Tabellen in einer Instanz von SQL Server zu verknüpfen.
PolyBase unterstützt auch das Abfragen von halbstrukturierten und strukturierten dateibasierten Datenformaten wie CSV-, Parkett-, JSON- und Delta Lake-Dateien. Dies ermöglicht eine nahtlose Integration dateibasierter Daten in Ihre T-SQL-Workflows.
Ein wichtiger Anwendungsfall für die Datenvirtualisierung mit PolyBase besteht darin, dass die Daten an Ihrem ursprünglichen Speicherort und im Quellformat verbleiben. Diese externen Daten können über die SQL Server-Instanz virtualisiert werden, sodass sie wie in jeder anderen Tabelle in SQL Server abgefragt werden können. Dadurch werden weniger ETL-Vorgänge für Datenverschiebungen benötigt. Dieses Datenvirtualisierungsszenario ist mithilfe von PolyBase-Connectors möglich.
Unterstützte SQL-Produkte und -Dienste
PolyBase bietet dieselben Funktionen für die folgenden SQL-Produkte von Microsoft:
SQL Server 2016 (13.x) und höhere Versionen (Windows)
SQL Server 2019 (15.x) und höhere Versionen (Windows und Linux)
Azure SQL Managed Instance, ausführliche Informationen zur Datenvirtualisierung mit verwalteter Azure SQL-Instanz
Für die Details siehe Datenvirtualisierung mit Azure SQL Database (Vorschau)
SQL Server, Analytics-Plattformsystem (PDW)
Azure Synapse Analytics (für dedizierte SQL-Pools)
- Die Datenvirtualisierung in Azure Synapse Analytics ist in zwei Modi verfügbar: PolyBase und nativ. Weitere Informationen finden Sie unter Verwenden externer Tabellen mit Synapse SQL.
SQL Server 2025 PolyBase-Verbesserungen
| Neu bei SQL Server 2025 (17.x) | Einzelheiten |
|---|---|
| Native Unterstützung für CSV, Parquet und Delta 1 | Die Installation des PolyBase Query Service für externe Daten ist nicht mehr erforderlich, um OPENROWSET, CREATE EXTERNAL TABLE oder CREATE EXTERNAL TABLE AS SELECT mit den folgenden Arten externer Daten zu verwenden: Parquet, Delta, Azure Blob Storage (ABS), Azure Data Lake Storage (ADLS) oder S3-Compatible Objektspeicher. |
| Verwenden generischer ODBC-Datenquellen unter Linux | Weitere Informationen finden Sie unter PolyBase konfigurieren, um auf externe Daten mit generischen ODBC-Typen zuzugreifen. |
| TDS 8.0-Unterstützung | PolyBase verwendet eine von Haus aus sichere Konfiguration mit dem ODBC-Treiber für SQL Server, Version 18 und Encrypt=Yes (verpflichtend). Im Gegensatz zu anderen SQL Server-Features ermöglicht PolyBase TrustServerCertificate=True Szenarien mit selbstsignierten Zertifikaten. Um TLS 1.3 und strenge Verschlüsselung mit TDS 8.0 zu erzwingen, legen Sie Encrypt=Strict und TrustServerCertificate=No fest. Weitere Informationen finden Sie unter CREATE EXTERNAL DATA SOURCE – CONNECTION_OPTIONS. Überprüfen Sie die Breaking-Änderungen bei den Datenbank-Engine-Funktionen in SQL Server 2025. |
| Verwaltete Identität | Verwaltete Identität ist für SQL Server verfügbar, wenn es durch Azure Arc und SQL Server 2025 auf Azure-VMs aktiviert wird. |
1 Auf SQL Server 2025 (17.x) ist polyBase Query Service für externe Daten weiterhin erforderlich, um eine Verbindung mit anderen Datenbanken herzustellen. Beispiel: SQL Server, Oracle, DB2, Teradata, MongoDB oder ODBC.
SQL Server 2022 PolyBase-Verbesserungen
| Neu in SQL Server 2022 (16.x) | Einzelheiten |
|---|---|
| S3-kompatibler Objektspeicher | SQL Server 2022 (16.x) fügt einen neuen Connector, einen S3-kompatiblen Objektspeicher, mit der S3-REST-API hinzu. Sie können sowohl OPENROWSET als auch CREATE EXTERNAL TABLE verwenden, um Datendateien im S3-kompatiblen Objektspeicher abzufragen. |
| Einige Connectors sind von den PolyBase-Diensten getrennt | Der S3-kompatible Objektspeicherconnector, ADSL Gen2 und Azure Blob Storage sind nicht mehr von PolyBase-Diensten abhängig. PolyBase-Dienste müssen weiterhin ausgeführt werden, um die Konnektivität mit Oracle, Teradata, MongoDB und generischem ODBC zu unterstützen. Das PolyBase-Feature muss weiterhin auf Ihrer SQL Server-Instanz installiert werden. |
| Parquet-Dateiformat | PolyBase kann jetzt auch Daten aus Parquet-Dateien abfragen, die sich in einem S3-kompatiblen Objektspeicher befinden. Weitere Informationen finden Sie unter Virtualisierung von Parquet-Dateien in einem S3-kompatiblen Objektspeicher mit PolyBase. |
| Format der Deltatabelle | PolyBase ist jetzt in der Lage, Daten aus dem Delta-Tabellenformat, die auf S3-kompatiblem Objektspeicher, Azure Storage Account V2 und Azure Data Lake Storage Gen2 gespeichert sind, abfragt (schreibgeschützt). Weitere Informationen finden Sie unter Virtualisieren der Delta-Tabelle mit PolyBase |
| Externe Tabelle als Select erstellen (CETAS) | PolyBase kann jetzt CETAS verwenden, um eine externe Tabelle zu erstellen und dann parallel das Ergebnis einer Transact-SQL-Anweisung SELECT in Azure Data Lake Storage Gen2, Azure Storage Account V2 und S3-kompatible Objektspeicher zu exportieren. Weitere Informationen finden Sie unter CREATE EXTERNAL TABLE AS SELECT (CETAS). |
Weitere neue Features von SQL Server 2022 (16.x) finden Sie unter Neuigkeiten in SQL Server 2022.
Tipp
Ein Lernprogramm zu PolyBase-Features und -Funktionen in SQL Server 2022 (16.x) finden Sie unter Erste Schritte mit PolyBase in SQL Server 2022.
PolyBase-Connectors
PolyBase bietet Konnektivität mit den folgenden externen Datenquellen:
| Externe Datenquellen | SQL Server 2016-2019 mit PolyBase | SQL Server 2022 (16.x) mit PolyBase | APS PDW | Azure Synapse Analytics |
|---|---|---|---|---|
| Oracle, MongoDB, Teradata | Lesen | Lesen | Nein | Nein |
| Generisches ODBC | Lesen (nur Windows) | Lesen (nur Windows) | Nein | Nein |
| Azure Storage | Lesen/Schreiben | Lesen/Schreiben | Lesen/Schreiben | Lesen/Schreiben |
| Hadoop | Lesen/Schreiben | Nein | Lesen/Schreiben | Nein |
| SQL Server | Lesen | Lesen | Nein | Nein |
| S3-kompatibler Objektspeicher | Nein | Lesen/Schreiben | Nein | Nein |
- SQL Server 2022 (16.x) und höhere Versionen unterstützen Hadoop nicht.
- SQL Server 2016 (13.x) führte PolyBase mit Unterstützung für Verbindungen mit Hadoop und Azure Blob Storage ein.
- SQL Server 2019 (15.x) führte weitere Connectors ein, darunter SQL Server, Oracle, Teradata und MongoDB.
- SQL Server 2022 (16.x) hat den S3-kompatiblen Speicherconnector eingeführt.
- Das kumulative Update 19 für SQL Server 2019 (15.x) bietet Unterstützung für Oracle TNS.
- Das kumulative Update 2 für SQL Server 2022 (16.x) bietet Unterstützung für Oracle TNS.
Beispiele für externe Connectors:
1 PolyBase unterstützt zwei Hadoop-Anbieter, Hortonworks Data Platform (HDP) und Cloudera Distributed Hadoop (CDH), bis SQL Server 2019. Sql Server-Unterstützung für HDFS Cloudera (CDP) und Hortonworks (HDP) externe Datenquellen wurden eingestellt und sind nicht in SQL Server 2022 (16.x) und höheren Versionen enthalten. Weitere Informationen finden Sie unter Big Data-Optionen auf der Microsoft SQL Server-Plattform.
So verwenden Sie PolyBase in einer Instanz von SQL Server:
- PolyBase unter Windows installieren oder PolyBase unter Linux installieren.
- Ab SQL Server 2019 (15.x) aktivieren Sie PolyBase in sp_configure, falls erforderlich.
- Erstellen Sie eine externe Datenquelle.
- Erstellen Sie eine externe Tabelle.
Azure-Integration
Durch die zugrunde liegende Unterstützung von PolyBase können T-SQL-Abfragen außerdem Daten aus Azure Blob Storage importieren und exportieren. PolyBase ermöglicht Azure Synapse Analytics zudem das Importieren und Exportieren von Daten aus Azure Data Lake Store und aus Azure Blob Storage.
Gründe für die Verwendung von PolyBase
Mit PolyBase können Sie Daten aus einer SQL Server-Instanz mit externen Daten verknüpfen. Bevor PolyBase Daten mit externen Datenquellen verknüpfen konnte, können Sie eine der folgenden Aktionen ausführen:
- Übertragen der Hälfte Ihrer Daten, damit sich alle Daten an einem Speicherort befinden.
- Abfragen beider Datenquellen und Schreiben benutzerdefinierter Abfragelogik zum Verknüpfen und Integrieren der Daten auf Clientebene.
Mit PolyBase können Sie Transact-SQL verwenden, um die Daten zu verknüpfen.
PolyBase erfordert nicht, dass Sie zusätzliche Software in Ihrer Hadoop-Umgebung installieren. Sie fragen externe Daten anhand der gleichen T-SQL-Syntax ab, die auch zum Abfragen einer Datenbanktabelle verwendet wird. Alle von PolyBase implementierten Unterstützungsaktionen werden transparent durchgeführt. Der Abfrageautor benötigt keine Kenntnisse über die externe Quelle.
Verwendungszwecke von PolyBase
PolyBase ermöglicht die folgenden Szenarios in SQL Server:
- Nahtloser Datenzugriff: Fragen Sie andere RDBMs oder externe Dateien wie CSV-, Parkett- und Delta Lake-Tabellen mithilfe von T-SQL ab, als wären sie systemeigene Tabellen.
- Auslagerung von Kaltdaten: Während sie leicht zugänglich bleiben.
- Verbesserte Produktivität: Verringern Sie die Zeit und den Aufwand für die Integration und Analyse von Daten aus mehreren Quellen.
- Kosteneffizienz: Minimieren Sie den Bedarf an Datenreplikations- und Speicherkosten, die mit herkömmlichen Datenintegrationsmethoden verbunden sind.
- Echtzeiteinblicke: Ermöglichen Sie Echtzeitdatenabfragen und -erkenntnisse ohne Verzögerungen, die durch Datenverschiebung oder Synchronisierung verursacht werden.
- Sicherheit: Verwenden Sie SQL Server-Sicherheitsfeatures für granulare Berechtigungen, die Verwaltung von Anmeldeinformationen und die Kontrolle.
Leistung
Die Anzahl der Dateien oder die Datenmenge, die abgefragt werden kann, ist nicht beschränkt. Die Abfrageleistung hängt von der Datenmenge, dem Datenformat, der Organisation von Daten und der Komplexität von Abfragen und Verknüpfungen ab.
Weitere Informationen zu Leistungsanleitungen und Empfehlungen für PolyBase finden Sie unter Leistungsüberlegungen in PolyBase für SQL Server.
Upgrade auf SQL Server 2022
Ab SQL Server 2022 (16.x) werden Hortonworks Data Platform (HDP) und Cloudera Distributed Hadoop (CDH) nicht mehr unterstützt. Aufgrund dieser Änderungen müssen Sie externe PolyBase-Datenquellen, die in früheren Versionen von SQL Server erstellt wurden und TYPE = HADOOP oder Azure Storage verwenden, manuell löschen, bevor Sie zu SQL Server 2022 (16.x) oder höher migrieren. Das Ablegen externer Datenquellen erfordert auch das Ablegen der zugeordneten Datenbankobjekte, z. B. Anmeldeinformationen mit Datenbankbereich und externe Tabellen.
Azure Storage-Connectors müssen basierend auf der folgenden Referenztabelle geändert werden:
| Externe Datenquelle | Von | An |
|---|---|---|
| Azure Blob Storage (Speicherdienst von Azure für unstrukturierte Daten) | wasb[s] |
abs |
| ADLS Gen2 | abfs[s] |
adls |
Erste Schritte
Vor der Verwendung von PolyBase müssen Sie PolyBase unter Windows oder Linux installieren und ggf. PolyBase in sp_configure aktivieren.
Ein Lernprogramm zu PolyBase-Features und -Funktionen finden Sie unter Erste Schritte mit PolyBase in SQL Server 2022.
Weitere Lernprogramme zu verschiedenen externen Datenquellen finden Sie unter:
- Hadoop
- Azure Blob Storage
- SQL Server
- Orakel
- Teradata
- MongoDB
- GENERISCHE ODBC-Typen
- S3-kompatibler Objektspeicher
- CSV-Datei
- Parquet-Datei
- Delta-Tabelle
Datenvirtualisierung auf anderen Plattformen
Datenvirtualisierungsfeatures sind auch auf anderen Plattformen verfügbar:
- Verwenden externer Tabellen mit Synapse SQL.
- Datenvirtualisierung mit Azure SQL Managed Instance
- Datenvirtualisierung mit Azure SQL-Datenbank (Vorschau)
Zugehöriger Inhalt
- Erste Schritte mit PolyBase in SQL Server 2022
- OPENROWSET (Transact-SQL)
- CREATE EXTERNAL TABLE (Transact-SQL)
- CREATE EXTERNAL TABLE AS SELECT (CETAS) (Transact-SQL)
- Leistungsüberlegungen in PolyBase für SQL Server
- Häufig gestellte Fragen in PolyBase
- Überwachung und Problembehandlung für PolyBase
- PolyBase-Transact-SQL-Referenz