PolyBase-referenties en -gegevensbronnen

Voltooid

Nu u de principes van gegevensvirtualisatie en PolyBase begrijpt, is het belangrijk om de beveiliging en connectiviteit te begrijpen. In deze les worden de objecten en operators beschreven die worden gebruikt met PolyBase.

Hoewel de PolyBase-functie is ingeschakeld op sql Server-exemplaarniveau, werken PolyBase-objecten en -operators zoals OPENROWSET, CET en CETAS op databaseniveau. Elke gegevensbron, externe bestandsindeling en externe referenties zijn gekoppeld aan een bepaalde database.

In het volgende diagram ziet u de databaserelatie met PolyBase-objecten.

Diagram van PolyBase-objecten in SQL Server.

  • Hoofdsleutel: De databasehoofdsleutel (DMK) is een symmetrische sleutel die wordt gebruikt voor het beveiligen van de persoonlijke sleutels van certificaten en asymmetrische sleutels die aanwezig zijn in de database. De DMK is een beveiligingsmechanisme voor het veilig opslaan van alle externe referenties en gegevensbrongegevens. Zie CREATE MASTER KEY (Transact-SQL)voor meer informatie.

  • Referentie voor databasebereik: Met de opdracht CREATE DATABASE SCOPED CREDENTIAL maakt u een referentie die de referentiegegevens bevat die worden gebruikt door de externe gegevensbron. Zie CREATE DATABASE SCOPED CREDENTIAL (Transact-SQL) voor meer informatie.

  • Externe gegevensbron: Met de opdracht CREATE EXTERNAL DATA SOURCE maakt u een gegevensbron met de vereiste informatie voor toegang tot een externe gegevensbron. De externe gegevensbron kan een andere databaseserver of een opslaglocatie zijn, zoals Azure Blob Storage, Azure Data Lake Storage of S3-compatibele objectopslag. Zie CREATE EXTERNAL DATA SOURCE (Transact-SQL)voor meer informatie.

  • Externe tabel: Met de opdracht CREATE EXTERNAL TABLE maakt u een virtuele tabel die verwijst naar de externe gegevensbron die een bestand of een andere databasetabel is. Wanneer deze tabel wordt gebruikt, haalt SQL Server de gegevens op uit de bron. Met deze opdracht krijgen gebruikers en toepassingen dezelfde mate van flexibiliteit als het werken met een gewone tabel zonder de complexiteit van het beheren van de oorspronkelijke gegevens. Zie CREATE EXTERNAL TABLE (Transact-SQL) voor meer informatie.

  • Externe bestandsindeling: Met de opdracht CREATE EXTERNAL FILE FORMAT wordt gedefinieerd hoe SQL Server werkt met een bepaald bestandstype. Externe bestandsindeling bepaalt het type bestand, veldeindteken, scheidingsteken, compressie en codering. Zie CREATE EXTERNAL FILE FORMAT (Transact-SQL)voor meer informatie.

Ondersteunde PolyBase-gegevensbronnen

Het locatievoorvoegsel van de connector informeert SQL Server over het type eindpunt waarmee u verbinding wilt maken. Als u bijvoorbeeld verbinding wilt maken met een Azure Blob Storage-account, gebruikt absu , maar om verbinding te maken met een Oracle-server, gebruikt oracleu .

Externe gegevensbron Connector-locatievoorvoegsel Locatiepad Authentication
Azure Blob Storage (opslagdienst van Azure) abs abs://<storage_account_name>.blob.core.windows.net/<container_name> Gedeelde toegangshandtekening (SAS)
Azure Data Lake Storage adls adls://<storage_account_name>.dfs.core.windows.net/<container_name> SAS
SQL Server sqlserver <server_name>[\<instance_name>][:port] Alleen SQL-verificatie
Oracle oracle <server_name>[:port] Alleen basisverificatie
Teradata teradata <server_name>[:port] Alleen basisverificatie
MongoDB of Azure Cosmos DB-API voor MongoDB mongodb <server_name>[:port] Alleen basisverificatie
Generieke ODBC (Open Database Connectivity) odbc <server_name>[:port] Alleen basisverificatie
Bulkbewerkingen https <storage_account>.blob.core.windows.net/<container> SAS
S3-compatibele objectopslag s3 s3://<server_name>:<port>/

Sommige voorvoegsels zijn om compatibiliteitsredenen gewijzigd ten opzichte van de vorige versie van SQL Server. Zie CREATE EXTERNAL DATA SOURCE voor een volledige lijst met gegevensbronnen en bijbehorende voorvoegsels.

Ondersteunde bestandsindelingen voor PolyBase

SQL Server 2025 ondersteunt de volgende bestandsindelingen:

  • CSV
  • Parquet
  • Begrensde tekst
  • Delta (alleen-lezen). SQL Server kan Delta-bestanden lezen, maar kan geen tabelresultaat exporteren als Delta.

OPENROWSET, CET en CETAS

PolyBase gebruikt drie operators om gegevens op te vragen of te virtualiseren. In deze trainingsmodule worden deze opdrachten en de bijbehorende use cases behandeld.

  • OPENROWSET is een lichtgewicht opdracht waarmee de SQL-engine toegang heeft tot gegevens buiten SQL Server, een bestand of een andere database. OPENROWSET is geoptimaliseerd voor ad-hocuitvoering en wordt aanbevolen voor het laden van gegevens of gegevensverkenning. Zie OPENROWSET (Transact-SQL) voor meer informatie.

  • MET CREATE EXTERNAL TABLE (CET) wordt een tabel gemaakt waarin de gegevens zich op de oorspronkelijke locatie buiten SQL Server bevinden. Wanneer de tabel is geselecteerd, levert de SQL-engine de aangevraagde gegevens aan de gebruiker. De externe tabel profiteert van herbruikbaarheid en kan statistieken gebruiken voor betere prestaties. Zie CREATE EXTERNAL TABLE (Transact-SQL) voor meer informatie.

  • CREATE EXTERNAL TABLE AS SELECT (CETAS) voert een combinatie van bewerkingen uit in één opdracht. CeTAS stelt SQL Server in staat om bepaalde gegevens die zijn opgeslagen binnen of buiten de database, te transformeren en te converteren. CETAS exporteert de gegevens vervolgens naar een andere locatie, ofwel een netwerklocatie of Azure. Ten slotte maakt CETAS een externe tabel die gericht is op de zojuist geëxporteerde gegevens. Zie CREATE EXTERNAL TABLE AS SELECT (Transact-SQL) voor meer informatie.