Introduktion til PolyBase
PolyBase er den funktion, som SQL Server bruger til at aktivere datavirtualiseringskonceptet. PolyBase blev oprindeligt udgivet i SQL Server 2016 og er forbedret i hver senere version af SQL Server. Det generelle begreb om fjernadgang til data uden at skulle kopiere datadatoerne fra SQL Server 7.0 med introduktionen af Linked Server.
I følgende tabel vises den første SQL Server-version, der understøtter forskellige PolyBase-funktioner.
| SQL Server 2016 | SQL Server 2017 | SQL Server 2019 | SQL Server 2025 |
|---|---|---|---|
| • Hadoop • Azure Blob Storage |
• FORBEDRINGER AF OPENROWSET • CSV til Azure Blob Storage • Legitimationsoplysninger, der er begrænset til databasen |
• SQL Server •Oracle • Azure Cosmos DB • MongoDB • Teradata • Understøttelse af Linux • Generisk ODBC |
• Ny connectorstruktur • Integration af objektlager • CSV •Parket •Delta • CETAS |
Du kan få flere oplysninger om PolyBase under PolyBase-funktioner og -begrænsninger.
PolyBase-forbedringer i SQL Server 2025
Oprindelig understøttelse af CSV, Parquet og Delta 1: PolyBase Query Service for External Data-installation er ikke længere påkrævet for at bruge OPENROWSET, CREATE EXTERNAL TABLE eller CREATE EXTERNAL TABLE AS SELECT med følgende typer eksterne data: Parquet, Delta, Azure Blob Storage (ABS), Azure Data Lake Storage (ADLS) eller S3-Compatible Object Storage.
Brug generiske ODBC-datakilder på Linux: Du kan finde flere oplysninger under Konfigurer PolyBase til at få adgang til eksterne data med generiske ODBC-typer.
Understøttelse af TDS 8.0: Når du bruger Microsoft ODBC-driver 18 til SQL Server, understøttes TDS 8.0 ikke for SQL Server som en ekstern datakilde.
S3-kompatibelt objektlager
SQL Server 2025 understøtter S3-kompatibelt objektlager. For at aktivere denne integration bruger SQL Server 2025 en REST API-connectorstrukturarkitektur, der følger S3-strukturen. Ethvert objektlager, der understøtter S3-strukturen, fungerer også med SQL Server 2025. S3-kompatible objektlagringsløsninger kan køre lokalt, i dit netværk, i cloudmiljøet eller i et hybridmiljø.
Objektlager, også kendt som objektbaseret lager, er en strategi, der administrerer og manipulerer datalager som særskilte enheder, kaldet objekter. Disse objekter opbevares i et enkelt lagerhus og er ikke indbygget i filer i andre mapper. Objektlageret kombinerer i stedet de datastykker, der udgør en fil, føjer alle relevante metadata til filen og vedhæfter et brugerdefineret id.
Nogle af de vigtigste funktioner i objektlageret sammenlignet med et traditionelt filsystem er:
- Holder metadata integreret i filen.
- Gør det muligt for filer at have attributter som tags.
- Mere omkostningseffektiv at skalere og nemmere at vedligeholde.
- Optimeret til store mængder data, f.eks. Big Data, Internet of Things (IoT), AI, Machine Learning og analyse.
- Anbefales ikke til arbejdsbelastninger med høj transaktion eller onlinetransaktionsbehandling (OLTP).
Du kan også bruge S3-kompatibelt objektlager til sikkerhedskopierings- og gendannelsesscenarier ved hjælp af kommandoen SIKKERHEDSKOPIÉR TIL URL-adresse. Du kan få flere oplysninger under SQL Server-sikkerhedskopiering og -gendannelse med S3-kompatibelt objektlager.
S3-standardrammen er bredt adopteret, og mange store lagringsudbydere tilbyder nu S3-kompatible objektlagringsløsninger. Hvis en løsning tilbyder kompatibilitet med S3 REST API'er, er den kompatibel med SQL Server 2025. For en liste over understøttede objektlagringsudbydere, se Providers of S3-kompatibel objektlagring.
Nogle objektlagerpartnere tilbyder muligheden for at køre deres løsning som software, der kan virtualisere dit aktuelle lager. Du kan installere og prøve disse løsninger på din egen maskine eller virtuelle maskine (VM).
PolyBase-tjenester i forhold til PolyBase REST API-funktionen
Hvis du vil bruge PolyBase, skal du installere PolyBase-forespørgselstjenesten til eksterne data og aktivere PolyBase på forekomstniveau ved hjælp af sp_configure. Konfiguration af PolyBase installerer to PolyBase-tjenester, SQL Server PolyBase Engine- og SQL Server PolyBase Data Movement.
SQL Server PolyBase-program
- Eksekverbar tjeneste:
mpdwsvc.exe -dweng - Fortolker forespørgsler.
- Genererer forespørgselsplaner.
- Distribuerer arbejde til beregningsnoder (SQL Server 2019).
- Behandler beregningsnodens resultater og resultater tilbage til klienten (SQL Server 2019).
- Eksekverbar tjeneste:
af SQL Server PolyBase-dataflytning
- Eksekverbar tjeneste:
mpdwsvc.exe -dms - Overfører data mellem eksterne datakilder og mellem PolyBase-hoved- og beregningsnoder (SQL Server 2019).
- Indsætter data i andre datakilder, f.eks. Azure Storage.
- Eksekverbar tjeneste:
Datakilder som SQL Server, Oracle, MongoDB eller ODBC-baserede kilder bruger disse PolyBase-tjenester. Datakilder, der bruger den SQL Server 2025 REST API-baserede PolyBase-arkitektur, kræver ikke, at disse tjenester kører eller konfigureres, men PolyBase-forespørgselstjenesten til eksterne data skal stadig være installeret og aktiveret.
Du kan bruge PolyBase REST API'er til at få adgang til Azure Data Lake Storage, Azure Blob Storage, et hvilket som helst S3-kompatibelt objektlager og filformater, f.eks. Parquet-, Delta- og CSV-filer. Tidligere understøttede datakilder bruger stadig SQL Server PolyBase Engine- og SQL Server PolyBase Data Movement tjenester.
| Datakilde | PolyBase-tjenester | PolyBase REST API-funktion |
|---|---|---|
| Azure Blob Storage |
|
|
| Azure Data Lake Storage |
|
|
| S3-kompatibelt objektlager |
|
|
| SQL Server |
|
|
| Oracle |
|
|
| Teradata |
|
|
| MongoDB eller Azure Cosmos DB API til MongoDB |
|
|
| Odbc (Generic Open Database Connectivity) |
|
|
| Massehandlinger |
|
|