Introduktion till PolyBase
- 8 minuter
PolyBase är den funktion som SQL Server använder för att aktivera datavirtualiseringskonceptet. PolyBase släpptes ursprungligen i SQL Server 2016 och förbättras i varje senare version av SQL Server. Men det allmänna begreppet att komma åt data på distans utan att behöva kopiera datan dateras till SQL Server 7.0 med introduktionen av Linked Server.
I följande tabell visas den första SQL Server-versionen som stöder olika PolyBase-funktioner.
| SQL Server 2016 | SQL Server 2017 | SQL Server 2019 | SQL Server 2025 |
|---|---|---|---|
| • Hadoop • Azure Blob Storage |
• Förbättringar av OPENROWSET • CSV för Azure Blob Storage • Databasomfattande autentiseringsuppgifter |
• SQL Server •Orakel • Azure Cosmos DB • MongoDB • Teradata • Linux-stöd • Allmän ODBC |
• Nytt anslutningsramverk • Objektlagringsintegrering • CSV • Parkett •Delta • CETAS |
Mer information om PolyBase finns i PolyBase-funktioner och begränsningar.
PolyBase-förbättringar i SQL Server 2025
Internt stöd för CSV, Parquet och Delta 1: PolyBase Query Service for External Data-installation krävs inte längre för att använda OPENROWSET, CREATE EXTERNAL TABLE eller CREATE EXTERNAL TABLE AS SELECT med följande typer av externa data: Parquet, Delta, Azure Blob Storage (ABS), Azure Data Lake Storage (ADLS) eller S3-Compatible Object Storage.
Använd generiska ODBC-datakällor i Linux: Mer information finns i Konfigurera PolyBase för åtkomst till externa data med allmänna ODBC-typer.
TDS 8.0-stöd: När du använder Microsoft ODBC Driver 18 för SQL Server stöds inte TDS 8.0 för SQL Server som en extern datakälla.
S3-kompatibel objektlagring
SQL Server 2025 stöder S3-kompatibel objektlagring. För att aktivera den här integreringen använder SQL Server 2025 en REST API-anslutningsramverksarkitektur som följer S3-ramverket. Alla objektlagringar som stöder S3-ramverket fungerar också med SQL Server 2025. S3-kompatibla objektlagringslösningar kan köras lokalt, i nätverket, i molnet eller i en hybridmiljö.
Objektlagring, även kallat objektbaserad lagring, är en strategi som hanterar och manipulerar datalagring som distinkta enheter, så kallade objekt. Dessa objekt lagras i ett enda lager och är inte inrotade i filer i andra mappar. I stället kombinerar objektlagring de datadelar som utgör en fil, lägger till alla relevanta metadata i filen och bifogar en anpassad identifierare.
Några huvudfunktioner i objektlagring jämfört med ett traditionellt filsystem är:
- Behåller metadata inbäddade i filen.
- Låter filer ha attribut som taggar.
- Mer kostnadseffektivt att skala och enklare att underhålla.
- Optimerad för stora mängder data, till exempel Stordata, Sakernas Internet (IoT), AI, Machine Learning och analys.
- Rekommenderas inte för OLTP-arbetsbelastningar (high-transactional eller online transaction processing).
Du kan också använda S3-kompatibel objektlagring för säkerhetskopierings- och återställningsscenarier med hjälp av kommandot BACKUP TO URL. Mer information finns i Säkerhetskopiering och återställning av SQL Server med S3-kompatibel objektlagring.
Amazon Web Services (AWS) etablerade S3-standardramverket och stora lagringsleverantörer som Cloudian, Dell, MinIO och PureStorage erbjuder nu S3-kompatibla objektlagringslösningar. Om en lösning erbjuder kompatibilitet med S3 REST API:er är den kompatibel med SQL Server 2025.
Mer information om fördelar med objektlagring, installation och testning finns i följande dokumentation om lagringspartner. Fler objektlagringsproviders finns i Providers of S3-compatible object storage (Leverantörer av S3-kompatibel objektlagring).
- Cloudian HyperStore
- Dal Isildon OneFS
- Dal ECS Community Edition
- Hitachi Hitachi Content Platform (HCP)
- MinIO Lagring av flera molnobjekt
- Ren lagring Ren FlashBlade.
Vissa objektlagringspartner erbjuder möjligheten att köra sin lösning som programvara som kan virtualisera din aktuella lagring. Du kan installera och prova dessa lösningar på din egen dator eller virtuella dator (VM).
PolyBase-tjänster jämfört med PolyBase REST API-funktionen
Om du vill använda PolyBase måste du installera PolyBase Query Service för externa data och aktivera PolyBase på instansnivå med hjälp sp_configureav . PolyBase-installationen installerar två PolyBase-tjänster, SQL Server PolyBase Engine och SQL Server PolyBase Data Movement.
SQL Server PolyBase-motor
- Körbar tjänst:
mpdwsvc.exe -dweng - Parsar sökfrågor.
- Genererar frågeplaner.
- Distribuerar arbete till beräkningsnoder (SQL Server 2019).
- Bearbetar beräkningsnoders resultat och skickar dem tillbaka till klienten (SQL Server 2019).
- Körbar tjänst:
SQL Server PolyBase Dataförflyttning
- Körbar tjänst:
mpdwsvc.exe -dms - Överför data mellan externa datakällor och mellan PolyBase-huvud- och beräkningsnoder (SQL Server 2019).
- Infogar data i andra datakällor, till exempel Azure Storage.
- Körbar tjänst:
Datakällor som SQL Server, Oracle, MongoDB eller ODBC-baserade källor använder dessa PolyBase-tjänster. Datakällor som använder SQL Server 2025 REST API-baserad PolyBase-arkitektur kräver inte att dessa tjänster körs eller konfigureras, men PolyBase-frågetjänsten för externa data måste fortfarande vara installerad och aktiverad.
Du kan använda PolyBase REST-API:er för att komma åt Azure Data Lake Storage, Azure Blob Storage, alla S3-kompatibla objektlagring och filformat som Parquet-, Delta- och CSV-filer. Tidigare stödda datakällor använder fortfarande SQL Server PolyBase Engine och SQL Server PolyBase Data Movement-tjänster .
| Datakälla | PolyBase-tjänster | PolyBase REST API-funktion |
|---|---|---|
| Azure Blob Storage (lagringstjänst) |
|
|
| Azure Data Lake Storage |
|
|
| S3-kompatibel objektlagring |
|
|
| SQL Server |
|
|
| Orakel |
|
|
| Teradata |
|
|
| MongoDB eller Azure Cosmos DB API för MongoDB |
|
|
| Allmän öppen databasanslutning (ODBC) |
|
|
| Massåtgärder |
|
|