Brug SQL Server 2022 som en datahub med forespørgselsfiler og sikkerhedskopiering/gendannelse til objektlagerudbydere
- 10 minutter
SQL Server 2022 indeholder funktioner til datavirtualisering for at få adgang til data, der er gemt i parquet- og deltatabeller over kilder som Azure Blob Storage, Azure Data Lake Storage og S3-kompatible objektlagerudbydere. Derudover forbedrer SQL Server 2022 fjernsikkerheds- og gendannelsesfunktionerne ved at understøtte S3-kompatible objektlagerudbydere.
Datavirtualisering i SQL Server
Polybase, der blev introduceret med SQL Server 2016, understøtter adgang til data uden for SQL Server ved hjælp af T-SQL-sætninger (Transact-SQL), f.eks. OPENROWSET- og CREATE EXTERNAL TABLE. Dette koncept kaldes datavirtualisering, da brugerne kan få adgang til data uden for SQL Server uden at flytte dataene til SQL Server. SQL Server 2019 tilføjede understøttelse af datavirtualisering ved hjælp af ODBC-drivere (Open Database Connectivity). Denne dataadgang bruger software kaldet Polybase-tjenester. SQL Server 2022 tilføjer understøttelse i databaseprogrammet ved hjælp af REST API-grænseflader til at få adgang til data i Azure Blob Storage, Azure Data Lake Storage og S3-kompatible objektlagerudbydere.
Følgende figur viser det fulde omfang af understøttelse af datavirtualisering i SQL Server 2022.
Datavirtualisering med REST API-connectors
SQL Server 2022-datavirtualisering omfatter nu adgang til nye datakildeconnectors ved hjælp af REST API-grænseflader, der er indbygget i SQL Server-programmet. Disse nye datakildeconnectors bruges ofte til at understøtte et stort sæt filer til at bygge en data lake. SQL Server kan nu bruges som en datahub til at forespørge filer i en data lake uden at flytte dataene.
REST API-connectors
Følgende nye connectors understøttes ved hjælp af REST API:
Azure Blob Storage
Ved hjælp af datakildeconnectoren
abs
kan du få adgang til filer, der er gemt i Azure Blob Storage-objektbeholdere. Azure Blob Storage er skalerbar, yderst tilgængelig, redundant og omkostningseffektiv med niveauinddelt lager, sikret og optimeret til datasøer. Du kan få flere oplysninger under datavirtualisering med Azure Blob Storage.Azure Data Lake Storage
Ved hjælp af datakildeconnectoren
adls
kan du få adgang til filer, der er gemt i Azure Data Lake Storage (ADLS). ADLS er bygget oven på Azure Blob Storage og leverer filsystemsemantik, sikkerhed på filniveau og skalering. Alle disse funktioner er bygget oven på Azure Blob Storage, hvilket giver lave omkostninger, niveauinddelt adgang, høj sikkerhed, høj tilgængelighed og holdbarhed. Du kan få flere oplysninger under datavirtualisering med Azure Data Lake Storage.S3-kompatible objektlagerudbydere
Ved hjælp af datakildeconnectoren s3 kan du få adgang til filer, der er gemt i et S3-kompatibelt objektlager. S3 er nu en populær objektlagerprotokol, der understøttes af mange udbydere, både i cloudmiljøer og i det lokale miljø. S3-objektlager tilbyder skalering, lavere omkostninger, geodistribution og en pålidelig datatransport. Du kan få flere oplysninger under datavirtualisering med S3-kompatible objektlagerudbydere.
Brug af T-SQL til datavirtualisering
T-SQL indeholder følgende sætninger til understøttelse af datavirtualisering med REST API-connectors:
OPENROWSET-
T-SQL-sætningen OPENROWSET- giver dig adgang til alle ad hoc-API-dataconnectorer, hvor du kan angive oplysninger om, hvordan du opretter forbindelse til den specifikke datakilde, fil eller mappeoplysninger.
OPRET EKSTERN TABEL
Du kan bruge T-SQL-sætningen CREATE EXTERNAL TABLE til at oprette en virtuel tabel, der er en tilknytning til filer i en HVILKEN som helst REST API-dataconnector. Du kan derefter få adgang til den eksterne tabel på samme måde som en SQL Server-tabel, bortset fra at dataene er gemt i fjerndatakilden. Metadataene for den eksterne tabel gemmes i SQL Server-systemtabeller.
OPRET EKSTERN TABEL, NÅR DU VÆLGER
En ny funktion i SQL Server 2022 er at oprette en ekstern tabel baseret på en forespørgsel fra en eksisterende SQL Server-tabel (eller en anden ekstern tabel), der også kaldes OPRET EKSTERN TABEL SOM SELECT. Resultatet af forespørgslen er en ny ekstern tabel og filer, der oprettes til fjerndatakilden baseret på resultaterne af SELECT-sætningen. Du kan bruge denne metode til at eksportere SQL Server-data til filer i en fjerndatakilde.
Understøttelse af nyt oprindeligt filformat
MED SQL Server kan du oprette et filformat for at definere strukturen af en fil i en ekstern datakilde. Du kan f.eks. bruge filformater til at definere strukturen af en JSON-fil, da JSON ikke er et filformat, der understøttes oprindeligt. SQL Server 2022 genkender nu oprindelige filformater parquet- og deltatabeller.
Parquet-
Parquet er et binært filformat med åben kildekode med det skema, der er indbygget i filen. Parquetfiler bruger et kolonnelagerformat, der gør dem effektive til komprimering og hentning. Du kan finde flere oplysninger og eksempler i Virtualize-parquet-fil i et S3-kompatibelt objektlager med PolyBase-.
Delta-tabeller
Delta Lake er en lagerarkitektur med åben kildekode ved hjælp af deltatabeller. Delta-tabeller er filer, der er baseret på parket, men tilbyder også grundlæggende understøttelse af transaktioner og logfiler. Du kan få flere oplysninger om, hvordan du bruger deltatabeller med Azure Data Lake Storage, under Virtualize-deltatabel med PolyBase-.
Sikkerhedskopiér og gendan med S3-kompatible objektlagerudbydere
SQL Server 2022 udvider BACKUP til URL- og RESTORE FROM URL T-SQL-sætninger til at understøtte S3-kompatible objektlagerudbydere. De fleste indstillinger for sikkerhedskopiering og gendannelse er tilgængelige ved hjælp af denne nye funktion. Du kan få flere oplysninger under SQL Server-sikkerhedskopi til URL-adressen til S3-kompatibelt objektlager.
Du kan se en liste over almindelige S3-kompatible objektlagerprovidere under Providere af S3-kompatible objektlager.