OneLake-genveje
Genveje i Microsoft OneLake giver dig mulighed for at samle dine data på tværs af domæner, cloudmiljøer og konti ved at oprette en enkelt virtuel data lake for hele virksomheden. Alle Fabric-oplevelser og analyseprogrammer kan oprette direkte forbindelse til dine eksisterende datakilder, f.eks. Azure, Amazon Web Services (AWS) og OneLake via et samlet navneområde. OneLake administrerer alle tilladelser og legitimationsoplysninger, så du ikke behøver at konfigurere hver Enkelt Fabric-arbejdsbelastning separat for at oprette forbindelse til hver datakilde. Derudover kan du bruge genveje til at fjerne kantkopier af data og reducere procesventetiden, der er knyttet til datakopier og midlertidig lagring.
Hvad er genveje?
Genveje er objekter i OneLake, der peger på andre lagerplaceringer. Placeringen kan være intern eller ekstern i forhold til OneLake. Den placering, som en genvej peger på, kaldes genvejens destinationssti. Den placering, hvor genvejen vises, kaldes genvejsstien. Genveje vises som mapper i OneLake, og alle arbejdsbelastninger eller tjenester, der har adgang til OneLake, kan bruge dem. Genveje fungerer som symbolske kæder. De er et uafhængigt objekt fra målet. Hvis du sletter en genvej, påvirkes destinationen ikke. Hvis du flytter, omdøber eller sletter en destinationssti, kan genvejen blive brudt.
Hvor kan jeg oprette genveje?
Du kan oprette genveje i lakehouses og KQL-databaser (Kusto Query Language). Desuden kan de genveje, du opretter i disse elementer, pege på andre OneLake-placeringer, Azure Data Lake Storage (ADLS) Gen2, Amazon S3-lagerkonti eller Dataverse. Du kan endda oprette genveje til placeringer , der er begrænset til det lokale miljø eller netværket, ved hjælp af OPDG (Fabric on-premises data gateway).
Du kan bruge Brugergrænsefladen i Fabric til at oprette genveje interaktivt, og du kan bruge REST-API'en til at oprette genveje programmatisk.
Lakehouse
Når du opretter genveje i et lakehouse, skal du forstå elementets mappestruktur. Lakehouses består af to mapper på øverste niveau: mappen Tabeller og mappen Filer . Mappen Tabeller repræsenterer den administrerede del af lakehouse, mens mappen Filer er den ikke-administrerede del af lakehouse'et. I mappen Tabeller kan du kun oprette genveje på øverste niveau. Genveje understøttes ikke i andre undermapper i mappen Tabeller . Hvis destinationen for genvejen indeholder data i formatet Delta\Parquet, synkroniserer lakehouse automatisk metadataene og genkender mappen som en tabel. I mappen Filer er der ingen begrænsninger for, hvor du kan oprette genveje. Du kan oprette dem på et hvilket som helst niveau i mappehierarkiet. Registrering af tabeller sker ikke i mappen Filer .
KQL-database
Når du opretter en genvej i en KQL-database, vises den i mappen Genveje i databasen. KQL-databasen behandler genveje som eksterne tabeller. Hvis du vil forespørge genvejen external_table
, skal du bruge funktionen for Kusto-forespørgselssproget.
Hvor kan jeg få adgang til genveje?
Alle Fabric- eller ikke-Fabric-tjenester, der kan få adgang til data i OneLake, kan bruge genveje. Genveje er gennemsigtige for alle tjenester, der tilgår data via OneLake-API'en. Genveje vises blot som en anden mappe i søen. Apache Spark, SQL, Realtidsintelligens og Analysis Services kan alle bruge genveje, når der forespørger om data.
Apache Spark
Apache Spark-notesbøger og Apache Spark-job kan bruge genveje, som du opretter i OneLake. Relative filstier kan bruges til at læse data direkte fra genveje. Hvis du desuden opretter en genvej i afsnittet Tabeller i lakehouse, og den er i Delta-formatet, kan du læse den som en administreret tabel ved hjælp af Apache Spark SQL-syntaksen.
df = spark.read.format("delta").load("Tables/MyShortcut")
display(df)
df = spark.sql("SELECT * FROM MyLakehouse.MyShortcut LIMIT 1000")
display(df)
Bemærk
Delta-formatet understøtter ikke tabeller med mellemrumstegn i navnet. Enhver genvej, der indeholder et mellemrum i navnet, bliver ikke fundet som en Delta-tabel i lakehouse.
SQL
Du kan også læse genveje i afsnittet Tabeller i et lakehouse via SQL Analytics-slutpunktet for lakehouse'et. Du kan få adgang til SQL Analytics-slutpunktet via tilstandsvælgeren for lakehouse'et eller via SQL Server Management Studio (SSMS).
SELECT TOP (100) *
FROM [MyLakehouse].[dbo].[MyShortcut]
Intelligence i realtid
Genveje i KQL-databaser genkendes som eksterne tabeller. Hvis du vil forespørge genvejen external_table
, skal du bruge funktionen for Kusto-forespørgselssproget.
external_table('MyShortcut')
| take 100
Analysis Services
Du kan oprette semantiske modeller til lakehouses, der indeholder genveje i afsnittet Tabeller i lakehouse. Når den semantiske model kører i Direct Lake-tilstand, kan Analysis Services læse data direkte fra genvejen.
Ikke-stof
Programmer og tjenester uden for Fabric kan også få adgang til genveje via OneLake-API'en. OneLake understøtter et undersæt af ADLS Gen2- og Blob Storage-API'er. Hvis du vil vide mere om OneLake-API'en, skal du se OneLake-adgang med API'er.
https://onelake.dfs.fabric.microsoft.com/MyWorkspace/MyLakhouse/Tables/MyShortcut/MyFile.csv
Typer af genveje
OneLake-genveje understøtter flere filsystemdatakilder. Disse omfatter interne OneLake-placeringer, Azure Data Lake Storage (ADLS) Gen2, Amazon S3, S3 Compatible, Google Cloud Storage (GCS) og Dataverse.
Interne OneLake-genveje
Med interne OneLake-genveje kan du referere til data i eksisterende Fabric-elementer. Disse elementer omfatter lakehouses, KQL-databaser og data warehouses. Genvejen kan pege på en mappeplacering i det samme element, på tværs af elementer i det samme arbejdsområde eller endda på tværs af elementer i forskellige arbejdsområder. Når du opretter en genvej på tværs af elementer, behøver elementtyperne ikke at stemme overens. Du kan f.eks. oprette en genvej i et lakehouse, der peger på data i et data warehouse.
Når en bruger får adgang til data via en genvej til en anden OneLake-placering, bruges identiteten for den kaldende bruger til at godkende adgang til dataene i genvejens destinationssti*. Denne bruger skal have tilladelser på målplaceringen for at kunne læse dataene.
Vigtigt
Når du får adgang til genveje via semantiske Power BI-modeller eller T-SQL, overføres den kaldende brugers identitet ikke til genvejsmålet. Ejeren af opkaldselementet overføres i stedet for og uddelegerer adgang til den kaldende bruger.
ADLS-genveje
Der kan også oprettes genveje til ADLS Gen2-lagerkonti. Når du opretter genveje til ADLS, kan destinationsstien pege på en hvilken som helst mappe i det hierarkiske navneområde. Destinationsstien skal som minimum indeholde et objektbeholdernavn.
Access
ADLS-genveje skal pege på DFS-slutpunktet for lagerkontoen.
Eksempel: https://accountname.dfs.core.windows.net/
Hvis din lagerkonto er beskyttet af en lagerfirewall, kan du konfigurere tjenesteadgang, der er tillid til. Se Adgang til arbejdsområde, der er tillid til
Autorisation
ADLS-genveje bruger en delegeret godkendelsesmodel. I denne model angiver genvejsforfatteren en legitimationsoplysninger for ADLS-genvejen, og al adgang til genvejen er godkendt ved hjælp af disse legitimationsoplysninger. De understøttede delegerede typer er Organisationskonto, Kontonøgle, SAS (Shared Access Signature) og Tjenesteprincipal.
- Organisationskonto – skal have rollen Lagerblobdatalæser, Bidragyder til lagerblobdata eller Ejer af lagerblobdata på lagerkonto
- SAS (Shared Access Signature) – skal som minimum indeholde følgende tilladelser: Læs, Liste og Udfør
- Tjenesteprincipal – skal have rollen Lagerblobdatalæser, Bidragyder til lagerblobdata eller Ejer af lagerblobdata på lagerkonto
- Arbejdsområdeidentitet – skal have rollen Lagerblobdatalæser, Bidragyder til lagerblobdata eller Ejer af lagerblobdata på lagerkonto
Bemærk
Hierarkiske navneområder skal være aktiveret på din ADLS Gen 2-lagerkonto.
S3-genveje
Du kan også oprette genveje til Amazon S3-konti. Når du opretter genveje til Amazon S3, skal destinationsstien som minimum indeholde et bucketnavn. S3 understøtter ikke hierarkiske navneområder oprindeligt, men du kan bruge præfikser til at efterligne en mappestruktur. Du kan inkludere præfikser i genvejsstien for yderligere at indsnævre omfanget af data, der er tilgængelige via genvejen. Når du får adgang til data via en S3-genvej, repræsenteres præfikser som mapper.
Access
S3-genveje skal pege på https-slutpunktet for S3-bucket'en.
Eksempel: https://bucketname.s3.region.amazonaws.com/
Bemærk
Du behøver ikke at deaktivere indstillingen S3 Bloker offentlig adgang for din S3-konto for S3-genvejen til funktionen.
Adgangen til S3-slutpunktet må ikke blokeres af en lagerfirewall eller Virtual Private Cloud.
Autorisation
S3-genveje bruger en delegeret godkendelsesmodel. I denne model angiver genvejsforfatteren en legitimationsoplysninger for S3-genvejen, og al adgang til genvejen er godkendt ved hjælp af disse legitimationsoplysninger. De understøttede delegerede legitimationsoplysninger er en nøgle og en hemmelighed for en IAM-bruger.
IAM-brugeren skal have følgende tilladelser til den bucket, som genvejen peger på.
S3:GetObject
S3:GetBucketLocation
S3:ListBucket
Bemærk
S3-genveje er skrivebeskyttede. De understøtter ikke skrivehandlinger, uanset tilladelserne for IAM-brugeren.
Genveje til Google Cloud Storage
Der kan oprettes genveje til Google Cloud Storage (GCS) ved hjælp af XML-API'en til GCS. Når du opretter genveje til Google Cloud Storage, skal målstien som minimum indeholde et bucketnavn. Du kan også begrænse omfanget af genvejen ved yderligere at angive det præfiks/den mappe, du vil pege på i lagerhierarkiet.
Access
Når du konfigurerer forbindelsen til en GCS-genvej, kan du enten angive det globale slutpunkt for lagertjenesten eller bruge et bucketspecifikt slutpunkt.
- Eksempel på globalt slutpunkt:
https://storage.googleapis.com
- Eksempel på bucketspecifikt slutpunkt:
https://<BucketName>.storage.googleapis.com
Autorisation
GCS-genveje bruger en delegeret godkendelsesmodel. I denne model angiver forfatteren af genvejen en legitimationsoplysninger for GCS-genvejen, og al adgang til genvejen er godkendt ved hjælp af disse legitimationsoplysninger. De understøttede delegerede legitimationsoplysninger er en HMAC-nøgle og en hemmelighed for en tjenestekonto eller brugerkonto.
Kontoen skal have tilladelse til at få adgang til dataene i GCS-bucketen. Hvis det bucketspecifikke slutpunkt blev brugt i forbindelsen til genvejen, skal kontoen have følgende tilladelser:
storage.objects.get
stoage.objects.list
Hvis det globale slutpunkt blev brugt i forbindelsen til genvejen, skal kontoen også have følgende tilladelse:
storage.buckets.list
Bemærk
GCS-genveje er skrivebeskyttede. De understøtter ikke skrivehandlinger, uanset tilladelserne for den konto, der bruges.
Dataversegenveje
Direkte integration med Dataverse med Microsoft Fabric gør det muligt for organisationer at udvide deres Dynamics 365-virksomhedsprogrammer og forretningsprocesser til Fabric. Denne integration opnås via genveje, som kan oprettes på to måder: via PowerApps-udviklerportalen eller via Fabric direkte.
Oprettelse af genveje via PowerApps-udviklerportalen
Autoriserede PowerApps-brugere kan få adgang til PowerApps-udviklerportalen og bruge funktionen Link til Microsoft Fabric . Fra denne enkelt handling oprettes der et Lakehouse i Fabric, og genveje genereres automatisk for hver tabel i Dataverse-miljøet. Du kan få flere oplysninger under Direkte integration af Dataverse med Microsoft Fabric.
Oprettelse af genveje via Fabric
Fabric-brugere kan også oprette genveje til Dataverse. Fra UX'en til oprettelse af genveje kan brugerne vælge Dataverse, angive deres URL-adresse til miljøet og gennemse de tilgængelige tabeller. Denne oplevelse giver brugerne mulighed for selektivt at vælge, hvilke tabeller der skal overføres til Fabric i stedet for at hente alle tabeller ind.
Bemærk
Dataverse-tabeller skal først være tilgængelige i Dataverse Managed Lake, før de kan ses i Fabric-oprettelsesgenvejene UX. Hvis dine tabeller ikke er synlige fra Fabric, kan du bruge funktionen Link til Microsoft Fabric fra PowerApps-udviklerportalen.
Autorisation
Dataverse-genveje bruger en uddelegeret godkendelsesmodel. I denne model angiver forfatteren af genvejen en legitimationsoplysninger for Dataverse-genvejen, og al adgang til genvejen er godkendt ved hjælp af disse legitimationsoplysninger. Den understøttede type delegerede legitimationsoplysninger er organisationskonto (OAuth2). Organisationskontoen skal have systemadministratorens tilladelse til at få adgang til data i Dataverse Managed Lake.
Bemærk
Tjenesteprincipaler, der føjes til stofarbejdsområdet, skal have administratorrollen for at godkende genvejen Dataverse.
Cachelagring
Cachelagring af genveje kan bruges til at reducere udgående dataomkostninger, der er knyttet til adgang til data på tværs af cloudmiljøet. Når filer læses via en ekstern genvej, gemmes filerne i en cache til Fabric-arbejdsområdet. Efterfølgende anmodninger om læsning behandles fra cachen i stedet for udbyderen af fjernlageret. Cachelagrede filer har en opbevaringsperiode på 24 timer. Hver gang filen åbnes, nulstilles opbevaringsperioden. Hvis filen i udbyderen af fjernlageret er nyere end filen i cachen, behandles anmodningen fra udbyderen af fjernlageret, og den opdaterede fil gemmes i cachen. Hvis en fil ikke er blevet åbnet i mere end 24 timer, fjernes den fra cachen. Individuelle filer, der er større end 1 GB, cachelagres ikke.
Bemærk
Cachelagring af genveje understøttes i øjeblikket kun for GCS-, S3- og S3-kompatible genveje.
Hvis du vil aktivere cachelagring for genveje, skal du åbne panelet Indstillinger for arbejdsområde. Vælg fanen OneLake. Slå cacheindstillingen til Til, og vælg Gem.
Sådan bruger genveje cloudforbindelser
Godkendelse af ADLS- og S3-genveje uddelegeres ved hjælp af cloudforbindelser. Når du opretter en ny ADLS- eller S3-genvej, opretter du enten en ny forbindelse eller vælger en eksisterende forbindelse til datakilden. Angivelse af en forbindelse for en genvej er en bindingshandling. Det er kun brugere med tilladelse til forbindelsen, der kan udføre bindingshandlingen. Hvis du ikke har tilladelser til forbindelsen, kan du ikke oprette nye genveje ved hjælp af denne forbindelse.
Genvejssikkerhed
Genveje kræver visse tilladelser til at administrere og bruge. Sikkerhed for OneLake-genvej ser på de tilladelser, der kræves for at oprette genveje og få adgang til data ved hjælp af dem.
Hvordan håndterer genveje sletninger?
Genveje udfører ikke overlappende sletninger. Når du udfører en sletning på en genvej, sletter du kun genvejsobjektet. Dataene i genvejsmålet forbliver uændrede. Men hvis du udfører en sletningshandling på en fil eller mappe i en genvej, og du har tilladelser i genvejsmålet til at udføre sletningen, slettes filerne og/eller mapperne i destinationen. Følgende eksempel illustrerer dette.
Slet eksempel
Bruger A har et lakehouse med følgende sti i:
MyLakehouse\Files\MyShortcut\Foo\Bar
MyShortcut er en genvej, der peger på en ADLS Gen2-konto, der indeholder mapperne Foo\Bar .
Sletning af et genvejsobjekt
Bruger A udfører en sletningshandling på følgende sti:
MyLakehouse\Files\MyShortcut
I dette tilfælde slettes MyShortcut fra lakehouse. Genveje udfører ikke overlappende sletninger, og derfor påvirkes filerne og mapperne i ADLS Gen2-kontoen Foo\Bar ikke.
Sletter indhold, der refereres til af en genvej
Bruger A udfører en sletningshandling på følgende sti:
MyLakehouse\Files\MyShortcut\Foo\Bar
Hvis Bruger A i dette tilfælde har skriverettigheder på ADLS Gen2-kontoen, slettes mappen Bar fra ADLS Gen2-kontoen.
Afstamningsvisning for arbejdsområde
Når du opretter genveje mellem flere Fabric-elementer i et arbejdsområde, kan du visualisere genvejsrelationerne via afstamningsvisningen for arbejdsområdet. Vælg knappen Afstamningsvisning ( ) i øverste højre hjørne af Arbejdsområdeoversigt.
Bemærk
Afstamningsvisningen er begrænset til et enkelt arbejdsområde. Genveje til placeringer uden for det valgte arbejdsområde vises ikke.
Begrænsninger og overvejelser
- Det maksimale antal genveje pr. Fabric-element er 100.000. I denne kontekst henviser begrebet element til: apps, lakehouses, warehouses, rapporter og meget mere.
- Det maksimale antal genveje i en enkelt OneLake-sti er 10.
- Det maksimale antal direkte genveje til genvejslinks er 5.
- ADLS- og S3-genvejsmålstier må ikke indeholde reserverede tegn fra RFC 3986 sektion 2.2. Se RFC 3968 section 2.3 for tilladte tegn.
- OneLake-genvejsnavne, overordnede stier og destinationsstier må ikke indeholde "%" eller "+"-tegn.
- Genveje understøtter ikke ikke-latinske tegn.
- Kopiér Blob API understøttes ikke for ADLS- eller S3-genveje.
- Funktionen Copy fungerer ikke på genveje, der peger direkte på ADLS-objektbeholdere. Det anbefales at oprette ADLS-genveje til en mappe, der er mindst ét niveau under en objektbeholder.
- Der kan ikke oprettes flere genveje i ADLS- eller S3-genveje.
- Afstamning for genveje til data warehouses og semantiske modeller er ikke tilgængelig i øjeblikket.
- Det kan tage op til et minut, før Tabel-API'en genkender nye genveje.