Del via


Selvstudium: Konfigurer Microsoft Fabric-spejlede databaser fra Azure Databricks

Databasespejling i Microsoft Fabric er en cloud-baseret SaaS-teknologi til virksomheder, der er baseret uden ETL. Denne vejledning hjælper dig med at oprette en spejlet database fra Azure Databricks, som opretter en skrivebeskyttet, kontinuerligt replikeret kopi af dine Azure Databricks-data i OneLake.

Forudsætninger

  • Du skal aktivere ekstern dataadgang i metalageret. Du kan finde flere oplysninger i Aktivere ekstern dataadgang i metalageret.
  • Opret eller brug et eksisterende Azure Databricks-arbejdsområde med Unity Catalog aktiveret.
  • Du skal have EXTERNAL USE SCHEMA rettigheden til skemaet i Unity Catalog, der indeholder de tabeller, der skal tilgås fra Fabric.
  • Du skal bruge Fabrics tilladelsesmodel til at angive adgangskontrol for kataloger, skemaer og tabeller i Fabric.
  • Azure Databricks-arbejdsområder må ikke være bag et privat slutpunkt.

Opret en spejlet database fra Azure Databricks

Følg disse trin for at oprette en ny spejlet database fra dit Azure Databricks Unity-katalog.

  1. Naviger til https://powerbi.com.

  2. Vælg + Ny og derefter Spejlet Azure Databricks-katalog.

    Skærmbillede fra Fabric-portalen af et nyt Azure Databricks-spejlet element.

  3. Vælg en eksisterende forbindelse, hvis du har konfigureret en.

    • Hvis du ikke har en eksisterende forbindelse, skal du oprette en ny forbindelse og angive alle oplysningerne. Du kan godkende til dit Azure Databricks-arbejdsområde ved hjælp af "Organisationskonto" eller "Tjenesteprincipal". Hvis du vil oprette en forbindelse, skal du enten være bruger eller administrator af Azure Databricks-arbejdsområdet.
    • Hvis du vil have adgang til Azure Data Lake Storage (ADLS) Gen2-konti bag en firewall, skal du følge trinnene til Aktivér netværkssikkerhedsadgang for din Azure Data Lake Storage Gen2-konto senere i denne artikel.
  4. Når du opretter forbindelse til et Azure Databricks-arbejdsområde, kan du på siden Vælg tabeller fra et Databricks-katalog vælge kataloget, skemaerne og tabellerne via den medtagelses-/udeladelsesliste, du vil tilføje og få adgang til fra Microsoft Fabric. Vælg kataloget og dets relaterede skemaer og tabeller, som du vil føje til dit Fabric-arbejdsområde.

  5. Som standard vil navnet på varen være navnet på det katalog, du forsøger at føje til Fabric. På siden Gennemse og opret kan du gennemse detaljerne og eventuelt ændre navnet på det spejlede databaseelement, som skal være entydigt i dit arbejdsområde. Vælg Opret.

  6. Der oprettes et Databricks-katalogelement, og for hver tabel oprettes der også en tilsvarende genvej af Databricks-typen.

    • Skemaer, der ikke har nogen tabeller, vises ikke.
  7. Du kan også se et eksempel på dataene, når du får adgang til en genvej ved at vælge SQL-analyseslutpunktet. Åbn SQL Analytics-slutpunktselementet for at starte siden Stifinder og forespørgselseditor. Du kan forespørge på dine spejlede Azure Databricks-tabeller med T-SQL i SQL-editoren.

Opret Lakehouse-genveje til Databricks-katalogelementet

Du kan også oprette genveje fra dit Lakehouse til dit Databricks-katalogelement for at bruge dine Lakehouse-data og bruge Spark Notebooks.

  1. Først skaber vi et søhus. Hvis du allerede har et søhus i dette arbejdsområde, kan du bruge et eksisterende søhus.
    1. Vælg dit arbejdsområde i navigationsmenuen.
    2. Vælg + Nyt>søhus.
    3. Angiv et navn til dit søhus i feltet Navn , og vælg Opret.
  2. I Stifinder-visningen af dit søhus skal du vælge knappen Ny genvej i menuen Hent data i dit søhus under Indlæs data i dit søhus.
  3. Vælg Microsoft OneLake. Vælg et katalog. Dette er det dataelement, du oprettede i de foregående trin. Vælg derefter Næste.
  4. Vælg tabeller i skemaet, og vælg Næste.
  5. Vælg Opret.
  6. Genveje er nu tilgængelige i dit Lakehouse, så du kan bruge dem sammen med dine andre Lakehouse-data. Du kan også bruge notesbøger og Spark til at udføre databehandling på dataene for disse katalogtabeller, som du har tilføjet fra dit Azure Databricks-arbejdsområde.

Oprette en semantisk model

Du kan oprette en semantisk Power BI-model baseret på dit spejlede element og manuelt tilføje/fjerne tabeller. Du kan finde flere oplysninger om oprettelse og administration af semantiske modeller under Opret en semantisk Power BI-model.

For at få den bedste oplevelse anbefales det, at du bruger Microsoft Edge Browser til semantiske modelleringsopgaver.

Administrere dine semantiske modelrelationer

Når du har oprettet en ny semantisk model baseret på din spejlede database,

  1. Vælg Modellayout i Stifinder i dit arbejdsområde.
  2. Når modellayout er valgt, får du vist en grafik over de tabeller, der blev inkluderet som en del af den semantiske model.
  3. Hvis du vil oprette relationer mellem tabeller, skal du trække et kolonnenavn fra en tabel til et andet kolonnenavn i en anden tabel. Der vises en popup for at identificere forholdet og kardinaliteten for tabellerne.

Aktivér netværkssikkerhedsadgang for din Azure Data Lake Storage Gen2-konto

I dette afsnit får du vejledning i, hvordan du konfigurerer netværkssikkerhed for din Azure Data Lake Storage (ADLS) Gen2-konto, når der er konfigureret en Azure Storage-firewall

Forudsætninger

  • Opret eller brug et eksisterende Azure Databricks-arbejdsområde med Unity Catalog aktiveret.
  • Hvis du vil aktivere godkendelsestypen for arbejdsområdeidentitet (anbefales), skal arbejdsområdet Fabric være knyttet til en hvilken som helst F-kapacitet. Hvis du vil oprette en arbejdsområdeidentitet, skal du se Godkend med arbejdsområdeidentitet.
  • Dette afsnit er til at få adgang til en Azure Data Lake Storage (ADLS) Gen2-lagerkonto bag en Azure Storage-firewall. Azure Databricks-arbejdsområdelager bag en Azure Storage-firewall understøttes ikke.
  • Et katalog skal være knyttet til en enkelt lagerkonto.

Aktiver adgang til netværkssikkerhed

  1. Når du opretter et nyt spejlet Azure Databricks-katalog, skal du vælge fanen Netværkssikkerhed i trinnet Vælg data.

    Skærmbillede af fanen Netværkssikkerhed i Databricks.

  2. Vælg en eksisterende forbindelse til lagerkontoen, hvis du har konfigureret en. 

    • Hvis du ikke har en eksisterende ADLS-forbindelse, skal du oprette en ny forbindelse.  
    • URL-adressen til lagerslutpunktet er det sted, hvor det valgte katalogs data gemmes. Slutpunktet skal være den specifikke mappe, hvor dataene er gemt, i stedet for at angive, at slutpunktet skal være på lagerkontoniveau. For eksempel give https://<storage account>.dfs.core.windows.net/container1/folder1 i stedet for https://<storage account>.dfs.core.windows.net/.
    • Angiv legitimationsoplysningerne til forbindelsen. De understøttede godkendelsestyper er Organisationskonto, Tjenesteprincipal og Arbejdsområdeidentitet (anbefales).
  3. I Azure Portal skal du give adgangsrettigheder til lagerkontoen baseret på den godkendelsestype, du valgte i forrige trin. Gå til lagerkontoen på Azure Portal. Vælg Adgangskontrol (IAM). Vælg +Tilføj og Tilføj rolletildeling. Du kan finde flere oplysninger under Tildele Azure-roller ved hjælp af Azure Portal.

    • Hvis du har angivet lagerkontoen som en del af forbindelsen, skal det valgte godkendelsesobjekt have rollen Storage Blob Data Reader på lagerkontoen. 
    • Hvis du har angivet en bestemt objektbeholder som en del af forbindelsen, skal det valgte godkendelsesobjekt have rollen Storage Blob Data Reader på objektbeholderen.  
    • Hvis du har angivet en bestemt mappe i en container (anbefales), skal det valgte godkendelsesobjekt have Læs (R) og Udfør (E) på mappeniveau. Hvis du bruger tjenesteprincipal eller arbejdsområdeidentitet som godkendelsestype, skal du give den pågældende tjenesteprincipal eller udførelsestilladelser til arbejdsområdeidentiteten til rodmappen i objektbeholderen og til hver mappe i hierarkiet af mapper, der fører til den mappe, du har angivet. 

    Du kan finde flere oplysninger og trin til at give ADLS-adgang under ADLS-adgangskontrol.

  4. Aktivér Trusted Workspace Access for at få adgang til firewallaktiverede Azure Data Lake Storage (ADLS) Gen2-konti på en sikker måde. Adgang til arbejdsområder, der er tillid til, kræver, at der oprettes en forbindelse direkte til ADLS-lagerkontoen, som kan bruges uafhængigt af Azure Databricks-arbejdsområdeforbindelsen. Du kan finde flere oplysninger under Secure Fabric-spejlede databaser fra Azure Databricks.

  5. Der oprettes en genvej til Unity Catalog-tabeller for de tabeller, hvis lagerkontonavn svarer til den lagerkonto, der er angivet i ADLS-forbindelsen. For tabeller, hvis lagerkontonavn ikke stemmer overens med den lagerkonto, der er angivet i ADLS-forbindelsen, oprettes der ikke genveje til disse tabeller. 

Important

Hvis du planlægger at bruge ADLS-forbindelsen uden for scenarierne med spejlede Azure Databricks-katalogelementer, skal du også give rollen Storage Blob Delegator på lagerkontoen.

Aktivér OneLake-sikkerhed på det spejlede Databricks-element

Tilknyt UC-politikker (Unity Catalog) til Microsoft OneLake-sikkerhed ved at følge disse trin:

  1. Synkroniser Entra Group, og anvend tilladelser i Unity Catalog. I Azure Databricks skal du bruge Automatic Identity Management til at synkronisere en Microsoft Entra ID-gruppe og give den de nødvendige Unity Catalog-rettigheder, f.eks. USE, BROWSE, SELECT på det relevante katalog/tabeller.
  2. Tildel en OneLake-dataadgangsrolle. I arbejdsområdet Fabric skal du oprette en dataadgangsrolle for de nyligt spejlede data. Føj den samme Entra-gruppe til denne rolle, og giv den læseadgang til de OneLake-genveje, der svarer til Azure Databricks-tabellerne. Du kan komme i gang med sikkerhed på tabelniveau med det samme ved at klikke på knappen Administrer OneLake-sikkerhed på båndet. Sørg for at holde adgangskonfigurationer synkroniseret, efterhånden som katalogstrukturer og tilladelser udvikler sig. Du kan finde flere oplysninger i OneLake-modellen til dataadgangskontrol (prøveversion).