Opplæring: Konfigurere dbt for Fabric Data Warehouse

Gjelder for: Lager i Microsoft Fabric

Denne opplæringen veileder deg gjennom hvordan du konfigurerer dbt og distribuerer ditt første prosjekt til et Azure Fabric Synapse Warehouse.

Viktig

Microsoft Fabric er i forhåndsversjon.

Innledning

dbt (Data Build Tool) er et rammeverk med åpen kildekode som forenkler datatransformasjon og analyseteknikk. Den fokuserer på SQL-baserte transformasjoner i analyselaget, og behandler SQL som kode. dbt støtter versjonskontroll, modulærisering, testing og dokumentasjon.

DBT-adapteren for Microsoft Fabric kan brukes til å lage dbt-prosjekter, som deretter kan distribueres til en Fabric Synapse-Data Warehouse.

Du kan også endre målplattformen for dbt-prosjektet ved ganske enkelt å endre adapteren, for eksempel Et prosjekt bygget for Azure Synapse dedikert SQL-basseng kan oppgraderes på noen få sekunder til en Fabric Synapse-Data Warehouse.

Forutsetninger for dbt-adapteren for Microsoft Fabric

Følg denne listen for å installere og konfigurere forutsetningene for dbt:

  1. Python-versjon 3.7 (eller nyere).

  2. Microsoft ODBC-driveren for SQL Server.

  3. Nyeste versjon av dbt-fabric-adapteren fra PyPI-repositoriet (Python Package Index) ved hjelp av pip install dbt-fabric.

    pip install dbt-fabric
    

    Obs!

    Ved å endre pip install dbt-fabric til pip install dbt-synapse og bruke følgende instruksjoner, kan du installere dbt-adapteren for Synapse dedikert SQL-utvalg.

  4. Sørg for å bekrefte at dbt-fabric og dets avhengigheter er installert ved hjelp pip list av kommandoen:

    pip list
    

    En lang liste over pakker og gjeldende versjoner bør returneres fra denne kommandoen.

  5. Opprett et lager hvis du ikke allerede har gjort det. Du kan bruke prøvekapasiteten for denne øvelsen: registrer deg for den gratis prøveversjonen av Microsoft Fabric, opprett et arbeidsområde, og opprett deretter et lager.

Kom i gang med dbt-fabric adapter

Denne opplæringen bruker Visual Studio Code, men du kan bruke det foretrukne verktøyet du ønsker.

  1. Klon demoprosjektet fra https://github.com/dbt-labs/jaffle_shop maskinen.

    git clone https://github.com/dbt-labs/jaffle_shop.git
    
  2. jaffle_shop Åpne prosjektmappen i Visual Studio Code.

    Et skjermbilde fra Visual Studio Code, som viser det åpne prosjektet.

  3. Du kan hoppe over registreringen hvis du allerede har opprettet et lager.

  4. Opprett en profiles.yml fil. Legg til følgende konfigurasjon i profiles.yml. Denne filen konfigurerer tilkoblingen til lageret i Microsoft Fabric ved hjelp av dbt-fabric-adapteren.

    config:
      partial_parse: true
    jaffle_shop:
      target: fabric-dev
      outputs:    
        fabric-dev:
          authentication: CLI
          database: <put the database name here>
          driver: ODBC Driver 18 for SQL Server
          host: <enter your sql endpoint here>
          schema: dbo
          threads: 4
          type: fabric
    

    Obs!

    type Endre fra fabric til for å synapse bytte databaseadapteren til Azure Synapse Analytics, hvis ønskelig. Dataplattformen til et eksisterende dbt-prosjekt kan oppdateres ved å endre databaseadapteren. Hvis du vil ha mer informasjon, kan du se listen over dataplattformer som støttes.

  5. Godkjenn deg mot Azure i Visual Studio Code-terminalen.

  6. Nå er du klar til å teste tilkoblingen. Kjør dbt debug i Visual Studio Code-terminalen for å teste tilkoblingen til lageret.

    dbt debug
    

    Et skjermbilde fra Visual Studio Code, som viser feilsøkingskommandoen for dbt.

    Alle kontroller blir sendt, noe som betyr at du kan koble til lageret ved hjelp av dbt-fabric adapter fra jaffle_shop dbt-prosjektet.

  7. Nå er det på tide å teste om adapteren fungerer eller ikke. Kjør først dbt seed for å sette inn eksempeldata i lageret.

    Et skjermbilde fra Visual Studio Code, som viser en dbt seed-kommando.

  8. Kjør dbt test for å kjøre modellene som er definert i demonstrasjonsprosjektet.

    dbt test
    

    Et skjermbilde fra Visual Studio Code, som viser en dbt-testkommando.

  9. Kjør dbt run for å validere data mot noen tester.

    dbt run
    

    Et skjermbilde fra Visual Studio Code, som viser en dbt-kjørekommando.

Det var det! Du har nå distribuert et dbt-prosjekt til Synapse Data Warehouse i Fabric.

Flytte mellom ulike lagre

Det er enkelt å flytte prosjektet mellom ulike lagre. Et prosjekt på et hvilket som helst støttet lager kan raskt overføres med denne tretrinnsprosessen:

  1. Installer den nye adapteren. Hvis du vil ha mer informasjon og fullstendige installasjonsinstruksjoner, kan du se dbt-adaptere.

  2. type Oppdater egenskapen i profiles.yml filen.

  3. Bygg prosjektet.

Viktige faktorer

Viktige ting å vurdere når du bruker dbt-fabric adapter:

Neste trinn