Poznámka
Na prístup k tejto stránke sa vyžaduje oprávnenie. Môžete sa skúsiť prihlásiť alebo zmeniť adresáre.
Na prístup k tejto stránke sa vyžaduje oprávnenie. Môžete skúsiť zmeniť adresáre.
Vzťahuje sa na:✅ Warehouse v službe Microsoft Fabric
Tento kurz vás prevedie nastavením databázy a nasadením vášho prvého projektu do skladu služby Fabric.
Úvod
Open-source architektúra DBT (Data Build Tool) zjednodušuje inžinierstvo transformácie údajov a analýzy. Zameriava sa na transformácie založené na SQL v rámci analytickej vrstvy, ktorá s SQL zaobchádza ako s kódom. Dbt podporuje riadenie verzií, modularizáciu, testovanie a dokumentáciu.
Adaptér dbt pre microsoft Fabric možno použiť na vytvorenie projektov dbt, ktoré sa potom môžu nasadiť do skladu údajov služby Fabric.
Môžete tiež zmeniť cieľovú platformu pre projekt dbt jednoduchým zmenou adaptéra, napríklad; Projekt vytvorený pre vyhradený fond SQL služby Azure Synapse je možné v priebehu niekoľkých sekúnd inovovať na sklad údajov služby Fabric.
Požiadavky na dbt adaptér pre Microsoft Fabric
Ak si chcete nainštalovať a nastaviť požiadavky databázy, postupujte podľa tohto zoznamu:
Ovládač Microsoft ODBC pre SERVER SQL Server.
Najnovšia verzia adaptéra dbt-fabric z odkladacieho priestoru PyPI (Python Package Index) pomocou
pip install dbt-fabric.pip install dbt-fabricPoznámka
pip install dbt-fabricZmenou apip install dbt-synapsepoužitím nasledujúcich pokynov môžete nainštalovať adaptér databázy pre vyhradený fond SQL Synapse.Uistite sa, že dbt-fabric a jeho závislosti sú nainštalované pomocou
pip listpríkazu:pip listDlhý zoznam balíkov a aktuálnych verzií by sa mal vrátiť z tohto príkazu.
Ak ešte nemáte zostavu, vytvorte sklad. Na toto cvičenie môžete použiť skúšobnú kapacitu: zaregistrujte sa do bezplatnej skúšobnej verzie služby Microsoft Fabric, vytvorte pracovný priestor a vytvorte sklad.
Začíname s adaptérom dbt-fabric
V tomto kurze sa používa Visual Studio Code, ale môžete použiť preferovaný nástroj podľa svojho výberu.
Naklonujte projekt jaffle_shop demo dbt do počítača.
- Odkladací priestor môžete naklonovať pomocou vstavaného ovládacieho prvku zdroja programu Visual Studio Code.
- Alebo môžete
git clonepoužiť napríklad príkaz:
git clone https://github.com/dbt-labs/jaffle-shop-classic.gitjaffle_shopOtvorte priečinok projektu v programe Visual Studio Code.
Registráciu môžete vynechať, ak ste už vytvorili Sklad.
Vytvorte
profiles.ymlsúbor. Pridajte nasledujúcu konfiguráciu do častiprofiles.yml. Tento súbor nakonfiguruje pripojenie k skladu v službe Microsoft Fabric pomocou adaptéra dbt-fabric.config: partial_parse: true jaffle_shop: target: fabric-dev outputs: fabric-dev: authentication: CLI database: <put the database name here> driver: ODBC Driver 18 for SQL Server host: <enter your SQL analytics endpoint here> schema: dbo threads: 4 type: fabricPoznámka
typeZmeňte hodnotu zfabricnasynapseprepnutie adaptéra databázy na službu Azure Synapse Analytics, ak chcete. Každá existujúca platforma údajov projektu dbt sa môže aktualizovať zmenou adaptéra databázy. Ďalšie informácie nájdete v zozname dbt podporovaných platforiem údajov.Vykonajte vlastné overenie v službe Azure v termináli programu Visual Studio Code.
- Ak používate overovanie azure CLI, spustite
az loginv termináli Visual Studio Code. - Informácie o objekte služby alebo inom identifikátore Entra ID spoločnosti Microsoft (predtým Azure Active Directory) v službe Microsoft Fabric nájdete v téme nastavenie dbt (Nástroj na tvorbu údajov) a dbt Resource Configurations. Ďalšie informácie nájdete v téme Overenie v spoločnosti Microsoft Entra ako alternatívu k overovania SQL v službe Microsoft Fabric.
- Ak používate overovanie azure CLI, spustite
Teraz ste pripravení otestovať pripojenie. Ak chcete otestovať pripojenie k skladu, spustite
dbt debugho v termináli Visual Studio Code.dbt debugVšetky kontroly sa prejdú, čo znamená, že môžete pripojiť svoj sklad pomocou adaptéra dbt-fabric z
jaffle_shopprojektu dbt.Teraz je čas otestovať, či adaptér funguje alebo nie. Najskôr spustite príkaz
dbt seedna vloženie vzorového údajov do skladu.Spustite príkaz
dbt runna spustenie modelov definovaných v projekte demo dbt.dbt runSpustením
dbt testoverte údaje pre niektoré testy.dbt test
Teraz ste nasadili projekt dbt do skladu údajov služby Fabric.
Presúvanie medzi rôznymi skladmi
Je to jednoduchý pohyb projektu dbt medzi rôznymi skladmi. Projekt dbt v ľubovoľnom podporovanom sklade možno rýchlo migrovať pomocou tohto postupu:
Nainštalujte nový adaptér. Ďalšie informácie a úplné pokyny na inštaláciu nájdete v téme Adaptéry dbt.
Aktualizujte
typevlastnosť v súboreprofiles.yml.Zostavte projekt.
dbt v službe Fabric Data Factory
V integrácii s Apache Airflow, populárnou službou na riadenie pracovných postupov, sa dbt stáva výkonným nástrojom na organizovanie transformácií údajov. Možnosti plánovania a správy úloh toku vzduchu umožňujú dátovým tímom automatizovať spustenia dbt. Zabezpečuje pravidelné aktualizácie údajov a zachováva konzistentný tok vysokokvalitných údajov na analýzu a vytváranie zostáv. Tento kombinovaný prístup, využívajúci odborné znalosti spoločnosti dbt v oblasti transformácie s riadením pracovných postupov spoločnosti Airflow, poskytuje efektívne a robustné potrubia, čo v konečnom dôsledku vedie k rýchlejším a prehľadnejším rozhodnutiam založeným na údajoch.
Apache Airflow je platforma typu open-source, ktorá sa používa na programové vytváranie, plánovanie a monitorovanie zložitých pracovných postupov údajov. Umožňuje definovať súbor úloh, nazývaných operátory, ktoré je možné kombinovať do smerovaných acyklických grafov (DAG) na reprezentáciu potrubí.
Ďalšie informácie o tom, ako využiť databázu so skladom, nájdete v téme Transformácia údajov pomocou dbt v službe Data Factory v službe Microsoft Fabric.
Úvahy
Dôležité veci, ktoré je potrebné vziať do úvahy pri použití dbt-tkaniny adaptér:
Skontrolujte aktuálne obmedzenia skladu údajov v službe Microsoft Fabric.
Fabric podporuje overovanie Microsoft Entra ID (predtým Azure Active Directory) pre subjekty používateľov, identity používateľov a objekty služby. Odporúčaným režimom overenia na interaktívnu prácu v sklade je CLI (rozhrania príkazového riadka) a používanie objektov služby na automatizáciu.
Pozrite si príkazy T-SQL (Transact-SQL), ktoré nie sú podporované v sklade údajov služby Fabric.
Niektoré príkazy T-SQL sú podporované adaptérom dbt-fabric pomocou
Create Table as Select(CTAS)DROPaCREATEpríkazov, akoALTER TABLE ADD/ALTER/DROP COLUMNsú napríklad , ,MERGETRUNCATE,sp_rename.Prečítajte si tému Nepodporované typy údajov a získajte informácie o podporovaných a nepodporovaných typoch údajov.
Môžete zapisovať problémy na adaptéri dbt-tkaniny na GitHube navštívením Issues · microsoft/dbt-fabric · GitHub.