Esercitazione: Configurare dbt per Fabric Data Warehouse
Si applica a: Warehouse in Microsoft Fabric
Questa esercitazione illustra come configurare dbt e distribuire il primo progetto in un'istanza di Fabric Warehouse.
Introduzione
Il framework open source dbt (Strumento di compilazione dati) semplifica la trasformazione dei dati e la progettazione dell'analisi. Si concentra sulle trasformazioni basate su SQL all'interno del livello di analisi, considerando SQL come codice. dbt supporta il controllo della versione, la modularizzazione, il test e la documentazione.
L'adapter dbt per Microsoft Fabric può essere usato per creare progetti dbt, che possono quindi essere distribuiti in un'istanza di Fabric Synapse Data Warehouse.
È anche possibile modificare la piattaforma di destinazione per il progetto dbt semplicemente modificando l'adattatore, ad esempio; Un progetto creato per il pool SQL dedicato di Azure Synapse può essere aggiornato in pochi secondi a un'istanza di Fabric Synapse Data Warehouse.
Prerequisiti per l'adapter dbt per Microsoft Fabric
Seguire questo elenco per installare e configurare i prerequisiti dbt:
Versione più recente dell'adapter dbt-fabric dal repository PyPI (Indice pacchetti Python) usando
pip install dbt-fabric
.pip install dbt-fabric
Nota
Se si passa
pip install dbt-fabric
apip install dbt-synapse
e usando le istruzioni seguenti, è possibile installare l'adapter dbt per il pool SQL dedicato di Synapse.Assicurarsi di verificare che dbt-fabric e le relative dipendenze siano installati tramite il
pip list
comando :pip list
Un lungo elenco dei pacchetti e delle versioni correnti deve essere restituito da questo comando.
Se non è già disponibile, creare un warehouse. È possibile usare la capacità di valutazione per questo esercizio: iscriversi alla versione di valutazione gratuita di Microsoft Fabric, creare un'area di lavoro e quindi creare un magazzino.
Introduzione all'adapter dbt-fabric
Questa esercitazione usa Visual Studio Code, ma è possibile usare lo strumento preferito preferito.
Clonare il progetto demo dbt jaffle_shop nel computer.
- È possibile clonare un repository con il controllo del codice sorgente predefinito di Visual Studio Code.
- In alternativa, ad esempio, è possibile usare il
git clone
comando :
git clone https://github.com/dbt-labs/jaffle_shop.git
Aprire la cartella del
jaffle_shop
progetto in Visual Studio Code.Se è già stato creato un warehouse, è possibile ignorare l'iscrizione.
Creare un file
profiles.yml
. Aggiungere la configurazione seguente aprofiles.yml
. Questo file configura la connessione al warehouse in Microsoft Fabric usando l'adapter dbt-fabric.config: partial_parse: true jaffle_shop: target: fabric-dev outputs: fabric-dev: authentication: CLI database: <put the database name here> driver: ODBC Driver 18 for SQL Server host: <enter your SQL analytics endpoint here> schema: dbo threads: 4 type: fabric
Nota
Modificare da
fabric
asynapse
per passare l'adattatoretype
di database ad Azure Synapse Analytics, se necessario. È possibile aggiornare qualsiasi piattaforma dati del progetto dbt esistente modificando l'adattatore di database. Per altre informazioni, vedere l'elenco dbt delle piattaforme dati supportate.Eseguire l'autenticazione in Azure nel terminale di Visual Studio Code.
- Eseguire
az login
nel terminale di Visual Studio Code se si usa l'autenticazione dell'interfaccia della riga di comando di Azure. - Per l'entità servizio o un altro ID Microsoft Entra (in precedenza Azure Active Directory) autenticazione in Microsoft Fabric, fare riferimento alla configurazione di dbt (Strumento di compilazione dati) e alle configurazioni delle risorse dbt.
- Eseguire
A questo momento si è pronti per testare la connettività. Per testare la connettività al warehouse, eseguire
dbt debug
nel terminale di Visual Studio Code.dbt debug
Tutti i controlli vengono passati, il che significa che è possibile connettere il warehouse usando l'adattatore dbt-fabric dal
jaffle_shop
progetto dbt.È ora possibile verificare se l'adattatore funziona o meno. Prima esecuzione
dbt seed
per inserire dati di esempio nel warehouse.Eseguire
dbt run
per convalidare i dati in base ad alcuni test.dbt run
Eseguire
dbt test
per eseguire i modelli definiti nel progetto demo dbt.dbt test
È stato ora distribuito un progetto dbt in Synapse Data Warehouse in Fabric.
Spostarsi tra magazzini diversi
È semplice spostare il progetto dbt tra magazzini diversi. È possibile eseguire rapidamente la migrazione di un progetto dbt in qualsiasi warehouse supportato con questo processo in tre passaggi:
Installare la nuova scheda. Per altre informazioni e istruzioni di installazione complete, vedere adapter dbt.
Aggiornare la
type
proprietà nelprofiles.yml
file.Compilare il progetto.
Considerazioni
Aspetti importanti da considerare quando si usa l'adapter dbt-fabric:
Esaminare le limitazioni correnti del data warehousing di Microsoft Fabric.
Fabric supporta l'autenticazione di Microsoft Entra ID (in precedenza Azure Active Directory) per le entità utente, le identità utente e le entità servizio. La modalità di autenticazione consigliata per lavorare in modo interattivo nel warehouse è l'interfaccia della riga di comando (interfacce della riga di comando) e l'uso delle entità servizio per l'automazione.
Esaminare i comandi T-SQL (Transact-SQL) non supportati in Synapse Data Warehouse in Microsoft Fabric.
Alcuni comandi T-SQL sono supportati dall'adapter dbt-fabric usando
Create Table as Select
(CTAS),DROP
eCREATE
comandi, ad esempioALTER TABLE ADD/ALTER/DROP COLUMN
,MERGE
,TRUNCATE
, .sp_rename
Vedere Tipi di dati non supportati per informazioni sui tipi di dati supportati e non supportati.
È possibile registrare i problemi nell'adapter dbt-fabric visitando Problemi · microsoft/dbt-fabric · GitHub.
Contenuto correlato
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per