Tutorial: Configurar o dbt para o Fabric Data Warehouse
Aplica-se a: Armazém no Microsoft Fabric
Este tutorial orienta você na configuração do dbt e na implantação do seu primeiro projeto em um Fabric Warehouse.
Introdução
A estrutura de código aberto dbt (Data Build Tool) simplifica a transformação de dados e a engenharia de análise. Ele se concentra em transformações baseadas em SQL dentro da camada de análise, tratando SQL como código. O DBT suporta controle de versão, modularização, testes e documentação.
O adaptador dbt para Microsoft Fabric pode ser usado para criar projetos dbt, que podem ser implantados em um Fabric Synapse Data Warehouse.
Você também pode alterar a plataforma de destino para o projeto dbt simplesmente alterando o adaptador, por exemplo; um projeto criado para o pool SQL dedicado do Azure Synapse pode ser atualizado em poucos segundos para um Fabric Synapse Data Warehouse.
Pré-requisitos para o adaptador dbt para Microsoft Fabric
Siga esta lista para instalar e configurar os pré-requisitos dbt:
Versão mais recente do adaptador dbt-fabric do repositório PyPI (Python Package Index) usando
pip install dbt-fabric
.pip install dbt-fabric
Nota
Alterando
pip install dbt-fabric
epip install dbt-synapse
usando as instruções a seguir, você pode instalar o adaptador dbt para o pool SQL dedicado Synapse.Certifique-se de verificar se dbt-fabric e suas dependências estão instalados usando o
pip list
comando:pip list
Uma longa lista dos pacotes e versões atuais deve ser retornada a partir deste comando.
Se ainda não tiver um, crie um Armazém. Você pode usar a capacidade de avaliação para este exercício: inscreva-se na avaliação gratuita do Microsoft Fabric, crie um espaço de trabalho e, em seguida , crie um depósito.
Introdução ao adaptador dbt-fabric
Este tutorial usa o Visual Studio Code, mas você pode usar sua ferramenta preferida de sua escolha.
Clone o projeto dbt de demonstração jaffle_shop em sua máquina.
- Você pode clonar um repositório com o controle de origem interno do Visual Studio Code.
- Ou, por exemplo, você pode usar o
git clone
comando:
git clone https://github.com/dbt-labs/jaffle_shop.git
Abra a pasta do
jaffle_shop
projeto no Visual Studio Code.Pode ignorar a inscrição se já tiver criado um Armazém.
Crie um ficheiro
profiles.yml
. Adicione a seguinte configuração aoprofiles.yml
. Esse arquivo configura a conexão com seu depósito no Microsoft Fabric usando o adaptador dbt-fabric.config: partial_parse: true jaffle_shop: target: fabric-dev outputs: fabric-dev: authentication: CLI database: <put the database name here> driver: ODBC Driver 18 for SQL Server host: <enter your SQL analytics endpoint here> schema: dbo threads: 4 type: fabric
Nota
Altere o
type
de parasynapse
para alternar o adaptador defabric
banco de dados para o Azure Synapse Analytics, se desejado. Qualquer plataforma de dados existente do projeto dbt pode ser atualizada alterando o adaptador de banco de dados. Para obter mais informações, consulte a lista dbt de plataformas de dados suportadas.Autentique-se no Azure no terminal do Visual Studio Code.
- Execute
az login
no terminal de código do Visual Studio se você estiver usando a autenticação da CLI do Azure. - Para obter a autenticação da Entidade de Serviço ou outra autenticação do Microsoft Entra ID (anteriormente Azure Ative Directory) no Microsoft Fabric, consulte a configuração dbt (Data Build Tool) e as Configurações de Recursos dbt.
- Execute
Agora você está pronto para testar a conectividade. Para testar a conectividade com seu depósito, execute
dbt debug
no terminal do Visual Studio Code.dbt debug
Todas as verificações são passadas, o que significa que você pode conectar seu armazém usando o adaptador dbt-fabric do
jaffle_shop
projeto dbt.Agora, é hora de testar se o adaptador está funcionando ou não. Primeira execução
dbt seed
para inserir dados de amostra no armazém.Execute
dbt run
para validar dados em relação a alguns testes.dbt run
Execute
dbt test
para executar os modelos definidos no projeto dbt de demonstração.dbt test
Agora você implantou um projeto dbt no Synapse Data Warehouse no Fabric.
Deslocar-se entre armazéns diferentes
É simples mover o projeto dbt entre diferentes armazéns. Um projeto dbt em qualquer armazém suportado pode ser migrado rapidamente com este processo de três etapas:
Instale o novo adaptador. Para obter mais informações e instruções de instalação completas, consulte dbt adapters.
Atualize a
type
profiles.yml
propriedade no arquivo.Compilar o projeto.
Considerações
Coisas importantes a considerar ao usar o adaptador dbt-fabric:
Analise as limitações atuais no armazenamento de dados do Microsoft Fabric.
O Fabric dá suporte à autenticação Microsoft Entra ID (anteriormente Azure Ative Directory) para entidades de usuário, identidades de usuário e entidades de serviço. O modo de autenticação recomendado para trabalhar interativamente no armazém é CLI (interfaces de linha de comando) e usar entidades de serviço para automação.
Analise os comandos T-SQL (Transact-SQL) não suportados no Synapse Data Warehouse no Microsoft Fabric.
Alguns comandos T-SQL são suportados pelo adaptador dbt-fabric usando
Create Table as Select
(CTAS),DROP
eCREATE
comandos, comoALTER TABLE ADD/ALTER/DROP COLUMN
,MERGE
, ,TRUNCATE
sp_rename
.Reveja os tipos de dados sem suporte para saber mais sobre os tipos de dados suportados e não suportados.
Você pode registrar problemas no adaptador dbt-fabric visitando Problemas · microsoft/dbt-fabric · GitHub.
Conteúdos relacionados
Comentários
https://aka.ms/ContentUserFeedback.
Brevemente: Ao longo de 2024, vamos descontinuar progressivamente o GitHub Issues como mecanismo de feedback para conteúdos e substituí-lo por um novo sistema de feedback. Para obter mais informações, veja:Submeter e ver comentários