Melhores práticas de modelos semânticos para agente de dados

O agente de dados Fabric permite às organizações construir sistemas conversacionais utilizando IA generativa. Ao ligar modelos semânticos do Power BI como fontes de dados, as equipas podem colocar questões em linguagem natural e obter respostas precisas e ricas em contexto sem recorrer a consultas complexas de DAX ou SQL.

No entanto, a qualidade das respostas de IA depende muito de quão bem preparas as tuas fontes de dados. Embora o agente de dados Fabric suporte múltiplos tipos de fontes de dados, incluindo lakehouses, armazéns, casas de eventos e ontologias, este guia foca-se especificamente em modelos semânticos do Power BI e apresenta as melhores práticas para os configurar de modo a maximizar a precisão e relevância.

Como funciona o agente de dados do Fabric

O agente de dados utiliza uma arquitetura em camadas onde as perguntas dos utilizadores fluem através de um Orchestrator. O Orchestrator determina a fonte de dados apropriada e invoca ferramentas especializadas, incluindo a ferramenta de geração DAX para modelos semânticos Power BI, para gerar, validar e executar consultas.

O fluxo de processamento de consultas

Análise de Perguntas: O agente processa as perguntas dos utilizadores através do Azure OpenAI, garantindo o cumprimento dos protocolos e permissões de segurança e respeitando os princípios da Microsoft Responsible AI.
Seleção da Fonte de Dados: O sistema avalia a questão com base nas fontes disponíveis usando a informação do esquema e as instruções de IA que fornece.
Geração de Consultas: Para modelos semânticos, a ferramenta de geração DAX gera consultas DAX com base no esquema, metadados (sinónimos, valores mínimos e máximos das colunas numéricas, metadados visuais do relatório e mais), contexto configurado em Prep data para IA e o histórico de conversas.
Formatação da Resposta: O formato do agente resulta em respostas legíveis por humanos, com tabelas, resumos ou insights baseados nas instruções do agente.

Preparar para IA: Tornar o modelo semântico pronto para IA

A funcionalidade Prep for AI do Power BI fornece três componentes de configuração que impactam diretamente a forma como o agente de dados Fabric interpreta o seu modelo semântico. Pode aceder a estes componentes tanto no Power BI Desktop como no serviço Power BI. O Power BI Copilot também utiliza configurações Prep for AI, por isso investir tempo na configuração beneficia tanto o Copilot como as respostas do agente de dados.

Importante

Ao consultar modelos semânticos, a ferramenta de geração DAX usada pelo agente de dados baseia-se exclusivamente nos metadados do modelo semântico e nas configurações de preparação para IA. A ferramenta de geração DAX ignora quaisquer instruções que adiciones ao nível do agente de dados para geração de consultas DAX. Uma preparação adequada para a configuração da IA é essencial para obter resultados precisos.

Esquemas de dados de IA

Os esquemas de dados de IA permitem-lhe definir um subconjunto focado do seu modelo para a priorização de IA. Embora o data agent também tenha a sua própria seleção de tabela ao adicionar um modelo semântico como fonte de dados, configure primeiro o seu esquema em Prep for AI. A ferramenta de geração DAX utiliza este esquema para criar consultas DAX.

Pode configurar este esquema no Power BI Desktop ou no serviço Power BI selecionando Prep data for AI na fita Home. Depois, navegue até ao separador Simplificar esquema de dados . A partir daí, selecione que tabelas, colunas e medidas a IA deve usar ao gerar respostas. Para instruções detalhadas de configuração, veja Definir um esquema de dados de IA.

Quando adicionar o modelo semântico ao agente de dados, selecione as mesmas tabelas que definiu no Prep for AI para garantir um comportamento consistente. Primeiro, defina o âmbito do seu agente de dados (os tipos de perguntas que deve responder). Depois, selecione apenas os objetos relevantes. Esta abordagem reduz a ambiguidade, melhora a precisão e reduz a latência de resposta.

A ferramenta de geração DAX baseia-se nos metadados do seu modelo para interpretar as perguntas. Use nomes claros e favoráveis para o negócio em tabelas, colunas e medidas que reflitam a forma como os utilizadores se referem naturalmente aos dados. Por exemplo, use 'Receita Total' em vez de 'TR_AMT' ou 'Região de Vendas' em vez de 'DIM_GEO_01'. Esta orientação é especialmente importante para modelos grandes com campos sobrepostos ou com nomes semelhantes, onde nomes ambíguos podem levar à geração incorreta de consultas.

Exemplo: Resolver ambiguidade de campos

Sem Esquema de Dados de IA	Utilizando o Esquema de Dados de IA
Um utilizador pergunta: `"What were our sales last quarter?"` O modelo semântico contém múltiplas medidas relacionadas com vendas: Receita Total, Vendas Brutas, Vendas Líquidas e Vendas Após Devoluções. A IA devolve as Vendas Brutas, mas a tua equipa normalmente usa as Vendas Líquidas para relatórios trimestrais.	Depois de configurar o esquema de dados de IA para incluir apenas Vendas Líquidas e excluir as outras medidas que não são relevantes, a mesma pergunta agora devolve a métrica esperada. A IA já não tem de adivinhar qual medida de "vendas" o utilizador pretendia.

Dicas para esquemas de dados de IA

Para resultados consistentes e precisos, certifique-se de selecionar as mesmas tabelas no agente de dados Fabric que também são definidas através dos Esquemas de Dados de IA em Prep for AI.
Ao selecionar o esquema, inclua também objetos dependentes. Por exemplo, se uma medida de Receita Total referenciar duas outras medidas que dependem de colunas adicionais, inclua todos esses objetos dependentes no seu esquema. Para identificar dependências, utilize a função get_measure_dependencies da biblioteca Semantic Link Labs .
Se tiver um modelo semântico grande, renomear todos os objetos manualmente pode ser aborrecido. Use o servidor MCP Power BI Modeling para que um LLM gere nomes amigáveis para o negócio para as suas tabelas, colunas e medidas. Revise e valide as alterações antes de guardar para garantir que não quebram expressões DAX, relações ou outros objetos dependentes.

Respostas verificadas

As respostas verificadas são respostas visuais aprovadas pelo utilizador que perguntas específicas desencadeiam. Fornecem respostas consistentes e fiáveis a perguntas comuns ou complexas que, de outra forma, poderiam ser mal interpretadas. Como armazenas respostas verificadas ao nível do modelo semântico (não ao nível do relatório), elas funcionam com qualquer agente de dados que use o mesmo modelo. Para mais informações, consulte Prepare os Seus Dados para IA – Respostas verificadas.

Quando usas respostas verificadas com data agent, o sistema não devolve o visual do Power BI em si. Em vez disso, utiliza as perguntas do utilizador e as propriedades do visual (colunas, medidas, filtros) para influenciar a geração de consultas DAX. Esta abordagem significa que as respostas verificadas melhoram a precisão das respostas ao orientar a ferramenta de geração DAX para a estrutura correta de consultas. Quando um utilizador faz uma pergunta ao agente de dados, o sistema verifica primeiro uma correspondência exata ou semanticamente semelhante ao seu prompt definido na resposta verificada antes de gerar uma nova resposta.

Exemplo: Lidar com terminologia regional

Sem Resposta Verificada Com Resposta Verificada

Um utilizador pergunta: "Show me performance by territory" A IA interpreta "território" como categoria de produto porque existe uma coluna Território na tabela de Produtos. O utilizador referia-se, na verdade, a regiões de vendas. Cria uma resposta verificada usando um visual de vendas regional com perguntas gatilho como "What is the sales performance by territory?", "Mostre-me vendas divididas por território" e "Como são distribuídas as vendas por regiões?" Agora, quando os utilizadores perguntam sobre o desempenho do território, obtêm consistentemente respostas precisas baseadas nos objetos usados no visual de vendas regionais.

Sem Resposta Verificada	Com Resposta Verificada
Um utilizador pergunta: `"Show me performance by territory"` A IA interpreta "território" como categoria de produto porque existe uma coluna Território na tabela de Produtos. O utilizador referia-se, na verdade, a regiões de vendas.	Cria uma resposta verificada usando um visual de vendas regional com perguntas gatilho como `"What is the sales performance by territory?"`, "Mostre-me vendas divididas por território" e "Como são distribuídas as vendas por regiões?" Agora, quando os utilizadores perguntam sobre o desempenho do território, obtêm consistentemente respostas precisas baseadas nos objetos usados no visual de vendas regionais.

Dicas de configuração para respostas verificadas

Use cinco a sete perguntas gatilho por resposta verificada para abranger variações naturais.
Inclua tanto frases formais como conversacionais que os utilizadores possam tentar.
Configure até três filtros para fatiação flexível sem criar múltiplas respostas verificadas.
Se renomear quaisquer tabelas, colunas ou medidas referenciadas numa resposta verificada, atualize a resposta verificada e guarde-a novamente para que as alterações entrem em vigor.

Instruções de IA

As instruções de IA em Prep for AI fornecem contexto, lógica de negócio e orientação diretamente sobre o modelo semântico. Ajudam a clarificar a terminologia, orientam abordagens de análise e fornecem contexto empresarial e semântico crítico que a IA não compreenderia de outra forma.

Pode configurar estas instruções no Power BI Desktop ou no serviço Power BI selecionando Preparar dados para IA na fita Home, e depois navegar até ao separador Adicionar instruções de IA . Para instruções detalhadas de configuração, consulte a documentação das Instruções de IA.

As instruções de IA são orientações não estruturadas que o LLM interpreta, mas não há garantia de que as siga exatamente. Instruções claras e específicas são mais eficazes do que as complexas ou contraditórias.

Como mencionado anteriormente, a ferramenta de geração DAX refere-se apenas às instruções de IA configuradas em Prep for AI do modelo semântico. As instruções do agente de dados não são passadas para a ferramenta e são ignoradas ao consultar modelos semânticos. Por esta razão, não adicione instruções específicas do modelo semântico ao nível do agente de dados. Em vez disso, mantenha todas as instruções semânticas do modelo em Prep for AI, onde a ferramenta de geração DAX as possa usar. As instruções do agente de dados devem incluir apenas orientações que se apliquem a todas as fontes de dados configuradas no agente, como preferências gerais de formatação de respostas, regras de encaminhamento entre fontes, abreviaturas comuns, tom, e assim por diante. Note também que, ao contrário de outras fontes de dados, o data agent não suporta instruções ou descrições de fontes de dados para modelos semânticos.

Exemplo: Definição da terminologia empresarial

Sem Instruções de IA	Com instruções de IA
Um utilizador pergunta: "Quem foram os melhores desempenhos no mês passado?" A IA não percebe o que significa "top performer" na sua organização e devolve um erro ou pede esclarecimentos.	Acrescenta uma instrução: "Um dos melhores desempenhos é um representante de vendas que atinge 110% ou mais da sua quota mensal. Use a tabela Rep_Performance e filtre onde Quota_Attainment >= 1,1". Agora a IA interpreta corretamente a pergunta e devolve os resultados corretos.

Padrões de instrução eficazes

Definições de Períodos de Tempo: "A época alta vai de novembro a janeiro. A época baixa é de fevereiro a abril."
Preferências de Métricas: "Quando os utilizadores perguntarem sobre rentabilidade, usem a medida Contribution_Margin, não a Gross_Profit."
Encaminhamento da Fonte de Dados: "Para perguntas de inventário, prioriza a tabela de Warehouse_Inventory em vez de Sales_Orders."
Agrupamentos padrão: "Salvo indicação em contrário, analise receitas por trimestre fiscal em vez de mês civil."

Para além do Prep for AI, a ferramenta de geração de consultas DAX também utiliza metadados dos visuais do relatório, como título visual, colunas, medidas, filtros, entre outros, para melhorar a precisão das consultas.

Fluxo de trabalho recomendado para implementação

Otimize o Modelo Semântico: Começa por otimizar o teu modelo semântico para desempenho. O fraco desempenho dos agentes de dados resulta frequentemente de um modelo semântico mal concebido, medidas DAX ineficientes ou uma mistura dos dois. Quando um utilizador faz uma pergunta, o agente de dados gera uma consulta DAX e executa-a contra o seu modelo. Um modelo bem otimizado consome menos recursos e alcança uma execução de consulta mais rápida. Numa interface conversacional, os utilizadores esperam respostas rápidas, pelo que o desempenho lento impacta diretamente a experiência e adoção do utilizador.

Além disso, um modelo inchado com colunas, tabelas e medidas desnecessárias cria mais ruído para a ferramenta de geração DAX analisar, o que pode reduzir a precisão da resposta. Ao otimizar o seu modelo cedo, também previne problemas de desempenho à medida que os dados crescem e o modelo se torna mais complexo. Pode aprender mais no curso Otimizar um modelo para desempenho no Power BI .

Use o Best Practice Analyzer e o Semantic Model Memory Analyzer num caderno Fabric para identificar problemas como tipos de dados incorretos, colunas desnecessárias, colunas de alta cardinalidade e padrões DAX ineficientes. Adicione descrições a tabelas, colunas e medidas para ajudar o LLM a compreender o propósito de cada objeto incluído no esquema de dados de IA.
Defina Preparação para IA > Esquema de Dados de IA: Com base no âmbito do seu agente de dados, configure o esquema de dados de IA em Prep for AI selecionando apenas as tabelas, colunas e medidas relevantes para as perguntas que o seu agente deve responder.
Criar Preparação para IA > Respostas Verificadas: Identifique as suas perguntas mais comuns e configure respostas verificadas no Prep for AI usando visuais apropriados. Use perguntas completas e robustas como gatilhos (não frases parciais) para aumentar a precisão do emparelhamento.
Adicionar Modelo Semântico ao agente de dados: Antes de adicionar instruções de IA em Prep for AI, teste e valide as respostas do agente de dados. Este passo ajuda-o a perceber onde são necessárias instruções de IA para melhorar a geração de consultas DAX.
Adicionar preparação para IA > Instruções de IA: Com base nas suas verificações de validação, defina terminologia de negócio, preferências de análise e prioridades de fontes de dados em Prep for AI instruções (não nas instruções do agente de dados).
Prepara visuais do relatório: Revê relatórios ligados ao modelo semântico, incluindo visuais e páginas ocultas, para garantir que os visuais têm títulos descritivos. Visuais bem estruturados ajudam a IA a fundamentar as respostas usando metadados visuais como título visual, tabela, coluna, medidas usadas, filtros aplicados e muito mais.
Verificar e testar DAX: A precisão da resposta depende da consulta DAX gerada. Ao testar o seu agente de dados, reveja a consulta DAX em cada resposta para verificar se é válida e responde corretamente à questão. Se os resultados estiverem incorretos, analise o DAX para identificar quais as configurações (modelo semântico, esquema de dados de IA, respostas verificadas ou instruções de IA) que precisam de ser ajustadas.
Configurar Instruções do agente de dados: Adicione instruções apenas ao nível do agente de dados para orientações que se apliquem a todas as fontes de dados configuradas no agente. Esta orientação inclui preferências gerais de formatação de respostas, regras de encaminhamento entre fontes, abreviaturas comuns e tom. Não adiciones aqui instruções semânticas específicas do modelo, pois não são passadas para a ferramenta de geração DAX. Para orientações sobre a configuração das instruções do agente, consulte as diretrizes de configuração.
Validar e Iterar: Os LLMs podem produzir resultados incorretos sem o devido contexto. Itere continuamente na sua configuração e valide as respostas para construir confiança no seu agente de dados. Para avaliar as respostas de forma programática, pode usar o SDK Python do agente de dados Fabric para executar avaliações automáticas contra pares pergunta-resposta de verdade e analisar métricas de precisão. Note que o SDK é apenas para avaliação neste caso e não pode modificar a preparação do modelo semântico para configurações de IA. Para mais detalhes, consulte Avaliar o seu agente de dados. Além disso, envolva as partes interessadas e os utilizadores finais no processo de avaliação. O seu feedback garante que as respostas estão alinhadas com as expectativas e a usabilidade do mundo real, ajudando-o a identificar lacunas que as verificações automáticas possam ignorar.
Implementar Pipelines de Controlo de Versões e Implementação: Utilize pipelines de integração e implementação do Git para gerir as configurações dos seus agentes de dados em espaços de trabalho de desenvolvimento, teste e produção. Esta prática assegura que as alterações de configuração são testadas e validadas antes de serem promovidas para produção, onde os utilizadores finais as acederem. Para mais detalhes, consulte Controlo de Fonte, CI/CD e ALM para o agente de dados Fabric.

Sugestão

Pode usar recursos no repositório fabric-toolbox como referência para ajudar neste fluxo de trabalho. Este repositório contém:

Lista de verificação para preparar e configurar um modelo semântico como fonte de dados
dataagent Utilities notebook com excertos de código úteis e funções auxiliares

Armadilhas comuns a evitar

Não usar o esquema estrela: Modelos semânticos que utilizam tabelas planas e desnormalizadas ou estruturas de dados pivotadas tornam o DAX menos eficiente e mais difícil de escrever corretamente. O DAX está otimizado para o esquema estrela, com tabelas de factos e dimensões bem definidas. Despivotar tabelas largas para estruturas normalizadas onde cada linha representa uma única observação.
Baseando-se em campos ocultos: Respostas verificadas não funcionam se referenciarem colunas ocultas no modelo.
Incluindo medidas desnecessárias: Os modelos semânticos frequentemente contêm medidas auxiliares e objetos intermédios usados para melhorar a interatividade dos relatórios. Ao configurar o seu esquema de dados de IA, inclua apenas as medidas que calculam métricas reais de negócio. Excluir medidas auxiliares reduz o ruído e ajuda a ferramenta de geração DAX a gerar consultas mais precisas.
Medidas duplicadas ou sobrepostas: Múltiplas medidas que calculam métricas semelhantes (por exemplo, Vendas Totais, Montante das Vendas, Receita) criam ambiguidade. Consolide ou diferencie claramente as medidas e exclua duplicados do seu esquema de dados de IA.
Nomeação não descritiva: Nomes de objetos como TR_AMT, F_SLS ou DIM_GEO_01 não fornecem contexto para a ferramenta de geração DAX. Use nomes claros e favoráveis ao negócio, como Receita Total, Vendas ou Geografia do Cliente. Se não puder renomear objetos, certifique-se de que descrições e sinónimos fornecem o contexto necessário para a IA compreender o seu propósito.
Baseando-se em medidas implícitas: Medidas implícitas podem conduzir a resultados imprevisíveis. Crie medidas DAX explícitas para os cálculos que quer que os utilizadores consultem, e defina a sumarização padrão correta (Soma, Média, Nenhuma, e assim sucessivamente) nas colunas numéricas para evitar agregações não intencionais.
Campos de data ambíguos: Várias colunas de data (Data da Encomenda, Data de Envio, Data de Vencimento, Trimestre Civil/Trimestre do Ano Fiscal, e assim por diante) sem orientações claras confundem a IA. Utilize Respostas Verificadas e instruções de IA na Prep for AI para especificar qual campo de data usar como padrão ou para tipos específicos de perguntas.
Instruções contraditórias: Instruções de IA que contradizem configurações de Respostas Verificadas criam comportamentos imprevisíveis.
Saltar o refinamento do esquema: Modelos grandes com muitos campos com nomes semelhantes precisam de esquemas de dados de IA focados.
Instruções demasiado complexas: Mantém as instruções focadas e específicas. A IA interpreta, mas não garante, seguir orientações complexas e contraditórias. Instruções complexas também podem aumentar a latência.

Tools

Para seguir estas orientações, pode usar as ferramentas abaixo do repositório GitHub do fabric-toolbox:

Lista de verificação com recomendações. Estas são orientações e nem todos os itens da lista de verificação podem ser aplicáveis ao seu caso.
Caderno com uma coleção de utilidades num só lugar.
Power BI MCP Server para acelerar o desenvolvimento e testes no VS Code
Semantic Link Labs biblioteca para atualizar programaticamente o modelo semântico no Notebook do Fabric.

Recursos adicionais

Comentários

Esta página foi útil?

Last updated on 2026-01-23