Compartilhar via


Conceitos do agente de dados do Fabric (versão prévia)

O agente de dados no Microsoft Fabric é um novo recurso do Microsoft Fabric que permite criar seus próprios sistemas de Q&A de conversa usando IA generativa. Um agente de dados do Fabric torna os insights de dados mais acessíveis e acionáveis para todos em sua organização. Com um agente de dados do Fabric, sua equipe pode ter conversas, com perguntas simples em inglês, sobre os dados que sua organização armazenou no Fabric OneLake e, em seguida, receber respostas relevantes. Dessa forma, mesmo pessoas sem experiência técnica em IA ou uma compreensão profunda da estrutura de dados podem receber respostas precisas e com contexto.

Você também pode adicionar instruções, exemplos e diretrizes específicos da organização para ajustar o agente de dados do Fabric. Isso garante que as respostas se alinhem às necessidades e às metas da sua organização, permitindo que todos se envolvam com os dados de forma mais eficaz. O agente de dados do Fabric promove uma cultura de tomada de decisão controlada por dados porque reduz as barreiras à acessibilidade de insights, facilita a colaboração e ajuda a sua organização a extrair mais valor de seus dados.

Importante

Esse recurso está na versão prévia.

Pré-requisitos

Como funciona o agente de dados do Fabric

O agente de dados do Fabric usa grandes modelos de linguagem (LLMs) para ajudar os usuários a interagir com os seus dados naturalmente. O agente de dados do Fabric aplica APIs do Assistente do OpenAI do Azure e se comporta como um agente. Ele processa perguntas do usuário, determina a fonte de dados mais relevante (lakehouse, warehouse, conjunto de dados do Power BI, bancos de dados KQL) e invoca a ferramenta apropriada para gerar, validar e executar consultas. Os usuários podem fazer perguntas em linguagem simples e receber respostas estruturadas e legíveis por humanos, eliminando a necessidade de escrever consultas complexas e garantindo acesso preciso e seguro aos dados.

Veja como funciona em detalhes:

Análise de perguntas e validação: o agente de dados do Fabric aplica as APIs do Assistente do Azure OpenAI como o agente subjacente para processar perguntas do usuário. Esta abordagem garante que a questão esteja em conformidade com protocolos de segurança, políticas de IA responsável (RAI) e permissões de usuário. O agente de dados do Fabric impõe estritamente o acesso somente leitura, mantendo conexões de dados somente leitura para todas as fontes de dados.

Identificação da fonte de dados: o agente de dados do Fabric usa as credenciais do usuário para acessar o esquema da fonte de dados. Isso garante que o sistema busque informações de estrutura de dados que o usuário tenha permissão para exibir. Em seguida, ele avalia a pergunta do usuário em relação a todas as fontes de dados disponíveis, incluindo bancos de dados relacionais (lakehouse e warehouse), conjuntos de dados do Power BI (modelos semânticos) e bancos de dados KQL. Ele também pode fazer referência às instruções do agente de dados fornecidas pelo usuário para determinar a fonte de dados mais relevante.

Invocação de ferramentas e geração de consultas: depois que a fonte ou fontes corretas são identificadas, o agente de dados do Fabric reformula a questão para aumentar a clareza e estrutura e invoca a ferramenta correspondente para gerar uma consulta estruturada:

  • Linguagem natural para SQL (NL2SQL) para bancos de dados relacionais (lakehouse/warehouse).
  • Linguagem natural para DAX (NL2DAX) para conjuntos de dados do Power BI (modelos semânticos).
  • Linguagem natural para KQL (NL2KQL) para bancos de dados KQL.

A ferramenta selecionada gera uma consulta com base no esquema, nos metadados e no contexto fornecidos que o agente subjacente ao agente de dados do Fabric então passa.

Validação de consulta: a ferramenta executa a validação para garantir que a consulta seja formada corretamente e siga os seus próprios protocolos de segurança e políticas RAI.

Execução de consultas e respostas: depois de validado, o agente de dados do Fabric executa a consulta na fonte de dados escolhida. Os resultados são formatados em uma resposta legível por humanos, que pode incluir dados estruturados, como tabelas, resumos ou insights importantes.

Essa abordagem garante que os usuários possam interagir com os seus dados usando linguagem natural, enquanto o agente de dados do Fabric lida com as complexidades de geração, validação e execução de consultas, tudo sem exigir que os usuários escrevam SQL, DAX ou KQL.

Configuração do agente de dados do Fabric

Configurar um agente de dados do Fabric é semelhante à criação de um relatório do Power BI — você começa projetando e refinando-o para garantir que ele atenda às suas necessidades e, em seguida, você o publica e compartilha com colegas para que eles possam interagir com os dados. A configuração de um agente de dados do Fabric envolve:

Selecionar fontes de dados: um agente de dados do Fabric dá suporte a até cinco fontes de dados em qualquer combinação, incluindo lakehouses, warehouses, bancos de dados KQL e modelos semânticos do Power BI. Por exemplo, um agente de dados do Fabric configurado pode incluir cinco modelos semânticos do Power BI. Ele pode incluir uma combinação de dois modelos semânticos do Power BI, um lakehouse e um banco de dados KQL. Você tem muitas opções disponíveis.

Escolher tabelas relevantes: depois de selecionar as fontes de dados, você precisará adicioná-las uma de cada vez e definir as tabelas específicas de cada fonte que serão usadas pelo agente de dados do Fabric. Esta etapa garante que o agente de dados do Fabric recupere resultados precisos concentrando-se apenas em dados relevantes.

Adicionar contexto: para melhorar a precisão do agente de dados do Fabric, você pode fornecer mais contexto por meio de instruções do agente de dados do Fabric e consultas de exemplo. Como o agente subjacente do agente de dados do Fabric, o contexto ajuda a API do Assistente do OpenAI do Azure a tomar decisões mais informadas sobre como processar perguntas do usuário e determinar qual fonte de dados é mais adequada para respondê-las.

  • Instruções do agente de dados: você pode adicionar instruções para orientar o agente que está por trás do agente de dados do Fabric, na determinação da melhor fonte de dados para responder a tipos específicos de perguntas. Você também pode fornecer regras ou definições personalizadas que esclarecem a terminologia organizacional ou requisitos específicos. Essas instruções podem fornecer mais contexto ou preferências que influenciam como o agente seleciona e consulta fontes de dados.

    • Perguntas diretas sobre métricas financeiras para um modelo semântico do Power BI.
    • Atribua consultas que envolvem exploração de dados brutos ao lakehouse.
    • Encaminhe perguntas que exigem análise de log para o banco de dados KQL.
  • Consultas de exemplo: você pode adicionar pares de consulta-pergunta de exemplo para ilustrar como o agente de dados do Fabric deve responder a consultas comuns. Esses exemplos servem como um guia para o agente, que o ajuda a entender como interpretar perguntas semelhantes e gerar respostas precisas.

Observação

No momento, não há suporte para a adição de pares de consulta/pergunta de exemplo para fontes de dados de modelo semântico do Power BI.

Combinando instruções de IA claras e consultas de exemplo relevantes, você pode alinhar melhor o agente de dados do Fabric com as necessidades de dados da sua organização, garantindo respostas mais precisas e com reconhecimento de contexto.

Diferença entre um agente de dados do Fabric e um copiloto

Embora os agentes de dados do Fabric e os co-pilotos do Fabric usem IA generativa para processar e raciocinar dados, há diferenças importantes em suas funcionalidades e casos de uso:

Flexibilidade de configuração: os agentes de dados do Fabric são altamente configuráveis. Você pode fornecer instruções e exemplos personalizados para adaptar o seu comportamento a cenários específicos. Os copilotos do Fabric, por outro lado, são pré-configurados e não oferecem esse nível de personalização.

Escopo e caso de uso: os copilotos do Fabric são projetados para ajudar com tarefas no Microsoft Fabric, como geração de código de notebook ou consultas de warehouse. Os agentes de dados do Fabric, por outro lado, são artefatos autônomos. Para tornar os agentes de dados do Fabric mais versáteis para casos de uso mais amplos, eles podem se integrar a sistemas externos como o Microsoft Copilot Studio, a Fábrica de IA do Azure, o Microsoft Teams ou outras ferramentas fora do Fabric.

Avaliação do agente de dados do Fabric

A qualidade e a segurança das respostas do agente de dados do Fabric passaram por uma avaliação rigorosa:

Teste de comparação: a equipe de produtos testou agentes de dados do Fabric em uma variedade de conjuntos de dados públicos e privados para garantir respostas precisas e de alta qualidade.

Mitigações de danos aprimoradas: há mais proteções em vigor para garantir que as saídas do agente de dados do Fabric permaneçam focadas no contexto de fontes de dados selecionadas, para reduzir o risco de respostas irrelevantes ou enganosas.

Limitações

O agente de dados do Fabric está atualmente em versão prévia pública e tem limitações. As atualizações melhorarão o agente de dados do Fabric ao longo do tempo.

  • O agente de dados do Fabric pode recuperar dados gerando consultas estruturadas (SQL, DAX ou KQL) para perguntas que envolvam fatos, totais, classificações ou filtros. No entanto, ele não pode interpretar tendências, fornecer explicações ou analisar causas subjacentes.
  • O agente de dados do Fabric gera apenas consultas de "leitura" de SQL/DAX/KQL. Ele não gera consultas SQL/DAX/KQL que criam, atualizam ou excluem dados.
  • O agente de dados do Fabric só pode acessar os dados fornecidos por você. Ela usa apenas as configurações de recursos de dados que você fornece.
  • O agente de dados do Fabric tem permissões de acesso a dados que correspondem às permissões concedidas ao usuário que interage com o agente de dados do Fabric. Isso é verdade quando o agente de dados do Fabric é publicado em outros locais, por exemplo, Microsoft Copilot Studio, Fábrica de IA do Azure e Microsoft Teams.
  • Você não pode adicionar mais de cinco fontes de dados ao agente de dados do Fabric.
  • Você não pode usar o agente de dados do Fabric para acessar recursos de dados não estruturados. Esses recursos incluem arquivos .pdf, .docx ou .txt, por exemplo.
  • O agente de dados do Fabric bloqueia perguntas ou instruções que não estejam no idioma inglês.
  • Você não pode alterar o LLM usado pelo agente de dados do Fabric.
  • Você não poderá adicionar um banco de dados KQL como uma fonte de dados se ele tiver mais de 1.000 tabelas ou alguma tabela com mais de 100 colunas.
  • Você não poderá adicionar um modelo semântico do Power BI como uma fonte de dados se ele contiver mais de um total de 100 colunas e medidas.
  • O agente de dados do Fabric funciona melhor com 25 ou menos tabelas selecionadas em todas as fontes de dados.
  • Os nomes de tabela e coluna de recurso de dados não descritivos têm um impacto significativo e negativo na qualidade da consulta SQL/DAX/KQL gerada. Recomenda-se o uso de nomes descritivos.
  • O uso de muitas colunas e tabelas pode reduzir o desempenho do agente de dados do Fabric.
  • O agente de dados do Fabric foi projetado no momento para lidar com consultas simples. Consultas complexas que exigem muitas junções ou lógica sofisticada tendem a ter menor confiabilidade.
  • Se você adicionar um modelo semântico do Power BI como uma fonte de dados, o agente de dados do Fabric não usará tabelas, colunas ou medidas ocultas.
  • Se você criou anteriormente um agente de dados do Fabric que usava um warehouse como fonte de dados e o warehouse estava localizado em um workspace que não hospeda esse agente de dados do Fabric, talvez ocorra um erro. Para resolver esse problema, exclua a fonte de dados existente e adicione-a novamente.
  • Para adicionar um modelo semântico do Power BI como uma fonte de dados para o agente de dados do Fabric, você precisa de permissões de leitura/gravação para esse modelo semântico do Power BI. Consultar um agente de dados do Fabric que usa um modelo semântico do Power BI também exige que você tenha permissões de leitura/gravação para o modelo semântico subjacente do Power BI.
  • O agente de dados do Fabric pode retornar respostas incorretas. Você deve testar o agente de dados do Fabric com seus colegas para verificar se ele responde às perguntas conforme o esperado. Se ela cometer erros, forneça mais exemplos e instruções.
  • Se você criou e publicou anteriormente um agente de dados do Fabric e usou a sua URL programaticamente, a URL não funcionará mais se você abrir o agente de dados do Fabric na nova página de interface do usuário do agente de dados do Fabric. Para resolver isso, você deve republicar o agente de dados do Fabric e usar a nova URL com base na API de Assistentes.