Procedimientos recomendados del modelo semántico para el agente de datos

El agente de datos de Fabric permite a las organizaciones crear sistemas conversacionales mediante inteligencia artificial generativa. Al conectar modelos semánticos de Power BI como orígenes de datos, los equipos pueden formular preguntas de lenguaje natural y recibir respuestas precisas y enriquecidas en contexto sin escribir consultas DE DAX o SQL complejas.

Sin embargo, la calidad de las respuestas de inteligencia artificial depende en gran medida de la preparación de los orígenes de datos. Aunque el agente de datos de Fabric admite varios tipos de origen de datos, como lakehouses, almacenes, centros de eventos y ontologías, esta guía se centra específicamente en los modelos semánticos de Power BI y le guía por los procedimientos recomendados para configurarlos para maximizar la precisión y la relevancia.

Funcionamiento del agente de datos de Fabric

El agente de datos usa una arquitectura superpuesta en la que las preguntas del usuario fluyen a través de un orquestador. Orchestrator determina el origen de datos adecuado e invoca herramientas especializadas, incluida la herramienta de generación DAX para los modelos semánticos de Power BI para generar, validar y ejecutar consultas.

Flujo de procesamiento de consultas

  1. Análisis de preguntas: El agente procesa preguntas de usuario a través de Azure OpenAI, lo que garantiza el cumplimiento de los protocolos de seguridad y los permisos y se adhiere a los principios de inteligencia artificial responsable de Microsoft.

  2. Selección del origen de datos: El sistema evalúa la pregunta con respecto a los orígenes disponibles mediante la información de esquema y las instrucciones de IA que proporcione.

  3. Generación de consultas: En el caso de los modelos semánticos, la herramienta de generación DAX genera consultas DAX basadas en esquemas, metadatos (sinónimos, mínimos y máximos de columnas numéricas, metadatos visuales de informe, etc.), contexto configurado en Prep data for AI y el historial de conversaciones.

  4. Formato de respuesta: El agente da formato a los resultados en respuestas legibles humanas con tablas, resúmenes o conclusiones basadas en las instrucciones del agente.

Flujo de procesamiento de consultas que muestra entradas a daX Generation: consulta, metadatos visuales de informes, instrucciones de IA, respuestas comprobadas y esquema de datos de IA.

Preparación para la IA: Hacer que el modelo semántico sea compatible con IA

La característica Prep for AI de Power BI proporciona tres componentes de configuración que afectan directamente a cómo el agente de datos de Fabric interpreta el modelo semántico. Puede acceder a estos componentes tanto en Power BI Desktop como en el servicio Power BI. Power BI Copilot también utiliza configuraciones de preparación para IA, por lo que invertir tiempo en configurarlas beneficia tanto a Copilot como a las respuestas del agente de datos.

Importante

Al consultar modelos semánticos, la herramienta de generación DAX usada por el agente de datos se basa únicamente en los metadatos del modelo semántico y en las configuraciones de preparación para inteligencia artificial. La herramienta de generación DAX omite las instrucciones que agregue en el nivel del agente de datos para la generación de consultas DAX. La preparación adecuada para la configuración de IA es esencial para obtener resultados precisos.

Esquemas de datos de IA

Los esquemas de datos de IA permiten definir un subconjunto centrado de su modelo para la priorización de IA. Aunque el agente de datos también tiene su propia selección de tabla al agregar un modelo semántico como origen de datos, configure el esquema en Prep for AI primero. La herramienta de generación DAX usa este esquema para crear consultas DAX.

Para configurar este esquema en Power BI Desktop o en el servicio Power BI, seleccione Prep data for AI (Preparar datos para ia ) en la cinta Inicio. A continuación, vaya a la pestaña Simplificar esquema de datos . Desde allí, seleccione qué tablas, columnas y medidas debe usar la inteligencia artificial al generar respuestas. Para obtener instrucciones detalladas sobre la configuración, consulte Establecimiento de un esquema de datos de IA.

Captura de pantalla de Preparación de datos para ia que muestra el panel Simplificar el esquema de datos con tablas y columnas seleccionadas para el análisis de IA.

Al agregar el modelo semántico al agente de datos, seleccione las mismas tablas que definió en Prep for AI para garantizar un comportamiento coherente. En primer lugar, defina el ámbito del agente de datos (los tipos de preguntas que debe responder). A continuación, seleccione solo los objetos pertinentes. Este enfoque reduce la ambigüedad, mejora la precisión y reduce la latencia de respuesta.

La herramienta de generación DAX se basa en los metadatos del modelo para interpretar preguntas. Use nombres claros y descriptivos para las tablas, columnas y medidas que reflejen cómo los usuarios hacen referencia de forma natural a los datos. Por ejemplo, use "Ingresos totales" en lugar de "TR_AMT" o "Región de ventas" en lugar de "DIM_GEO_01". Esta guía es especialmente importante para los modelos grandes con campos superpuestos o con nombre similar, donde los nombres ambiguos pueden dar lugar a una generación de consultas incorrecta.

Ejemplo: Resolución de ambigüedad de campo
Sin esquema de datos de IA Con el esquema de datos de IA
Un usuario pregunta: "What were our sales last quarter?" el modelo semántico contiene varias medidas relacionadas con las ventas: Ingresos totales, Ventas brutas, Ventas netas y Ventas después de las devoluciones. La inteligencia artificial devuelve ventas brutas, pero el equipo normalmente usa ventas netas para los informes trimestrales. Después de configurar el esquema de datos de IA para incluir solo Ventas netas y excluir las demás medidas que no son pertinentes, la misma pregunta ahora devuelve la métrica esperada. La inteligencia artificial ya no tiene que adivinar qué medida de "ventas" pretendía el usuario.

Sugerencias para esquemas de datos de IA

  • Para obtener resultados coherentes y precisos, asegúrese de seleccionar las mismas tablas en el agente de datos de Fabric que también se definen a través de esquemas de datos de IA en Prep para IA.

  • Al seleccionar esquema, incluya también objetos dependientes. Por ejemplo, si una medida Ingresos totales hace referencia a otras dos medidas que dependen de columnas adicionales, incluya todos esos objetos dependientes en el esquema. Para identificar las dependencias, use la función get_measure_dependencies de la biblioteca Semantic Link Labs .

  • Si tiene un modelo semántico grande, cambiar el nombre de todos los objetos manualmente puede ser tedioso. Use el servidor MCP de modelado de Power BI para que un LLM genere nombres descriptivos para las tablas, columnas y medidas. Revise y valide los cambios antes de guardar para asegurarse de que no interrumpan ninguna expresión DAX, relaciones u otros objetos dependientes.

Respuestas comprobadas

Las respuestas comprobadas son respuestas visuales aprobadas por el usuario que desencadenan preguntas específicas. Proporcionan respuestas coherentes y confiables a preguntas comunes o complejas que podrían malinterpretarse. Dado que almacena respuestas comprobadas en el nivel de modelo semántico (no en el nivel de informe), funcionan en cualquier agente de datos que use el mismo modelo. Para más información, consulte Preparación de los datos para la inteligencia artificial: respuestas comprobadas.

Cuando usas respuestas verificadas con el agente de datos, el sistema no devuelve la visualización de Power BI en sí misma. En su lugar, usa las preguntas del usuario y las propiedades del objeto visual (columnas, medidas, filtros) para influir en la generación de consultas DAX. Este enfoque significa que las respuestas comprobadas mejoran la precisión de la respuesta al guiar la herramienta de generación de DAX hacia la estructura de consulta correcta. Cuando un usuario realiza una pregunta al agente de datos, el sistema comprueba primero una coincidencia exacta o semánticamente similar a la pregunta definida en la respuesta comprobada antes de generar una nueva respuesta.

Captura de pantalla de la configuración de respuestas verificadas en Power BI, en la que se muestran frases de desencadenador, un gráfico visual y opciones de filtro para el nombre de isla y el propósito del viaje.

Ejemplo: Control de la terminología regional

Sin respuesta comprobada Con respuesta comprobada
Un usuario pregunta: "Show me performance by territory" la inteligencia artificial interpreta "territorio" como categoría de producto porque hay una columna Territory en la tabla Products. El usuario en realidad se refería a las regiones de ventas. Cree una respuesta comprobada mediante un objeto visual de ventas regional con preguntas de desencadenador como "What is the sales performance by territory?", "Mostrarme ventas desglosadas por territorio" y "¿Cómo se distribuyen las ventas entre regiones?" Ahora, cuando los usuarios preguntan sobre el rendimiento del territorio, obtienen constantemente respuestas precisas en función de los objetos usados en el objeto visual de ventas regional.

Sugerencias de configuración para respuestas comprobadas

  • Usa de cinco a siete preguntas desencadenantes para cada respuesta verificada para cubrir variaciones naturales.
  • Incluya tanto expresiones formales como conversacionales que los usuarios puedan intentar.
  • Configure hasta tres filtros para la segmentación flexible sin crear varias respuestas comprobadas.
  • Si cambia el nombre de las tablas, columnas o medidas a las que se hace referencia en una respuesta comprobada, actualice la respuesta comprobada y guárdela de nuevo para que los cambios surtan efecto.

Instrucciones de IA

Las instrucciones de IA en Prep para IA proporcionan contexto, lógica empresarial y orientación directamente sobre el modelo semántico. Ayudan a aclarar la terminología, guiar los enfoques de análisis y proporcionar contexto empresarial y semántico críticos que la inteligencia artificial no entendería de otro modo.

Puede configurar estas instrucciones en Power BI Desktop o en el servicio Power BI seleccionando Prep data for AI (Preparar datos para ia ) en la cinta Inicio y, a continuación, vaya a la pestaña Agregar instrucciones de IA . Para obtener instrucciones detalladas sobre la configuración, consulte la documentación de las instrucciones de IA.

Captura de pantalla del panel Preparación de Power BI para inteligencia artificial con la pestaña Agregar instrucciones de IA abierta, en la que se muestra un cuadro de texto para especificar los valores predeterminados de análisis y terminología empresarial.

Las orientaciones de IA son no estructuradas que el LLM interpreta, pero no se garantiza que las siga exactamente. Las instrucciones específicas claras son más eficaces que las complejas o conflictivas.

Como se mencionó anteriormente, la herramienta de generación DAX solo hace referencia a las instrucciones de IA configuradas en Preparación para IA del modelo semántico. Las instrucciones del agente de datos no se pasan a la herramienta y se omiten al consultar modelos semánticos. Por este motivo, no agregue instrucciones específicas del modelo semántico en el nivel del agente de datos. En su lugar, mantenga todas las instrucciones del modelo semántico en Prep for AI donde la herramienta de generación DAX puede usarlas. Las instrucciones del agente de datos solo deben incluir instrucciones que se apliquen en todos los orígenes de datos configurados en el agente, como preferencias generales de formato de respuesta, reglas de enrutamiento entre orígenes, abreviaturas comunes, tono, etc. Tenga en cuenta también que, a diferencia de otros orígenes de datos, el agente de datos no admite instrucciones ni descripciones de orígenes de datos para modelos semánticos.

Ejemplo: Definición de la terminología empresarial

Sin instrucciones de IA Con instrucciones de IA
Un usuario pregunta: "¿Quiénes fueron los mejores intérpretes el mes pasado?" La inteligencia artificial no entiende lo que significa "mejor rendimiento" en su organización y devuelve un error o solicita una aclaración. Tú agrega una instrucción: "Un destacado es un representante de ventas que logra el 110% o más de su cuota mensual. Use la tabla Rep_Performance y filtre dónde Quota_Attainment >= 1,1" Ahora la inteligencia artificial interpreta correctamente la pregunta y devuelve los resultados correctos.

Patrones de instrucción eficaces

  • Definiciones de período de tiempo: "La temporada alta va de noviembre a enero. La temporada baja es febrero hasta abril".
  • Preferencias de métricas: "Cuando los usuarios pregunten sobre la rentabilidad, use la medida de Contribution_Margin, no Gross_Profit".
  • Enrutamiento del origen de datos: "Para preguntas de inventario, priorice la tabla de Warehouse_Inventory sobre Sales_Orders".
  • Agrupaciones predeterminadas: "A menos que se especifique lo contrario, analice los ingresos por trimestre fiscal en lugar del mes natural".

Además de Prep for AI, la herramienta de generación de consultas DAX también usa metadatos de objetos visuales de informe, como título visual, columnas, medidas, filtros, etc. para mejorar la precisión de las consultas.

  1. Optimizar el modelo semántico: Empiece por optimizar el modelo semántico para el rendimiento. El rendimiento deficiente del agente de datos suele provenír de un modelo semántico mal diseñado, medidas DAX ineficaces o una combinación de los dos. Cuando un usuario realiza una pregunta, el agente de datos genera una consulta DAX y la ejecuta en el modelo. Un modelo bien optimizado usa menos recursos y logra una ejecución de consultas más rápida. En una interfaz conversacional, los usuarios esperan respuestas rápidas, por lo que el rendimiento lento afecta directamente a la experiencia y la adopción del usuario.

    Además, un modelo sobredimensionado con columnas, tablas y medidas innecesarias crea más ruido para que la herramienta de generación DAX analice, lo que puede reducir la precisión de la respuesta. Al optimizar el modelo al principio, también se evitan problemas de rendimiento a medida que crecen los datos y el modelo se vuelve más complejo. Puede obtener más información en el curso Optimización de un modelo para el rendimiento en Power BI .

    Use el Analizador de procedimientos recomendados y el Analizador de memoria de modelos semánticos en un cuaderno de Fabric para identificar problemas como tipos de datos incorrectos, columnas innecesarias, columnas de cardinalidad alta y patrones DAX ineficaces. Agregue descripciones a tablas, columnas y medidas para ayudar al LLM a comprender el propósito de cada objeto incluido en el esquema de datos de IA.

    Captura de pantalla del menú modelo semántico de Power BI con las opciones Analizador de procedimientos recomendados, Analizador de memoria y Cuadernos de la comunidad resaltadas.

  2. Definición de la preparación para la inteligencia artificial > Esquema de datos de IA: en función del ámbito del agente de datos, configure el esquema de datos de IA en Prep for AI seleccionando solo las tablas, columnas y medidas pertinentes para las preguntas que debe responder el agente.

  3. Preparar para AI > Respuestas verificadas: Identifique las preguntas más comunes y configure respuestas verificadas en Prep for AI utilizando elementos visuales apropiados. Use preguntas completas y sólidas como desencadenadores (no frases parciales) para mejorar la precisión de la coincidencia.

  4. Agregue el modelo semántico al agente de datos: Antes de agregar instrucciones de Inteligencia Artificial en Preparación para IA, pruebe y valide las respuestas del agente de datos. Este paso le ayuda a comprender dónde se necesitan las instrucciones de IA para mejorar la generación de consultas DAX.

  5. Incorporación de preparación para IA > Instrucciones de IA: en función de los resultados de validación, defina la terminología empresarial, las preferencias de análisis y las prioridades del origen de datos en Instrucciones de preparación para inteligencia artificial (no en las instrucciones del agente de datos).

  6. Preparar objetos visuales de informe: Revise los informes conectados al modelo semántico, incluidos los objetos visuales ocultos y las páginas, para asegurarse de que los objetos visuales tienen títulos descriptivos. Los objetos visuales bien estructurados ayudan a la inteligencia artificial a establecer las respuestas mediante los metadatos visuales, como el título visual, la tabla, la columna, las medidas usadas, los filtros aplicados, etc.

  7. Compruebe y pruebe DAX: La precisión de la respuesta depende de la consulta DAX generada. Al probar el agente de datos, revise la consulta DAX en cada respuesta para comprobar que es válida y responde correctamente a la pregunta. Si los resultados son incorrectos, analice el DAX para identificar qué configuraciones (modelo semántico, esquema de datos de IA, respuestas comprobadas o instrucciones de IA) necesitan un ajuste.

    Captura de pantalla de una interfaz del agente de datos que muestra una consulta de usuario, una respuesta de ventas generada por IA, un seguimiento de pasos y un panel de código de consulta DAX.

  8. Instrucciones para configurar el agente de datos: Agregue instrucciones en el nivel de agente de datos solo para obtener instrucciones que se apliquen en todos los orígenes de datos configurados en el agente. Esta guía incluye preferencias generales de formato de respuesta, reglas de enrutamiento entre orígenes, abreviaturas comunes y tono. No agregue instrucciones específicas del modelo semántico aquí, ya que no se pasan a la herramienta de generación daX. Para obtener instrucciones sobre cómo configurar instrucciones del agente, consulte las directrices de configuración.

  9. Validar e iterar: Las LLM pueden generar resultados incorrectos sin contexto adecuado. Itera continuamente sobre la configuración y valida las respuestas para crear confianza en el agente de datos. Para evaluar las respuestas mediante programación, puede usar el SDK de Python del agente de datos de Fabric para ejecutar evaluaciones automatizadas con pares de respuesta a preguntas y respuestas de verdad básica y analizar métricas de precisión. Tenga en cuenta que el SDK solo es para evaluación en este caso y no puede modificar las configuraciones de preparación del modelo semántico para la inteligencia artificial. Para más información, consulte Evaluación del agente de datos. Además, implique a las partes interesadas y a los usuarios finales en el proceso de evaluación. Sus comentarios garantizan que las respuestas se alineen con las expectativas y la facilidad de uso del mundo real, lo que le ayuda a identificar brechas que podrían perderse las comprobaciones automatizadas.

  10. Implementar canalizaciones de implementación y control de código fuente: Use canalizaciones de implementación e integración de Git para administrar las configuraciones del agente de datos en áreas de trabajo de desarrollo, pruebas y producción. Esta práctica garantiza que los cambios de configuración se prueben y validen antes de promoverse a producción donde los usuarios finales accedan a ellos. Para obtener más información, consulte Control de código fuente, CI/CD y ALM para el agente de datos de Fabric.

Sugerencia

Puede usar recursos en el repositorio fabric-toolbox como referencia para ayudarle a través de este flujo de trabajo. Este repositorio contiene:

Problemas comunes que se deben evitar

  • No usar el esquema de estrella: Los modelos semánticos que usan tablas planas, desnormalizadas o estructuras de datos pivotadas hacen que DAX sea menos eficaz y más difícil de escribir correctamente. DAX está optimizado para el esquema de estrella con tablas de dimensiones y hechos claros. Desagrupar tablas de gran amplitud en estructuras normalizadas en las que cada fila representa una única observación.

  • Confiar en campos ocultos: Las respuestas comprobadas no funcionarán si hacen referencia a columnas ocultas en el modelo.

  • Inclusión de medidas innecesarias: Los modelos semánticos suelen contener medidas auxiliares y objetos intermedios usados para mejorar la interactividad del informe. Al configurar el esquema de datos de IA, incluya solo las medidas que calculan las métricas empresariales reales. La exclusión de medidas auxiliares reduce el ruido y ayuda a la herramienta de generación DAX a generar consultas más precisas.

  • Medidas duplicadas o superpuestas: Varias medidas que calculan métricas similares (por ejemplo, Ventas totales, Importe de ventas, Ingresos) crean ambigüedad. Consolidar o diferenciar claramente las medidas y excluir duplicados del esquema de datos de IA.

  • Nomenclatura no descriptiva: Los nombres de objeto como TR_AMT, F_SLS o DIM_GEO_01 no proporcionan ningún contexto para la herramienta de generación daX. Use nombres claros y descriptivos para la empresa, como Ingresos totales, Ventas o Geografía del cliente. Si no puede cambiar el nombre de los objetos, asegúrese de que las descripciones y los sinónimos proporcionan el contexto necesario para que la inteligencia artificial comprenda su propósito.

  • Confiar en medidas implícitas: Las medidas implícitas pueden provocar resultados imprevisibles. Cree medidas DAX explícitas para los cálculos que desea que los usuarios consulten y establezca el resumen predeterminado correcto (Suma, Promedio, Ninguno, etc.) en columnas numéricas para evitar agregaciones no deseadas.

  • Campos de fecha ambiguos: Varias columnas de fecha (Fecha de pedido, Fecha de envío, Fecha de vencimiento, Trimestre del calendario/Trimestre FY, etc.) sin instrucciones claras confundan la inteligencia artificial. Use las instrucciones comprobadas sobre respuestas e inteligencia artificial de Prep for AI para especificar qué campo de fecha se va a usar de forma predeterminada o para tipos de preguntas específicos.

  • Instrucciones en conflicto: Las instrucciones de IA que contradigan las configuraciones de respuesta comprobada crean un comportamiento impredecible.

  • Omitir el refinamiento del esquema: Los modelos grandes con muchos campos con nombre similar necesitan esquemas de datos de IA centrados.

  • Instrucciones excesivamente complejas: Mantenga las instrucciones centradas y específicas. La inteligencia artificial interpreta, pero no garantiza seguir guías complejas y conflictivas. Las instrucciones complejas también pueden agregarse a la latencia.

Tools

Para seguir estas instrucciones, puede usar las siguientes herramientas del repositorio de GitHub fabric-toolbox:

Recursos adicionales