Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
El agente de datos de Microsoft Fabric es una nueva característica de Microsoft Fabric que le permite crear sus propios sistemas de preguntas y respuestas conversacionales mediante inteligencia artificial generativa. Un agente de datos de Fabric hace que la información de datos sea más accesible y procesable para todos los usuarios de su organización. Mediante el uso de un agente de datos de Fabric, el equipo puede tener conversaciones, con preguntas en inglés sin formato, sobre los datos almacenados en Fabric OneLake y, a continuación, recibir respuestas pertinentes. De este modo, incluso las personas sin conocimientos técnicos en inteligencia artificial o una comprensión profunda de la estructura de datos pueden recibir respuestas precisas y contextuales.
También puede agregar instrucciones, ejemplos y orientación específica de la organización para ajustar el agente de datos de Fabric. Este enfoque garantiza que las respuestas se alineen con las necesidades y los objetivos de su organización, lo que permite a todos interactuar con los datos de forma más eficaz. El agente de datos de Fabric fomenta una cultura de toma de decisiones controlada por datos porque reduce las barreras a la accesibilidad de información, facilita la colaboración y ayuda a su organización a extraer más valor de sus datos.
Importante
Esta característica se encuentra en versión preliminar.
Prerrequisitos
- Una capacidad de Tejido F2 o superior de pago, o una capacidad De Power BI Premium por capacidad (P1 o superior) con Microsoft Fabric habilitado
- La configuración del inquilino del agente de datos de Fabric está habilitada.
- El procesamiento entre ubicaciones geográficas para IA está habilitado.
- El almacenamiento entre ubicaciones geográficas para IA está habilitado.
- Al menos uno de ellos, con datos: un almacén, un lakehouse, uno o varios modelos semánticos de Power BI, una base de datos KQL o una ontología.
- Modelos semánticos de Power BI a través del conmutador de inquilino de puntos de conexión XMLA está habilitado para orígenes de datos del modelo semántico de Power BI.
Funcionamiento del agente de datos de Fabric
El agente de datos de Fabric usa modelos de lenguaje grandes (LLM) para ayudar a los usuarios a interactuar con sus datos de forma natural. El agente de datos de Fabric aplica las API de Azure OpenAI Assistant y se comporta como un agente. Procesa preguntas de usuario, determina el origen de datos más relevante (Lakehouse, Warehouse, conjunto de datos de Power BI, bases de datos KQL, ontología) e invoca la herramienta adecuada para generar, validar y ejecutar consultas. A continuación, los usuarios pueden formular preguntas en lenguaje sin formato y recibir respuestas estructuradas y legibles. Este enfoque elimina la necesidad de escribir consultas complejas y garantiza el acceso preciso y seguro a los datos.
Así es como funciona con detalle:
Análisis y validación de preguntas: el agente de datos de Fabric aplica las API de Azure OpenAI Assistant como agente subyacente para procesar las preguntas del usuario. Este enfoque garantiza que la pregunta cumpla con los protocolos de seguridad, las directivas de IA responsable (RAI) y los permisos de usuario. El agente de datos de Fabric aplica estrictamente el acceso de solo lectura, manteniendo conexiones de solo lectura con todas las fuentes de datos.
Identificación del origen de datos: el agente de datos de Fabric usa las credenciales del usuario para acceder al esquema del origen de datos. Este enfoque garantiza que el sistema captura información de la estructura de datos que el usuario tiene permiso para ver. A continuación, el agente evalúa la pregunta del usuario en todos los orígenes de datos disponibles, incluidas las bases de datos relacionales (Lakehouse y Warehouse), los conjuntos de datos de Power BI (modelos semánticos), las bases de datos KQL y las ontologías. También puede hacer referencia a instrucciones del agente de datos proporcionados por el usuario para determinar el origen de datos más relevante.
Invocación de herramientas y generación de consultas: una vez identificado el origen de datos o los orígenes correctos, el agente de datos de Fabric vuelve a crear la pregunta para mayor claridad y estructura y, a continuación, invoca la herramienta correspondiente para generar una consulta estructurada:
- Lenguaje natural a SQL (NL2SQL) para bases de datos relacionales (Lakehouse/Warehouse).
- Lenguaje natural a DAX (NL2DAX) para conjuntos de datos de Power BI (modelos semánticos).
- Lenguaje natural a KQL (NL2KQL) para bases de datos KQL.
La herramienta seleccionada genera una consulta basada en el esquema, los metadatos y el contexto proporcionados, que el agente subyacente al agente de datos de Fabric transmite.
Validación de consultas: la herramienta realiza la validación para asegurarse de que la consulta se ha formado correctamente y cumple sus propios protocolos de seguridad y directivas RAI.
Ejecución y respuesta de consultas: una vez validado, el agente de datos de Fabric ejecuta la consulta en el origen de datos elegido. Los resultados se formatean en una respuesta fácil de leer, que puede incluir datos estructurados como tablas, resúmenes o perspectivas clave.
Mediante este enfoque, los usuarios pueden interactuar con sus datos mediante lenguaje natural. El agente de datos de Fabric controla las complejidades de generación, validación y ejecución de consultas. Los usuarios no necesitan escribir SQL, DAX ni KQL por sí mismos.
Configuración del agente de datos de Fabric
La configuración de un agente de datos de Fabric es similar a la creación de un informe de Power BI: empiece por diseñarlo y refinarlo para asegurarse de que satisface sus necesidades y, a continuación, publicarlo y compartirlo con compañeros para que puedan interactuar con los datos. La configuración de un agente de datos de Fabric implica:
Seleccionar orígenes de datos: un agente de datos de Fabric admite hasta cinco orígenes de datos en cualquier combinación, incluidos lakehouses, almacenes, bases de datos KQL, modelos semánticos de Power BI y ontologías. Por ejemplo, un agente de datos de Fabric configurado podría incluir cinco modelos semánticos de Power BI. Podría incluir una combinación de dos modelos semánticos de Power BI, un lago y una base de datos KQL. Tiene muchas opciones disponibles.
Elección de tablas relevantes: después de seleccionar los orígenes de datos, agréguelos uno a uno y defina las tablas específicas de cada origen que use el agente de datos de Fabric. Este paso garantiza que el agente de datos de Fabric recupere resultados precisos centrándose solo en los datos pertinentes. En el caso de lakehouses, este paso significa seleccionar tablas de lakehouse (no archivos de lakehouse individuales). Si los datos se inician como archivos (por ejemplo, CSV o JSON), haga que esté disponible para el agente ingeriéndolo en tablas o exponiendolos a través de tablas.
Agregar contexto: para mejorar la precisión del agente de datos de Fabric, proporcione más contexto a través de instrucciones del agente de datos de Fabric y consultas de ejemplo. Como agente subyacente para el agente de datos de Fabric, el contexto ayuda a la API de Azure OpenAI Assistant a tomar decisiones más informadas sobre cómo procesar preguntas de usuario y determinar qué origen de datos es más adecuado para responder a ellos.
Instrucciones del agente de datos: agregue instrucciones para guiar al agente que subyace al agente de datos de Fabric, al determinar el mejor origen de datos para responder a determinados tipos de preguntas. También puede proporcionar reglas o definiciones personalizadas que aclare la terminología organizativa o los requisitos específicos. Estas instrucciones pueden proporcionar más contexto o preferencias que influyen en cómo selecciona el agente y consulta orígenes de datos. Por ejemplo, dirija preguntas sobre las métricas financieras a un modelo semántico de Power BI, asigne consultas que impliquen la exploración de datos sin procesar a lakehouse y enrutar preguntas que requieren análisis de registros a la base de datos KQL.
Consultas de ejemplo: agregue pares de consulta de preguntas de ejemplo para ilustrar cómo el agente de datos de Fabric debe responder a consultas comunes. Estos ejemplos sirven como guía para el agente, lo que ayuda a comprender cómo interpretar preguntas similares y generar respuestas precisas.
Nota:
La adición de pares de consultas y preguntas de ejemplo no se admite actualmente para orígenes de datos del modelo semántico de Power BI.
Al combinar instrucciones claras de inteligencia artificial y consultas de ejemplo pertinentes, puede alinear mejor el agente de datos de Fabric con las necesidades de datos de su organización, lo que garantiza respuestas más precisas y con reconocimiento del contexto.
Diferencia entre un agente de datos de Fabric y un copiloto
Aunque tanto los agentes de datos de Fabric como los copilotos de Fabric usan inteligencia artificial generativa para procesar y razonar los datos, existen diferencias clave en sus casos de uso y funcionalidad:
Flexibilidad de configuración: puede configurar altamente agentes de datos de Fabric. Puede proporcionar instrucciones y ejemplos personalizados para adaptar su comportamiento a escenarios específicos. Los copilotos de Fabric, por otro lado, vienen preconfigurados y no ofrecen este nivel de personalización.
Ámbito y caso de uso: Los copilotos de Fabric ayudan con tareas dentro de Microsoft Fabric, como generar código de cuaderno o consultas de almacenamiento. Los agentes de datos de Fabric, en cambio, son artefactos independientes. Para que los agentes de datos de Fabric sean más versátiles para casos de uso más amplios, pueden integrarse con sistemas externos como Microsoft Copilot Studio, Azure AI Foundry, Microsoft Teams u otras herramientas fuera de Fabric.
Evaluación del agente de datos de Fabric
El equipo del producto evaluó rigurosamente la calidad y la seguridad de las respuestas del agente de datos de Fabric:
Pruebas comparativas: el equipo de productos probó agentes de datos de Fabric en una variedad de conjuntos de datos públicos y privados para garantizar respuestas de alta calidad y precisas.
Mitigaciones de daños mejoradas: el equipo de productos implementó medidas de seguridad para asegurarse de que las salidas del agente de datos fabric permanecen centradas en el contexto de los orígenes de datos seleccionados, lo que reduce el riesgo de respuestas irrelevantes o engañosas.
Limitaciones
El agente de datos de Fabric se encuentra actualmente en versión preliminar pública y tiene limitaciones. Las actualizaciones mejorarán el agente de datos de Fabric a lo largo del tiempo.
- El agente de datos de Fabric solo genera consultas SQL, DAX y KQL "read". No genera consultas SQL, DAX ni KQL que crean, actualizan o eliminan datos.
- El agente de datos de Fabric no admite datos no estructurados, como .pdf, .docxo archivos .txt. No se puede usar el agente de datos de Fabric para acceder a recursos de datos no estructurados.
- En el caso de los orígenes de datos de lakehouse, el agente de datos de Fabric responde a preguntas mediante las tablas de lakehouse que usted seleccione. No lee directamente los archivos de lakehouse independientes (por ejemplo, archivos CSV o JSON), a menos que se ingieren o se exponen como tablas.
- El agente de datos de Fabric no admite actualmente idiomas que no son de inglés. Para obtener un rendimiento óptimo, proporcione preguntas, instrucciones y consultas de ejemplo en inglés.
- No se puede cambiar el LLM que usa el agente de datos de Fabric.
- Es posible que el historial de conversaciones del agente de datos de Fabric no siempre persista. En determinados casos, como los cambios en la infraestructura de back-end, las actualizaciones del servicio o las actualizaciones del modelo, es posible que se restablezca o pierda el historial de conversaciones anteriores.
- El agente de datos de Fabric no puede ejecutar consultas cuando la capacidad del área de trabajo del origen de datos está en una región diferente de la capacidad del área de trabajo del agente de datos. Por ejemplo, una Lakehouse con capacidad en el norte de Europa falla si la capacidad del Agente de Datos está en el centro de Francia.