Бөлісу құралы:


Основные понятия агента данных Fabric (предварительная версия)

Агент данных в Microsoft Fabric — это новая функция Microsoft Fabric, которая позволяет создавать собственные системы беседы Q&A с помощью создания искусственного интеллекта. Агент данных Fabric делает аналитику данных более доступной и доступной для всех пользователей в организации. Используя агент данных Fabric, ваша команда может иметь беседы с простыми вопросами на английском языке, о данных, которые ваша организация хранит в Fabric OneLake, а затем получать соответствующие ответы. Таким образом, даже люди без технического опыта в ИИ или глубокое понимание структуры данных могут получать точные и контекстные ответы.

Вы также можете добавить инструкции для конкретной организации, примеры и рекомендации по настройке агента данных Fabric. Этот подход гарантирует, что ответы соответствуют потребностям и целям вашей организации, что позволяет всем эффективно взаимодействовать с данными. Агент данных Fabric способствует развитию культуры принятия решений на основе данных, так как снижает барьеры для доступа к аналитическим данным, облегчает совместную работу и помогает вашей организации извлекать больше ценности из её данных.

Это важно

Эта функция доступна в предварительной версии.

Предпосылки

Как работает агент данных Fabric

Агент данных Fabric использует большие языковые модели (LLM), чтобы помочь пользователям взаимодействовать с данными естественным образом. Агент данных Fabric применяет API-интерфейсы Помощника Azure OpenAI и ведет себя как агент. Он обрабатывает вопросы пользователей, определяет наиболее релевантный источник данных (Lakehouse, Warehouse, набор данных Power BI, базы данных KQL, ontology) и вызывает соответствующий инструмент для создания, проверки и выполнения запросов. Затем пользователи могут задавать вопросы на простом языке и получать структурированные, доступные для чтения ответы. Такой подход устраняет необходимость написания сложных запросов и обеспечивает точный и безопасный доступ к данным.

Вот как это работает подробно:

Анализ вопросов и проверка. Агент данных Fabric применяет API Azure OpenAI Assistant в качестве базового агента для обработки вопросов пользователей. Этот подход гарантирует, что вопрос соответствует протоколам безопасности, политикам ответственного ИИ (RAI) и разрешениям пользователей. Агент данных Fabric строго применяет доступ только для чтения, поддерживая подключения только для чтения к всем источникам данных.

Идентификация источника данных. Агент данных Fabric использует учетные данные пользователя для доступа к схеме источника данных. Этот подход гарантирует, что система получает сведения о структуре данных, которые у пользователя есть разрешение на просмотр. Затем агент оценивает вопрос пользователя по всем доступным источникам данных, включая реляционные базы данных (Lakehouse и Warehouse), наборы данных Power BI (семантические модели), базы данных KQL и онтологии. Он также может ссылаться на инструкции агента данных, предоставленные пользователем, чтобы определить наиболее релевантный источник данных.

Вызов и создание запросов. После определения правильного источника данных или источников агент данных Fabric перефразирует вопрос для ясности и структуры, а затем вызывает соответствующее средство для создания структурированного запроса:

  • Естественный язык для SQL (NL2SQL) для реляционных баз данных (Lakehouse/Warehouse).
  • Естественный язык в DAX (NL2DAX) для наборов данных Power BI (Семантические Модели).
  • Преобразование естественного языка в KQL (NL2KQL) для баз данных KQL.

Выбранное средство создает запрос на основе предоставленной схемы, метаданных и контекста, которые затем передает агент, лежащий в основе агента данных Fabric.

Проверка запроса. Средство выполняет проверку, чтобы убедиться, что запрос правильно сформирован и соответствует собственным протоколам безопасности и политикам RAI.

Выполнение запроса и ответ. После проверки агент данных Fabric выполняет запрос к выбранному источнику данных. Результаты форматируются в удобочитаемый пользователем ответ, который может включать структурированные данные, такие как таблицы, сводки или ключевые аналитические сведения.

С помощью этого подхода пользователи могут взаимодействовать с данными с помощью естественного языка. Агент данных Fabric обрабатывает сложности создания запросов, проверки и выполнения. Пользователям не нужно самостоятельно писать SQL, DAX или KQL.

Конфигурация агента данных Fabric

Настройка агента данных Fabric аналогична созданию отчета Power BI. Сначала необходимо разработать и уточнить его, чтобы обеспечить соответствие вашим потребностям, а затем опубликовать и поделиться ими с коллегами, чтобы они могли взаимодействовать с данными. Настройка агента данных Fabric включает:

Выбор источников данных: агент данных Fabric поддерживает до пяти источников данных в любом сочетании, включая lakehouses, хранилища, базы данных KQL, семантические модели Power BI и онтологии. Например, настроенный агент данных Fabric может включать пять семантических моделей Power BI. Она может включать в себя сочетание двух семантических моделей Power BI, одного lakehouse и одной базы данных KQL. У вас есть множество доступных вариантов.

Выбор соответствующих таблиц: после выбора источников данных добавьте их по одному за раз и определите определенные таблицы из каждого источника, который использует агент данных Fabric. Этот шаг гарантирует, что агент данных Fabric получает точные результаты, фокусируясь только на соответствующих данных. Для озёрных хранилищ этот шаг означает выбор таблиц озёрного хранилища (а не отдельных файлов озёрного хранилища). Если данные начинаются как файлы (например, CSV или JSON), сделайте его доступным агенту путем приема в таблицы или иным образом предоставления их через таблицы.

Добавление контекста. Чтобы повысить точность агента данных Fabric, укажите больше контекста с помощью инструкций агента данных Fabric и примеров запросов. В качестве базового агента данных Fabric контекст помогает API Помощника Azure OpenAI принимать более обоснованные решения об обработке вопросов пользователей и определить, какой источник данных лучше всего подходит для их ответа.

  • Инструкции агента данных. Добавьте инструкции по использованию агента, который лежит в основе агента данных Fabric, чтобы определить лучший источник данных для ответа на определенные типы вопросов. Вы также можете указать пользовательские правила или определения, которые уточняют терминологию организации или конкретные требования. Эти инструкции могут предоставлять больше контекста или предпочтений, влияющих на выбор и запросы источников данных агентом. Например, направляйте прямые вопросы о финансовых метриках в семантическую модель Power BI, назначайте запросы, связанные с исследованием необработанных данных, в lakehouse и направляйте вопросы, требующие анализа журналов, в базу данных KQL.

  • Примеры запросов: добавьте примеры пар вопросов и запросов, чтобы иллюстрировать, как агент данных Fabric должен реагировать на распространенные запросы. Эти примеры служат руководством для агента, который помогает понять, как интерпретировать аналогичные вопросы и создавать точные ответы.

Примечание.

Добавление примеров пар запросов и вопросов в настоящее время не поддерживается для источников данных семантической модели Power BI.

Объединяя четкие инструкции ИИ и соответствующие примеры запросов, вы можете лучше выровнять агент данных Fabric с потребностями данных вашей организации, обеспечивая более точные и контекстные ответы.

Разница между агентом данных Fabric и копилотом

Хотя агенты данных Fabric и копилоты Fabric используют генеративный ИИ для обработки и анализа данных, основные различия существуют в их функциональных возможностях и вариантах использования.

Гибкость конфигурации. Вы можете строго настроить агенты данных Fabric. Вы можете предоставить пользовательские инструкции и примеры, чтобы адаптировать их поведение к определенным сценариям. С другой стороны, копилоты фабрики приходят предварительно настроенными и не предлагают этот уровень настройки.

Область применения и случаи использования: помощники Fabric помогают выполнять задачи в Microsoft Fabric, например, создавать код для записных книжек или запросы к складским данным. Агенты данных системы, напротив, являются автономными объектами. Чтобы сделать агенты данных Fabric более универсальными для более широких вариантов использования, они могут интегрироваться с внешними системами, такими как Microsoft Copilot Studio, Microsoft Foundry, Microsoft Teams или другие средства за пределами Fabric.

Оценка агента данных Fabric

Группа продуктов тщательно оценила качество и безопасность ответов агента данных Fabric:

Сравнительное тестирование: команда по продукту тестировала агентов данных Fabric в различных общедоступных и частных наборах данных, чтобы обеспечить высокое качество и точные ответы.

Расширенные меры по устранению вреда: группа продуктов реализовала гарантии, чтобы выходные данные агента данных Fabric оставались сосредоточены на контексте выбранных источников данных, что снижает риск неуместных или вводящих в заблуждение ответов.

Ограничения

Агент данных Fabric в настоящее время находится в общедоступной предварительной версии и имеет ограничения. Обновления помогут с течением времени улучшить агент данных Fabric.

  • Агент данных Fabric создает только запросы SQL, DAX и KQL "read". Он не создает запросы SQL, DAX или KQL, которые создают, обновляют или удаляют данные.
  • Агент данных Fabric не поддерживает неструктурированные данные, такие как .pdf, .docxили файлы .txt. Агент данных Fabric нельзя использовать для доступа к неструктурированным ресурсам данных.
  • Для источников данных Lakehouse агент данных Fabric отвечает на вопросы, используя избранные таблицы lakehouse. Он не считывает автономные файлы lakehouse (например, CSV или JSON файлы), если они не обработаны или представлены в виде таблиц.
  • Агент данных Fabric в настоящее время не поддерживает языки, отличные от английского языка. Для оптимальной производительности укажите вопросы, инструкции и примеры запросов на английском языке.
  • Вы не можете изменить LLM, который использует агент данных Fabric.
  • Журнал бесед в агенте данных Fabric может не всегда сохраняться. В некоторых случаях, таких как изменения серверной инфраструктуры, обновления служб или обновления модели, журнал общения в прошлом может быть сброшен или потерян.
  • Агент данных Fabric не может выполнять запросы, если емкость рабочей области источника данных находится в другом регионе, отличном от емкости рабочей области агента данных. Например, хранилище данных с емкостью в Северной Европе дает сбой, если емкость агента данных находится в Центральной Франции.
  • Пользователи могут предоставлять до 100 примеров запросов на источник данных в агенте данных.