Заметка
Доступ к этой странице требует авторизации. Вы можете попробовать войти в систему или изменить каталог.
Доступ к этой странице требует авторизации. Вы можете попробовать сменить директорию.
С помощью агента данных в Microsoft Fabric можно создавать диалоговые интерфейсы ИИ, которые отвечают на вопросы о данных, хранящихся в озерах, хранилищах, семантических моделях Power BI, базах данных KQL и онтологиях в Fabric. Ваши коллеги могут задавать вопросы на простом английском языке и получать ответы на основе данных, даже если они не являются экспертами ИИ или глубоко знакомы с данными.
Это важно
Эта функция доступна в предварительной версии.
Предпосылки
- Платная емкость F2 или более поздняя структура или емкость Power BI Premium для емкости (P1 или выше) с включенной поддержкой Microsoft Fabric
- Параметры клиента агента данных Fabric включены.
- Включена меж-географическая обработка для ИИ .
- Межрегиоционное хранение для искусственного интеллекта включено.
- По крайней мере один из этих объектов с данными: хранилище, lakehouse, одна или несколько семантических моделей Power BI, база данных KQL или онтология.
- Семантические модели Power BI с помощью коммутатора клиента конечных точек XMLA включены для источников данных семантической модели Power BI.
Проверка подлинности и токены
Вам не нужно создавать или предоставлять ключ Azure OpenAI или маркер доступа для использования агента данных Fabric. Fabric использует помощника Azure OpenAI, управляемого Microsoft, и обрабатывает проверку подлинности за вас.
- Доступ к данным выполняется под удостоверением пользователя Microsoft Entra ID и разрешениями рабочей области или данных. Агент считывает схемы и запускает SQL/DAX/KQL, только если у вас есть доступ.
- Чтобы добавить семантику Power BI в качестве источника данных, требуется разрешение на чтение для этой модели (запись не требуется). Доступ на чтение также достаточно, чтобы задавать вопросы об источниках, к которым у вас есть доступ. Дополнительные сведения о разрешениях семантической модели см. в разделе "Безопасность семантической модели" и "Набор данных".
- Если ваша организация использует Power BI Premium на емкость (P1 или более поздней) вместо F SKU, убедитесь, что Microsoft Fabric включена в этой емкости.
- Принципы обслуживания и токены API не требуются для использования чата внутри продукта. Любая автоматизация с субъектами-службами является отдельным сценарием и не рассматривается здесь.
Комплексный поток для создания и использования агентов данных платформы Fabric
В этом разделе описаны основные шаги по созданию, проверке и совместному использованию агента данных Fabric в Fabric, что делает его доступным для использования.
Процесс прост, и вы можете начать тестирование ресурсов агента данных Fabric за считанные минуты.
Создайте нового агента данных Fabric
Чтобы создать нового агента данных Fabric, сначала перейдите в рабочую область, а затем нажмите кнопку «+ Новый элемент». На вкладке "Все элементы" найдите агент данных Fabric , чтобы найти соответствующий параметр, как показано на снимке экрана:
После выбора вам будет предложено указать имя агента данных Fabric, как показано на снимке экрана:
См. приведенный снимок экрана для визуального руководства по именованию агента данных Fabric. После ввода имени перейдите к конфигурации, чтобы настроить агент данных Fabric в соответствии с вашими конкретными требованиями.
Выбор данных
После создания агента данных Fabric можно добавить до пяти источников данных, включая озера данных, хранилища, семантические модели Power BI, базы данных KQL и онтологии в любом сочетании (всего до пяти). Например, можно добавить пять семантических моделей Power BI или две семантические модели Power BI, одно озеро и одну базу данных KQL.
При первом создании агента данных Fabric и предоставлении имени каталог OneLake автоматически отображается, что позволяет добавлять источники данных. Чтобы добавить источник данных, выберите его из каталога, как показано на следующем экране, а затем нажмите кнопку "Добавить". Каждый источник данных должен быть добавлен по отдельности. Например, можно добавить lakehouse, нажать кнопку "Добавить", а затем перейти к добавлению другого источника данных. Чтобы отфильтровать типы источников данных, выберите значок фильтра и выберите нужный тип. Вы можете просматривать только источники данных выбранного типа, что упрощает поиск и подключение соответствующих источников для агента данных Fabric.
После добавления источника данных Обозреватель на левой панели страницы агента данных Fabric заполняется доступными таблицами для каждого выбранного источника данных. Здесь вы можете использовать флажки, чтобы сделать таблицы доступными или недоступными для ИИ, как показано на следующем снимке экрана.
Примечание.
Для добавления семантической модели Power BI в качестве источника данных требуется разрешение на чтение. Разрешение на запись не требуется, так как агент данных Fabric выдает запросы только для чтения.
Для последующих добавлений источников данных перейдите в обозреватель на левой панели страницы агента данных Fabric и выберите +Источник данных, как показано на этом снимке экрана:
Каталог OneLake открывается снова, и вы можете легко добавить дополнительные источники данных по мере необходимости.
Подсказка
Обязательно используйте описательные имена как для таблиц, так и для столбцов. Таблица с именем SalesData более значима, чем TableA, а имена столбцов, например ActiveCustomer или IsCustomerActive, более понятны, чем C1 или ActCu. Описательные имена помогают ИИ создавать более точные и надежные запросы.
Вопросы и ответы
После добавления источников данных и выбора соответствующих таблиц для каждого источника данных можно начать задавать вопросы. Система обрабатывает вопросы, как показано на этом снимке экрана:
Снимок экрана с вопросом для агента данных Fabric.
Вопросы, аналогичные этим примерам, также должны работать:
- Каков был наш общий объем продаж в Калифорнии в 2023 году?
- Какие 5 продуктов с самыми высокими ценами, и каковы их категории?
- "Какие самые дорогие товары, которые никогда не были проданы?"
Такие вопросы подходят, так как система может преобразовать их в структурированные запросы (T-SQL, DAX или KQL), выполнить их для баз данных, а затем возвращать конкретные ответы на основе сохраненных данных.
Однако такие вопросы не входят в сферу:
- Почему производительность нашего завода ниже во втором квартале 2024 года?
- "Что является первопричиной нашего всплеска продаж?"
Эти вопросы в настоящее время недоступны, так как для них требуются сложные причины, анализ корреляции или внешние факторы, недоступные непосредственно в базе данных. Агент данных Fabric в настоящее время не выполняет расширенную аналитику, машинное обучение или причинное вывод. Он просто извлекает структурированные данные и обрабатывает их на основе запроса пользователя.
Когда вы задаете вопрос, агент данных Fabric использует API помощника Azure OpenAI для обработки запроса. Поток работает таким образом:
Доступ к схеме по учетным данным пользователя
Система сначала использует учетные данные пользователя для доступа к схеме источника данных (например, озерохранилище, склад, семантическая модель PBI, базы данных KQL или онтология). Это гарантирует, что система получает сведения о структуре данных, если у пользователя есть разрешение на просмотр.
Создание подсказки
Чтобы интерпретировать вопрос пользователя, система объединяет:
- Запрос пользователя: вопрос естественного языка, предоставленный пользователем.
- Сведения о схеме: метаданные и структурные сведения источника данных, полученные на предыдущем шаге.
- Примеры и инструкции. Все предопределенные примеры (например, примеры вопросов и ответов) или конкретные инструкции, предоставляемые при настройке агента данных Fabric. Эти примеры и инструкции помогают уточнить понимание вопроса и направляют ИИ в его взаимодействии с данными.
Вся эта информация используется для создания подсказки. Этот запрос используется как входные данные для API Помощника Azure OpenAI, который функционирует как агент, под агентом данных Fabric. Это, по сути, указывает агенту данных Fabric о том, как обрабатывать запрос, и тип ответа для создания.
Вызов инструмента в зависимости от потребностей запроса
Агент анализирует созданный запрос и решает, какой инструмент будет вызываться для получения ответа:
- Естественный язык в SQL (NL2SQL): используется для создания запросов SQL при расположении данных в озерном хранилище или хранилище.
- Естественный язык в DAX (NL2DAX): используется для создания запросов DAX для взаимодействия с семантических моделей в источниках данных Power BI
- Естественный язык к KQL (NL2KQL): используется для создания запросов KQL для запроса данных в базах данных KQL
Выбранное средство создает запрос с помощью схемы, метаданных и контекста, которые предоставляет агент, работающий на платформе Fabric. Затем средство проверяет запрос, чтобы обеспечить надлежащее форматирование и соответствие своим протоколам безопасности и собственным политикам ответственного ИИ (RAI).
Построение ответов
Агент, базовый агент данных Fabric выполняет запрос и гарантирует, что ответ структурирован и отформатирован соответствующим образом. Агент часто включает дополнительный контекст, чтобы сделать ответ понятным для пользователя. Наконец, ответ отображается пользователю в интерфейсе беседы, как показано на следующем снимке экрана:
Агент представляет результат и промежуточные шаги, которые он принял для получения окончательного ответа. Этот подход повышает прозрачность и позволяет проверять эти шаги при необходимости. Пользователи могут развернуть раскрывающийся список действий, чтобы просмотреть все действия агента данных Fabric, принятые для получения ответа, как показано на следующем снимке экрана:
Кроме того, агент данных Fabric предоставляет созданный код, используемый для запроса соответствующего источника данных, предоставляя дополнительные сведения о том, как был создан ответ.
Эти запросы предназначены исключительно для запроса данных. Операции, связанные с созданием данных, обновлениями данных, удалением данных, любым типом изменений данных, не допускаются для защиты целостности данных.
В любой момент можно выбрать кнопку "Очистить чат", чтобы очистить чат, как показано на следующем снимке экрана:
Функция "Очистить чат" удаляет всю историю чата и запускает новый сеанс. После удаления журнала чата его невозможно получить.
Изменение источника данных
Чтобы удалить источник данных, наведите указатель мыши на имя источника данных в обозревателе на левой панели страницы агента данных Fabric до тех пор, пока не появится меню с тремя точками. Выберите три точки, чтобы отобразить параметры, а затем нажмите кнопку "Удалить ", чтобы удалить источник данных, как показано на следующем снимке экрана:
Кроме того, если источник данных изменился, можно выбрать "Обновить " в том же меню, как показано на следующем снимке экрана:
Это гарантирует, что все обновления источника данных отражаются и правильно заполнены в обозревателе, чтобы агент данных Fabric синхронизировался с последними данными.
Конфигурация агента данных Fabric
Агент данных Fabric предлагает несколько вариантов конфигурации, позволяющих пользователям настраивать поведение агента данных Fabric, чтобы лучше соответствовать потребностям вашей организации. Как агент данных Fabric обрабатывает и представляет данные, эти конфигурации обеспечивают гибкость, которая обеспечивает более контроль над результатами.
Укажите инструкции
Вы можете указать конкретные инструкции по поведению ИИ. Чтобы добавить их в область инструкций агента данных Fabric, выберите инструкции агента данных , как показано на следующем снимке экрана:
Здесь можно написать до 15 000 символов в простом тексте на английском языке, чтобы указать ИИ о том, как обрабатывать запросы.
Например, можно указать точный источник данных, используемый для определенных типов вопросов. Примеры выбора источника данных могут включать указание ИИ, какой источник данных использовать.
- Семантические модели Power BI для финансовых запросов
- Озёрный дом данных для данных о продажах
- база данных KQL для операционных метрик
Эти инструкции гарантируют, что ИИ создает соответствующие запросы, будь то SQL, DAX или KQL, на основе ваших рекомендаций и контекста вопросов.
Если ресурс ИИ последовательно неправильно интерпретирует определенные слова, акронимы или термины, можно попытаться предоставить четкие определения в этом разделе, чтобы убедиться, что ИИ правильно понимает и обрабатывает их. Это особенно полезно для терминологии для конкретного домена или уникального бизнес-жаргона.
С помощью этих инструкций и определения терминов вы повышаете способность ИИ предоставлять точные и соответствующие аналитические сведения в полном соответствии с вашей стратегией данных и бизнес-требованиями.
Укажите примеры запросов
Вы можете повысить точность ответа, предоставив примеры запросов, адаптированных для каждого поддерживаемого источника данных (lakehouse, хранилища, базы данных KQL). Такой подход, известный как небольшое обучение в генерируемом ИИ, помогает агенту данных Fabric создавать ответы, которые лучше соответствуют вашим ожиданиям.
При предоставлении ИИ примерами пар запросов и вопросов он ссылается на эти примеры при ответе на будущие вопросы. Сопоставление новых запросов с наиболее актуальными примерами помогает ИИ включать логику для конкретного бизнеса и эффективно отвечать на часто задаваемые вопросы. Эта функция позволяет точно настроить отдельные источники данных и обеспечивает создание более точных запросов SQL или KQL.
В настоящее время данные семантической модели Power BI не поддерживают добавление примеров пар запросов и вопросов. Однако для поддерживаемых источников данных, таких как lakehouse, хранилище и базы данных KQL, дополнительные примеры могут значительно повысить способность ИИ создавать точные запросы, когда его производительность по умолчанию требует корректировки.
Подсказка
Разнообразный набор примеров запросов повышает способность агента данных Fabric создавать точные и соответствующие запросы SQL/KQL.
Чтобы добавить или изменить примеры запросов, нажмите кнопку "Примеры запросов ", чтобы открыть область примеров запросов, как показано на следующем снимке экрана:
Эта область предоставляет параметры для добавления или редактирования примеров запросов ко всем поддерживаемым источникам данных, кроме семантических моделей Power BI и онтологий. Для каждого источника данных можно выбрать "Добавить или изменить примеры запросов" для ввода соответствующих примеров, как показано на следующем снимке экрана:
Примечание.
Агент данных Fabric ссылается только на запросы, содержащие допустимый синтаксис SQL/KQL и соответствующие схеме выбранных таблиц. Агент данных Fabric не использует запросы, которые не завершили проверку. Убедитесь, что все примеры запросов действительны и правильно согласованы со схемой, чтобы агент данных Fabric эффективно их использовали.
Публикация и предоставление общего доступа к агенту данных Fabric
После тестирования производительности агента данных Fabric по различным вопросам, и вы подтверждаете, что он создает точные запросы SQL, DAX или KQL, вы можете поделиться им с коллегами. На этом этапе выберите "Опубликовать", как показано на следующем снимке экрана:
На этом шаге откроется окно, которое запрашивает описание агента данных Fabric. Ниже приведено подробное описание того, что делает агент данных Fabric. Эти сведения помогут вашим коллегам разобраться в функциональности агента данных Fabric и обеспечат другим системам и оркестраторам ИИ возможность эффективно вызывать агента данных Fabric.
После публикации агента данных Fabric у вас будет две версии его. Одна из версий — это текущая версия черновика, которую можно продолжать уточнять и улучшать. Вторая версия — это опубликованная версия, которую вы можете поделиться своими коллегами, которые хотят запросить агент данных Fabric, чтобы получить ответы на их вопросы. Вы можете включить отзывы коллег в текущую версию черновика при разработке, чтобы повысить производительность агента данных Fabric.
Связанный контент
- концепция агента данных
- Комплексное руководство по агенту данных