Что такое источник знаний?

Примечание

Некоторые агентные функции извлечения доступны в версии REST API 2026-04-01 через программный доступ. Портал Azure и портал Microsoft Foundry продолжают предоставлять предварительный доступ ко всем агентным функциям извлечения. Рекомендации по миграции, включая обзор того, что доступно в общем доступе и что остаётся в предварительном просмотре, см. в разделе "Перенос кода агентного извлечения на последнюю версию".

Источник знаний определяет содержимое, используемое для агентического извлечения. Он либо инкапсулирует индекс поиска, заполненный внешними данными, либо это прямое подключение к удаленному объекту, например Bing или SharePoint, которые запрашиваются напрямую. Источник знаний — это обязательное определение в базе знаний.

  • Создайте источник знаний в качестве ресурса верхнего уровня в службе поиска. Каждый источник знаний указывает ровно на одну структуру данных: либо индекс поиска, соответствующий критериям агентического извлечения, либо поддерживаемый внешний ресурс.

  • Ссылка на один или несколько источников знаний в базе знаний. В агентном конвейере извлечения можно запрашивать несколько источников знаний одним запросом. Вложенные запросы создаются для каждого источника знаний. Лучшие результаты возвращаются в ответе на запрос на извлечение.

  • Для некоторых источников знаний можно использовать определение источника знаний для создания полного конвейера индексатора (источник данных, набор навыков, индексатор и индекс), который обеспечивает автономное извлечение данных. Вместо того чтобы создавать несколько объектов вручную, информация из источника знаний используется для генерации всех объектов, включая заполненный, сегментированный и индекс для поиска.

Перед созданием базы знаний убедитесь, что у вас есть хотя бы один источник знаний. Полную спецификацию источников знаний и баз знаний можно найти в справочнике по REST API.

Работа с источником знаний

  • Путь создания: сначала создайте источник знаний, а затем создайте базу знаний.

  • Путь удаления: обновление или удаление баз знаний для удаления ссылок на источник знаний, а затем удаление источника знаний последней.

  • Источник знаний, его индекс и база знаний должны существовать в одной службе поиска. Внешний контент доступен через общедоступный Интернет (Bing) или в клиенте Microsoft (удаленный SharePoint).

Поддерживаемые источники знаний

Вы можете создать следующие источники знаний:

Вид Индексированные или удаленные
"searchIndex" API упаковывает существующий индекс. Индексируемые
"azureBlob" API создает конвейер индексатора, который извлекает данные из контейнера блобов. Проиндексировано
"indexedOneLake" API создает конвейер индексатора, который извлекает из lakehouse. Индексировано
"indexedSharePoint" API (предварительная версия) создает конвейер индексатора, который получает данные с сайта SharePoint. Индексированный
"remoteSharePoint" API (предварительная версия) получает содержимое непосредственно из SharePoint. Удаленный
"web" API извлекает данные о заземлении в режиме реального времени из службы Microsoft Bing. Удаленный

Индексированные источники знаний указывают на целевой индекс на Поиск с использованием ИИ Azure. Выполнение запроса является локальным для поисковой системы в службе поиска. Ключевые слова (полнотекстовый поиск), векторные и гибридные возможности запросов используются для получения данных из индексированных источников знаний.

Вы обращаетесь к удаленным источникам знаний во время запроса. Обработчик извлечения вызывает API-интерфейсы извлечения, родные для платформы (Bing или SharePoint API).

Все извлекаемое содержимое, независимо от того, индексированное оно или удаленное, извлекается в конвейер ранжирования в Поиск с использованием ИИ Azure, где контент оценивается по релевантности, объединяется (при условии, что имеется несколько запросов), перераспределяется и возвращается в ответ на запрос.

Создание источников знаний

Создайте источники знаний в качестве автономных объектов. Затем укажите их в базе знаний в массиве knowledgeSources.

Чтобы создать объекты в службе поиска, требуется разрешение участника службы поиска. Если вы используете источник знаний, который создает конвейер индексатора, вам также требуются разрешения участника индекса поиска для загрузки индекса. Кроме того, вместо ролей можно использовать ключ администратора API .

Используйте портал Azure, REST API или пакет Azure SDK для создания источника знаний. Следующие ссылки содержат инструкции по созданию источника знаний:

После того как вы создадите источник знаний, ссылку на него необходимо разместить в базе знаний.

Использование источников знаний

Вы можете явно контролировать использование источника знаний, установив alwaysQuery определение источника знаний или следуя инструкциям, используемым во время планирования запросов. Инструкции по управлению ссылаются на описания индекса или явные инструкции по извлечению в источнике знаний, которые предоставляют рекомендации по использованию индекса. Планирование запросов происходит при использовании низких или средних усилий по извлечению со стороны LLM. По минимальным соображениям все источники знаний, перечисленные в базе знаний, находятся в области каждого запроса. Для запросов низкой и средней сложности база знаний и LLM могут уточнить в момент запроса, какие источники знаний скорее всего предоставят наилучший корпус для поиска.

Логика выбора источника знаний основана на следующих факторах:

  • Установлено ли alwaysQuery? Если да, источник знаний всегда используется для каждого запроса.

  • Источник name знаний.

  • Индекс description , предполагающий индексированные источники знаний.

  • Указанный retrievalInstructions в действии извлечения или в определении базы знаний содержит рекомендации, которые включают или исключают источник знаний. Это похоже на запрос. Вы можете указать краткость, тон и форматирование в виде инструкции извлечения.

  • outputMode в базе знаний также влияет на выходные данные запроса и то, что происходит в ответе.

Использование усилий по извлечению причин для управления использованием LLM

Не все решения получают преимущества от планирования и выполнения запросов LLM. Если простота и скорость перевешивают преимущества планирования запросов LLM и проектирования контекста, укажите минимальные усилия по предотвращению обработки LLM в конвейере.

Для низкого и среднего уровня обработки LLM используется подход, который может быть либо сбалансированным, либо максимальным, что улучшает релевантность. Дополнительные сведения см. в разделе "Настройка усилий по извлечению причин".

Примечание

Если вы использовали attemptFastPath в предыдущей версии, этот подход теперь заменен на retrievalReasoningEffort, установленное на minimal.