Поделиться через


Что такое источник знаний?

Замечание

Эта функция сейчас доступна в общедоступной предварительной версии. Этот предварительный просмотр предоставляется без соглашения об уровне обслуживания и не предназначается для производственных рабочих нагрузок. Некоторые функции могут не поддерживаться или их возможности могут быть ограничены. Для получения дополнительной информации см. Дополнительные условия использования для предварительных версий Microsoft Azure.

Источник знаний указывает содержимое, используемое для агентного извлечения. Он либо инкапсулирует индекс поиска, заполненный внешними данными, либо это прямое подключение к удаленному целевому объекту, например Bing или SharePoint, который запрашивается напрямую. Источник знаний — это обязательное определение в базе знаний.

  • Создайте источник знаний в качестве ресурса верхнего уровня в службе поиска. Каждый источник знаний указывает ровно на одну структуру данных, либо индекс поиска, соответствующий критериям агентского извлечения, или поддерживаемого внешнего ресурса.

  • Ссылка на один или несколько источников знаний в базе знаний. В агентном конвейере извлечения можно запрашивать несколько источников знаний в одном запросе. Вложенные запросы создаются для каждого источника знаний. Лучшие результаты возвращаются в ответе на получение.

  • Для определённых источников знаний можно использовать их определение для создания полного конвейера индексирования (источник данных, набор функций, индексатор и индекс), который работает для автоматизированного извлечения данных. Вместо ручного создания нескольких объектов используется информация из источника знаний для генерации всех объектов, включая заполненный, разбитый на части и индексируемый поиск.

Перед созданием базы знаний убедитесь, что у вас есть хотя бы один источник знаний. Полную спецификацию источника знаний и базы знаний можно найти в справочнике по REST API предварительной версии.

Работа с источником знаний

  • Путь создания: сначала создайте источник знаний, а затем создайте базу знаний.

  • Путь удаления: обновление или удаление баз знаний для удаления ссылок на источник знаний, а затем удаление источника знаний последней.

  • Источник знаний, его индекс и база знаний должны существовать в одной службе поиска. Внешний контент доступен либо через общедоступный интернет (Bing), либо в среде Microsoft (дистанционный SharePoint).

Поддерживаемые источники знаний

В этой предварительной версии можно создать следующие источники знаний:

Kind Индексированные или удаленные
"searchIndex" API упаковывает существующий индекс. Indexed
"azureBlob" API создает конвейер индексатора, который извлекает данные из контейнера блоб-данных. Indexed
"indexedOneLake"API создает конвейер индексатора для извлечения данных из lakehouse. Indexed
"indexedSharePoint" API создает конвейер индексатора, извлекаемый из сайта SharePoint. Indexed
"remoteSharePoint" API извлекает содержимое непосредственно из SharePoint. Remote
"webParameters" API извлекает актуальные данные из Microsoft Bing в режиме реального времени. Remote

Индексированные источники знаний указывают на целевой индекс в поиске ИИ Azure. Выполнение запроса является локальным для поисковой системы в службе поиска. Ключевые слова (полнотекстовый поиск), векторные и гибридные возможности запросов используются для получения данных из индексированных источников знаний.

Вы обращаетесь к удаленным источникам знаний во время запроса. Агентский двигатель извлечения вызывает API извлечения, встроенные в платформу (API Bing или SharePoint).

Всё извлечённое содержимое, будь то индексированное или удалённое, попадает в конвейер ранжирования в службе «Поиск с использованием Azure AI», где его оценивают на релевантность, объединяют (если поступает несколько запросов), ранжируют заново и возвращают в ответе на запрос.

Создание источников знаний

Создайте источники знаний в качестве автономных объектов. Затем укажите их в базе знаний в массиве knowledgeSources.

Чтобы создать объекты в службе поиска, требуется разрешение участника службы поиска. Если вы используете источник знаний, который создает конвейер индексатора, вам также требуются разрешения участника индекса поиска для загрузки индекса. Кроме того, вместо ролей можно использовать ключ администратора API .

Чтобы создать источник знаний, используйте портал Azure, REST API или пакет предварительной версии пакета Azure SDK. Следующие ссылки содержат инструкции по созданию источника знаний:

После того, как вы создадите источник знаний, укажите на него в базе знаний.

Использование источников знаний

Вы можете явно контролировать использование источника знаний, установив alwaysQuery определение источника знаний или следуя инструкциям, используемым во время планирования запросов. Инструкции по управлению ссылаются на описания индекса или явные инструкции по извлечению в источнике знаний, которые предоставляют рекомендации по использованию индекса. Планирование запросов происходит при использовании низких или средних усилий по извлечению в рамках LLM. По минимальным соображениям все источники знаний, перечисленные в базе знаний, находятся в области каждого запроса. Для низкого и среднего уровней база знаний и LLM могут определить на этапе запроса, какие источники знаний, вероятно, станут основой для лучшего корпуса поиска.

Логика выбора источника знаний основана на следующих факторах:

  • Задано ли alwaysQuery? Если да, источник знаний всегда используется для каждого запроса.

  • Источник name знаний.

  • Индекс description , предполагающий индексированные источники знаний.

  • Указанный retrievalInstructions в действии извлечения или в определении базы знаний содержит рекомендации, которые включают или исключают источник знаний. Это похоже на запрос. Вы можете указать краткость, тон и форматирование в виде инструкции извлечения.

  • outputMode в базе знаний также влияет на результаты запроса и содержание ответа.

Использование усилий по извлечению причин для управления использованием LLM

Не все решения получают преимущества от планирования и выполнения запросов LLM. Если простота и скорость перевешивают преимущества планирования запросов LLM и проектирования контекста, укажите минимальные усилия по предотвращению обработки LLM в конвейере.

Для низкого и среднего уровня обработки LLM используется либо сбалансированный, либо максимально возможный подход в целях повышения релевантности. Дополнительные сведения см. в разделе Настройка усилий по анализу причин.

Замечание

Если вы использовали в attemptFastPath предыдущей предварительной версии, этот подход теперь заменяется заданным retrievalReasoningEffort значением minimal.