Что такое векторный поиск?

Завершено

Векторный поиск — это возможность, доступная в поиске ИИ, используемая для индексирования, хранения и извлечения вектора внедрения из индекса поиска. Его можно использовать для реализации архитектуры получения дополненного поколения (RAG), сходства и много модальных поисков или подсистем рекомендаций.

Ниже приведена иллюстрация рабочих процессов индексирования и запросов для векторного поиска.

Схема рабочих процессов индексирования и запросов.

Векторный запрос можно использовать для сопоставления критериев в разных типах исходных данных, предоставляя математическое представление содержимого, созданного моделями машинного обучения. Это устраняет ограничения поиска на основе текста, возвращая соответствующие результаты с помощью намерения запроса.

Ниже приведены некоторые сценарии, в которых следует использовать векторный поиск:

  • Используйте модели OpenAI или открытый код для кодирования текста и использования запросов, закодированных как векторов для извлечения документов.
  • Выполните поиск по сходству между закодированными изображениями, текстом, видео и звуком или смесью этих изображений (многофакторной).
  • Представляет документы на разных языках с помощью многоязычной внедренной модели для поиска документов на любом языке.
  • Создание гибридных поисковых запросов из векторных и текстовых полей с возможностью поиска в виде векторных поисков реализуется на уровне поля. Результаты будут объединены для возврата одного ответа.
  • Примените фильтры к текстовым и числовым полям и включите их в запрос, чтобы уменьшить объем данных, необходимых для обработки векторного поиска.
  • Создайте векторную базу данных для предоставления внешней база знаний или использования в качестве долгосрочной памяти.

Ограничения

При использовании векторного поиска существует несколько ограничений, которые следует отметить:

  • Вам потребуется предоставить внедрение с помощью Azure OpenAI или аналогичного решения открытый код, так как поиск ИИ Azure не создает их для содержимого.
  • Управляемые клиентом ключи (CMK) не поддерживаются.
  • Существуют ограничения на хранение, поэтому следует проверить, какая квота службы предоставляет.

Примечание.

Если документы большие, рассмотрите возможность фрагментирования. Дополнительные сведения см. в документации по поиску векторов с помощью блоков больших документов в документации по поиску ИИ.