Создание векторного запроса в службе "Поиск ИИ Azure"

Статья
09/24/2024

Если у вас есть векторный индекс в azure AI, в этой статье объясняется, как:

Поля вектора запроса
Запрос нескольких векторных полей одновременно
Установка весов векторов
Запрос с интегрированной векторизацией
Задайте пороговые значения, чтобы исключить результаты низкой оценки (предварительная версия)

В этой статье используется REST для иллюстрации. Примеры кода на других языках см . в репозитории GitHub azure-search-vector-samples для комплексных решений, включающих векторные запросы.

Обозреватель поиска также можно использовать в портал Azure.

Необходимые компоненты

Поиск ИИ Azure в любом регионе и на любом уровне.
Векторный индекс в поиске ИИ Azure. Проверьте раздел в индексе vectorSearch , чтобы подтвердить векторный индекс.
При необходимости добавьте векторизатор в индекс для встроенного преобразования текста в вектор или преобразования изображений в вектор во время запросов.
Visual Studio Code с клиентом REST и примерами данных, если вы хотите запустить эти примеры самостоятельно. Сведения о начале работы с клиентом REST см . в кратком руководстве по поиску ИИ Azure с помощью REST.

Преобразование входных данных строки запроса в вектор

Для запроса поля вектора сам запрос должен быть вектором.

Одним из способов преобразования строки текстового запроса пользователя в векторное представление является вызов библиотеки внедрения или API в коде приложения. Рекомендуется всегда использовать те же модели внедрения, используемые для создания внедрения в исходные документы. Примеры кода, показывающие , как создавать внедрения в репозиторий azure-search-vector-samples .

Второй подход использует встроенную векторизацию, теперь общедоступную для обработки входных и выходных данных векторизации запросов с помощью службы "Поиск ИИ Azure".

Ниже приведен пример REST API строки запроса, отправленной в развертывание модели внедрения Azure OpenAI:

POST https://{{openai-service-name}}.openai.azure.com/openai/deployments/{{openai-deployment-name}}/embeddings?api-version={{openai-api-version}}
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "input": "what azure services support generative AI'"
}

Ожидаемый ответ — 202 для успешного вызова развернутой модели.

Поле "внедрение" в тексте ответа является векторным представлением строки запроса "input". В целях тестирования вы скопируйте значение массива "внедрение" в vectorQueries.vector в запросе запроса с помощью синтаксиса, показанного в следующих нескольких разделах.

Фактический ответ на этот вызов POST к развернутой модели включает в себя 1536 внедрения, обрезанный здесь только до первых нескольких векторов для удобства чтения.

{
    "object": "list",
    "data": [
        {
            "object": "embedding",
            "index": 0,
            "embedding": [
                -0.009171937,
                0.018715322,
                ...
                -0.0016804502
            ]
        }
    ],
    "model": "ada",
    "usage": {
        "prompt_tokens": 7,
        "total_tokens": 7
    }
}

В этом подходе код приложения отвечает за подключение к модели, создание внедрения и обработку ответа.

Запрос векторного запроса

В этом разделе показана базовая структура векторного запроса. Для создания векторного запроса можно использовать портал Azure, REST API или пакеты SDK Azure. Если вы переносите с 2023-07-01-Preview, есть критические изменения. Дополнительные сведения см. в статье об обновлении до последней версии REST API .

2024-07-01 — стабильная версия REST API для search POST. Эта версия поддерживает следующее:

vectorQueries — это конструкция для векторного поиска.
vectorQueries.kindvector установите значение для массива векторов или задайте значениеtext, если входные данные являются строкой, и у вас есть векторизатор.
vectorQueries.vector — запрос (векторное представление текста или изображения).
vectorQueries.weight(необязательно) указывает относительный вес каждого векторного запроса, включенного в операции поиска (см. векторный вес).
exhaustive (необязательно) вызывает исчерпывающий KNN во время запроса, даже если поле индексируется для HNSW.

В следующем примере вектор представляет эту строку: "то, что службы Azure поддерживают полнотекстовый поиск". Запрос предназначен для contentVector поля. Запрос возвращает k результаты. Фактический вектор имеет 1536 внедрения, поэтому он обрезан в этом примере для удобства чтения.

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/search?api-version=2024-07-01
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "count": true,
    "select": "title, content, category",
    "vectorQueries": [
        {
            "kind": "vector",
            "vector": [
                -0.009154141,
                0.018708462,
                . . . 
                -0.02178128,
                -0.00086512347
            ],
            "exhaustive": true,
            "fields": "contentVector",
            "weight": 0.5,
            "k": 5
        }
    ]
}

2024-05-01-preview — это последняя предварительная версия API для поиска — POST. Он поддерживает тот же синтаксис векторного запроса, что и 2024-07-01, с дополнительными параметрами гибридного поиска и минимальными порогами для исключения слабых результатов.

Эта предварительная версия добавляет:

threshold для исключения результатов низкой оценки.
Hybridsearch.MaxTextRecallSize для получения большего контроля над входными данными для гибридного запроса.

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/search?api-version=2024-05-01-preview
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "count": true,
    "select": "title, content, category",
    "hybridSearch": {
        "maxTextRecallSize": 100,
        "countAndFacetMode": "countAllResults"
        }
    "vectorQueries": [
        {
            "kind": "vector",
            "vector": [
                -0.009154141,
                0.018708462,
                . . . 
                -0.02178128,
                -0.00086512347
            ],
            "fields": "contentVector",
            "k": 5,
            "exhaustive": true,
            "weight": 2,
            "threshold": {
                "kind": "vectorSimilarity",
                "value": 0.8
            },

        }
    ]

Ответ векторного запроса

В службе "Поиск ИИ Azure" ответы запросов состоят из всех retrievable полей по умолчанию. Однако обычно результаты поиска ограничиваются подмножеством retrievable полей, перечисляя их в инструкции select .

В векторном запросе тщательно рассмотрите необходимость векторных полей в ответе. Поля векторов не доступны для чтения, поэтому если вы отправляете ответ на веб-страницу, следует выбрать невекторные поля, которые являются репрезентативными результатами. Например, если запрос выполняется против contentVector, вы можете вернуться content .

Если вы хотите векторные поля в результате, вот пример структуры отклика. contentVector представляет собой массив строк внедрения, обрезанный здесь для краткости. Оценка поиска указывает релевантность. Другие невекторные поля включаются в контекст.

{
    "@odata.count": 3,
    "value": [
        {
            "@search.score": 0.80025613,
            "title": "Azure Search",
            "category": "AI + Machine Learning",
            "contentVector": [
                -0.0018343845,
                0.017952163,
                0.0025753193,
                ...
            ]
        },
        {
            "@search.score": 0.78856903,
            "title": "Azure Application Insights",
            "category": "Management + Governance",
            "contentVector": [
                -0.016821077,
                0.0037742127,
                0.016136652,
                ...
            ]
        },
        {
            "@search.score": 0.78650564,
            "title": "Azure Media Services",
            "category": "Media",
            "contentVector": [
                -0.025449317,
                0.0038463024,
                -0.02488436,
                ...
            ]
        }
    ]
}

Основные моменты:

k определяет, сколько ближайших результатов возвращаются, в данном случае три. Векторные запросы всегда возвращают k результаты, если существуют хотя k бы документы, даже если есть документы с плохой сходством, так как алгоритм находит ближайших k соседей с вектором запроса.
Определяется @search.score алгоритмом векторного поиска.
Поля в результатах поиска — это либо все retrievable поля, либо поля в предложении select . Во время выполнения векторного запроса совпадение выполняется только для векторных данных. Однако ответ может включать любое retrievable поле в индекс. Так как не существует средства для декодирования результата векторного поля, включение текстовых полей невектора полезно для их удобочитаемых значений.

Несколько векторных полей

Свойство VectorQueries.fields можно задать для нескольких векторных полей. Векторный запрос выполняется для каждого поля вектора, указанного в списке fields . При запросе нескольких векторных полей убедитесь, что каждый из них содержит внедрения из одной модели внедрения, и что запрос также создается из той же модели внедрения.

POST https://{{search-service-name}}.search.windows.net/indexes/{{index-name}}/docs/search?api-version=2024-07-01
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "count": true,
    "select": "title, content, category",
    "vectorQueries": [
        {
            "kind": "vector",
            "vector": [
                -0.009154141,
                0.018708462,
                . . . 
                -0.02178128,
                -0.00086512347
            ],
            "exhaustive": true,
            "fields": "contentVector, titleVector",
            "k": 5
        }
    ]
}

Несколько векторных запросов

Поиск вектора с несколькими запросами отправляет несколько запросов в нескольких полях векторов в индексе поиска. Типичным примером этого запроса является использование моделей, таких как CLIP для многомодального векторного поиска, где та же модель может векторизировать изображение и текстовое содержимое.

Следующий пример запроса ищет сходство в обоих myImageVector и myTextVector, но отправляет два разных внедрения запросов соответственно, каждый из которых выполняется параллельно. Этот запрос создает результат, который оценивается с помощью RRF.

vectorQueries предоставляет массив векторных запросов.
vector содержит векторы изображения и текстовые векторы в индексе поиска. Каждый экземпляр является отдельным запросом.
fields указывает, какое поле вектора для целевого объекта.
k — это число ближайших совпадений соседей, включаемых в результаты.

{
    "count": true,
    "select": "title, content, category",
    "vectorQueries": [
        {
            "kind": "vector",
            "vector": [
                -0.009154141,
                0.018708462,
                . . . 
                -0.02178128,
                -0.00086512347
            ],
            "fields": "myimagevector",
            "k": 5
        },
        {
            "kind": "vector"
            "vector": [
                -0.002222222,
                0.018708462,
                -0.013770515,
            . . .
            ],
            "fields": "mytextvector",
            "k": 5
        }
    ]
}

Результаты поиска включают сочетание текста и изображений, если индекс поиска включает поле для файла изображения (индекс поиска не сохраняет изображения).

Запрос с интегрированной векторизацией

В этом разделе показан векторный запрос, вызывающий встроенную векторизацию, которая преобразует текстовый или графический запрос в вектор. Мы рекомендуем стабильный ИНТЕРФЕЙС REST API 2024-07-01 , обозреватель поиска или более новые пакеты Azure SDK для этой функции.

Предварительные требования — это индекс поиска с настроенным векторизатором и назначенным векторным полем. Векторизатор предоставляет сведения о подключении к модели внедрения, используемой во время запроса.

Портал Azure
REST API

Обозреватель поиска поддерживает встроенную векторизацию во время запроса. Если индекс содержит векторные поля и имеет векторизатор, можно использовать встроенное преобразование текста в вектор.

Войдите в портал Azure с помощью учетной записи Azure и перейдите к служба Azure AI.
В меню слева разверните индексы управления>поиском и выберите индекс. Обозреватель поиска — это первая вкладка на странице индекса.
Проверьте профили векторов , чтобы подтвердить наличие векторизатора.
В обозревателе поиска можно ввести текстовую строку в строку поиска по умолчанию в представлении запроса. Встроенный векторизатор преобразует строку в вектор, выполняет поиск и возвращает результаты.

Кроме того, можно выбрать >представление JSON для просмотра или изменения запроса. Если векторы присутствуют, обозреватель поиска автоматически настраивает векторный запрос. Представление JSON можно использовать для выбора полей, используемых в поиске и в ответе, добавления фильтров или создания более сложных запросов, таких как гибридные. Пример JSON представлен на вкладке REST API этого раздела.

Используйте индекс — GET , чтобы вернуть определение индекса и проверить наличие конфигурации векторизатора. vectorizers Найдите в определении индекса. Он должен указать развернутую модель внедрения.
Используйте поиск — POST для запроса.
- kind должно быть задано значение text .
- text должен иметь текстовую строку. Он передается в векторизатор, назначенный полю вектора.
- fields — это поле вектора для поиска.
- k — это число возвращаемых векторных совпадений.

Ниже приведен простой пример векторного запроса во время запроса. Текстовая строка векторизирована, а затем используется для запроса поля descriptionVector.

POST https://{{search-service}}.search.windows.net/indexes/{{index}}/docs/search?api-version=2024-07-01
{
    "select": "title, genre, description",
    "vectorQueries": [
        {
            "kind": "text",
            "text": "mystery novel set in London",
            "fields": "descriptionVector",
            "k": 5
        }
    ]
}

Ниже приведен гибридный запрос с помощью встроенной векторизации текстовых запросов. Этот запрос включает несколько полей вектора запроса, несколько невекторных полей, фильтр и семантический ранжирование. Опять же, различия — это kind векторный запрос и text строка вместо вектора vector.

В этом примере поисковая система выполняет три вызова векторизации к векторизаторам, назначенным descriptionVector, synopsisVectorи authorBioVector в индексе. Результирующий вектор используется для получения документов в соответствующих полях. Поиск в поисковой системе также выполняет поиск ключевых слов по search запросу , "тайный роман набор в Лондоне".

POST https://{{search-service}}.search.windows.net/indexes/{{index}}/docs/search?api-version=2024-07-01
Content-Type: application/json
api-key: {{admin-api-key}}
{
    "search":"mystery novel set in London", 
    "searchFields":"description, synopsis", 
    "semanticConfiguration":"my-semantic-config", 
    "queryType":"semantic",
    "select": "title, author, synopsis",
    "filter": "genre eq 'mystery'",
    "vectorFilterMode": "postFilter",
    "vectorQueries": [
        {
            "kind": "text",
            "text": "mystery novel set in London",
            "fields": "descriptionVector, synopsisVector",
            "k": 5
        },
        {
            "kind": "text"
            "text": "living english author",
            "fields": "authorBioVector",
            "k": 5
        }
    ]
}

Оценка результатов всех четырех запросов слита с использованием ранжирования RRF. Вторичный семантический ранжирование вызывается по сплавленным результатам поиска, но только searchFields повышение результатов, наиболее семантических семантических "search":"mystery novel set in London".

Примечание.

Векторизация происходит во время индексирования и запроса. Если в индексе не требуется блокирование и векторизация данных, можно пропустить шаги, такие как создание индексатора, набора навыков и источника данных. В этом рабочем процессе векторизация используется только во время запроса для преобразования текстовой строки или изображения в внедрение. Вы можете определить векторизатор в индексе поиска для этого шага.

Число ранжированных результатов в ответе на векторный запрос

Векторный запрос указывает k параметр, определяющий, сколько совпадений возвращаются в результатах. Поисковая система всегда возвращает k количество совпадений. Если k больше количества документов в индексе, то количество документов определяет верхний предел возвращаемого значения.

Если вы знакомы с полным текстовым поиском, вы знаете, что вы ожидаете нуля результатов, если индекс не содержит термин или фразу. Однако в векторном поиске операция поиска определяет ближайших соседей, и она всегда возвращает k результаты, даже если ближайшие соседи не так похожи. Таким образом, можно получить результаты для нечувствичных или вне темы запросов, особенно если вы не используете запросы на установка границ. Менее релевантные результаты имеют худший показатель сходства, но они по-прежнему "ближайшие" векторы, если нет ничего ближе. Таким образом, ответ без значимых результатов по-прежнему может возвращать k результаты, но оценка сходства каждого результата будет низкой.

Гибридный подход , включающий полнотекстовый поиск, может устранить эту проблему. Другое решение заключается в том, чтобы задать минимальное пороговое значение для оценки поиска, но только если запрос является чистым одним векторным запросом. Гибридные запросы не способствуют минимальным пороговым значениям, так как диапазоны RRF гораздо меньше и изменчивы.

Параметры запроса, влияющие на число результатов, включают:

"k": n результаты запросов только для векторов
"top": n результаты гибридных запросов, включающих параметр search

Оба "k" и "top" являются необязательными. Не указано, число результатов по умолчанию — 50. Вы можете задать "top" и "пропустить" на страницу с дополнительными результатами или изменить значение по умолчанию.

Алгоритмы ранжирования, используемые в векторном запросе

Ранжирование результатов вычисляется по следующим значениям:

Метрика сходства
Если имеется несколько наборов результатов поиска, взаимное слияние ранга (RRF).

Метрика сходства

Метрика сходства, указанная в разделе индекса vectorSearch для запроса только для вектора. Допустимые значения: cosine, euclidean и dotProduct.

Модели внедрения Azure OpenAI используют совместное сходство, поэтому если вы используете модели внедрения Azure OpenAI, cosine рекомендуется метрика. Другие поддерживаемые метрики ранжирования включают euclidean и dotProduct.

Использование RRF

Несколько наборов создаются, если запрос предназначен для нескольких векторных полей, выполняет несколько векторных запросов параллельно или если запрос является гибридом векторного и полнотекстового поиска с семантической ранжированием или без них.

Во время выполнения запроса векторный запрос может использовать только один внутренний векторный индекс. Поэтому для нескольких векторных полей и нескольких векторных запросов поисковая система создает несколько запросов, предназначенных для соответствующих индексов векторов каждого поля. Выходные данные — это набор ранжированных результатов для каждого запроса, который использует RRF. Дополнительные сведения см. в разделе "Оценка релевантности" с помощью реляционного ранга Fusion (RRF).>.

Векторный вес

Добавьте параметр запроса, чтобы указать относительный weight вес каждого векторного запроса, включенного в операции поиска. Это значение используется при объединении результатов нескольких списков ранжирования, созданных двумя или более векторными запросами в одном запросе, или из векторной части гибридного запроса.

Значение по умолчанию равно 1.0, а значение должно быть положительным числом, превышающим нулю.

Весы используются при вычислении показателей слиянием обратного ранжирования каждого документа. Вычисление умножается weight на оценку ранжирования документа в соответствующем результирующем наборе.

В следующем примере используется гибридный запрос с двумя строками векторных запросов и одной текстовой строкой. Весы назначаются векторным запросам. Первый запрос составляет 0,5 или половину веса, уменьшая его важность в запросе. Второй векторный запрос является дважды важным.

POST https://[service-name].search.windows.net/indexes/[index-name]/docs/search?api-version=2024-07-01

    { 
      "vectorQueries": [ 
        { 
          "kind": "vector", 
          "vector": [1.0, 2.0, 3.0], 
          "fields": "my_first_vector_field", 
          "k": 10, 
          "weight": 0.5 
        },
        { 
          "kind": "vector", 
          "vector": [4.0, 5.0, 6.0], 
          "fields": "my_second_vector_field", 
          "k": 10, 
          "weight": 2.0
        } 
      ], 
      "search": "hello world" 
    }

Вес вектора применяется только к векторам. Текстовый запрос в этом примере ("hello world") имеет неявный вес 1,0 или нейтральный вес. Однако в гибридном запросе можно увеличить или уменьшить важность текстовых полей, задав maxTextRecallSize.

Задайте пороговые значения, чтобы исключить результаты низкой оценки (предварительная версия)

Так как поиск ближайшего соседа всегда возвращает запрошенные k соседи, можно получить несколько совпадений с низкой оценкой в рамках выполнения k требования количества результатов поиска. Чтобы исключить результат поиска с низкой оценкой threshold , можно добавить параметр запроса, который фильтрует результаты на основе минимальной оценки. Фильтрация возникает перед объединением результатов из разных наборов отзывов.

Этот параметр по-прежнему находится в предварительной версии. Мы рекомендуем предварительной версии REST API версии 2024-05-01-preview.

В этом примере все совпадения, которые оцениваются ниже 0,8, исключаются из результатов векторного поиска, даже если число результатов упало ниже k.

POST https://[service-name].search.windows.net/indexes/[index-name]/docs/search?api-version=2024-05-01-preview 
    Content-Type: application/json 
    api-key: [admin key] 

    { 
      "vectorQueries": [ 
        { 
          "kind": "vector", 
          "vector": [1.0, 2.0, 3.0], 
          "fields": "my-cosine-field", 
          "threshold": { 
            "kind": "vectorSimilarity", 
            "value": 0.8 
          } 
        }
      ]
    }

MaxTextSizeRecall для гибридного поиска (предварительная версия)

Векторные запросы часто используются в гибридных конструкциях, включающих невекторные поля. Если вы обнаружите, что результаты BM25 по сравнению или ниже представлены в результатах гибридного запроса, вы можете maxTextRecallSize увеличить или уменьшить результаты BM25, предоставляемые для гибридного ранжирования.

Это свойство можно задать только в гибридных запросах, включая компоненты search и vectorQueries.

Дополнительные сведения см. в разделе Set maxTextRecallSize — создание гибридного запроса.

Следующие шаги

На следующем шаге просмотрите примеры кода векторного запроса в Python, C# или JavaScript.

Поделиться через