Что такое поиск в Azure AI?
Поиск ИИ Azure (ранее известный как "Когнитивный поиск Azure") обеспечивает безопасное получение информации в масштабе по сравнению с пользовательским содержимым в традиционных и созданных приложениях поиска ИИ.
Получение информации является основой для любого приложения, которое отображает текст и векторы. Распространенные сценарии включают в себя поиск по каталогу или документу, исследование данных и все большее питание результатов запроса на основе собственных данных об основах для поиска беседы и copilot. При создании службы поиска вы работаете со следующими возможностями:
- Поисковая система для векторного поиска и полнотекстового и гибридного поиска по индексу поиска
- Форматированный индексирование с помощью встроенного фрагментирования и векторизации данных, лексического анализа текста и необязательного применения ИИ для извлечения и преобразования содержимого
- Расширенный синтаксис запросов для векторных запросов, текстовый поиск, гибридные запросы, нечеткий поиск, автозавершение, геоизбыточное и другое
- Настройка релевантности и производительности запросов с помощью семантического ранжирования, профилей оценки, квантизации для векторных запросов и параметров для управления поведением запросов во время выполнения
- Масштабирование, безопасность и охват Azure
- Интеграция Azure с уровнем данных, уровнем машинного обучения, службами ИИ Azure и Azure OpenAI
С точки зрения архитектуры служба поиска находится между внешними хранилищами данных, которые содержат неиндексированные данные, и вашим клиентским приложением, которое отправляет запросы к индексу поиска и обрабатывает ответ.
В клиентском приложении интерфейс поиска определяется с помощью API из поиска ИИ Azure и может включать настройку релевантности, семантический ранжирование, автозавершение, сопоставление синонимов, сопоставление нечетких шаблонов, фильтрацию и сортировку.
На платформе Azure поиск ИИ Azure может интегрироваться с другими службами Azure в виде индексаторов, которые автоматизируют прием и извлечение данных из источников данных Azure, а также наборы навыков, которые включают потребляемый ИИ из служб ИИ Azure, таких как обработка изображений и естественного языка, или настраиваемый ИИ, создаваемый в Машинное обучение Azure или оболочку внутри Функции Azure.
Внутри службы поиска
В самой службе поиска находятся две основные рабочие нагрузки: индексирование и запросы.
Индексирование — это процесс приема, который загружает содержимое в службу поиска и делает его доступным для поиска. Внутри системы входящий текст обрабатывается в маркеры и хранится в инвертированных индексах, а входящий векторы хранятся в векторных индексах. Формат документа, который может индексировать поиск ИИ Azure, — JSON. Вы можете отправить собранные документы JSON или использовать индексатор для извлечения и сериализации данных в JSON.
Примененный искусственный интеллект с помощью набора навыков расширяет индексирование с помощью моделей изображений и языков. Если у вас есть изображения или большой неструктурированный текст в исходном документе, вы можете присоединить навыки, выполняющие OCR, описывать изображения, выводить структуру, переводить текст и многое другое. Вы также можете присоединить навыки, выполняющие блоки данных и векторизацию.
Запросы могут произойти после заполнения индекса с помощью поиска содержимого, когда клиентское приложение отправляет запросы в службу поиска и обрабатывает ответы. Все выполнение запроса выполняется по индексу поиска, который вы управляете.
Семантический ранжирование — это расширение выполнения запроса. Он добавляет вторичный рейтинг, используя распознавание речи для повторного получения результирующих наборов, повышая наиболее семантически релевантные результаты в верхней части.
Почему используйте поиск по искусственному интеллекту Azure?
Поиск по искусственному интеллекту Azure хорошо подходит для следующих сценариев приложения:
Используйте его для традиционного полнотекстового поиска и векторного поиска следующего поколения. Верните созданные приложения ИИ с помощью получения информации, которая использует сильные стороны поиска ключевых слов и сходства. Используйте оба модальности, чтобы получить наиболее релевантные результаты.
Консолидируйте разнородное содержимое в определяемый пользователем и заполненный индекс поиска, состоящий из векторов и текста. Вы поддерживаете владение и контроль над тем, что можно найти.
Интегрируйте блоки данных и векторизацию для создания приложений ИИ и RAG.
Применение детализированного управления доступом на уровне документа.
Разгрузка рабочих нагрузок индексирования и запросов на выделенную службу поиска.
Удобная реализация функций поиска, таких как настройка релевантности, фасетная навигация, фильтры (включая геопространственный поиск), сопоставление синонимов и автозавершение.
Преобразуйте большие неифференцированные текстовые файлы или файлы изображений или файлы приложений, хранящиеся в Хранилище BLOB-объектов Azure или Azure Cosmos DB, в блоки, доступные для поиска. Это достигается во время индексирования с помощью когнитивных навыков , которые добавляют внешнюю обработку из ИИ Azure.
Добавление лингвистического или пользовательского анализа текста. Если у вас есть содержимое, отличное от английского языка, служба "Поиск ИИ Azure" поддерживает анализаторы Lucene и процессоры естественного языка Майкрософт. Можно также настроить анализаторы для выполнения специализированной обработки необработанного содержимого, например для фильтрации диакритических знаков или распознавания и сохранения шаблонов в строках.
Дополнительные сведения о конкретных функциях см. в разделе "Функции поиска ИИ Azure"
Как приступить к работе
Функциональные возможности предоставляются с помощью портал Azure, простых REST API или пакетов SDK Azure, таких как пакет SDK Azure для .NET. Портал Azure поддерживает администрирование служб и управление содержимым с инструментами для создания прототипов и запроса индексов и наборов навыков.
Комплексное изучение основных функций поиска можно выполнить в четырех шагах:
Определите уровень и регион. Одна бесплатная служба поиска разрешена для каждой подписки. Все краткие руководства можно выполнить на бесплатном уровне. Для получения дополнительных возможностей и возможностей вам потребуется оплачиваемый уровень.
Создайте службу поиска в портал Azure.
Начните с мастера импорта данных. Выберите встроенный пример или поддерживаемый источник данных для создания, загрузки и запроса индекса в минутах.
Завершите работу с обозревателем поиска, используя клиент портала для запроса только что созданного индекса поиска.
Кроме того, можно создать, загрузить и запросить индекс поиска в атомарных шагах:
Создание индекса поиска с помощью портала, REST API, пакета SDK для.NET или другого пакета SDK. Схема индекса определяет структуру содержимого, доступного для поиска.
Отправьте содержимое с помощью модели push-отправки документов JSON из любого источника или используйте модель извлечения (индексаторы), если исходные данные являются поддерживаемыми типами.
Запрос индекса с помощью обозревателя поиска на портале, REST API, пакета SDK для .NET или другого пакета SDK.
Кроме того, попробуйте использовать акселераторы решений:
Чат с акселератором решения для обработки данных помогает создать пользовательское решение RAG по содержимому.
Акселератор решения интеллектуального анализа знаний беседы помогает создать интерактивное решение для извлечения полезных аналитических сведений из расшифровок после контакта.
Создайте собственный акселератор решений copilot, использует Службу OpenAI Azure, поиск ИИ Azure и Microsoft Fabric для создания пользовательских решений copilot.
Помощник по клиентам с одним пользовательским copilot позволяет помощнику по клиентам использовать возможности генерированного ИИ как в структурированных, так и неструктурированных данных. Помогите нашим клиентам оптимизировать ежедневные задачи и повысить эффективность взаимодействия с большим числом клиентов
Помощник по исследованиям помогает создать собственный помощник по искусственному интеллекту, чтобы определить соответствующие документы, суммировать и классифицировать огромные объемы неструктурированной информации, а также ускорить общее создание документов и создания содержимого.
Совет
Чтобы помочь с сложными или настраиваемыми решениями, обратитесь к партнеру с глубоким опытом в технологии поиска ИИ Azure.
Сравнение параметров поиска
Клиенты часто спрашивают, как поиск ИИ Azure сравнивается с другими решениями, связанными с поиском. В следующей таблице представлены основные отличия.
По сравнению с | Основные отличия |
---|---|
Microsoft Search | Поиск (Майкрософт) предназначен для прошедших проверку подлинности пользователей Microsoft 365, которым необходимо выполнять запросы к содержимому в SharePoint. Поиск ИИ Azure извлекает содержимое в Azure и любом наборе данных JSON. |
Bing; | API Bing запрашивают индексы в Bing.com для сопоставления терминов. Поиск в Azure AI по индексам, заполненным содержимым. Вы управляете приемом данных и схемой. |
Поиск по базе данных | В SQL Azure есть полнотекстовый поиск и векторный поиск. В Azure Cosmos DB также есть поиск текста и векторный поиск. Поиск ИИ Azure становится привлекательной альтернативой, если вам нужны такие функции, как настройка релевантности или содержимое из разнородных источников. Другим важным отличием является использование ресурсов. Индексирование и запросы интенсивно используются для вычислений. Выгрузка поиска из СУБД сохраняет системные ресурсы для обработки транзакций. |
Специализированное решение для поиска | Предположим, что вы решили использовать выделенный поиск с полной функциональностью спектра, окончательное категориальное сравнение между технологиями поиска. Среди поставщиков облачных служб поиск ИИ Azure является самым сильным для векторных, ключевых слов и гибридных рабочих нагрузок по содержимому в Azure, для приложений, которые в основном используют поиск как для получения информации, так и для навигации по содержимому. |
Ниже перечислены ключевые преимущества.
- Поддержка индексирования и запросов вектора и невектора (текста). С помощью поиска сходства векторов можно найти сведения, которые семантические похожи на поисковые запросы, даже если условия поиска не являются точными совпадениями. Используйте гибридный поиск для лучшего ключевого слова и векторного поиска.
- Настройка ранжирования и релевантности с помощью профилей семантического ранжирования и оценки. Синтаксис запросов поддерживает повышение терминов и приоритет полей.
- Интеграция данных Azure (обходчики) на уровне индексирования.
- Интеграция СИ Azure для преобразований, которые делают текст содержимого и векторным поиском.
- Безопасность Microsoft Entra для доверенных подключений и Приватный канал Azure для частных подключений в сценариях без Интернета.
- Полный интерфейс поиска: лингвистическое и пользовательское анализ текста на 56 языках. Аспекты, запросы автозаполнения и предлагаемые результаты и синонимы.
- Масштаб, надежность и глобальный охват Azure.