Определение элементов решения поиска

Завершено

Infographic of indexing process.

Обычное решение поиска по искусственному интеллекту Azure начинается с источника данных, содержащего артефакты данных, которые требуется выполнить поиск. Это может быть иерархия папок и файлов в служба хранилища Azure или текст в базе данных, такой как База данных SQL Azure или Azure Cosmos DB. Формат данных, поддерживаемый поиском ИИ Azure, — JSON. Независимо от того, откуда происходят ваши данные, если вы можете предоставить их в виде документа JSON, поисковая система может индексировать их.

Если данные находятся в поддерживаемом источнике данных, можно использовать индексатор для автоматизации приема данных, включая сериализацию JSON исходных данных в собственных форматах. Индексатор подключается к источнику данных, сериализует данные и передает их поисковой системе для индексирования. Большинство индексаторов поддерживают обнаружение изменений, что упрощает обновление данных.

Помимо автоматизации приема данных индексаторы также поддерживают обогащение с помощью ИИ. Можно присоединить набор навыков, который применяет последовательность навыков ИИ для обогащения данных, что делает их более пригодными для поиска. Полный набор встроенных навыков на основе API служб искусственного интеллекта Azure может помочь вам получить новые поля, например распознавание сущностей в тексте, переводе текста, оценке тональности или прогнозировании соответствующих подпись изображений. При необходимости обогащенное содержимое отправить в хранилище знаний, которое сохраняет выходные данные конвейера обогащения с помощью ИИ в таблицах и BLOB-объектах в хранилище Azure для независимого анализа или обработки в нисходящем направлении.

Независимо от того, пишете ли вы код приложения, который отправляет данные в индекс, или используете индексатор, который автоматизирует прием данных и добавляет обогащение с помощью ИИ, поля с вашим содержимым сохраняются в индексе, по которому можно выполнять поиск в клиентских приложениях. Поля используются для поиска, фильтрации и сортировки в целях последующего формирования набора результатов для отображения или использования иным образом клиентским приложением.