Серия

Помимо ключевых слов: поиск сходства изображений в Azure Cosmos DB для PostgreSQL | День Обработка и анализ данных Python

на Foteini Savvidou

Векторный поиск, также известный как поиск сходства векторов, — это метод, который помогает находить похожие элементы на основе их содержимого, а не точные совпадения свойств, таких как ключевое слово, теги или другие метаданные, как и системы поиска на основе ключевое слово. Он использует машинное обучение для отслеживания смысла данных, позволяя находить похожие элементы на основе их содержимого. Ключевой идеей поиска векторов является перевод неструктурированных данных, таких как текст, изображения, видео и аудио, в высокомерные векторы (также известные как внедрение) и применение ближайших алгоритмов соседей для поиска похожих данных.

В этом кратком руководстве мы будем работать вместе, чтобы создать систему поиска сходства изображений с помощью Python, Azure Cosmos DB для PostgreSQL и pgvector, расширения поиска по сходству вектора с открытым исходным кодом для PostgreSQL. Мы рассмотрим процесс создания векторных внедрения с помощью API многофакторной внедрения распознавания искусственного интеллекта Azure и включения расширения pgvector. Затем мы обсудим точный и приблизительный поиск ближайших соседей и используйте Azure Cosmos DB для PostgreSQL для хранения и запроса векторных данных.

Главы

  • 00:00 — поиск сходства изображений в Azure CosmosDB для PostgreSQL
  • 00:56 - Почему векторный поиск?
  • 01:49 - Повестка дня
  • 02:14 . Преобразование данных в векторы
  • 03:02 — проектирует векторы на 2D-векторное пространство
  • 03:37 — как измерить, если 2 вектора являются simlar
  • 03:56 — рабочий процесс поиска векторов
  • 04:34 — поиск вектора в PostgreSQL
  • 05:01 . Создание таблицы для хранения внедренных данных
  • 05:34 — внедрение запросов
  • 06:01 — демонстрация
  • 07:00 — стратегии поиска векторов
  • 08:21 . Создание индекса IVFlat в pgvector
  • 09:30 — демонстрация
  • 10:01 — ресурсы

Связь

Разработка
Python