Episodio

Datos vectoriales en Postgres: ¿cómo es diferente de los datos "normales"?

con Heikki Linnakangas

Vídeo de una conferencia sobre los datos vectoriales en Postgres presentados por Heikki Linnakangas en POSETTE: An Event for Postgres 2024. La inteligencia artificial funciona con vectores. ¿Pero qué es un vector? ¿Cómo es un vector de Postgres diferente de los enteros, texto, datos geoespaciales u otros tipos de datos de Postgres tradicionales? ¿Por qué no se puede crear un índice normal de árbol B a través de vectores? ¿Pero por qué no un índice giST?

Heikki tocará estos temas de Postgres y pgvector:

  • Tipos de datos de la extensión pgvector, incluidos los nuevos tipos de vector dispersos y de bits
  • Maldición de la dimensionalidad con bases de datos vectoriales
  • Algoritmos de búsqueda vectorial, incluidos HNSW (mundos pequeños navegables jerárquicos)

Heikki es un cofundador de Neon y un desarrollador y confirmador de PostgreSQL de mucho tiempo. Desde 2023, también ha contribuido a pgvector.

Capítulos

  • 00:00: Introducción
  • 01:37 : la búsqueda de vectores es costosa
  • 02:30 - ¿Qué es un vector?
  • 03:57 : los vectores son grandes
  • 06:36 - ¿Qué es la búsqueda de vectores?
  • 11:45 : la búsqueda de vectores es aproximada
  • 15:17 : tipos de algoritmos de búsqueda vectorial
  • 20:12 - Tres nuevos tipos de datos en pgvector 0.7.0
  • 23:55 - Resumen

Conexión

Azure
Azure Database for PostgreSQL