Descripción de las inserciones en Azure OpenAI Service

Artículo
16/10/2024

Una inserción es un formato especial de representación de datos que los modelos y algoritmos de Machine Learning pueden usar fácilmente. La incrustación es una representación densa en información del significado semántico de un texto. Cada incrustración es un vector de números de punto flotante, de modo que la distancia entre dos incrustraciones en el espacio vectorial está correlacionada con la similitud semántica entre dos entradas en el formato original. Por ejemplo, si hay dos textos similares, sus representaciones vectoriales también deberían ser similares. Inserta una búsqueda de similitud de vectores de energía en sistemas de recuperación como Azure AI Search (recomendado) y en bases de datos de Azure, como el núcleo virtual de Azure Cosmos DB for MongoDB, Azure SQL Database y Azure Database for PostgreSQL: servidor flexible.

Modelos de incrustración

Las incrustraciones facilitan el aprendizaje automático en entradas grandes que representan palabras mediante la captura de las similitudes semánticas en un espacio vectorial. Por lo tanto, se pueden usar inserciones para determinar si dos fragmentos de texto están relacionados semánticamente o son similares, y proporcionar una puntuación para evaluar la similitud.

Similitud coseno

Las inserciones de Azure OpenAI suelen depender de la similitud de coseno con respecto a la similitud de proceso entre documentos y una consulta.

Desde una perspectiva matemática, la similitud coseno mide el coseno del ángulo entre dos vectores proyectados en un espacio multidimensional. Esta medida es beneficiosa porque si dos documentos están muy separados por la distancia euclidiana debido al tamaño, podrían tener un ángulo más pequeño entre ellos y, por lo tanto, una similitud de coseno mayor. Para obtener más información sobre ecuaciones de similitud coseno, consulte Similitud de coseno.

Un método alternativo de identificación de documentos similares es contar el número de palabras comunes entre documentos. Este enfoque no se escala, ya que es probable que una expansión en el tamaño del documento lleve a un mayor número de palabras comunes detectadas incluso entre temas dispares. Por este motivo, la similitud coseno puede ofrecer una alternativa más eficaz.

Pasos siguientes

Obtenga más información sobre el uso de Azure OpenAI e incrustraciones para realizar la búsqueda de documentos con nuestro tutorial de incrustraciones.
Almacene las inserciones y realice la búsqueda de vectores (similitud) mediante núcleo virtual de Azure Cosmos DB for MongoDB, Azure Cosmos DB for NoSQL, Azure SQL Database o Azure Database for PostgreSQL - servidor flexible.
Uso de Eventhouse en Inteligencia en tiempo real en Microsoft Fabric como base de datos vectorial
- Use la función series_cosine_similarity para la búsqueda de similitud.

Recursos adicionales

Documentación

Generación de incrustraciones con Azure OpenAI Service - Azure OpenAI

Aprenda a generar incrustraciones con Azure OpenAI
Tutorial de insertado de Azure OpenAI Service - Azure OpenAI

Obtenga información sobre cómo usar la API de inserción de Azure OpenAI para la búsqueda de documentos con el conjunto de datos BillSum
Introducción al servicio Azure OpenAI con la personalización de un modelo de lenguaje grande (LLM) - Azure OpenAI Service

Obtenga más información sobre los conceptos detrás de la personalización de un LLM con Azure OpenAI.
Use sus propios datos con Azure OpenAI Service - Azure OpenAI

Use este artículo para importar y usar los datos en Azure OpenAI.
Uso de los datos con Azure OpenAI Service - Azure OpenAI

Use este artículo para obtener información sobre el uso de los datos para una mejor generación de texto en Azure OpenAI.
Consideraciones sobre el ajuste preciso de Azure OpenAI Service - Azure AI services

Obtener más información sobre lo que debe tener en cuenta antes de ajustar de forma precisa Azure OpenAI Service
Procedimientos recomendados para usar Azure OpenAI en sus datos - Azure OpenAI Service

Obtenga información sobre los procedimientos recomendados para usar Azure OpenAI en los datos, junto con cómo corregir problemas comunes.
Puesta a punto de Azure OpenAI Service gpt-4o-mini - Azure OpenAI

Obtenga información sobre cómo utilizar las últimas funciones de ajuste de Azure OpenAI con gpt-4o-mini-2024-07-18

Cursos

Módulo

Realización de la búsqueda y recuperación de vectores en Búsqueda de Azure AI - Training

Realice la búsqueda y recuperación de vectores en Búsqueda de Azure AI.

Certificación

Microsoft Certified: Azure AI Engineer Associate - Certifications

Diseñe e implemente una solución de Azure AI mediante servicios de Azure AI, Búsqueda de Azure AI y Azure Open AI.

Eventos

Compilación de Intelligent Apps

17 mar, 21 - 21 mar, 10

Únase a la serie de reuniones para crear soluciones de inteligencia artificial escalables basadas en casos de uso reales con compañeros desarrolladores y expertos.

Regístrese ahora

Compartir a través de

Descripción de las inserciones en Azure OpenAI Service

Modelos de incrustración

Similitud coseno

Pasos siguientes

Comentarios

Recursos adicionales