Aprenda a generar incrustraciones con Azure OpenAI
Una incrustración es un formato especial de representación de datos que se puede usar fácilmente por los modelos y algoritmos de Machine Learning. La incrustación es una representación densa en información del significado semántico de un texto. Cada incrustración es un vector de números de punto flotante, de modo que la distancia entre dos incrustraciones en el espacio vectorial está correlacionada con la similitud semántica entre dos entradas en el formato original. Por ejemplo, si hay dos textos similares, sus representaciones vectoriales también deberían ser similares. Las inserciones permiten la búsqueda de similitud de vectores en bases de datos de Azure, como núcleo virtual de Azure Cosmos DB for MongoDB, Azure SQL Database o Azure Database for PostgreSQL: servidor flexible.
Cómo obtener incrustraciones
A fin de obtener un vector de incrustración para un fragmento de texto, hacemos una solicitud al punto de conexión de las incrustraciones, tal como se muestra en los fragmentos de código siguientes:
curl https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings?api-version=2024-02-01\
-H 'Content-Type: application/json' \
-H 'api-key: YOUR_API_KEY' \
-d '{"input": "Sample Document goes here"}'
procedimientos recomendados
Compruebe que las entradas no superen la longitud máxima
- La longitud máxima del texto de entrada para nuestros modelos de inserción más recientes es de 8192 tokens. Antes de hacer una solicitud, debe comprobar que las entradas no superan este límite.
- Si envía una matriz de entradas en una única solicitud de inserción, el tamaño máximo de la matriz es 2048.
- Al enviar una matriz de entradas en una sola solicitud, recuerde que el número de tokens por minuto de las solicitudes debe permanecer por debajo del límite de cuota asignado en la implementación del modelo. De manera predeterminada, los modelos de inserción 3 de última generación están sujetos a un límite de 350 K TPM por región.
Limitaciones y riesgos
En casos determinados, los modelos de incrustración pueden ser poco confiables o suponer riesgos sociales y es posible que provoquen daño en la ausencia de mitigaciones. Revise el contenido de IA responsable para más información sobre cómo enfocar el uso de manera responsable.
Pasos siguientes
- Obtenga más información sobre el uso de Azure OpenAI e incrustraciones para realizar la búsqueda de documentos con nuestro tutorial de incrustraciones.
- Más información sobre los modelos subyacentes que impulsan Azure OpenAI.
- Almacene sus incrustaciones y realice vectores de búsqueda (similitud) usando el servicio de su elección:
- Azure AI Search
- Núcleo virtual de Azure Cosmos DB for MongoDB
- Azure SQL Database
- Azure Cosmos DB para NoSQL
- Azure Cosmos DB para PostgreSQL
- Azure Database for PostgreSQL: servidor flexible
- Azure Cache for Redis
- Usar Eventhouse como base de datos vectorial: inteligencia en tiempo real en Microsoft Fabric