Eventos
Compilación de Intelligent Apps
17 mar, 21 - 21 mar, 10
Únase a la serie de reuniones para crear soluciones de inteligencia artificial escalables basadas en casos de uso reales con compañeros desarrolladores y expertos.
Regístrese ahoraEste explorador ya no se admite.
Actualice a Microsoft Edge para aprovechar las características y actualizaciones de seguridad más recientes, y disponer de soporte técnico.
Las API de inserción multimodal permiten la vectorización de imágenes y consultas de texto. Convierten imágenes en coordenadas en un espacio vectorial multidimensional. A continuación, las consultas de texto entrantes también se pueden convertir en vectores y las imágenes se pueden comparar con el texto en función de la proximidad semántica. Esto permite al usuario buscar en un conjunto de imágenes mediante texto, sin necesidad de usar etiquetas de imagen u otros metadatos. La proximidad semántica suele producir mejores resultados en la búsqueda.
La API 2024-02-01
incluye un modelo multilingüe (versión del modelo 2023-04-15
) que admite la búsqueda de texto en 102 idiomas. El modelo de solo inglés original (versión 2022-04-11
) sigue disponible, pero no se puede combinar con el nuevo modelo en el mismo índice de búsqueda. Si ha vectorizado texto e imágenes con el modelo de solo inglés, estos vectores no serán compatibles con vectores de imagen y texto multilingües.
Importante
Estas API solo están disponibles en determinadas regiones geográficas. Consulte Disponibilidad de la región.
Puede probar la característica de inserciones multimodales de forma rápida y sencilla en el explorador mediante Vision Studio.
Importante
La experiencia de Vision Studio está limitada a 500 imágenes. Para usar un conjunto de imágenes mayor, cree su propia aplicación de búsqueda utilizando las API de esta guía.
La API retrieval:vectorizeImage
permite convertir los datos de una imagen en un vector. Para la llamada, realice estos cambios en el siguiente comando cURL:
<endpoint>
por su punto de conexión de Visión de Azure AI.<subscription-key>
por su clave de Visión de Azure AI."url"
como la dirección URL de una imagen remota que desea utilizar.model-version
a una versión anterior.
2022-04-11
es el modelo heredado que solo admite texto en inglés. Las imágenes y el texto que se vectorizan con un modelo determinado no son compatibles con otros modelos, por lo que asegúrese de usar el mismo modelo para ambos.curl.exe -v -X POST "<endpoint>/computervision/retrieval:vectorizeImage?api-version=2024-02-01&model-version=2023-04-15" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription-key>" --data-ascii "
{
'url':'https://learn.microsoft.com/azure/ai-services/computer-vision/media/quickstarts/presentation.png'
}"
Para vectorizar una imagen local, se ponen los datos binarios en el cuerpo de la solicitud HTTP.
La llamada API devuelve un objeto JSON vectorial, que define las coordenadas de la imagen en el espacio vectorial de alta dimensión.
{
"modelVersion": "2022-04-11",
"vector": [ -0.09442752, -0.00067171326, -0.010985051, ... ]
}
La API retrieval:vectorizeText
permite convertir una cadena de texto en un vector. Para la llamada, realice estos cambios en el siguiente comando cURL:
<endpoint>
por su punto de conexión de Visión de Azure AI.<subscription-key>
por su clave de Visión de Azure AI."text"
en el término de búsqueda de ejemplo que desea usar.model-version
a una versión anterior.
2022-04-11
es el modelo heredado que solo admite texto en inglés. Las imágenes y el texto que se vectorizan con un modelo determinado no son compatibles con otros modelos, por lo que asegúrese de usar el mismo modelo para ambos.curl.exe -v -X POST "<endpoint>/computervision/retrieval:vectorizeText?api-version=2024-02-01&model-version=2023-04-15" -H "Content-Type: application/json" -H "Ocp-Apim-Subscription-Key: <subscription-key>" --data-ascii "
{
'text':'cat jumping'
}"
La llamada API devuelve un objeto JSON vectorial, que define las coordenadas de la cadena de texto en el espacio vectorial de alta dimensión.
{
"modelVersion": "2023-04-15",
"vector": [ -0.09442752, -0.00067171326, -0.010985051, ... ]
}
La similitud de coseno es un método para medir la similitud de dos vectores. En un escenario de recuperación de imágenes, comparará el vector de consulta de búsqueda con cada vector de imagen. Las imágenes que están por encima de un umbral determinado de similitud se pueden devolver como resultados de búsqueda.
El siguiente código de ejemplo calcula la similitud de coseno entre dos vectores. Es necesario decidir qué umbral de similitud usar para devolver imágenes como resultados de búsqueda.
public static float GetCosineSimilarity(float[] vector1, float[] vector2)
{
float dotProduct = 0;
int length = Math.Min(vector1.Length, vector2.Length);
for (int i = 0; i < length; i++)
{
dotProduct += vector1[i] * vector2[i];
}
float magnitude1 = Math.Sqrt(vector1.Select(x => x * x).Sum());
float magnitude2 = Math.Sqrt(vector2.Select(x => x * x).Sum());
return dotProduct / (magnitude1 * magnitude2);
}
Eventos
Compilación de Intelligent Apps
17 mar, 21 - 21 mar, 10
Únase a la serie de reuniones para crear soluciones de inteligencia artificial escalables basadas en casos de uso reales con compañeros desarrolladores y expertos.
Regístrese ahoraCursos
Módulo
Realización de la búsqueda y recuperación de vectores en Búsqueda de Azure AI - Training
Realice la búsqueda y recuperación de vectores en Búsqueda de Azure AI.
Certificación
Microsoft Certified: Azure AI Engineer Associate - Certifications
Diseñe e implemente una solución de Azure AI mediante servicios de Azure AI, Búsqueda de Azure AI y Azure Open AI.
Documentación
Conceptos de inserciones multimodales: Análisis de imágenes 4.0 - Azure AI services
Obtenga información sobre los conceptos relacionados con la vectorización de imágenes y la búsqueda y recuperación mediante la API Image Analysis 4.0.
Aptitud de inserción de azure AI Vision multiinstalación - Azure AI Search
Vectorice imágenes o texto mediante la API de inserciones vectoriales de Azure AI Vision.
Vectorizador de Visión de Azure AI - Azure AI Search
Se conecta a un recurso de Visión de Azure AI para generar incrustaciones en el momento de la consulta.
Revolución de la búsqueda de imágenes con vectores
Descubra el potencial de cambio de juego de la característica de búsqueda vectorial de Azure Cognitive Search (versión preliminar), que permite una recuperación de imágenes precisa y eficaz mediante la captura de similitudes semánticas entre imágenes. Profundizar en funcionalidades avanzadas de búsqueda de imágenes, como la similitud de imágenes basada en contenido, las recomendaciones visuales y la agrupación en clústeres de imágenes. Testigo del impacto transformador de emparejamiento de Azure Cognitive S