Descripciones de imágenes
Visión de Azure AI puede analizar una imagen y generar una frase inteligible que describa su contenido. El servicio devuelve varias descripciones según diferentes características visuales y cada descripción tiene una puntuación de confianza. El resultado final es una lista de descripciones ordenadas de mayor a menor confianza.
El inglés es el único idioma admitido para la descripción de la imagen.
Pruebe las características de generación de subtítulos para imágenes de forma rápida y sencilla en el explorador mediante Vision Studio.
Ejemplo de descripción de imagen
La siguiente respuesta JSON ilustra lo que devuelve la API de Analyze Image al describir la imagen de ejemplo basándose en sus características visuales.
{
"description":{
"tags":[
"outdoor",
"city",
"white"
],
"captions":[
{
"text":"a city with tall buildings",
"confidence":0.48468858003616333
}
]
},
"requestId":"7e5e5cac-ef16-43ca-a0c4-02bd49d379e9",
"metadata":{
"height":300,
"width":239,
"format":"Png"
},
"modelVersion":"2021-05-01"
}
Uso de la API
La característica de descripción de imágenes forma parte de la API Analyze Image. Puede llamar a esta API mediante una SDK nativa o con llamadas a REST. Incluya Description
en el parámetro de consulta visualFeatures. Después, cuando obtenga la respuesta JSON completa, analice la cadena con el contenido de la sección "description"
.
Pasos siguientes
Conozca los conceptos relacionados de etiquetado de imágenes y de categorización de imágenes.