ComputerVisionClientOperationsMixin Clase

Herencia
builtins.object
ComputerVisionClientOperationsMixin

Constructor

ComputerVisionClientOperationsMixin()

Métodos

analyze_image

Esta operación extrae un amplio conjunto de características visuales en función del contenido de la imagen. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Dentro de la solicitud, hay un parámetro opcional que le permite elegir qué características se van a devolver. De forma predeterminada, las categorías de imagen se devuelven en la respuesta. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que ha ido mal.

analyze_image_by_domain

Esta operación reconoce el contenido de una imagen mediante la aplicación de un modelo específico del dominio. La lista de modelos específicos del dominio admitidos por Computer Vision API se puede obtener mediante la solicitud /models GET. Actualmente, la API proporciona los siguientes modelos específicos del dominio: celebridades, lugares de interés. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que ha ido mal.

analyze_image_by_domain_in_stream

Esta operación reconoce el contenido de una imagen mediante la aplicación de un modelo específico del dominio. La lista de modelos específicos del dominio admitidos por Computer Vision API se puede obtener mediante la solicitud /models GET. Actualmente, la API proporciona los siguientes modelos específicos del dominio: celebridades, lugares de interés. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que ha ido mal.

analyze_image_in_stream

Esta operación extrae un amplio conjunto de características visuales en función del contenido de la imagen. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Dentro de la solicitud, hay un parámetro opcional que permite elegir las características que se van a devolver. De forma predeterminada, las categorías de imagen se devuelven en la respuesta. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

describe_image

Esta operación genera una descripción de una imagen en lenguaje natural con frases completas. La descripción se basa en una colección de etiquetas de contenido que también son devueltas por la operación. Puede generarse más de una descripción de cada imagen. Las descripciones se ordenan por su puntuación de confianza. Las descripciones pueden incluir resultados de modelos de dominio famosos y de puntos de referencia, si procede. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

describe_image_in_stream

Esta operación genera una descripción de una imagen en lenguaje natural con frases completas. La descripción se basa en una colección de etiquetas de contenido que también son devueltas por la operación. Puede generarse más de una descripción de cada imagen. Las descripciones se ordenan por su puntuación de confianza. Las descripciones pueden incluir resultados de modelos de dominio famosos y de puntos de referencia, si procede. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

detect_objects

Realiza la detección de objetos en la imagen especificada. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

detect_objects_in_stream

Realiza la detección de objetos en la imagen especificada. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

generate_thumbnail

Esta operación genera una imagen en miniatura con el ancho y alto especificados por el usuario. De forma predeterminada, el servicio analiza la imagen, identifica la región de interés (ROI) y genera las coordenadas de recorte inteligentes según el ROI. El recorte inteligente ayuda a especificar una relación de aspecto que difiere de la de la imagen de entrada. Una respuesta correcta contiene el binario de la imagen en miniatura. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

generate_thumbnail_in_stream

Esta operación genera una imagen en miniatura con el ancho y alto especificados por el usuario. De forma predeterminada, el servicio analiza la imagen, identifica la región de interés (ROI) y genera las coordenadas de recorte inteligentes según el ROI. El recorte inteligente ayuda a especificar una relación de aspecto que difiere de la de la imagen de entrada. Una respuesta correcta contiene el binario de la imagen en miniatura. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

get_area_of_interest

Esta operación devuelve un rectángulo delimitador alrededor del área más importante de la imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

get_area_of_interest_in_stream

Esta operación devuelve un rectángulo delimitador alrededor del área más importante de la imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

get_read_result

Esta interfaz se usa para obtener los resultados de OCR de la operación de lectura. La dirección URL de esta interfaz debe recuperarse del campo "Operation-Location" devuelto desde la interfaz read.

list_models

Esta operación devuelve la lista de modelos específicos del dominio admitidos por Computer Vision API. Actualmente, la API admite los siguientes modelos específicos del dominio: reconocimiento de celebridades, reconocimiento de lugares de interés. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

read

Use esta interfaz para obtener el resultado de una operación de lectura, utilizando los algoritmos de reconocimiento óptico de caracteres (OCR) de última generación optimizados para documentos con gran cantidad de texto. Cuando se usa la interfaz Read, la respuesta contiene un campo denominado "Operation-Location". El campo "Operation-Location" contiene la dirección URL que debe usar para la operación "GetReadResult" para acceder a los resultados de OCR..

read_in_stream

Use esta interfaz para obtener el resultado de una operación de lectura, utilizando los algoritmos de reconocimiento óptico de caracteres (OCR) de última generación optimizados para documentos con gran cantidad de texto. Cuando se usa la interfaz Read, la respuesta contiene un campo denominado "Operation-Location". El campo "Operation-Location" contiene la dirección URL que debe usar para la operación "GetReadResult" para acceder a los resultados de OCR..

recognize_printed_text

El reconocimiento óptico de caracteres (OCR) detecta el texto de una imagen y extrae los caracteres reconocidos en una secuencia de caracteres que se puede usar en una máquina. Si se ejecuta correctamente, se devolverán los resultados de OCR. Tras un error, se devolverá el código de error junto con un mensaje de error. El código de error puede ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError.

recognize_printed_text_in_stream

El reconocimiento óptico de caracteres (OCR) detecta el texto de una imagen y extrae los caracteres reconocidos en una secuencia de caracteres que se puede usar en una máquina. Si se ejecuta correctamente, se devolverán los resultados de OCR. Tras un error, se devolverá el código de error junto con un mensaje de error. El código de error puede ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError.

tag_image

Esta operación genera una lista de palabras o etiquetas que son representativas del contenido de la imagen proporcionada. Computer Vision API puede devolver etiquetas basadas en objetos, seres vivos, paisajes o acciones encontrados en las imágenes. A diferencia de las categorías, las etiquetas no se organizan según un sistema de clasificación jerárquico, sino que se corresponden con el contenido de la imagen. Las etiquetas pueden contener sugerencias para evitar la ambigüedad o proporcionar un contexto; por ejemplo, la etiqueta "ascomiceto" puede venir acompañada de la sugerencia "hongo". Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

tag_image_in_stream

Esta operación genera una lista de palabras o etiquetas que son representativas del contenido de la imagen proporcionada. Computer Vision API puede devolver etiquetas basadas en objetos, seres vivos, paisajes o acciones encontrados en las imágenes. A diferencia de las categorías, las etiquetas no se organizan según un sistema de clasificación jerárquico, sino que se corresponden con el contenido de la imagen. Las etiquetas pueden contener sugerencias para evitar la ambigüedad o proporcionar un contexto; por ejemplo, la etiqueta "ascomiceto" puede venir acompañada de la sugerencia "hongo". Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

analyze_image

Esta operación extrae un amplio conjunto de características visuales en función del contenido de la imagen. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Dentro de la solicitud, hay un parámetro opcional que le permite elegir qué características se van a devolver. De forma predeterminada, las categorías de imagen se devuelven en la respuesta. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que ha ido mal.

analyze_image(url, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parámetros

url
str
Requerido

Dirección URL accesible públicamente de una imagen.

visual_features
list[str o VisualFeatureTypes]
valor predeterminado: None

Cadena que indica qué tipos de características visuales se van a devolver. Varios valores deben estar separados por comas. Los tipos de características visuales válidos incluyen: Categorías: clasifica el contenido de la imagen según una taxonomía definida en la documentación. Etiquetas: etiqueta la imagen con una lista detallada de palabras relacionadas con el contenido de la imagen. Descripción: describe el contenido de la imagen con una oración completa en inglés. Caras: detecta si las caras están presentes. Si las hay, genere las coordenadas, el género y la edad. ImageType: detecta si la imagen está prediseñada o si es un dibujo lineal. Color: determina el color de énfasis, el color dominante y si una imagen es blanca negra&. Adulto: detecta si la imagen es pornográfica por naturaleza (representa nudidad o un acto sexual), o es goria (representa violencia extrema o sangre). También se detecta contenido provocativo (esto es, contenido subido de tono). Objetos: detecta varios objetos dentro de una imagen, incluida la ubicación aproximada. El argumento Objects solo está disponible en inglés. Marcas: detecta varias marcas dentro de una imagen, incluida la ubicación aproximada. El argumento Brands solo está disponible en inglés.

details
list[str o Details]
valor predeterminado: None

Cadena que indica qué detalles específicos del dominio se van a devolver. Varios valores deben estar separados por comas. Los tipos de características visuales válidos incluyen: Celebridades: identifica celebridades si se detectan en la imagen, Landmarks, identifica puntos de referencia importantes en la imagen.

language
str
valor predeterminado: en

Idioma deseado para la generación de salida. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'

description_exclude
list[str o DescriptionExclude]
valor predeterminado: None

Desactive los modelos de dominio especificados al generar la descripción.

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

ImageAnalysis o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

analyze_image_by_domain

Esta operación reconoce el contenido de una imagen mediante la aplicación de un modelo específico del dominio. La lista de modelos específicos del dominio admitidos por Computer Vision API se puede obtener mediante la solicitud /models GET. Actualmente, la API proporciona los siguientes modelos específicos del dominio: celebridades, lugares de interés. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que ha ido mal.

analyze_image_by_domain(model, url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

Parámetros

model
str
Requerido

Contenido específico del dominio que se va a reconocer.

url
str
Requerido

Dirección URL accesible públicamente de una imagen.

language
str
valor predeterminado: en

Idioma deseado para la generación de salida. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

DomainModelResults o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

analyze_image_by_domain_in_stream

Esta operación reconoce el contenido de una imagen mediante la aplicación de un modelo específico del dominio. La lista de modelos específicos del dominio admitidos por Computer Vision API se puede obtener mediante la solicitud /models GET. Actualmente, la API proporciona los siguientes modelos específicos del dominio: celebridades, lugares de interés. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que ha ido mal.

analyze_image_by_domain_in_stream(model, image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parámetros

model
str
Requerido

Contenido específico del dominio que se va a reconocer.

image
Generator
Requerido

Secuencia de imágenes.

language
str
valor predeterminado: en

Idioma deseado para la generación de salida. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

callback
Callable[<xref:Bytes>, <xref:response=None>]
valor predeterminado: None

Cuando se especifique, se llamará con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

DomainModelResults o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

analyze_image_in_stream

Esta operación extrae un amplio conjunto de características visuales en función del contenido de la imagen. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Dentro de la solicitud, hay un parámetro opcional que permite elegir las características que se van a devolver. De forma predeterminada, las categorías de imagen se devuelven en la respuesta. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

analyze_image_in_stream(image, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parámetros

image
Generator
Requerido

Secuencia de imágenes.

visual_features
list[str o VisualFeatureTypes]
valor predeterminado: None

Cadena que indica qué tipos de características visuales se van a devolver. Varios valores deben estar separados por comas. Los tipos de características visuales válidos incluyen: Categorías: clasifica el contenido de la imagen según una taxonomía definida en la documentación. Etiquetas: etiqueta la imagen con una lista detallada de palabras relacionadas con el contenido de la imagen. Descripción: describe el contenido de la imagen con una oración completa en inglés. Caras: detecta si las caras están presentes. Si las hay, genere las coordenadas, el género y la edad. ImageType: detecta si la imagen está prediseñada o si es un dibujo lineal. Color: determina el color de énfasis, el color dominante y si una imagen es blanca negra&. Adulto: detecta si la imagen es pornográfica por naturaleza (representa nudidad o un acto sexual), o es goria (representa violencia extrema o sangre). También se detecta contenido provocativo (esto es, contenido subido de tono). Objetos: detecta varios objetos dentro de una imagen, incluida la ubicación aproximada. El argumento Objects solo está disponible en inglés. Marcas: detecta varias marcas dentro de una imagen, incluida la ubicación aproximada. El argumento Brands solo está disponible en inglés.

details
list[str o Details]
valor predeterminado: None

Cadena que indica qué detalles específicos del dominio se van a devolver. Varios valores deben estar separados por comas. Los tipos de características visuales válidos incluyen: Celebridades: identifica celebridades si se detectan en la imagen, Landmarks, identifica puntos de referencia importantes en la imagen.

language
str
valor predeterminado: en

Idioma deseado para la generación de resultados. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'

description_exclude
list[str o DescriptionExclude]
valor predeterminado: None

Desactive los modelos de dominio especificados al generar la descripción.

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

callback
Callable[<xref:Bytes>, <xref:response=None>]
valor predeterminado: None

Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

ImageAnalysis o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

describe_image

Esta operación genera una descripción de una imagen en lenguaje natural con frases completas. La descripción se basa en una colección de etiquetas de contenido que también son devueltas por la operación. Puede generarse más de una descripción de cada imagen. Las descripciones se ordenan por su puntuación de confianza. Las descripciones pueden incluir resultados de modelos de dominio famosos y de puntos de referencia, si procede. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

describe_image(url, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parámetros

url
str
Requerido

Dirección URL accesible públicamente de una imagen.

max_candidates
int
valor predeterminado: 1

Número máximo de descripciones candidatas que se van a devolver. El valor predeterminado es 1.

language
str
valor predeterminado: en

Idioma deseado para la generación de resultados. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'

description_exclude
list[str o DescriptionExclude]
valor predeterminado: None

Desactive los modelos de dominio especificados al generar la descripción.

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

ImageDescription o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

describe_image_in_stream

Esta operación genera una descripción de una imagen en lenguaje natural con frases completas. La descripción se basa en una colección de etiquetas de contenido que también son devueltas por la operación. Puede generarse más de una descripción de cada imagen. Las descripciones se ordenan por su puntuación de confianza. Las descripciones pueden incluir resultados de modelos de dominio famosos y de puntos de referencia, si procede. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

describe_image_in_stream(image, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parámetros

image
Generator
Requerido

Una secuencia de imágenes.

max_candidates
int
valor predeterminado: 1

Número máximo de descripciones candidatas que se van a devolver. El valor predeterminado es 1.

language
str
valor predeterminado: en

Idioma deseado para la generación de resultados. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'

description_exclude
list[str o DescriptionExclude]
valor predeterminado: None

Desactive los modelos de dominio especificados al generar la descripción.

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

callback
Callable[<xref:Bytes>, <xref:response=None>]
valor predeterminado: None

Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

ImageDescription o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

detect_objects

Realiza la detección de objetos en la imagen especificada. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

detect_objects(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parámetros

url
str
Requerido

Dirección URL accesible públicamente de una imagen.

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

DetectResult o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

detect_objects_in_stream

Realiza la detección de objetos en la imagen especificada. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

detect_objects_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parámetros

image
Generator
Requerido

Una secuencia de imágenes.

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

callback
Callable[<xref:Bytes>, <xref:response=None>]
valor predeterminado: None

Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

DetectResult o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

generate_thumbnail

Esta operación genera una imagen en miniatura con el ancho y alto especificados por el usuario. De forma predeterminada, el servicio analiza la imagen, identifica la región de interés (ROI) y genera las coordenadas de recorte inteligentes según el ROI. El recorte inteligente ayuda a especificar una relación de aspecto que difiere de la de la imagen de entrada. Una respuesta correcta contiene el binario de la imagen en miniatura. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

generate_thumbnail(width, height, url, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parámetros

width
int
Requerido

Ancho de la miniatura, en píxeles. Debe estar entre 1 y 1024. Se recomienda un mínimo de 50.

height
int
Requerido

Alto de la miniatura, en píxeles. Debe estar entre 1 y 1024. Se recomienda un mínimo de 50.

url
str
Requerido

Dirección URL accesible públicamente de una imagen.

smart_cropping
bool
valor predeterminado: False

Marca booleana para habilitar el recorte inteligente.

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

callback
Callable[<xref:Bytes>, <xref:response=None>]
valor predeterminado: None

Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

object o ClientRawResponse if raw=true

Tipo de valor devuelto

Excepciones

generate_thumbnail_in_stream

Esta operación genera una imagen en miniatura con el ancho y alto especificados por el usuario. De forma predeterminada, el servicio analiza la imagen, identifica la región de interés (ROI) y genera las coordenadas de recorte inteligentes según el ROI. El recorte inteligente ayuda a especificar una relación de aspecto que difiere de la de la imagen de entrada. Una respuesta correcta contiene el binario de la imagen en miniatura. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

generate_thumbnail_in_stream(width, height, image, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parámetros

width
int
Requerido

Ancho de la miniatura, en píxeles. Debe estar entre 1 y 1024. Se recomienda un mínimo de 50.

height
int
Requerido

Alto de la miniatura, en píxeles. Debe estar entre 1 y 1024. Se recomienda un mínimo de 50.

image
Generator
Requerido

Una secuencia de imágenes.

smart_cropping
bool
valor predeterminado: False

Marca booleana para habilitar el recorte inteligente.

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

callback
Callable[<xref:Bytes>, <xref:response=None>]
valor predeterminado: None

Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

object o ClientRawResponse if raw=true

Tipo de valor devuelto

Excepciones

get_area_of_interest

Esta operación devuelve un rectángulo delimitador alrededor del área más importante de la imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

get_area_of_interest(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

Parámetros

url
str
Requerido

Dirección URL accesible públicamente de una imagen.

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

AreaOfInterestResult o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

get_area_of_interest_in_stream

Esta operación devuelve un rectángulo delimitador alrededor del área más importante de la imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.

get_area_of_interest_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parámetros

image
Generator
Requerido

Una secuencia de imágenes.

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

callback
Callable[<xref:Bytes>, <xref:response=None>]
valor predeterminado: None

Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

AreaOfInterestResult o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

get_read_result

Esta interfaz se usa para obtener los resultados de OCR de la operación de lectura. La dirección URL de esta interfaz debe recuperarse del campo "Operation-Location" devuelto desde la interfaz read.

get_read_result(operation_id, custom_headers=None, raw=False, **operation_config)

Parámetros

operation_id
str
Requerido

Identificador de la operación de lectura devuelta en la respuesta de la interfaz "Read".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

ReadOperationResult o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

list_models

Esta operación devuelve la lista de modelos específicos del dominio admitidos por Computer Vision API. Actualmente, la API admite los siguientes modelos específicos del dominio: reconocimiento de celebridades, reconocimiento de lugares de interés. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

list_models(custom_headers=None, raw=False, **operation_config)

Parámetros

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

ListModelsResult o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

read

Use esta interfaz para obtener el resultado de una operación de lectura, utilizando los algoritmos de reconocimiento óptico de caracteres (OCR) de última generación optimizados para documentos con gran cantidad de texto. Cuando se usa la interfaz Read, la respuesta contiene un campo denominado "Operation-Location". El campo "Operation-Location" contiene la dirección URL que debe usar para la operación "GetReadResult" para acceder a los resultados de OCR..

read(url, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, **operation_config)

Parámetros

url
str
Requerido

Dirección URL accesible públicamente de una imagen.

language
str o OcrDetectionLanguage
valor predeterminado: None

Código de idioma BCP-47 del texto del documento. Read admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese en ese idioma específico. Consulte https://aka.ms/ocr-languages para obtener una lista de los idiomas admitidos. Entre los valores posibles se incluyen: 'af', 'ast', 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'

pages
list[str]
valor predeterminado: None

Números de página personalizados para documentos de varias páginas (PDF/TIFF), escriba el número de páginas que desea obtener el resultado de OCR. Para un intervalo de páginas, use un guión. Separe cada página o intervalo con una coma.

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo OCR usado para la extracción de texto. Los valores aceptados son: "latest", "latest-preview", "2021-04-12". El valor predeterminado es "latest".

reading_order
str
valor predeterminado: basic

Parámetro opcional para especificar qué algoritmo de orden de lectura se debe aplicar al ordenar los elementos de texto de extracción. Puede ser "básico" o "natural". El valor predeterminado es "basic" si no se especifica.

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

Ninguno o ClientRawResponse si raw=true

Tipo de valor devuelto

None,

Excepciones

read_in_stream

Use esta interfaz para obtener el resultado de una operación de lectura, utilizando los algoritmos de reconocimiento óptico de caracteres (OCR) de última generación optimizados para documentos con gran cantidad de texto. Cuando se usa la interfaz Read, la respuesta contiene un campo denominado "Operation-Location". El campo "Operation-Location" contiene la dirección URL que debe usar para la operación "GetReadResult" para acceder a los resultados de OCR..

read_in_stream(image, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, callback=None, **operation_config)

Parámetros

image
Generator
Requerido

Una secuencia de imágenes.

language
str o OcrDetectionLanguage
valor predeterminado: None

Código de idioma BCP-47 del texto del documento. Read admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese en ese idioma específico. Consulte https://aka.ms/ocr-languages para obtener una lista de los idiomas admitidos. Entre los valores posibles se incluyen: 'af', 'ast', 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'

pages
list[str]
valor predeterminado: None

Números de página personalizados para documentos de varias páginas (PDF/TIFF), escriba el número de páginas que desea obtener el resultado de OCR. Para un intervalo de páginas, use un guión. Separe cada página o intervalo con una coma.

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo OCR usado para la extracción de texto. Los valores aceptados son: "latest", "latest-preview", "2021-04-12". El valor predeterminado es "latest".

reading_order
str
valor predeterminado: basic

Parámetro opcional para especificar qué algoritmo de orden de lectura se debe aplicar al ordenar los elementos de texto de extracción. Puede ser "básico" o "natural". El valor predeterminado es "basic" si no se especifica.

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

callback
Callable[<xref:Bytes>, <xref:response=None>]
valor predeterminado: None

Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

Ninguno o ClientRawResponse si raw=true

Tipo de valor devuelto

None,

Excepciones

recognize_printed_text

El reconocimiento óptico de caracteres (OCR) detecta el texto de una imagen y extrae los caracteres reconocidos en una secuencia de caracteres que se puede usar en una máquina. Si se ejecuta correctamente, se devolverán los resultados de OCR. Tras un error, se devolverá el código de error junto con un mensaje de error. El código de error puede ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError.

recognize_printed_text(url, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, **operation_config)

Parámetros

detect_orientation
bool
valor predeterminado: True

Si detecta la orientación del texto en la imagen. Con detectOrientation=true, el servicio OCR intenta detectar la orientación de la imagen y corregirla antes de su posterior procesamiento (por ejemplo, si está al revés).

url
str
Requerido

Dirección URL accesible públicamente de una imagen.

language
str o OcrLanguages
valor predeterminado: unk

Código de idioma BCP-47 del texto que se va a detectar en la imagen. El valor predeterminado es "unk". Entre los valores posibles se incluyen: "unk", "zh-Hans", "zh-Hant", 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

OcrResult o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

recognize_printed_text_in_stream

El reconocimiento óptico de caracteres (OCR) detecta el texto de una imagen y extrae los caracteres reconocidos en una secuencia de caracteres que se puede usar en una máquina. Si se ejecuta correctamente, se devolverán los resultados de OCR. Tras un error, se devolverá el código de error junto con un mensaje de error. El código de error puede ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError.

recognize_printed_text_in_stream(image, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parámetros

detect_orientation
bool
valor predeterminado: True

Si detecta la orientación del texto en la imagen. Con detectOrientation=true, el servicio OCR intenta detectar la orientación de la imagen y corregirla antes de su posterior procesamiento (por ejemplo, si está al revés).

image
Generator
Requerido

Una secuencia de imágenes.

language
str o OcrLanguages
valor predeterminado: unk

Código de idioma BCP-47 del texto que se va a detectar en la imagen. El valor predeterminado es "unk". Entre los valores posibles se incluyen: "unk", "zh-Hans", "zh-Hant", 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

callback
Callable[<xref:Bytes>, <xref:response=None>]
valor predeterminado: None

Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

OcrResult o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

tag_image

Esta operación genera una lista de palabras o etiquetas que son representativas del contenido de la imagen proporcionada. Computer Vision API puede devolver etiquetas basadas en objetos, seres vivos, paisajes o acciones encontrados en las imágenes. A diferencia de las categorías, las etiquetas no se organizan según un sistema de clasificación jerárquico, sino que se corresponden con el contenido de la imagen. Las etiquetas pueden contener sugerencias para evitar la ambigüedad o proporcionar un contexto; por ejemplo, la etiqueta "ascomiceto" puede venir acompañada de la sugerencia "hongo". Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

tag_image(url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

Parámetros

url
str
Requerido

Dirección URL accesible públicamente de una imagen.

language
str
valor predeterminado: en

Idioma deseado para la generación de resultados. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

TagResult o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones

tag_image_in_stream

Esta operación genera una lista de palabras o etiquetas que son representativas del contenido de la imagen proporcionada. Computer Vision API puede devolver etiquetas basadas en objetos, seres vivos, paisajes o acciones encontrados en las imágenes. A diferencia de las categorías, las etiquetas no se organizan según un sistema de clasificación jerárquico, sino que se corresponden con el contenido de la imagen. Las etiquetas pueden contener sugerencias para evitar la ambigüedad o proporcionar un contexto; por ejemplo, la etiqueta "ascomiceto" puede venir acompañada de la sugerencia "hongo". Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.

tag_image_in_stream(image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

Parámetros

image
Generator
Requerido

Una secuencia de imágenes.

language
str
valor predeterminado: en

Idioma deseado para la generación de resultados. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'

model_version
str
valor predeterminado: latest

Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".

custom_headers
dict
valor predeterminado: None

encabezados que se agregarán a la solicitud

raw
bool
valor predeterminado: False

devuelve la respuesta directa junto con la respuesta deserializada.

callback
Callable[<xref:Bytes>, <xref:response=None>]
valor predeterminado: None

Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.

operation_config
Requerido

Invalidaciones de configuración de la operación.

Devoluciones

TagResult o ClientRawResponse si raw=true

Tipo de valor devuelto

Excepciones