ComputerVisionClientOperationsMixin Clase
- Herencia
-
builtins.objectComputerVisionClientOperationsMixin
Constructor
ComputerVisionClientOperationsMixin()
Métodos
analyze_image |
Esta operación extrae un amplio conjunto de características visuales en función del contenido de la imagen. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Dentro de la solicitud, hay un parámetro opcional que le permite elegir qué características se van a devolver. De forma predeterminada, las categorías de imagen se devuelven en la respuesta. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que ha ido mal. |
analyze_image_by_domain |
Esta operación reconoce el contenido de una imagen mediante la aplicación de un modelo específico del dominio. La lista de modelos específicos del dominio admitidos por Computer Vision API se puede obtener mediante la solicitud /models GET. Actualmente, la API proporciona los siguientes modelos específicos del dominio: celebridades, lugares de interés. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que ha ido mal. |
analyze_image_by_domain_in_stream |
Esta operación reconoce el contenido de una imagen mediante la aplicación de un modelo específico del dominio. La lista de modelos específicos del dominio admitidos por Computer Vision API se puede obtener mediante la solicitud /models GET. Actualmente, la API proporciona los siguientes modelos específicos del dominio: celebridades, lugares de interés. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que ha ido mal. |
analyze_image_in_stream |
Esta operación extrae un amplio conjunto de características visuales en función del contenido de la imagen. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Dentro de la solicitud, hay un parámetro opcional que permite elegir las características que se van a devolver. De forma predeterminada, las categorías de imagen se devuelven en la respuesta. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal. |
describe_image |
Esta operación genera una descripción de una imagen en lenguaje natural con frases completas. La descripción se basa en una colección de etiquetas de contenido que también son devueltas por la operación. Puede generarse más de una descripción de cada imagen. Las descripciones se ordenan por su puntuación de confianza. Las descripciones pueden incluir resultados de modelos de dominio famosos y de puntos de referencia, si procede. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal. |
describe_image_in_stream |
Esta operación genera una descripción de una imagen en lenguaje natural con frases completas. La descripción se basa en una colección de etiquetas de contenido que también son devueltas por la operación. Puede generarse más de una descripción de cada imagen. Las descripciones se ordenan por su puntuación de confianza. Las descripciones pueden incluir resultados de modelos de dominio famosos y de puntos de referencia, si procede. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal. |
detect_objects |
Realiza la detección de objetos en la imagen especificada. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal. |
detect_objects_in_stream |
Realiza la detección de objetos en la imagen especificada. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal. |
generate_thumbnail |
Esta operación genera una imagen en miniatura con el ancho y alto especificados por el usuario. De forma predeterminada, el servicio analiza la imagen, identifica la región de interés (ROI) y genera las coordenadas de recorte inteligentes según el ROI. El recorte inteligente ayuda a especificar una relación de aspecto que difiere de la de la imagen de entrada. Una respuesta correcta contiene el binario de la imagen en miniatura. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError. |
generate_thumbnail_in_stream |
Esta operación genera una imagen en miniatura con el ancho y alto especificados por el usuario. De forma predeterminada, el servicio analiza la imagen, identifica la región de interés (ROI) y genera las coordenadas de recorte inteligentes según el ROI. El recorte inteligente ayuda a especificar una relación de aspecto que difiere de la de la imagen de entrada. Una respuesta correcta contiene el binario de la imagen en miniatura. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError. |
get_area_of_interest |
Esta operación devuelve un rectángulo delimitador alrededor del área más importante de la imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError. |
get_area_of_interest_in_stream |
Esta operación devuelve un rectángulo delimitador alrededor del área más importante de la imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError. |
get_read_result |
Esta interfaz se usa para obtener los resultados de OCR de la operación de lectura. La dirección URL de esta interfaz debe recuperarse del campo "Operation-Location" devuelto desde la interfaz read. |
list_models |
Esta operación devuelve la lista de modelos específicos del dominio admitidos por Computer Vision API. Actualmente, la API admite los siguientes modelos específicos del dominio: reconocimiento de celebridades, reconocimiento de lugares de interés. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal. |
read |
Use esta interfaz para obtener el resultado de una operación de lectura, utilizando los algoritmos de reconocimiento óptico de caracteres (OCR) de última generación optimizados para documentos con gran cantidad de texto. Cuando se usa la interfaz Read, la respuesta contiene un campo denominado "Operation-Location". El campo "Operation-Location" contiene la dirección URL que debe usar para la operación "GetReadResult" para acceder a los resultados de OCR.. |
read_in_stream |
Use esta interfaz para obtener el resultado de una operación de lectura, utilizando los algoritmos de reconocimiento óptico de caracteres (OCR) de última generación optimizados para documentos con gran cantidad de texto. Cuando se usa la interfaz Read, la respuesta contiene un campo denominado "Operation-Location". El campo "Operation-Location" contiene la dirección URL que debe usar para la operación "GetReadResult" para acceder a los resultados de OCR.. |
recognize_printed_text |
El reconocimiento óptico de caracteres (OCR) detecta el texto de una imagen y extrae los caracteres reconocidos en una secuencia de caracteres que se puede usar en una máquina. Si se ejecuta correctamente, se devolverán los resultados de OCR. Tras un error, se devolverá el código de error junto con un mensaje de error. El código de error puede ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError. |
recognize_printed_text_in_stream |
El reconocimiento óptico de caracteres (OCR) detecta el texto de una imagen y extrae los caracteres reconocidos en una secuencia de caracteres que se puede usar en una máquina. Si se ejecuta correctamente, se devolverán los resultados de OCR. Tras un error, se devolverá el código de error junto con un mensaje de error. El código de error puede ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError. |
tag_image |
Esta operación genera una lista de palabras o etiquetas que son representativas del contenido de la imagen proporcionada. Computer Vision API puede devolver etiquetas basadas en objetos, seres vivos, paisajes o acciones encontrados en las imágenes. A diferencia de las categorías, las etiquetas no se organizan según un sistema de clasificación jerárquico, sino que se corresponden con el contenido de la imagen. Las etiquetas pueden contener sugerencias para evitar la ambigüedad o proporcionar un contexto; por ejemplo, la etiqueta "ascomiceto" puede venir acompañada de la sugerencia "hongo". Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal. |
tag_image_in_stream |
Esta operación genera una lista de palabras o etiquetas que son representativas del contenido de la imagen proporcionada. Computer Vision API puede devolver etiquetas basadas en objetos, seres vivos, paisajes o acciones encontrados en las imágenes. A diferencia de las categorías, las etiquetas no se organizan según un sistema de clasificación jerárquico, sino que se corresponden con el contenido de la imagen. Las etiquetas pueden contener sugerencias para evitar la ambigüedad o proporcionar un contexto; por ejemplo, la etiqueta "ascomiceto" puede venir acompañada de la sugerencia "hongo". Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal. |
analyze_image
Esta operación extrae un amplio conjunto de características visuales en función del contenido de la imagen. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Dentro de la solicitud, hay un parámetro opcional que le permite elegir qué características se van a devolver. De forma predeterminada, las categorías de imagen se devuelven en la respuesta. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que ha ido mal.
analyze_image(url, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parámetros
- visual_features
- list[str o VisualFeatureTypes]
Cadena que indica qué tipos de características visuales se van a devolver. Varios valores deben estar separados por comas. Los tipos de características visuales válidos incluyen: Categorías: clasifica el contenido de la imagen según una taxonomía definida en la documentación. Etiquetas: etiqueta la imagen con una lista detallada de palabras relacionadas con el contenido de la imagen. Descripción: describe el contenido de la imagen con una oración completa en inglés. Caras: detecta si las caras están presentes. Si las hay, genere las coordenadas, el género y la edad. ImageType: detecta si la imagen está prediseñada o si es un dibujo lineal. Color: determina el color de énfasis, el color dominante y si una imagen es blanca negra&. Adulto: detecta si la imagen es pornográfica por naturaleza (representa nudidad o un acto sexual), o es goria (representa violencia extrema o sangre). También se detecta contenido provocativo (esto es, contenido subido de tono). Objetos: detecta varios objetos dentro de una imagen, incluida la ubicación aproximada. El argumento Objects solo está disponible en inglés. Marcas: detecta varias marcas dentro de una imagen, incluida la ubicación aproximada. El argumento Brands solo está disponible en inglés.
Cadena que indica qué detalles específicos del dominio se van a devolver. Varios valores deben estar separados por comas. Los tipos de características visuales válidos incluyen: Celebridades: identifica celebridades si se detectan en la imagen, Landmarks, identifica puntos de referencia importantes en la imagen.
- language
- str
Idioma deseado para la generación de salida. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'
- description_exclude
- list[str o DescriptionExclude]
Desactive los modelos de dominio especificados al generar la descripción.
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
ImageAnalysis o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
analyze_image_by_domain
Esta operación reconoce el contenido de una imagen mediante la aplicación de un modelo específico del dominio. La lista de modelos específicos del dominio admitidos por Computer Vision API se puede obtener mediante la solicitud /models GET. Actualmente, la API proporciona los siguientes modelos específicos del dominio: celebridades, lugares de interés. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que ha ido mal.
analyze_image_by_domain(model, url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)
Parámetros
- language
- str
Idioma deseado para la generación de salida. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
DomainModelResults o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
analyze_image_by_domain_in_stream
Esta operación reconoce el contenido de una imagen mediante la aplicación de un modelo específico del dominio. La lista de modelos específicos del dominio admitidos por Computer Vision API se puede obtener mediante la solicitud /models GET. Actualmente, la API proporciona los siguientes modelos específicos del dominio: celebridades, lugares de interés. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que ha ido mal.
analyze_image_by_domain_in_stream(model, image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parámetros
- language
- str
Idioma deseado para la generación de salida. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Cuando se especifique, se llamará con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
DomainModelResults o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
analyze_image_in_stream
Esta operación extrae un amplio conjunto de características visuales en función del contenido de la imagen. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Dentro de la solicitud, hay un parámetro opcional que permite elegir las características que se van a devolver. De forma predeterminada, las categorías de imagen se devuelven en la respuesta. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.
analyze_image_in_stream(image, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parámetros
- visual_features
- list[str o VisualFeatureTypes]
Cadena que indica qué tipos de características visuales se van a devolver. Varios valores deben estar separados por comas. Los tipos de características visuales válidos incluyen: Categorías: clasifica el contenido de la imagen según una taxonomía definida en la documentación. Etiquetas: etiqueta la imagen con una lista detallada de palabras relacionadas con el contenido de la imagen. Descripción: describe el contenido de la imagen con una oración completa en inglés. Caras: detecta si las caras están presentes. Si las hay, genere las coordenadas, el género y la edad. ImageType: detecta si la imagen está prediseñada o si es un dibujo lineal. Color: determina el color de énfasis, el color dominante y si una imagen es blanca negra&. Adulto: detecta si la imagen es pornográfica por naturaleza (representa nudidad o un acto sexual), o es goria (representa violencia extrema o sangre). También se detecta contenido provocativo (esto es, contenido subido de tono). Objetos: detecta varios objetos dentro de una imagen, incluida la ubicación aproximada. El argumento Objects solo está disponible en inglés. Marcas: detecta varias marcas dentro de una imagen, incluida la ubicación aproximada. El argumento Brands solo está disponible en inglés.
Cadena que indica qué detalles específicos del dominio se van a devolver. Varios valores deben estar separados por comas. Los tipos de características visuales válidos incluyen: Celebridades: identifica celebridades si se detectan en la imagen, Landmarks, identifica puntos de referencia importantes en la imagen.
- language
- str
Idioma deseado para la generación de resultados. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'
- description_exclude
- list[str o DescriptionExclude]
Desactive los modelos de dominio especificados al generar la descripción.
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
ImageAnalysis o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
describe_image
Esta operación genera una descripción de una imagen en lenguaje natural con frases completas. La descripción se basa en una colección de etiquetas de contenido que también son devueltas por la operación. Puede generarse más de una descripción de cada imagen. Las descripciones se ordenan por su puntuación de confianza. Las descripciones pueden incluir resultados de modelos de dominio famosos y de puntos de referencia, si procede. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.
describe_image(url, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parámetros
- max_candidates
- int
Número máximo de descripciones candidatas que se van a devolver. El valor predeterminado es 1.
- language
- str
Idioma deseado para la generación de resultados. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'
- description_exclude
- list[str o DescriptionExclude]
Desactive los modelos de dominio especificados al generar la descripción.
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
ImageDescription o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
describe_image_in_stream
Esta operación genera una descripción de una imagen en lenguaje natural con frases completas. La descripción se basa en una colección de etiquetas de contenido que también son devueltas por la operación. Puede generarse más de una descripción de cada imagen. Las descripciones se ordenan por su puntuación de confianza. Las descripciones pueden incluir resultados de modelos de dominio famosos y de puntos de referencia, si procede. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.
describe_image_in_stream(image, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parámetros
- max_candidates
- int
Número máximo de descripciones candidatas que se van a devolver. El valor predeterminado es 1.
- language
- str
Idioma deseado para la generación de resultados. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'
- description_exclude
- list[str o DescriptionExclude]
Desactive los modelos de dominio especificados al generar la descripción.
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
ImageDescription o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
detect_objects
Realiza la detección de objetos en la imagen especificada. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.
detect_objects(url, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parámetros
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
DetectResult o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
detect_objects_in_stream
Realiza la detección de objetos en la imagen especificada. Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.
detect_objects_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parámetros
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
DetectResult o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
generate_thumbnail
Esta operación genera una imagen en miniatura con el ancho y alto especificados por el usuario. De forma predeterminada, el servicio analiza la imagen, identifica la región de interés (ROI) y genera las coordenadas de recorte inteligentes según el ROI. El recorte inteligente ayuda a especificar una relación de aspecto que difiere de la de la imagen de entrada. Una respuesta correcta contiene el binario de la imagen en miniatura. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.
generate_thumbnail(width, height, url, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parámetros
- width
- int
Ancho de la miniatura, en píxeles. Debe estar entre 1 y 1024. Se recomienda un mínimo de 50.
- height
- int
Alto de la miniatura, en píxeles. Debe estar entre 1 y 1024. Se recomienda un mínimo de 50.
- smart_cropping
- bool
Marca booleana para habilitar el recorte inteligente.
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
object o ClientRawResponse if raw=true
Tipo de valor devuelto
Excepciones
generate_thumbnail_in_stream
Esta operación genera una imagen en miniatura con el ancho y alto especificados por el usuario. De forma predeterminada, el servicio analiza la imagen, identifica la región de interés (ROI) y genera las coordenadas de recorte inteligentes según el ROI. El recorte inteligente ayuda a especificar una relación de aspecto que difiere de la de la imagen de entrada. Una respuesta correcta contiene el binario de la imagen en miniatura. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.
generate_thumbnail_in_stream(width, height, image, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parámetros
- width
- int
Ancho de la miniatura, en píxeles. Debe estar entre 1 y 1024. Se recomienda un mínimo de 50.
- height
- int
Alto de la miniatura, en píxeles. Debe estar entre 1 y 1024. Se recomienda un mínimo de 50.
- smart_cropping
- bool
Marca booleana para habilitar el recorte inteligente.
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
object o ClientRawResponse if raw=true
Tipo de valor devuelto
Excepciones
get_area_of_interest
Esta operación devuelve un rectángulo delimitador alrededor del área más importante de la imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.
get_area_of_interest(url, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parámetros
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
AreaOfInterestResult o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
get_area_of_interest_in_stream
Esta operación devuelve un rectángulo delimitador alrededor del área más importante de la imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contiene un código de error y un mensaje para ayudar a determinar lo que salió mal. Tras un error, se devuelve el código de error y un mensaje de error. El código de error podría ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout o InternalServerError.
get_area_of_interest_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parámetros
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
AreaOfInterestResult o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
get_read_result
Esta interfaz se usa para obtener los resultados de OCR de la operación de lectura. La dirección URL de esta interfaz debe recuperarse del campo "Operation-Location" devuelto desde la interfaz read.
get_read_result(operation_id, custom_headers=None, raw=False, **operation_config)
Parámetros
- operation_id
- str
Identificador de la operación de lectura devuelta en la respuesta de la interfaz "Read".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
ReadOperationResult o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
list_models
Esta operación devuelve la lista de modelos específicos del dominio admitidos por Computer Vision API. Actualmente, la API admite los siguientes modelos específicos del dominio: reconocimiento de celebridades, reconocimiento de lugares de interés. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.
list_models(custom_headers=None, raw=False, **operation_config)
Parámetros
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
ListModelsResult o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
read
Use esta interfaz para obtener el resultado de una operación de lectura, utilizando los algoritmos de reconocimiento óptico de caracteres (OCR) de última generación optimizados para documentos con gran cantidad de texto. Cuando se usa la interfaz Read, la respuesta contiene un campo denominado "Operation-Location". El campo "Operation-Location" contiene la dirección URL que debe usar para la operación "GetReadResult" para acceder a los resultados de OCR..
read(url, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, **operation_config)
Parámetros
- language
- str o OcrDetectionLanguage
Código de idioma BCP-47 del texto del documento. Read admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese en ese idioma específico. Consulte https://aka.ms/ocr-languages para obtener una lista de los idiomas admitidos. Entre los valores posibles se incluyen: 'af', 'ast', 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'
Números de página personalizados para documentos de varias páginas (PDF/TIFF), escriba el número de páginas que desea obtener el resultado de OCR. Para un intervalo de páginas, use un guión. Separe cada página o intervalo con una coma.
- model_version
- str
Parámetro opcional para especificar la versión del modelo OCR usado para la extracción de texto. Los valores aceptados son: "latest", "latest-preview", "2021-04-12". El valor predeterminado es "latest".
- reading_order
- str
Parámetro opcional para especificar qué algoritmo de orden de lectura se debe aplicar al ordenar los elementos de texto de extracción. Puede ser "básico" o "natural". El valor predeterminado es "basic" si no se especifica.
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
Ninguno o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
read_in_stream
Use esta interfaz para obtener el resultado de una operación de lectura, utilizando los algoritmos de reconocimiento óptico de caracteres (OCR) de última generación optimizados para documentos con gran cantidad de texto. Cuando se usa la interfaz Read, la respuesta contiene un campo denominado "Operation-Location". El campo "Operation-Location" contiene la dirección URL que debe usar para la operación "GetReadResult" para acceder a los resultados de OCR..
read_in_stream(image, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, callback=None, **operation_config)
Parámetros
- language
- str o OcrDetectionLanguage
Código de idioma BCP-47 del texto del documento. Read admite la identificación automática del idioma y los documentos de varios idiomas, por lo que solo debe proporcionar un código de idioma si desea forzar que el documento se procese en ese idioma específico. Consulte https://aka.ms/ocr-languages para obtener una lista de los idiomas admitidos. Entre los valores posibles se incluyen: 'af', 'ast', 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'
Números de página personalizados para documentos de varias páginas (PDF/TIFF), escriba el número de páginas que desea obtener el resultado de OCR. Para un intervalo de páginas, use un guión. Separe cada página o intervalo con una coma.
- model_version
- str
Parámetro opcional para especificar la versión del modelo OCR usado para la extracción de texto. Los valores aceptados son: "latest", "latest-preview", "2021-04-12". El valor predeterminado es "latest".
- reading_order
- str
Parámetro opcional para especificar qué algoritmo de orden de lectura se debe aplicar al ordenar los elementos de texto de extracción. Puede ser "básico" o "natural". El valor predeterminado es "basic" si no se especifica.
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
Ninguno o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
recognize_printed_text
El reconocimiento óptico de caracteres (OCR) detecta el texto de una imagen y extrae los caracteres reconocidos en una secuencia de caracteres que se puede usar en una máquina. Si se ejecuta correctamente, se devolverán los resultados de OCR. Tras un error, se devolverá el código de error junto con un mensaje de error. El código de error puede ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError.
recognize_printed_text(url, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, **operation_config)
Parámetros
- detect_orientation
- bool
Si detecta la orientación del texto en la imagen. Con detectOrientation=true, el servicio OCR intenta detectar la orientación de la imagen y corregirla antes de su posterior procesamiento (por ejemplo, si está al revés).
- language
- str o OcrLanguages
Código de idioma BCP-47 del texto que se va a detectar en la imagen. El valor predeterminado es "unk". Entre los valores posibles se incluyen: "unk", "zh-Hans", "zh-Hant", 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
OcrResult o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
recognize_printed_text_in_stream
El reconocimiento óptico de caracteres (OCR) detecta el texto de una imagen y extrae los caracteres reconocidos en una secuencia de caracteres que se puede usar en una máquina. Si se ejecuta correctamente, se devolverán los resultados de OCR. Tras un error, se devolverá el código de error junto con un mensaje de error. El código de error puede ser uno de InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage o InternalServerError.
recognize_printed_text_in_stream(image, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parámetros
- detect_orientation
- bool
Si detecta la orientación del texto en la imagen. Con detectOrientation=true, el servicio OCR intenta detectar la orientación de la imagen y corregirla antes de su posterior procesamiento (por ejemplo, si está al revés).
- language
- str o OcrLanguages
Código de idioma BCP-47 del texto que se va a detectar en la imagen. El valor predeterminado es "unk". Entre los valores posibles se incluyen: "unk", "zh-Hans", "zh-Hant", 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
OcrResult o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
tag_image
Esta operación genera una lista de palabras o etiquetas que son representativas del contenido de la imagen proporcionada. Computer Vision API puede devolver etiquetas basadas en objetos, seres vivos, paisajes o acciones encontrados en las imágenes. A diferencia de las categorías, las etiquetas no se organizan según un sistema de clasificación jerárquico, sino que se corresponden con el contenido de la imagen. Las etiquetas pueden contener sugerencias para evitar la ambigüedad o proporcionar un contexto; por ejemplo, la etiqueta "ascomiceto" puede venir acompañada de la sugerencia "hongo". Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.
tag_image(url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)
Parámetros
- language
- str
Idioma deseado para la generación de resultados. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
TagResult o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
tag_image_in_stream
Esta operación genera una lista de palabras o etiquetas que son representativas del contenido de la imagen proporcionada. Computer Vision API puede devolver etiquetas basadas en objetos, seres vivos, paisajes o acciones encontrados en las imágenes. A diferencia de las categorías, las etiquetas no se organizan según un sistema de clasificación jerárquico, sino que se corresponden con el contenido de la imagen. Las etiquetas pueden contener sugerencias para evitar la ambigüedad o proporcionar un contexto; por ejemplo, la etiqueta "ascomiceto" puede venir acompañada de la sugerencia "hongo". Se admiten dos métodos de entrada: (1) Cargando una imagen o (2) especificando una dirección URL de imagen. Se devolverá una respuesta correcta en JSON. Si se produce un error en la solicitud, la respuesta contendrá un código de error y un mensaje para ayudar a comprender lo que salió mal.
tag_image_in_stream(image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parámetros
- language
- str
Idioma deseado para la generación de resultados. Si no se especifica este parámetro, el valor predeterminado es "en". Idiomas admitidos: en : inglés, valor predeterminado. es - Español, ja - japonés, pt - portugués, zh - chino simplificado. Entre los valores posibles se incluyen: 'en', 'es', 'ja', 'pt', 'zh'
- model_version
- str
Parámetro opcional para especificar la versión del modelo de IA. Los valores aceptados son: "latest", "2021-04-01". El valor predeterminado es "latest".
- raw
- bool
devuelve la respuesta directa junto con la respuesta deserializada.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Cuando se especifique, se llamará a con cada fragmento de datos que se transmita. La devolución de llamada debe tomar dos argumentos, los bytes del fragmento actual de datos y el objeto de respuesta. Si los datos se cargan, la respuesta será Ninguna.
- operation_config
Invalidaciones de configuración de la operación.
Devoluciones
TagResult o ClientRawResponse si raw=true
Tipo de valor devuelto
Excepciones
Azure SDK for Python
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de