ComputerVisionClientOperationsMixin Класс
- Наследование
-
builtins.objectComputerVisionClientOperationsMixin
Конструктор
ComputerVisionClientOperationsMixin()
Методы
analyze_image |
Эта операция извлекает набор визуальных средств на основе содержимого изображения. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. В запросе есть необязательный параметр, позволяющий выбрать возвращаемые функции. По умолчанию в ответе возвращаются категории изображений. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так. |
analyze_image_by_domain |
Эта операция распознает содержимое изображения путем применения модели для конкретной предметной области. Список моделей для конкретных предметных областей, которые поддерживаются API Компьютерного зрения, можно получить с помощью запроса /models GET. В настоящее время API предоставляет следующие модели для конкретных предметных областей: знаменитости, ориентиры. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так. |
analyze_image_by_domain_in_stream |
Эта операция распознает содержимое изображения путем применения модели для конкретной предметной области. Список моделей для конкретных предметных областей, которые поддерживаются API Компьютерного зрения, можно получить с помощью запроса /models GET. В настоящее время API предоставляет следующие модели для конкретных предметных областей: знаменитости, ориентиры. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так. |
analyze_image_in_stream |
Эта операция извлекает набор визуальных средств на основе содержимого изображения. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. В запросе есть необязательный параметр, позволяющий выбрать возвращаемые функции. По умолчанию в ответе возвращаются категории изображений. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так. |
describe_image |
Эта операция создает описание всего изображения на удобочитаемом языке с использованием полных предложений. Описание основано на коллекции тегов содержимого, которые также возвращаются операцией. Для каждого изображения может быть создано несколько описаний. Описания упорядочены по оценке достоверности. Описания могут включать результаты из моделей знаменитостей и ориентиров предметной области, если это применимо. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так. |
describe_image_in_stream |
Эта операция создает описание всего изображения на удобочитаемом языке с использованием полных предложений. Описание основано на коллекции тегов содержимого, которые также возвращаются операцией. Для каждого изображения может быть создано несколько описаний. Описания упорядочены по оценке достоверности. Описания могут включать результаты из моделей знаменитостей и ориентиров предметной области, если это применимо. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так. |
detect_objects |
Выполняет обнаружение объектов на указанном изображении. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так. |
detect_objects_in_stream |
Выполняет обнаружение объектов на указанном изображении. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так. |
generate_thumbnail |
Эта операция создает изображение эскиза с указанной пользователем шириной и высотой. По умолчанию служба анализирует изображение, определяет область интереса и создает координаты смарт-обрезки в соответствии с областью интереса. Интеллектуальная обрезка помогает при указании пропорций, отличающихся от пропорций входного изображения. В случае успешного выполнения ответ будет содержать двоичный файл эскиза изображения. Если запрос завершился сбоем, ответ содержит код ошибки и сообщение, помогающие определить, что пошло не так. При сбое возвращаются код ошибки и сообщение об ошибке. Код ошибки может быть следующим: InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout или InternalServerError. |
generate_thumbnail_in_stream |
Эта операция создает изображение эскиза с указанной пользователем шириной и высотой. По умолчанию служба анализирует изображение, определяет область интереса и создает координаты смарт-обрезки в соответствии с областью интереса. Интеллектуальная обрезка помогает при указании пропорций, отличающихся от пропорций входного изображения. В случае успешного выполнения ответ будет содержать двоичный файл эскиза изображения. Если запрос завершился сбоем, ответ содержит код ошибки и сообщение, помогающие определить, что пошло не так. При сбое возвращаются код ошибки и сообщение об ошибке. Код ошибки может быть следующим: InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout или InternalServerError. |
get_area_of_interest |
Эта операция возвращает ограничивающий прямоугольник вокруг наиболее важной области изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился сбоем, ответ содержит код ошибки и сообщение, помогающие определить, что пошло не так. При сбое возвращаются код ошибки и сообщение об ошибке. Кодом ошибки может быть invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout или InternalServerError. |
get_area_of_interest_in_stream |
Эта операция возвращает ограничивающий прямоугольник вокруг наиболее важной области изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился сбоем, ответ содержит код ошибки и сообщение, помогающие определить, что пошло не так. При сбое возвращаются код ошибки и сообщение об ошибке. Кодом ошибки может быть invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout или InternalServerError. |
get_read_result |
Этот интерфейс используется для получения результатов OCR операции чтения. URL-адрес этого интерфейса должен быть получен из поля Operation-Location, возвращаемого из интерфейса чтения. |
list_models |
Эта операция возвращает список моделей для конкретных предметных областей, которые поддерживаются API Компьютерного зрения. В настоящее время API поддерживает модели для следующих предметных областей: распознаватель знаменитостей, распознаватель ориентиров. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так. |
read |
Используйте этот интерфейс для получения результата операции чтения с использованием современного алгоритма оптического распознавания символов (OCR), оптимизированного для документов с большим объемом текста. При использовании интерфейса чтения ответ содержит поле с именем Operation-Location. Поле Operation-Location содержит URL-адрес, который необходимо использовать для операции GetReadResult для доступа к результатам OCR.. |
read_in_stream |
Используйте этот интерфейс для получения результата операции чтения с использованием современного алгоритма оптического распознавания символов (OCR), оптимизированного для документов с большим объемом текста. При использовании интерфейса чтения ответ содержит поле с именем Operation-Location. Поле Operation-Location содержит URL-адрес, который необходимо использовать для операции GetReadResult для доступа к результатам OCR.. |
recognize_printed_text |
Оптическое распознавание символов (OCR) определяет печатный текст на изображении и извлекает распознанные символы в поток символов, пригодный для машинной обработки. После успешного выполнения будут возвращены результаты OCR. При сбое возвращается код ошибки вместе с сообщением об ошибке. Кодом ошибки может быть invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage или InternalServerError. |
recognize_printed_text_in_stream |
Оптическое распознавание символов (OCR) определяет печатный текст на изображении и извлекает распознанные символы в поток символов, пригодный для машинной обработки. После успешного выполнения будут возвращены результаты OCR. При сбое возвращается код ошибки вместе с сообщением об ошибке. Кодом ошибки может быть invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage или InternalServerError. |
tag_image |
Эта операция создает список слов или тегов, относящихся к содержимому предоставленного изображения. API Компьютерного зрения может возвращать теги на основе объектов, живых существ, пейзажей или действий, обнаруженных на изображениях. В отличие от категорий теги не упорядочиваются в соответствии с иерархической системой классификации, а соответствуют содержимому изображения. Теги могут содержать указания, позволяющие избежать неясности или предоставляющие контекст, например тег "аскомицет" может сопровождаться указанием "грибок". Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так. |
tag_image_in_stream |
Эта операция создает список слов или тегов, относящихся к содержимому предоставленного изображения. API Компьютерного зрения может возвращать теги на основе объектов, живых существ, пейзажей или действий, обнаруженных на изображениях. В отличие от категорий теги не упорядочиваются в соответствии с иерархической системой классификации, а соответствуют содержимому изображения. Теги могут содержать указания, позволяющие избежать неясности или предоставляющие контекст, например тег "аскомицет" может сопровождаться указанием "грибок". Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился сбоем, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так. |
analyze_image
Эта операция извлекает набор визуальных средств на основе содержимого изображения. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. В запросе есть необязательный параметр, позволяющий выбрать возвращаемые функции. По умолчанию в ответе возвращаются категории изображений. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так.
analyze_image(url, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)
Параметры
- visual_features
- list[str или VisualFeatureTypes]
Строка, указывающая, какие типы визуальных признаков следует возвращать. Несколько значений должны быть разделены запятыми. Допустимые типы визуальных функций: Категории — классифицирует содержимое изображения в соответствии с таксономией, определенной в документации. Теги — пометка изображения подробным списком слов, связанных с содержимым изображения. Description — описывает содержимое изображения полным предложением на английском языке. Лица — определяет, присутствуют ли лица. При их наличии вычисляет координаты лица, возраст и пол. ImageType — определяет, является ли изображение картинкой или чертежом. Цвет — определяет цвет элементов, доминирующий цвет и является ли изображение черно-белым&. Взрослый — определяет, является ли изображение порнографическим по своей природе (изображает наготу или половой акт) или является ли оно горьким (изображает крайнее насилие или кровь). Также определяются материалы сексуального (непристойного) содержания. Objects — обнаруживает различные объекты на изображении, включая приблизительное расположение. Аргумент Objects доступен только на английском языке. Торговые марки — обнаруживает различные торговые марки на изображении, включая приблизительное расположение. Аргумент Brands доступен только на английском языке.
Строка, указывающая, какие сведения о конкретном домене следует вернуть. Несколько значений должны быть разделены запятыми. Допустимые типы визуальных признаков: Знаменитости — определяет знаменитостей при обнаружении на изображении, Ориентиры — определяет важные ориентиры на изображении.
- language
- str
Требуемый язык для создания выходных данных. Если этот параметр не указан, значение по умолчанию — "en". Поддерживаемые языки:en — английский, по умолчанию. es - испанский, ja - японский, pt - португальский, zh - китайский (упрощенное письмо). Возможные значения: "en", "es", "ja", "pt", "zh"
- description_exclude
- list[str или DescriptionExclude]
Отключите указанные модели предметной области при создании описания.
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
ImageAnalysis или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
analyze_image_by_domain
Эта операция распознает содержимое изображения путем применения модели для конкретной предметной области. Список моделей для конкретных предметных областей, которые поддерживаются API Компьютерного зрения, можно получить с помощью запроса /models GET. В настоящее время API предоставляет следующие модели для конкретных предметных областей: знаменитости, ориентиры. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так.
analyze_image_by_domain(model, url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)
Параметры
- language
- str
Требуемый язык для создания выходных данных. Если этот параметр не указан, значение по умолчанию — "en". Поддерживаемые языки:en — английский, по умолчанию. es - испанский, ja - японский, pt - португальский, zh - китайский (упрощенное письмо). Возможные значения: "en", "es", "ja", "pt", "zh"
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
DomainModelResults или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
analyze_image_by_domain_in_stream
Эта операция распознает содержимое изображения путем применения модели для конкретной предметной области. Список моделей для конкретных предметных областей, которые поддерживаются API Компьютерного зрения, можно получить с помощью запроса /models GET. В настоящее время API предоставляет следующие модели для конкретных предметных областей: знаменитости, ориентиры. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так.
analyze_image_by_domain_in_stream(model, image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Параметры
- language
- str
Требуемый язык для создания выходных данных. Если этот параметр не указан, значение по умолчанию — "en". Поддерживаемые языки:en — английский, по умолчанию. es - испанский, ja - японский, pt - португальский, zh - китайский (упрощенное письмо). Возможные значения: "en", "es", "ja", "pt", "zh"
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
При указании будет вызываться с каждым блоком данных, который передается в поток. Обратный вызов должен принимать два аргумента: байт текущего фрагмента данных и объект ответа. Если данные передаются, ответ будет равен None.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
DomainModelResults или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
analyze_image_in_stream
Эта операция извлекает набор визуальных средств на основе содержимого изображения. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. В запросе есть необязательный параметр, позволяющий выбрать возвращаемые функции. По умолчанию в ответе возвращаются категории изображений. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так.
analyze_image_in_stream(image, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Параметры
- visual_features
- list[str или VisualFeatureTypes]
Строка, указывающая, какие типы визуальных признаков следует возвращать. Несколько значений должны быть разделены запятыми. Допустимые типы визуальных функций: Категории — классифицирует содержимое изображения в соответствии с таксономией, определенной в документации. Теги — пометка изображения подробным списком слов, связанных с содержимым изображения. Description — описывает содержимое изображения полным предложением на английском языке. Лица — определяет, присутствуют ли лица. При их наличии вычисляет координаты лица, возраст и пол. ImageType — определяет, является ли изображение картинкой или чертежом. Цвет — определяет цвет элементов, доминирующий цвет и является ли изображение черно-белым&. Взрослый — определяет, является ли изображение порнографическим по своей природе (изображает наготу или половой акт) или является ли оно горьким (изображает крайнее насилие или кровь). Также определяются материалы сексуального (непристойного) содержания. Objects — обнаруживает различные объекты на изображении, включая приблизительное расположение. Аргумент Objects доступен только на английском языке. Торговые марки — обнаруживает различные торговые марки на изображении, включая приблизительное расположение. Аргумент Brands доступен только на английском языке.
Строка, указывающая, какие сведения о конкретном домене следует вернуть. Несколько значений должны быть разделены запятыми. Допустимые типы визуальных признаков: Знаменитости — определяет знаменитостей при обнаружении на изображении, Ориентиры — определяет важные ориентиры на изображении.
- language
- str
Требуемый язык для создания выходных данных. Если этот параметр не указан, значение по умолчанию — "en". Поддерживаемые языки:en — английский, по умолчанию. es - испанский, ja - японский, pt - португальский, zh - китайский (упрощенное письмо). Возможные значения: "en", "es", "ja", "pt", "zh"
- description_exclude
- list[str или DescriptionExclude]
Отключите указанные модели предметной области при создании описания.
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
При указании будет вызываться с каждым блоком данных, который передается в поток. Обратный вызов должен принимать два аргумента: байт текущего фрагмента данных и объект ответа. Если данные передаются, ответ будет равен None.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
ImageAnalysis или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
describe_image
Эта операция создает описание всего изображения на удобочитаемом языке с использованием полных предложений. Описание основано на коллекции тегов содержимого, которые также возвращаются операцией. Для каждого изображения может быть создано несколько описаний. Описания упорядочены по оценке достоверности. Описания могут включать результаты из моделей знаменитостей и ориентиров предметной области, если это применимо. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так.
describe_image(url, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)
Параметры
- max_candidates
- int
Максимальное число возвращаемых описаний кандидатов. Значение по умолчанию — 1.
- language
- str
Требуемый язык для создания выходных данных. Если этот параметр не указан, значение по умолчанию — "en". Поддерживаемые языки:en — английский, по умолчанию. es - испанский, ja - японский, pt - португальский, zh - китайский (упрощенное письмо). Возможные значения: "en", "es", "ja", "pt", "zh"
- description_exclude
- list[str или DescriptionExclude]
Отключите указанные модели предметной области при создании описания.
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
ImageDescription или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
describe_image_in_stream
Эта операция создает описание всего изображения на удобочитаемом языке с использованием полных предложений. Описание основано на коллекции тегов содержимого, которые также возвращаются операцией. Для каждого изображения может быть создано несколько описаний. Описания упорядочены по оценке достоверности. Описания могут включать результаты из моделей знаменитостей и ориентиров предметной области, если это применимо. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так.
describe_image_in_stream(image, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Параметры
- max_candidates
- int
Максимальное число возвращаемых описаний кандидатов. Значение по умолчанию — 1.
- language
- str
Требуемый язык для создания выходных данных. Если этот параметр не указан, значение по умолчанию — "en". Поддерживаемые языки:en — английский, по умолчанию. es - испанский, ja - японский, pt - португальский, zh - китайский (упрощенное письмо). Возможные значения: "en", "es", "ja", "pt", "zh"
- description_exclude
- list[str или DescriptionExclude]
Отключите указанные модели предметной области при создании описания.
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
При указании будет вызываться с каждым блоком данных, который передается в поток. Обратный вызов должен принимать два аргумента: байт текущего фрагмента данных и объект ответа. Если данные передаются, ответ будет равен None.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
ImageDescription или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
detect_objects
Выполняет обнаружение объектов на указанном изображении. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так.
detect_objects(url, model_version='latest', custom_headers=None, raw=False, **operation_config)
Параметры
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
DetectResult или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
detect_objects_in_stream
Выполняет обнаружение объектов на указанном изображении. Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так.
detect_objects_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Параметры
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
При указании будет вызываться с каждым блоком данных, который передается в поток. Обратный вызов должен принимать два аргумента: байт текущего фрагмента данных и объект ответа. Если данные передаются, ответ будет равен None.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
DetectResult или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
generate_thumbnail
Эта операция создает изображение эскиза с указанной пользователем шириной и высотой. По умолчанию служба анализирует изображение, определяет область интереса и создает координаты смарт-обрезки в соответствии с областью интереса. Интеллектуальная обрезка помогает при указании пропорций, отличающихся от пропорций входного изображения. В случае успешного выполнения ответ будет содержать двоичный файл эскиза изображения. Если запрос завершился сбоем, ответ содержит код ошибки и сообщение, помогающие определить, что пошло не так. При сбое возвращаются код ошибки и сообщение об ошибке. Код ошибки может быть следующим: InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout или InternalServerError.
generate_thumbnail(width, height, url, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Параметры
- width
- int
Ширина эскиза в пикселях. Оно должно находиться в диапазоне от 1 до 1024. Рекомендуется не менее 50.
- height
- int
Высота эскиза в пикселях. Оно должно находиться в диапазоне от 1 до 1024. Рекомендуется не менее 50.
- smart_cropping
- bool
Логический флаг для включения интеллектуальной обрезки.
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
При указании будет вызываться с каждым блоком данных, который передается в поток. Обратный вызов должен принимать два аргумента: байт текущего фрагмента данных и объект ответа. Если данные передаются, ответ будет равен None.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
object или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
generate_thumbnail_in_stream
Эта операция создает изображение эскиза с указанной пользователем шириной и высотой. По умолчанию служба анализирует изображение, определяет область интереса и создает координаты смарт-обрезки в соответствии с областью интереса. Интеллектуальная обрезка помогает при указании пропорций, отличающихся от пропорций входного изображения. В случае успешного выполнения ответ будет содержать двоичный файл эскиза изображения. Если запрос завершился сбоем, ответ содержит код ошибки и сообщение, помогающие определить, что пошло не так. При сбое возвращаются код ошибки и сообщение об ошибке. Код ошибки может быть следующим: InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout или InternalServerError.
generate_thumbnail_in_stream(width, height, image, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Параметры
- width
- int
Ширина эскиза в пикселях. Оно должно находиться в диапазоне от 1 до 1024. Рекомендуется не менее 50.
- height
- int
Высота эскиза в пикселях. Оно должно находиться в диапазоне от 1 до 1024. Рекомендуется не менее 50.
- smart_cropping
- bool
Логический флаг для включения интеллектуальной обрезки.
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
При указании будет вызываться с каждым блоком данных, который передается в поток. Обратный вызов должен принимать два аргумента: байт текущего фрагмента данных и объект ответа. Если данные передаются, ответ будет равен None.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
object или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
get_area_of_interest
Эта операция возвращает ограничивающий прямоугольник вокруг наиболее важной области изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился сбоем, ответ содержит код ошибки и сообщение, помогающие определить, что пошло не так. При сбое возвращаются код ошибки и сообщение об ошибке. Кодом ошибки может быть invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout или InternalServerError.
get_area_of_interest(url, model_version='latest', custom_headers=None, raw=False, **operation_config)
Параметры
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
AreaOfInterestResult или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
get_area_of_interest_in_stream
Эта операция возвращает ограничивающий прямоугольник вокруг наиболее важной области изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился сбоем, ответ содержит код ошибки и сообщение, помогающие определить, что пошло не так. При сбое возвращаются код ошибки и сообщение об ошибке. Кодом ошибки может быть invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout или InternalServerError.
get_area_of_interest_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Параметры
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
При указании будет вызываться с каждым блоком данных, который передается в поток. Обратный вызов должен принимать два аргумента: байт текущего фрагмента данных и объект ответа. Если данные передаются, ответ будет равен None.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
AreaOfInterestResult или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
get_read_result
Этот интерфейс используется для получения результатов OCR операции чтения. URL-адрес этого интерфейса должен быть получен из поля Operation-Location, возвращаемого из интерфейса чтения.
get_read_result(operation_id, custom_headers=None, raw=False, **operation_config)
Параметры
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
ReadOperationResult или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
list_models
Эта операция возвращает список моделей для конкретных предметных областей, которые поддерживаются API Компьютерного зрения. В настоящее время API поддерживает модели для следующих предметных областей: распознаватель знаменитостей, распознаватель ориентиров. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так.
list_models(custom_headers=None, raw=False, **operation_config)
Параметры
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
ListModelsResult или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
read
Используйте этот интерфейс для получения результата операции чтения с использованием современного алгоритма оптического распознавания символов (OCR), оптимизированного для документов с большим объемом текста. При использовании интерфейса чтения ответ содержит поле с именем Operation-Location. Поле Operation-Location содержит URL-адрес, который необходимо использовать для операции GetReadResult для доступа к результатам OCR..
read(url, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, **operation_config)
Параметры
- language
- str или OcrDetectionLanguage
Код языка BCP-47 текста в документе. Чтение поддерживает автоматическую идентификацию языка и многоязычные документы, поэтому предоставляйте код языка, только если вы хотите принудительно обрабатывать документ на этом языке. Список поддерживаемых языков см. в этой статье https://aka.ms/ocr-languages . Возможные значения: af, ast, bi, 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'cs', 'cs', 'da', 'de', 'en', 'es', 'et', 'eu', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac ', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'
Пользовательские номера страниц для многостраничных документов (PDF/TIFF), введите количество страниц, которые вы хотите получить результат OCR. Для диапазона страниц используйте дефис. Разделите каждую страницу или диапазон с помощью запятой.
- model_version
- str
Необязательный параметр для указания версии модели OCR, используемой для извлечения текста. Допустимые значения: "latest", "latest-preview", "2021-04-12". Значение по умолчанию — latest.
- reading_order
- str
Необязательный параметр, указывающий, какой алгоритм порядка чтения должен применяться при упорядочении элементов извлечения текста. Может быть "базовым" или "естественным". Значение по умолчанию — basic, если не указано.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
None или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
read_in_stream
Используйте этот интерфейс для получения результата операции чтения с использованием современного алгоритма оптического распознавания символов (OCR), оптимизированного для документов с большим объемом текста. При использовании интерфейса чтения ответ содержит поле с именем Operation-Location. Поле Operation-Location содержит URL-адрес, который необходимо использовать для операции GetReadResult для доступа к результатам OCR..
read_in_stream(image, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, callback=None, **operation_config)
Параметры
- language
- str или OcrDetectionLanguage
Код языка BCP-47 текста в документе. Чтение поддерживает автоматическую идентификацию языка и многоязычные документы, поэтому предоставляйте код языка, только если вы хотите принудительно обрабатывать документ на этом языке. Список поддерживаемых языков см. в этой статье https://aka.ms/ocr-languages . Возможные значения: af, ast, bi, 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'cs', 'cs', 'da', 'de', 'en', 'es', 'et', 'eu', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac ', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'
Пользовательские номера страниц для многостраничных документов (PDF/TIFF), введите количество страниц, которые вы хотите получить результат OCR. Для диапазона страниц используйте дефис. Разделите каждую страницу или диапазон с помощью запятой.
- model_version
- str
Необязательный параметр для указания версии модели OCR, используемой для извлечения текста. Допустимые значения: "latest", "latest-preview", "2021-04-12". Значение по умолчанию — latest.
- reading_order
- str
Необязательный параметр, указывающий, какой алгоритм порядка чтения должен применяться при упорядочении элементов извлечения текста. Может быть "базовым" или "естественным". Значение по умолчанию — basic, если не указано.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
При указании будет вызываться с каждым блоком данных, который передается в поток. Обратный вызов должен принимать два аргумента: байт текущего фрагмента данных и объект ответа. Если данные передаются, ответ будет равен None.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
None или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
recognize_printed_text
Оптическое распознавание символов (OCR) определяет печатный текст на изображении и извлекает распознанные символы в поток символов, пригодный для машинной обработки. После успешного выполнения будут возвращены результаты OCR. При сбое возвращается код ошибки вместе с сообщением об ошибке. Кодом ошибки может быть invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage или InternalServerError.
recognize_printed_text(url, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, **operation_config)
Параметры
- detect_orientation
- bool
Определяет, определяет ли ориентацию текста на изображении. При использовании detectOrientation=true служба OCR пытается обнаружить ориентацию изображения и исправить его перед дальнейшей обработкой (например, если оно перевернуто).
- language
- str или OcrLanguages
Код языка BCP-47 текста, который будет обнаружен на изображении. Значение по умолчанию — "unk". Возможные значения: 'unk', 'zh-Hans', 'zh-Hant', 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
OcrResult или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
recognize_printed_text_in_stream
Оптическое распознавание символов (OCR) определяет печатный текст на изображении и извлекает распознанные символы в поток символов, пригодный для машинной обработки. После успешного выполнения будут возвращены результаты OCR. При сбое возвращается код ошибки вместе с сообщением об ошибке. Кодом ошибки может быть invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage или InternalServerError.
recognize_printed_text_in_stream(image, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Параметры
- detect_orientation
- bool
Определяет, определяет ли ориентацию текста на изображении. При использовании detectOrientation=true служба OCR пытается обнаружить ориентацию изображения и исправить его перед дальнейшей обработкой (например, если оно перевернуто).
- language
- str или OcrLanguages
Код языка BCP-47 текста, который будет обнаружен на изображении. Значение по умолчанию — "unk". Возможные значения: 'unk', 'zh-Hans', 'zh-Hant', 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
При указании будет вызываться с каждым блоком данных, который передается в поток. Обратный вызов должен принимать два аргумента: байт текущего фрагмента данных и объект ответа. Если данные передаются, ответ будет равен None.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
OcrResult или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
tag_image
Эта операция создает список слов или тегов, относящихся к содержимому предоставленного изображения. API Компьютерного зрения может возвращать теги на основе объектов, живых существ, пейзажей или действий, обнаруженных на изображениях. В отличие от категорий теги не упорядочиваются в соответствии с иерархической системой классификации, а соответствуют содержимому изображения. Теги могут содержать указания, позволяющие избежать неясности или предоставляющие контекст, например тег "аскомицет" может сопровождаться указанием "грибок". Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился ошибкой, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так.
tag_image(url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)
Параметры
- language
- str
Требуемый язык для создания выходных данных. Если этот параметр не указан, значение по умолчанию — "en". Поддерживаемые языки:en — английский, по умолчанию. es - испанский, ja - японский, pt - португальский, zh - китайский (упрощенное письмо). Возможные значения: "en", "es", "ja", "pt", "zh"
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". Значение по умолчанию — latest.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
TagResult или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
tag_image_in_stream
Эта операция создает список слов или тегов, относящихся к содержимому предоставленного изображения. API Компьютерного зрения может возвращать теги на основе объектов, живых существ, пейзажей или действий, обнаруженных на изображениях. В отличие от категорий теги не упорядочиваются в соответствии с иерархической системой классификации, а соответствуют содержимому изображения. Теги могут содержать указания, позволяющие избежать неясности или предоставляющие контекст, например тег "аскомицет" может сопровождаться указанием "грибок". Поддерживаются два метода ввода: (1) отправка изображения или (2) указание URL-адреса изображения. Успешный ответ будет возвращен в формате JSON. Если запрос завершился сбоем, ответ будет содержать код ошибки и сообщение, которое поможет понять, что пошло не так.
tag_image_in_stream(image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Параметры
- language
- str
Требуемый язык для создания выходных данных. Если этот параметр не указан, значение по умолчанию — "en". Поддерживаемые языки:en — английский, по умолчанию. es - испанский, ja - японский, pt - португальский, zh - китайский (упрощенное письмо). Возможные значения: "en", "es", "ja", "pt", "zh"
- model_version
- str
Необязательный параметр для указания версии модели ИИ. Допустимые значения: "latest", "2021-04-01". По умолчанию используется значение "latest".
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
При указании будет вызываться с каждым блоком данных, которые передаются в поток. Обратный вызов должен принимать два аргумента: байт текущего блока данных и объект ответа. Если данные передаются, ответ будет равен None.
- operation_config
Переопределения конфигурации операций.
Возвращаемое значение
TagResult или ClientRawResponse, если raw=true
Возвращаемый тип
Исключения
Azure SDK for Python
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по