ComputerVisionClientOperationsMixin 클래스

상속
builtins.object
ComputerVisionClientOperationsMixin

생성자

ComputerVisionClientOperationsMixin()

메서드

analyze_image

이 작업은 이미지 콘텐츠를 기준으로 다양한 시각적 기능 집합을 추출합니다. 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 요청 내에 반환할 기능을 선택할 수 있는 선택적 매개 변수가 있습니다. 기본적으로 이미지 범주는 응답에 반환됩니다. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

analyze_image_by_domain

이 작업은 도메인별 모델을 적용하여 이미지 내에서 콘텐츠를 인식합니다. /models GET 요청을 사용하여 Computer Vision API에서 지원하는 도메인별 모델 목록을 검색할 수 있습니다. 현재 이 API는 유명인과 랜드마크와 같은 도메인별 모델을 제공합니다. 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

analyze_image_by_domain_in_stream

이 작업은 도메인별 모델을 적용하여 이미지 내에서 콘텐츠를 인식합니다. /models GET 요청을 사용하여 Computer Vision API에서 지원하는 도메인별 모델 목록을 검색할 수 있습니다. 현재 이 API는 유명인과 랜드마크와 같은 도메인별 모델을 제공합니다. 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

analyze_image_in_stream

이 작업은 이미지 콘텐츠를 기준으로 다양한 시각적 기능 집합을 추출합니다. 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 요청 내에 반환할 기능을 선택할 수 있는 선택적 매개 변수가 있습니다. 기본적으로 이미지 범주는 응답에 반환됩니다. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

describe_image

이 작업은 완전한 문장을 사용하여 사람이 읽을 수 있는 언어로 이미지의 설명을 생성합니다. 설명은 작업에서 반환된 콘텐츠 태그의 컬렉션을 기반으로 합니다. 각 이미지에 대해 둘 이상의 설명을 생성할 수 있습니다. 설명은 신뢰도 점수를 기준으로 정렬됩니다. 설명에는 유명 인사 및 랜드마크 도메인 모델의 결과가 포함될 수 있습니다(해당하는 경우). 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

describe_image_in_stream

이 작업은 완전한 문장을 사용하여 사람이 읽을 수 있는 언어로 이미지의 설명을 생성합니다. 설명은 작업에서 반환된 콘텐츠 태그의 컬렉션을 기반으로 합니다. 각 이미지에 대해 둘 이상의 설명을 생성할 수 있습니다. 설명은 신뢰도 점수를 기준으로 정렬됩니다. 설명에는 유명 인사 및 랜드마크 도메인 모델의 결과가 포함될 수 있습니다(해당하는 경우). 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

detect_objects

지정된 이미지에서 개체 검색을 수행합니다. 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

detect_objects_in_stream

지정된 이미지에서 개체 검색을 수행합니다. 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

generate_thumbnail

이 작업은 사용자 지정 폭 및 높이의 썸네일 이미지를 생성합니다. 기본적으로 서비스는 이미지를 분석하고 ROI(관심 영역)를 식별하며 ROI를 기반으로 스마트 자르기 좌표를 생성합니다. 스마트 자르기를 사용하면 입력 이미지와 다른 가로 세로 비율을 지정할 때 도움이 됩니다. 성공적인 응답에는 썸네일 이미지 이진 파일이 포함됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 확인하는 데 도움이 되는 메시지가 포함됩니다. 오류가 발생하면 오류 코드와 오류 메시지가 반환됩니다. 오류 코드는 InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout 또는 InternalServerError 중 하나일 수 있습니다.

generate_thumbnail_in_stream

이 작업은 사용자 지정 폭 및 높이의 썸네일 이미지를 생성합니다. 기본적으로 서비스는 이미지를 분석하고 ROI(관심 영역)를 식별하며 ROI를 기반으로 스마트 자르기 좌표를 생성합니다. 스마트 자르기를 사용하면 입력 이미지와 다른 가로 세로 비율을 지정할 때 도움이 됩니다. 성공적인 응답에는 썸네일 이미지 이진 파일이 포함됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 확인하는 데 도움이 되는 메시지가 포함됩니다. 오류가 발생하면 오류 코드와 오류 메시지가 반환됩니다. 오류 코드는 InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout 또는 InternalServerError 중 하나일 수 있습니다.

get_area_of_interest

이 작업은 이미지의 가장 중요한 영역 주위에 경계 상자를 반환합니다. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 확인하는 데 도움이 되는 메시지가 포함됩니다. 오류가 발생하면 오류 코드와 오류 메시지가 반환됩니다. 오류 코드는 InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout 또는 InternalServerError 중 하나일 수 있습니다.

get_area_of_interest_in_stream

이 작업은 이미지의 가장 중요한 영역 주위에 경계 상자를 반환합니다. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 확인하는 데 도움이 되는 메시지가 포함됩니다. 오류가 발생하면 오류 코드와 오류 메시지가 반환됩니다. 오류 코드는 InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout 또는 InternalServerError 중 하나일 수 있습니다.

get_read_result

이 인터페이스는 읽기 작업의 OCR 결과를 가져오는 데 사용됩니다. 이 인터페이스의 URL은 읽기 인터페이스에서 반환된 'Operation-Location' 필드에서 검색해야 합니다.

list_models

이 작업은 Computer Vision API에서 지원하는 도메인별 모델 목록을 반환합니다. 현재 이 API는 유명인 인식기, 랜드마크 인식기와 같은 도메인별 모델을 지원합니다. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

read

텍스트가 많은 문서에 최적화된 최첨단 OCR(광학 인식) 알고리즘을 사용하여 읽기 작업의 결과를 얻으려면 이 인터페이스를 사용합니다. 읽기 인터페이스를 사용하는 경우 응답에는 'Operation-Location'이라는 필드가 포함됩니다. 'Operation-Location' 필드에는 OCR 결과에 액세스하기 위해 'GetReadResult' 작업에 사용해야 하는 URL이 포함되어 있습니다. .

read_in_stream

텍스트가 많은 문서에 최적화된 최첨단 OCR(광학 인식) 알고리즘을 사용하여 읽기 작업의 결과를 얻으려면 이 인터페이스를 사용합니다. 읽기 인터페이스를 사용하는 경우 응답에는 'Operation-Location'이라는 필드가 포함됩니다. 'Operation-Location' 필드에는 OCR 결과에 액세스하기 위해 'GetReadResult' 작업에 사용해야 하는 URL이 포함되어 있습니다. .

recognize_printed_text

광학 인식(OCR)은 이미지의 텍스트를 감지하고, 인식된 문자를 머신에서 사용 가능한 문자 스트림으로 추출합니다. 성공하면 OCR 결과가 반환됩니다. 오류가 발생하면 오류 코드와 오류 메시지가 함께 반환됩니다. 오류 코드는 InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage 또는 InternalServerError 중 하나일 수 있습니다.

recognize_printed_text_in_stream

광학 인식(OCR)은 이미지의 텍스트를 감지하고, 인식된 문자를 머신에서 사용 가능한 문자 스트림으로 추출합니다. 성공하면 OCR 결과가 반환됩니다. 오류가 발생하면 오류 코드와 오류 메시지가 함께 반환됩니다. 오류 코드는 InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage 또는 InternalServerError 중 하나일 수 있습니다.

tag_image

이 작업은 제공된 이미지의 콘텐츠와 관련된 단어 목록 또는 태그를 생성합니다. Computer Vision API는 이미지에 있는 물체, 생물, 장면 또는 동작을 기반으로 태그를 반환할 수 있습니다. 범주와 달리 태그는 계층적 분류 시스템에 따라 구성되지 않지만 이미지 콘텐츠에 해당합니다. 태그에는 모호성을 방지하거나 컨텍스트를 제공하기 위한 힌트가 포함될 수 있습니다. 예를 들어 "ascomycete" 태그는 "fungus" 힌트와 함께 사용될 수 있습니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정 등 두 가지 입력 방법이 지원됩니다. 성공적인 응답은 JSON으로 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

tag_image_in_stream

이 작업은 제공된 이미지의 콘텐츠와 관련된 단어 목록 또는 태그를 생성합니다. Computer Vision API는 이미지에 있는 물체, 생물, 장면 또는 동작을 기반으로 태그를 반환할 수 있습니다. 범주와 달리 태그는 계층적 분류 시스템에 따라 구성되지 않지만 이미지 콘텐츠에 해당합니다. 태그에는 모호성을 방지하거나 컨텍스트를 제공하기 위한 힌트가 포함될 수 있습니다. 예를 들어 "ascomycete" 태그는 "fungus" 힌트와 함께 사용될 수 있습니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정 등 두 가지 입력 방법이 지원됩니다. 성공적인 응답은 JSON으로 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

analyze_image

이 작업은 이미지 콘텐츠를 기준으로 다양한 시각적 기능 집합을 추출합니다. 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 요청 내에 반환할 기능을 선택할 수 있는 선택적 매개 변수가 있습니다. 기본적으로 이미지 범주는 응답에 반환됩니다. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

analyze_image(url, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

매개 변수

url
str
필수

이미지의 공개적으로 연결할 수 있는 URL입니다.

visual_features
list[str 또는 VisualFeatureTypes]
기본값: None

반환할 시각적 기능 유형을 나타내는 문자열입니다. 여러 값을 쉼표로 구분해야 합니다. 유효한 시각적 기능 유형은 다음과 같습니다. 범주 - 설명서에 정의된 분류에 따라 이미지 콘텐츠를 분류합니다. 태그 - 이미지 콘텐츠와 관련된 단어의 자세한 목록으로 이미지에 태그를 지정합니다. ‘설명’ - 완전한 문장으로 이미지 콘텐츠를 설명합니다. 얼굴 - 얼굴이 있는지 감지합니다. 얼굴이 있으면 좌표, 성별 및 나이를 생성합니다. ‘이미지 유형’ - 이미지가 클립 아트인지 또는 선 그리기인지 검색합니다. 색 - 강조 색, 주요 색 및 이미지가 검은색&흰색인지 여부를 결정합니다. 성인 - 이미지가 본질적으로 포르노인지(누드 또는 성행위를 묘사함) 피투성이인지 감지합니다(극단적인 폭력이나 피를 묘사함). 성적으로 노골적인 콘텐츠(즉, 외설 콘텐츠)도 감지됩니다. 개체 - 대략적인 위치를 포함하여 이미지 내의 다양한 개체를 검색합니다. Objects 인수는 영어로만 사용할 수 있습니다. 브랜드 - 대략적인 위치를 포함하여 이미지 내의 다양한 브랜드를 검색합니다. Brands 인수는 영어로만 사용할 수 있습니다.

details
list[str 또는 Details]
기본값: None

반환할 도메인별 세부 정보를 나타내는 문자열입니다. 여러 값을 쉼표로 구분해야 합니다. 유효한 시각적 기능 유형은 다음과 같습니다. 유명 인사 - 이미지에서 감지되면 유명인을 식별합니다. 랜드마크 - 이미지에서 주목할 만한 랜드마크를 식별합니다.

language
str
기본값: en

출력 생성에 필요한 언어입니다. 이 매개 변수를 지정하지 않으면 기본값은 "en"입니다. 지원되는 언어:en - 영어, 기본값입니다. es - 스페인어, ja - 일본어, pt - 포르투갈어, zh - 중국어 간체. 가능한 값은 'en', 'es', 'ja', 'pt', 'zh'입니다.

description_exclude
list[str 또는 DescriptionExclude]
기본값: None

설명을 생성할 때 지정된 도메인 모델을 끕니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

operation_config
필수

작업 구성 재정의.

반환

ImageAnalysis 또는 ClientRawResponse if raw=true

반환 형식

예외

analyze_image_by_domain

이 작업은 도메인별 모델을 적용하여 이미지 내에서 콘텐츠를 인식합니다. /models GET 요청을 사용하여 Computer Vision API에서 지원하는 도메인별 모델 목록을 검색할 수 있습니다. 현재 이 API는 유명인과 랜드마크와 같은 도메인별 모델을 제공합니다. 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

analyze_image_by_domain(model, url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

매개 변수

model
str
필수

인식할 도메인별 콘텐츠입니다.

url
str
필수

이미지의 공개적으로 연결할 수 있는 URL입니다.

language
str
기본값: en

출력 생성에 필요한 언어입니다. 이 매개 변수를 지정하지 않으면 기본값은 "en"입니다. 지원되는 언어:en - 영어, 기본값입니다. es - 스페인어, ja - 일본어, pt - 포르투갈어, zh - 중국어 간체. 가능한 값은 'en', 'es', 'ja', 'pt', 'zh'입니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

operation_config
필수

작업 구성 재정의.

반환

DomainModelResults 또는 ClientRawResponse if raw=true

반환 형식

예외

analyze_image_by_domain_in_stream

이 작업은 도메인별 모델을 적용하여 이미지 내에서 콘텐츠를 인식합니다. /models GET 요청을 사용하여 Computer Vision API에서 지원하는 도메인별 모델 목록을 검색할 수 있습니다. 현재 이 API는 유명인과 랜드마크와 같은 도메인별 모델을 제공합니다. 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

analyze_image_by_domain_in_stream(model, image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

매개 변수

model
str
필수

인식할 도메인별 콘텐츠입니다.

image
<xref:Generator>
필수

이미지 스트림입니다.

language
str
기본값: en

출력 생성에 필요한 언어입니다. 이 매개 변수를 지정하지 않으면 기본값은 "en"입니다. 지원되는 언어:en - 영어, 기본값입니다. es - 스페인어, ja - 일본어, pt - 포르투갈어, zh - 중국어 간체. 가능한 값은 'en', 'es', 'ja', 'pt', 'zh'입니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

callback
<xref:Callable>[<xref:Bytes>, <xref:response=None>]
기본값: None

지정된 경우 은 스트리밍되는 데이터의 각 청크로 호출됩니다. 콜백은 현재 데이터 청크 및 응답 개체의 바이트인 두 개의 인수를 사용해야 합니다. 데이터가 업로드되는 경우 응답은 없음이 됩니다.

operation_config
필수

작업 구성 재정의.

반환

DomainModelResults 또는 ClientRawResponse if raw=true

반환 형식

예외

analyze_image_in_stream

이 작업은 이미지 콘텐츠를 기준으로 다양한 시각적 기능 집합을 추출합니다. 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 요청 내에 반환할 기능을 선택할 수 있는 선택적 매개 변수가 있습니다. 기본적으로 이미지 범주는 응답에 반환됩니다. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

analyze_image_in_stream(image, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

매개 변수

image
<xref:Generator>
필수

이미지 스트림입니다.

visual_features
list[str 또는 VisualFeatureTypes]
기본값: None

반환할 시각적 기능 유형을 나타내는 문자열입니다. 여러 값을 쉼표로 구분해야 합니다. 유효한 시각적 기능 유형은 다음과 같습니다. 범주 - 설명서에 정의된 분류에 따라 이미지 콘텐츠를 분류합니다. 태그 - 이미지 콘텐츠와 관련된 단어의 자세한 목록으로 이미지에 태그를 지정합니다. ‘설명’ - 완전한 문장으로 이미지 콘텐츠를 설명합니다. 얼굴 - 얼굴이 있는지 감지합니다. 얼굴이 있으면 좌표, 성별 및 나이를 생성합니다. ‘이미지 유형’ - 이미지가 클립 아트인지 또는 선 그리기인지 검색합니다. 색 - 강조 색, 주요 색 및 이미지가 검은색&흰색인지 여부를 결정합니다. 성인 - 이미지가 본질적으로 포르노인지(누드 또는 성행위를 묘사함) 피투성이인지 감지합니다(극단적인 폭력이나 피를 묘사함). 성적으로 노골적인 콘텐츠(즉, 외설 콘텐츠)도 감지됩니다. 개체 - 대략적인 위치를 포함하여 이미지 내의 다양한 개체를 검색합니다. Objects 인수는 영어로만 사용할 수 있습니다. 브랜드 - 대략적인 위치를 포함하여 이미지 내의 다양한 브랜드를 검색합니다. Brands 인수는 영어로만 사용할 수 있습니다.

details
list[str 또는 Details]
기본값: None

반환할 도메인별 세부 정보를 나타내는 문자열입니다. 여러 값을 쉼표로 구분해야 합니다. 유효한 시각적 기능 유형은 다음과 같습니다. 유명 인사 - 이미지에서 감지되면 유명인을 식별합니다. 랜드마크 - 이미지에서 주목할 만한 랜드마크를 식별합니다.

language
str
기본값: en

출력 생성에 필요한 언어입니다. 이 매개 변수를 지정하지 않으면 기본값은 "en"입니다. 지원되는 언어:en - 영어, 기본값입니다. es - 스페인어, ja - 일본어, pt - 포르투갈어, zh - 중국어 간체. 가능한 값은 'en', 'es', 'ja', 'pt', 'zh'입니다.

description_exclude
list[str 또는 DescriptionExclude]
기본값: None

설명을 생성할 때 지정된 도메인 모델을 끕니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

callback
<xref:Callable>[<xref:Bytes>, <xref:response=None>]
기본값: None

지정된 경우 은 스트리밍되는 데이터의 각 청크로 호출됩니다. 콜백은 현재 데이터 청크 및 응답 개체의 바이트인 두 개의 인수를 사용해야 합니다. 데이터가 업로드되는 경우 응답은 없음이 됩니다.

operation_config
필수

작업 구성 재정의.

반환

ImageAnalysis 또는 ClientRawResponse if raw=true

반환 형식

예외

describe_image

이 작업은 완전한 문장을 사용하여 사람이 읽을 수 있는 언어로 이미지의 설명을 생성합니다. 설명은 작업에서 반환된 콘텐츠 태그의 컬렉션을 기반으로 합니다. 각 이미지에 대해 둘 이상의 설명을 생성할 수 있습니다. 설명은 신뢰도 점수를 기준으로 정렬됩니다. 설명에는 유명 인사 및 랜드마크 도메인 모델의 결과가 포함될 수 있습니다(해당하는 경우). 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

describe_image(url, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)

매개 변수

url
str
필수

이미지의 공개적으로 연결할 수 있는 URL입니다.

max_candidates
int
기본값: 1

반환할 최대 후보 설명 수입니다. 기본값은 1입니다.

language
str
기본값: en

출력 생성에 필요한 언어입니다. 이 매개 변수를 지정하지 않으면 기본값은 "en"입니다. 지원되는 언어:en - 영어, 기본값입니다. es - 스페인어, ja - 일본어, pt - 포르투갈어, zh - 중국어 간체. 가능한 값은 'en', 'es', 'ja', 'pt', 'zh'입니다.

description_exclude
list[str 또는 DescriptionExclude]
기본값: None

설명을 생성할 때 지정된 도메인 모델을 끕니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

operation_config
필수

작업 구성 재정의.

반환

ImageDescription 또는 ClientRawResponse if raw=true

반환 형식

예외

describe_image_in_stream

이 작업은 완전한 문장을 사용하여 사람이 읽을 수 있는 언어로 이미지의 설명을 생성합니다. 설명은 작업에서 반환된 콘텐츠 태그의 컬렉션을 기반으로 합니다. 각 이미지에 대해 둘 이상의 설명을 생성할 수 있습니다. 설명은 신뢰도 점수를 기준으로 정렬됩니다. 설명에는 유명 인사 및 랜드마크 도메인 모델의 결과가 포함될 수 있습니다(해당하는 경우). 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

describe_image_in_stream(image, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

매개 변수

image
<xref:Generator>
필수

이미지 스트림입니다.

max_candidates
int
기본값: 1

반환할 최대 후보 설명 수입니다. 기본값은 1입니다.

language
str
기본값: en

출력 생성에 필요한 언어입니다. 이 매개 변수를 지정하지 않으면 기본값은 "en"입니다. 지원되는 언어:en - 영어, 기본값입니다. es - 스페인어, ja - 일본어, pt - 포르투갈어, zh - 중국어 간체. 가능한 값은 'en', 'es', 'ja', 'pt', 'zh'입니다.

description_exclude
list[str 또는 DescriptionExclude]
기본값: None

설명을 생성할 때 지정된 도메인 모델을 끕니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

callback
<xref:Callable>[<xref:Bytes>, <xref:response=None>]
기본값: None

지정된 경우 은 스트리밍되는 데이터의 각 청크로 호출됩니다. 콜백은 현재 데이터 청크 및 응답 개체의 바이트인 두 개의 인수를 사용해야 합니다. 데이터가 업로드되는 경우 응답은 없음이 됩니다.

operation_config
필수

작업 구성 재정의.

반환

ImageDescription 또는 ClientRawResponse if raw=true

반환 형식

예외

detect_objects

지정된 이미지에서 개체 검색을 수행합니다. 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

detect_objects(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

매개 변수

url
str
필수

이미지의 공개적으로 연결할 수 있는 URL입니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

operation_config
필수

작업 구성 재정의.

반환

DetectResult 또는 ClientRawResponse if raw=true

반환 형식

예외

detect_objects_in_stream

지정된 이미지에서 개체 검색을 수행합니다. 두 가지 입력 메서드가 지원됩니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

detect_objects_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

매개 변수

image
<xref:Generator>
필수

이미지 스트림입니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

callback
<xref:Callable>[<xref:Bytes>, <xref:response=None>]
기본값: None

지정된 경우 은 스트리밍되는 데이터의 각 청크로 호출됩니다. 콜백은 현재 데이터 청크 및 응답 개체의 바이트인 두 개의 인수를 사용해야 합니다. 데이터가 업로드되는 경우 응답은 없음이 됩니다.

operation_config
필수

작업 구성 재정의.

반환

DetectResult 또는 ClientRawResponse if raw=true

반환 형식

예외

generate_thumbnail

이 작업은 사용자 지정 폭 및 높이의 썸네일 이미지를 생성합니다. 기본적으로 서비스는 이미지를 분석하고 ROI(관심 영역)를 식별하며 ROI를 기반으로 스마트 자르기 좌표를 생성합니다. 스마트 자르기를 사용하면 입력 이미지와 다른 가로 세로 비율을 지정할 때 도움이 됩니다. 성공적인 응답에는 썸네일 이미지 이진 파일이 포함됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 확인하는 데 도움이 되는 메시지가 포함됩니다. 오류가 발생하면 오류 코드와 오류 메시지가 반환됩니다. 오류 코드는 InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout 또는 InternalServerError 중 하나일 수 있습니다.

generate_thumbnail(width, height, url, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

매개 변수

width
int
필수

축소판 그림의 너비(픽셀)입니다. 1에서 1024 사이여야 합니다. 최소 50을 권장합니다.

height
int
필수

축소판 그림의 높이(픽셀)입니다. 1에서 1024 사이여야 합니다. 최소 50을 권장합니다.

url
str
필수

이미지의 공개적으로 연결할 수 있는 URL입니다.

smart_cropping
bool
기본값: False

스마트 자르기를 사용하도록 설정하는 부울 플래그입니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

callback
<xref:Callable>[<xref:Bytes>, <xref:response=None>]
기본값: None

지정된 경우 은 스트리밍되는 데이터의 각 청크로 호출됩니다. 콜백은 현재 데이터 청크 및 응답 개체의 바이트인 두 개의 인수를 사용해야 합니다. 데이터가 업로드되는 경우 응답은 없음이 됩니다.

operation_config
필수

작업 구성 재정의.

반환

object 또는 ClientRawResponse if raw=true

반환 형식

<xref:Generator>,

예외

generate_thumbnail_in_stream

이 작업은 사용자 지정 폭 및 높이의 썸네일 이미지를 생성합니다. 기본적으로 서비스는 이미지를 분석하고 ROI(관심 영역)를 식별하며 ROI를 기반으로 스마트 자르기 좌표를 생성합니다. 스마트 자르기를 사용하면 입력 이미지와 다른 가로 세로 비율을 지정할 때 도움이 됩니다. 성공적인 응답에는 썸네일 이미지 이진 파일이 포함됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 확인하는 데 도움이 되는 메시지가 포함됩니다. 오류가 발생하면 오류 코드와 오류 메시지가 반환됩니다. 오류 코드는 InvalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout 또는 InternalServerError 중 하나일 수 있습니다.

generate_thumbnail_in_stream(width, height, image, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

매개 변수

width
int
필수

축소판 그림의 너비(픽셀)입니다. 1에서 1024 사이여야 합니다. 최소 50을 권장합니다.

height
int
필수

축소판 그림의 높이(픽셀)입니다. 1에서 1024 사이여야 합니다. 최소 50을 권장합니다.

image
<xref:Generator>
필수

이미지 스트림입니다.

smart_cropping
bool
기본값: False

스마트 자르기를 사용하도록 설정하는 부울 플래그입니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

callback
<xref:Callable>[<xref:Bytes>, <xref:response=None>]
기본값: None

지정된 경우 은 스트리밍되는 데이터의 각 청크로 호출됩니다. 콜백은 현재 데이터 청크 및 응답 개체의 바이트인 두 개의 인수를 사용해야 합니다. 데이터가 업로드되는 경우 응답은 없음이 됩니다.

operation_config
필수

작업 구성 재정의.

반환

object 또는 ClientRawResponse if raw=true

반환 형식

<xref:Generator>,

예외

get_area_of_interest

이 작업은 이미지의 가장 중요한 영역 주위에 경계 상자를 반환합니다. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 확인하는 데 도움이 되는 메시지가 포함됩니다. 오류가 발생하면 오류 코드와 오류 메시지가 반환됩니다. 오류 코드는 InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout 또는 InternalServerError 중 하나일 수 있습니다.

get_area_of_interest(url, model_version='latest', custom_headers=None, raw=False, **operation_config)

매개 변수

url
str
필수

이미지의 공개적으로 연결할 수 있는 URL입니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

operation_config
필수

작업 구성 재정의.

반환

AreaOfInterestResult 또는 ClientRawResponse if raw=true

반환 형식

예외

get_area_of_interest_in_stream

이 작업은 이미지의 가장 중요한 영역 주위에 경계 상자를 반환합니다. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 확인하는 데 도움이 되는 메시지가 포함됩니다. 오류가 발생하면 오류 코드와 오류 메시지가 반환됩니다. 오류 코드는 InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout 또는 InternalServerError 중 하나일 수 있습니다.

get_area_of_interest_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

매개 변수

image
<xref:Generator>
필수

이미지 스트림입니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

callback
<xref:Callable>[<xref:Bytes>, <xref:response=None>]
기본값: None

지정된 경우 은 스트리밍되는 데이터의 각 청크로 호출됩니다. 콜백은 현재 데이터 청크 및 응답 개체의 바이트인 두 개의 인수를 사용해야 합니다. 데이터가 업로드되는 경우 응답은 없음이 됩니다.

operation_config
필수

작업 구성 재정의.

반환

AreaOfInterestResult 또는 ClientRawResponse if raw=true

반환 형식

예외

get_read_result

이 인터페이스는 읽기 작업의 OCR 결과를 가져오는 데 사용됩니다. 이 인터페이스의 URL은 읽기 인터페이스에서 반환된 'Operation-Location' 필드에서 검색해야 합니다.

get_read_result(operation_id, custom_headers=None, raw=False, **operation_config)

매개 변수

operation_id
str
필수

'읽기' 인터페이스의 응답에서 반환된 읽기 작업의 ID입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

operation_config
필수

작업 구성 재정의.

반환

ReadOperationResult 또는 ClientRawResponse if raw=true

반환 형식

예외

list_models

이 작업은 Computer Vision API에서 지원하는 도메인별 모델 목록을 반환합니다. 현재 이 API는 유명인 인식기, 랜드마크 인식기와 같은 도메인별 모델을 지원합니다. 성공적인 응답은 JSON에서 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

list_models(custom_headers=None, raw=False, **operation_config)

매개 변수

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

operation_config
필수

작업 구성 재정의.

반환

ListModelsResult 또는 ClientRawResponse if raw=true

반환 형식

예외

read

텍스트가 많은 문서에 최적화된 최첨단 OCR(광학 인식) 알고리즘을 사용하여 읽기 작업의 결과를 얻으려면 이 인터페이스를 사용합니다. 읽기 인터페이스를 사용하는 경우 응답에는 'Operation-Location'이라는 필드가 포함됩니다. 'Operation-Location' 필드에는 OCR 결과에 액세스하기 위해 'GetReadResult' 작업에 사용해야 하는 URL이 포함되어 있습니다. .

read(url, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, **operation_config)

매개 변수

url
str
필수

이미지의 공개적으로 연결할 수 있는 URL입니다.

language
str 또는 OcrDetectionLanguage
기본값: None

문서에 있는 텍스트의 BCP-47 언어 코드입니다. 읽기는 자동 언어 식별 및 다국어 문서를 지원하므로 문서를 해당 특정 언어로 강제로 처리하려는 경우에만 언어 코드를 제공합니다. 지원되는 언어 목록은 을 참조 https://aka.ms/ocr-languages 하세요. 가능한 값은 'af', 'ast', 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'

pages
list[str]
기본값: None

다중 페이지 문서(PDF/TIFF)에 대한 사용자 지정 페이지 번호는 OCR 결과를 가져올 페이지 수를 입력합니다. 페이지 범위의 경우 하이픈을 사용합니다. 각 페이지 또는 범위를 쉼표로 구분합니다.

model_version
str
기본값: latest

텍스트 추출에 사용되는 OCR 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "latest-preview", "2021-04-12"입니다. 기본값은 "latest"입니다.

reading_order
str
기본값: basic

추출 텍스트 요소를 정렬할 때 적용해야 하는 읽기 순서 알고리즘을 지정하는 선택적 매개 변수입니다. '기본' 또는 '자연'일 수 있습니다. 지정하지 않으면 기본적으로 'basic'으로 설정됩니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

operation_config
필수

작업 구성 재정의.

반환

None 또는 ClientRawResponse if raw=true

반환 형식

None,

예외

read_in_stream

텍스트가 많은 문서에 최적화된 최첨단 OCR(광학 인식) 알고리즘을 사용하여 읽기 작업의 결과를 얻으려면 이 인터페이스를 사용합니다. 읽기 인터페이스를 사용하는 경우 응답에는 'Operation-Location'이라는 필드가 포함됩니다. 'Operation-Location' 필드에는 OCR 결과에 액세스하기 위해 'GetReadResult' 작업에 사용해야 하는 URL이 포함되어 있습니다. .

read_in_stream(image, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, callback=None, **operation_config)

매개 변수

image
<xref:Generator>
필수

이미지 스트림입니다.

language
str 또는 OcrDetectionLanguage
기본값: None

문서에 있는 텍스트의 BCP-47 언어 코드입니다. 읽기는 자동 언어 식별 및 다국어 문서를 지원하므로 특정 언어로 문서를 강제로 처리하려는 경우에만 언어 코드를 제공합니다. 지원되는 언어 목록은 를 참조 https://aka.ms/ocr-languages 하세요. 가능한 값은 'af', 'ast', 'bi', 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'

pages
list[str]
기본값: None

다중 페이지 문서의 사용자 지정 페이지 번호(PDF/TIFF)에서 OCR 결과를 가져올 페이지 수를 입력합니다. 페이지 범위의 경우 하이픈을 사용합니다. 각 페이지 또는 범위를 쉼표로 구분합니다.

model_version
str
기본값: latest

텍스트 추출에 사용되는 OCR 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "latest-preview", "2021-04-12"입니다. 기본값은 "latest"입니다.

reading_order
str
기본값: basic

추출 텍스트 요소를 정렬할 때 적용해야 하는 읽기 순서 알고리즘을 지정하는 선택적 매개 변수입니다. '기본' 또는 '자연'일 수 있습니다. 지정하지 않으면 기본적으로 'basic'으로 설정됩니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

callback
<xref:Callable>[<xref:Bytes>, <xref:response=None>]
기본값: None

지정된 경우 은 스트리밍되는 데이터의 각 청크로 호출됩니다. 콜백은 현재 데이터 청크의 바이트와 응답 개체라는 두 개의 인수를 사용해야 합니다. 데이터가 업로드되는 경우 응답은 없음이 됩니다.

operation_config
필수

작업 구성 재정의.

반환

None 또는 ClientRawResponse if raw=true

반환 형식

None,

예외

recognize_printed_text

광학 인식(OCR)은 이미지의 텍스트를 감지하고, 인식된 문자를 머신에서 사용 가능한 문자 스트림으로 추출합니다. 성공하면 OCR 결과가 반환됩니다. 오류가 발생하면 오류 코드와 오류 메시지가 함께 반환됩니다. 오류 코드는 InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage 또는 InternalServerError 중 하나일 수 있습니다.

recognize_printed_text(url, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, **operation_config)

매개 변수

detect_orientation
bool
기본값: True

이미지에서 텍스트 방향을 검색하는지 여부입니다. detectOrientation=true를 사용하면 OCR 서비스는 이미지 방향을 감지하고 추가 처리 전에 수정하려고 시도합니다(예: 거꾸로 된 경우).

url
str
필수

이미지의 공개적으로 연결할 수 있는 URL입니다.

language
str 또는 OcrLanguages
기본값: unk

이미지에서 검색할 텍스트의 BCP-47 언어 코드입니다. 기본값은 'unk'입니다. 가능한 값은 'unk', 'zh-Hans', 'zh-Hant', 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

operation_config
필수

작업 구성 재정의.

반환

OcrResult 또는 ClientRawResponse if raw=true

반환 형식

예외

recognize_printed_text_in_stream

광학 인식(OCR)은 이미지의 텍스트를 감지하고, 인식된 문자를 머신에서 사용 가능한 문자 스트림으로 추출합니다. 성공하면 OCR 결과가 반환됩니다. 오류가 발생하면 오류 코드와 오류 메시지가 함께 반환됩니다. 오류 코드는 InvalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage 또는 InternalServerError 중 하나일 수 있습니다.

recognize_printed_text_in_stream(image, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

매개 변수

detect_orientation
bool
기본값: True

이미지에서 텍스트 방향을 검색하는지 여부입니다. detectOrientation=true를 사용하면 OCR 서비스는 이미지 방향을 감지하고 추가 처리 전에 수정하려고 시도합니다(예: 거꾸로 된 경우).

image
<xref:Generator>
필수

이미지 스트림입니다.

language
str 또는 OcrLanguages
기본값: unk

이미지에서 검색할 텍스트의 BCP-47 언어 코드입니다. 기본값은 'unk'입니다. 가능한 값은 'unk', 'zh-Hans', 'zh-Hant', 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

callback
<xref:Callable>[<xref:Bytes>, <xref:response=None>]
기본값: None

지정된 경우 은 스트리밍되는 데이터의 각 청크로 호출됩니다. 콜백은 현재 데이터 청크의 바이트와 응답 개체라는 두 개의 인수를 사용해야 합니다. 데이터가 업로드되는 경우 응답은 없음이 됩니다.

operation_config
필수

작업 구성 재정의.

반환

OcrResult 또는 ClientRawResponse if raw=true

반환 형식

예외

tag_image

이 작업은 제공된 이미지의 콘텐츠와 관련된 단어 목록 또는 태그를 생성합니다. Computer Vision API는 이미지에 있는 물체, 생물, 장면 또는 동작을 기반으로 태그를 반환할 수 있습니다. 범주와 달리 태그는 계층적 분류 시스템에 따라 구성되지 않지만 이미지 콘텐츠에 해당합니다. 태그에는 모호성을 방지하거나 컨텍스트를 제공하기 위한 힌트가 포함될 수 있습니다. 예를 들어 "ascomycete" 태그는 "fungus" 힌트와 함께 사용될 수 있습니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정 등 두 가지 입력 방법이 지원됩니다. 성공적인 응답은 JSON으로 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

tag_image(url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)

매개 변수

url
str
필수

이미지의 공개적으로 연결할 수 있는 URL입니다.

language
str
기본값: en

출력 생성에 필요한 언어입니다. 이 매개 변수를 지정하지 않으면 기본값은 "en"입니다. 지원되는 언어:en - 영어, 기본값. es - 스페인어, ja - 일본어, pt - 포르투갈어, zh - 중국어 간체. 가능한 값은 'en', 'es', 'ja', 'pt', 'zh'입니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

operation_config
필수

작업 구성 재정의.

반환

TagResult 또는 ClientRawResponse if raw=true

반환 형식

예외

tag_image_in_stream

이 작업은 제공된 이미지의 콘텐츠와 관련된 단어 목록 또는 태그를 생성합니다. Computer Vision API는 이미지에 있는 물체, 생물, 장면 또는 동작을 기반으로 태그를 반환할 수 있습니다. 범주와 달리 태그는 계층적 분류 시스템에 따라 구성되지 않지만 이미지 콘텐츠에 해당합니다. 태그에는 모호성을 방지하거나 컨텍스트를 제공하기 위한 힌트가 포함될 수 있습니다. 예를 들어 "ascomycete" 태그는 "fungus" 힌트와 함께 사용될 수 있습니다. (1) 이미지 업로드 또는 (2) 이미지 URL 지정 등 두 가지 입력 방법이 지원됩니다. 성공적인 응답은 JSON으로 반환됩니다. 요청이 실패하면 응답에 오류 코드와 무엇이 잘못되었는지 이해하는 데 도움이 되는 메시지가 포함됩니다.

tag_image_in_stream(image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)

매개 변수

image
<xref:Generator>
필수

이미지 스트림입니다.

language
str
기본값: en

출력 생성에 필요한 언어입니다. 이 매개 변수를 지정하지 않으면 기본값은 "en"입니다. 지원되는 언어:en - 영어, 기본값. es - 스페인어, ja - 일본어, pt - 포르투갈어, zh - 중국어 간체. 가능한 값은 'en', 'es', 'ja', 'pt', 'zh'입니다.

model_version
str
기본값: latest

AI 모델의 버전을 지정하는 선택적 매개 변수입니다. 허용되는 값은 "latest", "2021-04-01"입니다. 기본값은 "latest"입니다.

custom_headers
dict
기본값: None

요청에 추가될 헤더

raw
bool
기본값: False

는 역직렬화된 응답과 함께 직접 응답을 반환합니다.

callback
<xref:Callable>[<xref:Bytes>, <xref:response=None>]
기본값: None

지정된 경우 은 스트리밍되는 데이터의 각 청크로 호출됩니다. 콜백은 현재 데이터 청크의 바이트와 응답 개체라는 두 개의 인수를 사용해야 합니다. 데이터가 업로드되는 경우 응답은 없음이 됩니다.

operation_config
필수

작업 구성 재정의.

반환

TagResult 또는 ClientRawResponse if raw=true

반환 형식

예외