ComputerVisionClientOperationsMixin Klasa
- Dziedziczenie
-
builtins.objectComputerVisionClientOperationsMixin
Konstruktor
ComputerVisionClientOperationsMixin()
Metody
analyze_image |
Ta operacja wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. W żądaniu istnieje opcjonalny parametr umożliwiający wybranie funkcji, które mają być zwracane. Domyślnie kategorie obrazów są zwracane w odpowiedzi. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak. |
analyze_image_by_domain |
Ta operacja rozpoznaje zawartość na obrazie, stosując model specyficzny dla domeny. Listę modeli specyficznych dla domeny obsługiwanych przez interfejs API przetwarzanie obrazów można pobrać przy użyciu żądania /models GET. Obecnie interfejs API udostępnia następujące modele specyficzne dla domeny: gwiazdy, punkty orientacyjne. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak. |
analyze_image_by_domain_in_stream |
Ta operacja rozpoznaje zawartość na obrazie, stosując model specyficzny dla domeny. Listę modeli specyficznych dla domeny obsługiwanych przez interfejs API przetwarzanie obrazów można pobrać przy użyciu żądania /models GET. Obecnie interfejs API udostępnia następujące modele specyficzne dla domeny: gwiazdy, punkty orientacyjne. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak. |
analyze_image_in_stream |
Ta operacja wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. W żądaniu istnieje opcjonalny parametr umożliwiający wybranie funkcji, które mają być zwracane. Domyślnie kategorie obrazów są zwracane w odpowiedzi. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak. |
describe_image |
Ta operacja generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami. Opis jest oparty na kolekcji tagów zawartości, które są również zwracane przez operację. Dla każdego obrazu można wygenerować więcej niż jeden opis. Opisy są uporządkowane według ich współczynnika ufności. Opisy mogą obejmować wyniki z modeli domeny osobistości i punktów orientacyjnych, jeśli ma to zastosowanie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak. |
describe_image_in_stream |
Ta operacja generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami. Opis jest oparty na kolekcji tagów zawartości, które są również zwracane przez operację. Dla każdego obrazu można wygenerować więcej niż jeden opis. Opisy są uporządkowane według ich współczynnika ufności. Opisy mogą obejmować wyniki z modeli domeny osobistości i punktów orientacyjnych, jeśli ma to zastosowanie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak. |
detect_objects |
Wykonuje wykrywanie obiektów na określonym obrazie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak. |
detect_objects_in_stream |
Wykonuje wykrywanie obiektów na określonym obrazie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak. |
generate_thumbnail |
Ta operacja generuje obraz miniatury z określoną przez użytkownika szerokością i wysokością. Domyślnie usługa analizuje obraz, identyfikuje region zainteresowania (ROI) i generuje współrzędne inteligentnego przycinania w oparciu o ten region. Inteligentne przycinanie pomaga po określeniu współczynnika proporcji, który różni się od obrazu wejściowego. Po pomyślnym przetworzeniu żądania jest zwracana odpowiedź zawierająca dane binarne obrazu miniatury. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError. |
generate_thumbnail_in_stream |
Ta operacja generuje obraz miniatury z określoną przez użytkownika szerokością i wysokością. Domyślnie usługa analizuje obraz, identyfikuje region zainteresowania (ROI) i generuje współrzędne inteligentnego przycinania w oparciu o ten region. Inteligentne przycinanie pomaga po określeniu współczynnika proporcji, który różni się od obrazu wejściowego. Po pomyślnym przetworzeniu żądania jest zwracana odpowiedź zawierająca dane binarne obrazu miniatury. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError. |
get_area_of_interest |
Ta operacja zwraca pole ograniczenia wokół najważniejszego obszaru obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError. |
get_area_of_interest_in_stream |
Ta operacja zwraca pole ograniczenia wokół najważniejszego obszaru obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError. |
get_read_result |
Ten interfejs służy do uzyskiwania wyników operacji odczytu OCR. Adres URL tego interfejsu należy pobrać z pola "Operation-Location" zwróconego z interfejsu odczytu. |
list_models |
Ta operacja zwraca listę modeli specyficznych dla domeny obsługiwanych przez interfejs API przetwarzanie obrazów. Obecnie interfejs API obsługuje następujące modele specyficzne dla domeny: rozpoznawanie osobistości, rozpoznawanie punktów orientacyjnych. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak. |
read |
Użyj tego interfejsu, aby uzyskać wynik operacji odczytu, wykorzystując najnowocześniejsze algorytmy optycznego rozpoznawania znaków (OCR) zoptymalizowane pod kątem dokumentów z dużą ilością tekstu. W przypadku korzystania z interfejsu Read odpowiedź zawiera pole o nazwie "Operation-Location". Pole "Operation-Location" zawiera adres URL, którego należy użyć do operacji "GetReadResult", aby uzyskać dostęp do wyników OCR.. |
read_in_stream |
Użyj tego interfejsu, aby uzyskać wynik operacji odczytu, wykorzystując najnowocześniejsze algorytmy optycznego rozpoznawania znaków (OCR) zoptymalizowane pod kątem dokumentów z dużą ilością tekstu. W przypadku korzystania z interfejsu Read odpowiedź zawiera pole o nazwie "Operation-Location". Pole "Operation-Location" zawiera adres URL, którego należy użyć do operacji "GetReadResult", aby uzyskać dostęp do wyników OCR.. |
recognize_printed_text |
Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do strumienia znaków nadającego się do użycia maszynowo. Po pomyślnym zwróceniu wyników OCR. Po awarii zostanie zwrócony kod błędu wraz z komunikatem o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage lub InternalServerError. |
recognize_printed_text_in_stream |
Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do strumienia znaków nadającego się do użycia maszynowo. Po pomyślnym zwróceniu wyników OCR. Po awarii zostanie zwrócony kod błędu wraz z komunikatem o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage lub InternalServerError. |
tag_image |
Ta operacja generuje listę wyrazów lub tagów, które są istotne dla zawartości dostarczonego obrazu. Interfejs API przetwarzanie obrazów może zwracać tagi na podstawie obiektów, istot żywych, scenerii lub akcji znalezionych na obrazach. W przeciwieństwie do kategorii tagi nie są zorganizowane zgodnie z hierarchicznym systemem klasyfikacji, ale odpowiadają zawartości obrazu. Tagi mogą zawierać wskazówki, aby uniknąć niejednoznaczności lub zapewnić kontekst, na przykład tag "ascomycete" może towarzyszyć wskazówce "grzyb". Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak. |
tag_image_in_stream |
Ta operacja generuje listę słów lub tagów, które są istotne dla zawartości dostarczonego obrazu. Interfejs API przetwarzanie obrazów może zwracać tagi na podstawie obiektów, istot żywych, scenerii lub akcji znalezionych na obrazach. W przeciwieństwie do kategorii tagi nie są zorganizowane zgodnie z hierarchicznym systemem klasyfikacji, ale odpowiadają zawartości obrazu. Tagi mogą zawierać wskazówki, aby uniknąć niejednoznaczności lub zapewnić kontekst, na przykład tag "ascomycete" może towarzyszyć wskazówka "grzyb". Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak. |
analyze_image
Ta operacja wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. W żądaniu istnieje opcjonalny parametr umożliwiający wybranie funkcji, które mają być zwracane. Domyślnie kategorie obrazów są zwracane w odpowiedzi. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.
analyze_image(url, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametry
- visual_features
- list[str lub VisualFeatureTypes]
Ciąg wskazujący, jakie typy funkcji wizualizacji mają być zwracane. Wiele wartości powinno być rozdzielonych przecinkami. Prawidłowe typy funkcji wizualizacji obejmują: Kategorie — kategoryzuje zawartość obrazu zgodnie z taksonomią zdefiniowaną w dokumentacji. Tagi — taguje obraz ze szczegółową listą słów związanych z zawartością obrazu. Opis — opisuje zawartość obrazu z pełnym zdaniem w języku angielskim. Twarze — wykrywa, czy twarze są obecne. Jeśli istnieje, wygeneruj współrzędne, płeć i wiek. ImageType — wykrywa, czy obraz jest clipart lub rysunek liniowy. Kolor — określa kolor wyróżniający, kolor dominujący i czy obraz jest czarny&biały. Dorosły - wykrywa, czy obraz jest pornograficzny w naturze (przedstawia nagość lub akt seksualny) lub jest gory (przedstawia skrajną przemoc lub krew). Wykryto również treści sugestywne seksualnie (aka rasistowskie). Obiekty — wykrywa różne obiekty na obrazie, w tym przybliżoną lokalizację. Argument Objects jest dostępny tylko w języku angielskim. Marki — wykrywa różne marki na obrazie, w tym przybliżoną lokalizację. Argument Brands jest dostępny tylko w języku angielskim.
Ciąg wskazujący, które szczegóły specyficzne dla domeny mają być zwracane. Wiele wartości powinno być rozdzielonych przecinkami. Prawidłowe typy funkcji wizualizacji obejmują: Gwiazdy — identyfikuje gwiazdy, jeśli zostały wykryte na obrazie, Punkty orientacyjne — identyfikuje godne uwagi punkty orientacyjne na obrazie.
- language
- str
Żądany język generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - uproszczony chiński. Możliwe wartości to: "en", "es", "ja", "pt", "zh"
- description_exclude
- list[str lub DescriptionExclude]
Wyłącz określone modele domeny podczas generowania opisu.
- model_version
- str
Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
ImageAnalysis lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
analyze_image_by_domain
Ta operacja rozpoznaje zawartość na obrazie, stosując model specyficzny dla domeny. Listę modeli specyficznych dla domeny obsługiwanych przez interfejs API przetwarzanie obrazów można pobrać przy użyciu żądania /models GET. Obecnie interfejs API udostępnia następujące modele specyficzne dla domeny: gwiazdy, punkty orientacyjne. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.
analyze_image_by_domain(model, url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametry
- language
- str
Żądany język generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - uproszczony chiński. Możliwe wartości to: "en", "es", "ja", "pt", "zh"
- model_version
- str
Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
DomainModelResults lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
analyze_image_by_domain_in_stream
Ta operacja rozpoznaje zawartość na obrazie, stosując model specyficzny dla domeny. Listę modeli specyficznych dla domeny obsługiwanych przez interfejs API przetwarzanie obrazów można pobrać przy użyciu żądania /models GET. Obecnie interfejs API udostępnia następujące modele specyficzne dla domeny: gwiazdy, punkty orientacyjne. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.
analyze_image_by_domain_in_stream(model, image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametry
- language
- str
Żądany język generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - uproszczony chiński. Możliwe wartości to: "en", "es", "ja", "pt", "zh"
- model_version
- str
Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Po określeniu zostanie wywołana z każdym fragmentem danych przesyłanych strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty, bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie brak.
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
DomainModelResults lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
analyze_image_in_stream
Ta operacja wyodrębnia bogaty zestaw funkcji wizualnych na podstawie zawartości obrazu. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. W żądaniu istnieje opcjonalny parametr umożliwiający wybranie funkcji, które mają być zwracane. Domyślnie kategorie obrazów są zwracane w odpowiedzi. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.
analyze_image_in_stream(image, visual_features=None, details=None, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametry
- visual_features
- list[str lub VisualFeatureTypes]
Ciąg wskazujący, jakie typy funkcji wizualizacji mają być zwracane. Wiele wartości powinno być rozdzielonych przecinkami. Prawidłowe typy funkcji wizualizacji obejmują: Kategorie — kategoryzuje zawartość obrazu zgodnie z taksonomią zdefiniowaną w dokumentacji. Tagi — taguje obraz ze szczegółową listą słów związanych z zawartością obrazu. Opis — opisuje zawartość obrazu z pełnym zdaniem w języku angielskim. Twarze — wykrywa, czy twarze są obecne. Jeśli istnieje, wygeneruj współrzędne, płeć i wiek. ImageType — wykrywa, czy obraz jest clipart lub rysunek liniowy. Kolor — określa kolor wyróżniający, kolor dominujący i czy obraz jest czarny&biały. Dorosły - wykrywa, czy obraz jest pornograficzny w naturze (przedstawia nagość lub akt seksualny) lub jest gory (przedstawia skrajną przemoc lub krew). Wykryto również treści sugestywne seksualnie (aka rasistowskie). Obiekty — wykrywa różne obiekty na obrazie, w tym przybliżoną lokalizację. Argument Objects jest dostępny tylko w języku angielskim. Marki — wykrywa różne marki na obrazie, w tym przybliżoną lokalizację. Argument Brands jest dostępny tylko w języku angielskim.
Ciąg wskazujący, które szczegóły specyficzne dla domeny mają być zwracane. Wiele wartości powinno być rozdzielonych przecinkami. Prawidłowe typy funkcji wizualizacji obejmują: Gwiazdy — identyfikuje osobistości, jeśli zostały wykryte na obrazie, Landmarks — identyfikuje istotne elementy krajobrazu na obrazie.
- language
- str
Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - chiński uproszczony. Możliwe wartości to: "en", "es", "ja", "pt", "zh"
- description_exclude
- list[str lub DescriptionExclude]
Wyłącz określone modele domeny podczas generowania opisu.
- model_version
- str
Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".
- raw
- bool
Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Po określeniu zostanie wywołana z każdym fragmentem danych, które są przesyłane strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty— bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie mieć wartość Brak.
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
ImageAnalysis lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
describe_image
Ta operacja generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami. Opis jest oparty na kolekcji tagów zawartości, które są również zwracane przez operację. Dla każdego obrazu można wygenerować więcej niż jeden opis. Opisy są uporządkowane według ich współczynnika ufności. Opisy mogą obejmować wyniki z modeli domeny osobistości i punktów orientacyjnych, jeśli ma to zastosowanie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.
describe_image(url, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametry
- max_candidates
- int
Maksymalna liczba opisów kandydatów do zwrócenia. Wartość domyślna to 1.
- language
- str
Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - chiński uproszczony. Możliwe wartości to: "en", "es", "ja", "pt", "zh"
- description_exclude
- list[str lub DescriptionExclude]
Wyłącz określone modele domeny podczas generowania opisu.
- model_version
- str
Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".
- raw
- bool
Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
ImageDescription lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
describe_image_in_stream
Ta operacja generuje opis obrazu w języku czytelnym dla człowieka z pełnymi zdaniami. Opis jest oparty na kolekcji tagów zawartości, które są również zwracane przez operację. Dla każdego obrazu można wygenerować więcej niż jeden opis. Opisy są uporządkowane według ich współczynnika ufności. Opisy mogą obejmować wyniki z modeli domeny osobistości i punktów orientacyjnych, jeśli ma to zastosowanie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.
describe_image_in_stream(image, max_candidates=1, language='en', description_exclude=None, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametry
- max_candidates
- int
Maksymalna liczba opisów kandydatów do zwrócenia. Wartość domyślna to 1.
- language
- str
Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - chiński uproszczony. Możliwe wartości to: "en", "es", "ja", "pt", "zh"
- description_exclude
- list[str lub DescriptionExclude]
Wyłącz określone modele domeny podczas generowania opisu.
- model_version
- str
Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".
- raw
- bool
Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Po określeniu zostanie wywołana z każdym fragmentem danych, które są przesyłane strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty— bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie mieć wartość Brak.
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
ImageDescription lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
detect_objects
Wykonuje wykrywanie obiektów na określonym obrazie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.
detect_objects(url, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametry
- model_version
- str
Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".
- raw
- bool
Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
DetectResult lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
detect_objects_in_stream
Wykonuje wykrywanie obiektów na określonym obrazie. Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.
detect_objects_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametry
- model_version
- str
Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".
- raw
- bool
Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Po określeniu zostanie wywołana z każdym fragmentem danych, które są przesyłane strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty— bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie mieć wartość Brak.
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
DetectResult lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
generate_thumbnail
Ta operacja generuje obraz miniatury z określoną przez użytkownika szerokością i wysokością. Domyślnie usługa analizuje obraz, identyfikuje region zainteresowania (ROI) i generuje współrzędne inteligentnego przycinania w oparciu o ten region. Inteligentne przycinanie pomaga po określeniu współczynnika proporcji, który różni się od obrazu wejściowego. Po pomyślnym przetworzeniu żądania jest zwracana odpowiedź zawierająca dane binarne obrazu miniatury. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError.
generate_thumbnail(width, height, url, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametry
- width
- int
Szerokość miniatury w pikselach. Musi zawierać się w przedziale od 1 do 1024. Zalecane minimum 50.
- height
- int
Wysokość miniatury w pikselach. Musi należeć do zakresu od 1 do 1024. Zalecane minimum 50.
- model_version
- str
Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Po określeniu zostanie wywołana z każdym fragmentem danych przesyłanych strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty, bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie brak.
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
object lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
generate_thumbnail_in_stream
Ta operacja generuje obraz miniatury z określoną przez użytkownika szerokością i wysokością. Domyślnie usługa analizuje obraz, identyfikuje region zainteresowania (ROI) i generuje współrzędne inteligentnego przycinania w oparciu o ten region. Inteligentne przycinanie pomaga po określeniu współczynnika proporcji, który różni się od obrazu wejściowego. Po pomyślnym przetworzeniu żądania jest zwracana odpowiedź zawierająca dane binarne obrazu miniatury. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, InvalidThumbnailSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError.
generate_thumbnail_in_stream(width, height, image, smart_cropping=False, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametry
- width
- int
Szerokość miniatury w pikselach. Musi należeć do zakresu od 1 do 1024. Zalecane minimum 50.
- height
- int
Wysokość miniatury w pikselach. Musi należeć do zakresu od 1 do 1024. Zalecane minimum 50.
- model_version
- str
Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Po określeniu zostanie wywołana z każdym fragmentem danych przesyłanych strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty, bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie brak.
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
object lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
get_area_of_interest
Ta operacja zwraca pole ograniczenia wokół najważniejszego obszaru obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError.
get_area_of_interest(url, model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametry
- model_version
- str
Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
AreaOfInterestResult lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
get_area_of_interest_in_stream
Ta operacja zwraca pole ograniczenia wokół najważniejszego obszaru obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź zawiera kod błędu i komunikat, który pomoże określić, co poszło nie tak. Po awarii zwracany jest kod błędu i komunikat o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, FailedToProcess, Timeout lub InternalServerError.
get_area_of_interest_in_stream(image, model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametry
- model_version
- str
Opcjonalny parametr określający wersję modelu sztucznej inteligencji. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Po określeniu zostanie wywołana z każdym fragmentem danych przesyłanych strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty, bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie brak.
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
AreaOfInterestResult lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
get_read_result
Ten interfejs służy do uzyskiwania wyników operacji odczytu OCR. Adres URL tego interfejsu należy pobrać z pola "Operation-Location" zwróconego z interfejsu odczytu.
get_read_result(operation_id, custom_headers=None, raw=False, **operation_config)
Parametry
- operation_id
- str
Identyfikator operacji odczytu zwróconej w odpowiedzi interfejsu "Odczyt".
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
ReadOperationResult lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
list_models
Ta operacja zwraca listę modeli specyficznych dla domeny obsługiwanych przez interfejs API przetwarzanie obrazów. Obecnie interfejs API obsługuje następujące modele specyficzne dla domeny: rozpoznawanie osobistości, rozpoznawanie punktów orientacyjnych. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.
list_models(custom_headers=None, raw=False, **operation_config)
Parametry
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
ListModelsResult lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
read
Użyj tego interfejsu, aby uzyskać wynik operacji odczytu, wykorzystując najnowocześniejsze algorytmy optycznego rozpoznawania znaków (OCR) zoptymalizowane pod kątem dokumentów z dużą ilością tekstu. W przypadku korzystania z interfejsu Read odpowiedź zawiera pole o nazwie "Operation-Location". Pole "Operation-Location" zawiera adres URL, którego należy użyć do operacji "GetReadResult", aby uzyskać dostęp do wyników OCR..
read(url, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, **operation_config)
Parametry
- language
- str lub OcrDetectionLanguage
Kod języka BCP-47 tekstu w dokumencie. Funkcja Read obsługuje automatyczną identyfikację języka i dokumenty wielojęzyczne, dlatego podaj tylko kod języka, jeśli chcesz wymusić przetwarzanie dokumentu w tym konkretnym języku. Zobacz https://aka.ms/ocr-languages listę obsługiwanych języków. Możliwe wartości to: "af", "ast", "bi", 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', "gv", "hni", "hsb", "ht", "hu", "ia", "id", "it", "iu", "ja", "jv", "kaa", "kac", 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hag', 'zu'
Niestandardowe numery stron dla dokumentów wielostronicowych (PDF/TIFF), wprowadź liczbę stron, które chcesz uzyskać wynik OCR. W przypadku zakresu stron użyj łącznika. Oddziel każdą stronę lub zakres przecinkiem.
- model_version
- str
Opcjonalny parametr określający wersję modelu OCR używanego do wyodrębniania tekstu. Akceptowane wartości to: "latest", "latest-preview", "2021-04-12". Wartość domyślna to "latest".
- reading_order
- str
Opcjonalny parametr określający algorytm kolejności odczytu, który ma być stosowany podczas porządkowania wyodrębnianych elementów tekstowych. Może to być "podstawowy" lub "naturalny". Wartość domyślna to "basic", jeśli nie zostanie określona
- raw
- bool
Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
Brak lub Wartość ClientRawResponse, jeśli parametr raw=true
Typ zwracany
Wyjątki
read_in_stream
Użyj tego interfejsu, aby uzyskać wynik operacji odczytu, wykorzystując najnowocześniejsze algorytmy optycznego rozpoznawania znaków (OCR) zoptymalizowane pod kątem dokumentów z dużą ilością tekstu. W przypadku korzystania z interfejsu Read odpowiedź zawiera pole o nazwie "Operation-Location". Pole "Operation-Location" zawiera adres URL, którego należy użyć do operacji "GetReadResult", aby uzyskać dostęp do wyników OCR..
read_in_stream(image, language=None, pages=None, model_version='latest', reading_order='basic', custom_headers=None, raw=False, callback=None, **operation_config)
Parametry
- language
- str lub OcrDetectionLanguage
Kod języka BCP-47 tekstu w dokumencie. Funkcja Read obsługuje automatyczną identyfikację języka i dokumenty w wielu językach, dlatego podaj tylko kod języka, jeśli chcesz wymusić przetworzenie dokumentu w tym konkretnym języku. Zobacz https://aka.ms/ocr-languages listę obsługiwanych języków. Możliwe wartości to: "af", "ast", "bi", 'br', 'ca', 'ceb', 'ch', 'co', 'crh', 'cs', 'csb', 'da', 'de', 'en', 'es', 'et', 'eu', 'fi', 'fil', 'fj', 'fr', 'fur', 'fy', 'ga', 'gd', 'gil', 'gl', 'gl', 'gv', 'hni', 'hsb', 'ht', 'hu', 'ia', 'id', 'it', 'iu', 'ja', 'jv', 'kaa', 'kac'', 'kea', 'kha', 'kl', 'ko', 'ku', 'kw', 'lb', 'ms', 'mww', 'nap', 'nl', 'no', 'oc', 'pl', 'pt', 'quc', 'rm', 'sco', 'sl', 'sq', 'sv', 'sw', 'tet', 'tr', 'tt', 'uz', 'vo', 'wae', 'yua', 'za', 'zh-Hans', 'zh-Hant', 'zu'
Niestandardowe numery stron dla dokumentów wielostronicowych (PDF/TIFF), wprowadź liczbę stron, które chcesz uzyskać wynik OCR. W przypadku zakresu stron użyj łącznika. Oddziel każdą stronę lub zakres przecinkiem.
- model_version
- str
Opcjonalny parametr określający wersję modelu OCR używanego do wyodrębniania tekstu. Akceptowane wartości to: "latest", "latest-preview", "2021-04-12". Wartość domyślna to "latest".
- reading_order
- str
Opcjonalny parametr określający algorytm kolejności odczytu, który ma być stosowany podczas porządkowania wyodrębnianych elementów tekstowych. Może to być "podstawowy" lub "naturalny". Wartość domyślna to "basic", jeśli nie zostanie określona
- raw
- bool
Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Po określeniu zostanie wywołana z każdym fragmentem danych, które są przesyłane strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty— bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie mieć wartość Brak.
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
Brak lub Wartość ClientRawResponse, jeśli parametr raw=true
Typ zwracany
Wyjątki
recognize_printed_text
Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do strumienia znaków nadającego się do użycia maszynowo. Po pomyślnym zwróceniu wyników OCR. Po awarii zostanie zwrócony kod błędu wraz z komunikatem o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage lub InternalServerError.
recognize_printed_text(url, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametry
- detect_orientation
- bool
Określa, czy na obrazie wykryto orientację tekstu. Za pomocą funkcji detectOrientation=true usługa OCR próbuje wykryć orientację obrazu i poprawić ją przed dalszym przetwarzaniem (np. jeśli jest do góry nogami).
- language
- str lub OcrLanguages
Kod języka BCP-47 tekstu, który ma zostać wykryty na obrazie. Wartość domyślna to "unk". Możliwe wartości to: "unk", "zh-Hans", "zh-Hant", 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'
- model_version
- str
Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".
- raw
- bool
Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
OcrResult lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
recognize_printed_text_in_stream
Optyczne rozpoznawanie znaków (OCR) wykrywa tekst na obrazie i wyodrębnia rozpoznane znaki do strumienia znaków nadającego się do użycia maszynowo. Po pomyślnym zwróceniu wyników OCR. Po awarii zostanie zwrócony kod błędu wraz z komunikatem o błędzie. Kod błędu może być jednym z invalidImageUrl, InvalidImageFormat, InvalidImageSize, NotSupportedImage, NotSupportedLanguage lub InternalServerError.
recognize_printed_text_in_stream(image, detect_orientation=True, language='unk', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametry
- detect_orientation
- bool
Określa, czy na obrazie wykryto orientację tekstu. Za pomocą funkcji detectOrientation=true usługa OCR próbuje wykryć orientację obrazu i poprawić ją przed dalszym przetwarzaniem (np. jeśli jest do góry nogami).
- language
- str lub OcrLanguages
Kod języka BCP-47 tekstu, który ma zostać wykryty na obrazie. Wartość domyślna to "unk". Możliwe wartości to: "unk", "zh-Hans", "zh-Hant", 'cs', 'da', 'nl', 'en', 'fi', 'fr', 'de', 'el', 'hu', 'it', 'ja', 'ko', 'nb', 'pl', 'pt', 'ru', 'es', 'sv', 'tr', 'ar', 'ro', 'sr-Cyrl', 'sr-Latn', 'sk'
- model_version
- str
Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".
- raw
- bool
Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Po określeniu zostanie wywołana z każdym fragmentem danych, które są przesyłane strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty— bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie mieć wartość Brak.
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
OcrResult lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
tag_image
Ta operacja generuje listę wyrazów lub tagów, które są istotne dla zawartości dostarczonego obrazu. Interfejs API przetwarzanie obrazów może zwracać tagi na podstawie obiektów, istot żywych, scenerii lub akcji znalezionych na obrazach. W przeciwieństwie do kategorii tagi nie są zorganizowane zgodnie z hierarchicznym systemem klasyfikacji, ale odpowiadają zawartości obrazu. Tagi mogą zawierać wskazówki, aby uniknąć niejednoznaczności lub zapewnić kontekst, na przykład tag "ascomycete" może towarzyszyć wskazówce "grzyb". Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiedzie się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.
tag_image(url, language='en', model_version='latest', custom_headers=None, raw=False, **operation_config)
Parametry
- language
- str
Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - chiński uproszczony. Możliwe wartości to: "en", "es", "ja", "pt", "zh"
- model_version
- str
Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest".
- raw
- bool
Metoda zwraca bezpośrednią odpowiedź obok zdeserializowanej odpowiedzi
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
TagResult lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
tag_image_in_stream
Ta operacja generuje listę słów lub tagów, które są istotne dla zawartości dostarczonego obrazu. Interfejs API przetwarzanie obrazów może zwracać tagi na podstawie obiektów, istot żywych, scenerii lub akcji znalezionych na obrazach. W przeciwieństwie do kategorii tagi nie są zorganizowane zgodnie z hierarchicznym systemem klasyfikacji, ale odpowiadają zawartości obrazu. Tagi mogą zawierać wskazówki, aby uniknąć niejednoznaczności lub zapewnić kontekst, na przykład tag "ascomycete" może towarzyszyć wskazówka "grzyb". Obsługiwane są dwie metody wejściowe — (1) Przekazywanie obrazu lub (2) określanie adresu URL obrazu. Pomyślna odpowiedź zostanie zwrócona w formacie JSON. Jeśli żądanie nie powiodło się, odpowiedź będzie zawierać kod błędu i komunikat, który pomoże zrozumieć, co poszło nie tak.
tag_image_in_stream(image, language='en', model_version='latest', custom_headers=None, raw=False, callback=None, **operation_config)
Parametry
- language
- str
Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Obsługiwane języki:en — angielski, domyślny. es - hiszpański, ja - japoński, pt - portugalski, zh - chiński uproszczony. Możliwe wartości to: "en", "es", "ja", "pt", "zh"
- model_version
- str
Opcjonalny parametr określający wersję modelu AI. Akceptowane wartości to: "latest", "2021-04-01". Wartość domyślna to "latest" (najnowsza wersja).
- callback
- Callable[<xref:Bytes>, <xref:response=None>]
Po określeniu zostanie wywołana z każdym fragmentem danych przesyłanych strumieniowo. Wywołanie zwrotne powinno przyjmować dwa argumenty, bajty bieżącego fragmentu danych i obiektu odpowiedzi. Jeśli dane są przekazywane, odpowiedź będzie brak.
- operation_config
Przesłonięcia konfiguracji operacji.
Zwraca
TagResult lub ClientRawResponse, jeśli raw=true
Typ zwracany
Wyjątki
Azure SDK for Python