Image Analysis - Analyze Stream
Analizowanie obrazu wejściowego. Żądanie zawiera strumień obrazu z dowolnym typem zawartości ['image/*', 'application/octet-stream'] lub ładunkiem JSON, który zawiera właściwość adresu URL, która ma być używana do pobierania strumienia obrazu.
POST /imageanalysis:analyze?overload=stream&api-version=2023-04-01-preview
POST /imageanalysis:analyze?overload=stream&features={features}&model-name={model-name}&language={language}&smartcrops-aspect-ratios={smartcrops-aspect-ratios}&gender-neutral-caption={gender-neutral-caption}&api-version=2023-04-01-preview
Parametry identyfikatora URI
| Nazwa | W | Wymagane | Typ | Opis |
|---|---|---|---|---|
|
api-version
|
query | True |
string |
Żądana wersja interfejsu API. |
|
features
|
query |
Żądane funkcje wizualne: tagi, obiekty, podpisy, gęsteCaptions, odczyt, smartCrops, osoby. Ten parametr należy określić, jeśli nie określono parametru "nazwa-modelu". |
||
|
gender-neutral-caption
|
query |
boolean |
Flaga logiczna umożliwiająca podpisy neutralne pod względem płci dla podpisów i funkcji gęstychCaptions. Jeśli ten parametr nie zostanie określony, wartość domyślna to "false". |
|
|
language
|
query |
string |
Żądany język do generowania danych wyjściowych. Jeśli ten parametr nie zostanie określony, wartość domyślna to "en". Aby uzyskać listę obsługiwanych języków, zobacz https://aka.ms/cv-languages. |
|
|
model-name
|
query |
string |
Nazwa niestandardowego wytrenowanego modelu. Ten parametr należy określić, jeśli parametr "features" nie został określony. |
|
|
smartcrops-aspect-ratios
|
query |
string |
Lista współczynników proporcji do użycia w funkcji smartCrops. Współczynniki proporcji są obliczane przez podzielenie docelowej szerokości przycinania według wysokości. Obsługiwane wartości to od 0,75 do 1,8 (włącznie). Wiele wartości powinno być rozdzielonych przecinkami. Jeśli ten parametr nie zostanie określony, usługa zwróci jedną sugestię przycinania z współczynnikiem proporcji, który zobaczy w zakresie od 0,5 do 2,0 (włącznie). |
Treść żądania
Media Types: "application/octet-stream", "image/jpeg", "image/gif", "image/tiff", "image/bmp", "image/png"
| Nazwa | Typ | Opis |
|---|---|---|
| body |
string (byte) |
Strumień obrazu. |
Odpowiedzi
| Nazwa | Typ | Opis |
|---|---|---|
| 200 OK |
Powodzenie |
|
| Other Status Codes |
Błąd Nagłówki x-ms-error-code: string |
Przykłady
AnalyzeImageFromImageStream_CustomModel
Przykładowe żądanie
POST /imageanalysis:analyze?overload=stream&model-name=my_model_name&api-version=2023-04-01-preview
"Ynl0ZXM="
Przykładowa odpowiedź
{
"modelVersion": "2023-04-01-preview",
"customModelResult": {
"objectsResult": {
"values": [
{
"id": "1",
"boundingBox": {
"x": 197,
"y": 68,
"w": 356,
"h": 394
},
"tags": [
{
"name": "class1",
"confidence": 0.92431640625
}
]
},
{
"id": "2",
"boundingBox": {
"x": 0,
"y": 77,
"w": 241,
"h": 359
},
"tags": [
{
"name": "class1",
"confidence": 0.87890625
}
]
}
]
}
},
"metadata": {
"width": 660,
"height": 495
}
}
Definicje
| Nazwa | Opis |
|---|---|
|
Adult |
Obiekt opisujący dopasowanie zawartości dla dorosłych. |
|
Adult |
Obiekt opisujący, czy obraz zawiera zawartość zorientowaną dla dorosłych i/lub jest rasistą. |
|
Bounding |
Pole ograniczenia obszaru wewnątrz obrazu. |
|
Caption |
Krótki opis obrazu. |
|
Crop |
Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region. |
|
Dense |
Krótki opis obrazu. |
|
Dense |
Lista podpisów. |
|
Detected |
Opisuje wykryty obiekt na obrazie. |
|
Detected |
Osoba wykryta na obrazie. |
|
Document |
Obiekt wiersza zawartości składający się z sąsiedniej sekwencji elementów zawartości, takich jak wyrazy i znaczniki zaznaczenia. |
|
Document |
Elementy zawartości i układu wyodrębnione ze strony z danych wejściowych. |
|
Document |
Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość. |
|
Document |
Obiekt reprezentujący obserwowane style tekstu. |
|
Document |
Obiekt wyrazu składający się z ciągłej sekwencji znaków. W przypadku języków rozdzielanych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz. |
|
Error |
Odpowiedź zwrócona po wystąpieniu błędu. |
|
Error |
Informacje o błędzie. |
|
Error |
Szczegółowy błąd. |
|
Image |
Opisz połączone wyniki różnych typów analizy obrazów. |
|
Image |
Informacje o metadanych obrazu, takie jak wysokość i szerokość. |
|
Image |
Opisuje wynik przewidywania obrazu. |
|
Objects |
Opisuje wykryte obiekty na obrazie. |
|
People |
Obiekt opisujący, czy obraz zawiera osoby. |
|
Read |
Wyniki operacji odczytu. |
|
Smart |
Wynik inteligentnego przycinania. |
| Tag |
Obserwacja jednostki na obrazie wraz z współczynnikiem ufności. |
|
Tags |
Lista tagów z poziomem ufności. |
|
Visual |
Żądane funkcje wizualne: tagi, obiekty, podpisy, gęsteCaptions, odczyt, smartCrops, osoby. Ten parametr należy określić, jeśli nie określono parametru "nazwa-modelu". |
AdultMatch
Obiekt opisujący dopasowanie zawartości dla dorosłych.
| Nazwa | Typ | Opis |
|---|---|---|
| confidence |
number (double) minimum: 0maximum: 1 |
Wartość wskazująca poziom ufności dopasowanej zawartości dla dorosłych. |
| isMatch |
boolean |
Wartość wskazująca, czy obraz jest zgodny z zawartością dla dorosłych. |
AdultResult
Obiekt opisujący, czy obraz zawiera zawartość zorientowaną dla dorosłych i/lub jest rasistą.
| Nazwa | Typ | Opis |
|---|---|---|
| adult |
Obiekt opisujący dopasowanie zawartości dla dorosłych. |
|
| gore |
Obiekt opisujący dopasowanie zawartości dla dorosłych. |
|
| racy |
Obiekt opisujący dopasowanie zawartości dla dorosłych. |
BoundingBox
Pole ograniczenia obszaru wewnątrz obrazu.
| Nazwa | Typ | Opis |
|---|---|---|
| h |
integer (int32) minimum: 1 |
Wysokość mierzona od lewego górnego punktu obszaru w pikselach. |
| w |
integer (int32) minimum: 1 |
Szerokość mierzona od lewego górnego punktu obszaru w pikselach. |
| x |
integer (int32) minimum: 0 |
Współrzędna lewa górna lewa część obszaru w pikselach. |
| y |
integer (int32) minimum: 0 |
Górna współrzędna lewego górnego punktu obszaru w pikselach. |
CaptionResult
Krótki opis obrazu.
| Nazwa | Typ | Opis |
|---|---|---|
| confidence |
number (double) minimum: 0maximum: 1 |
Poziom pewności, jaki usługa ma w podpisie. |
| text |
string minLength: 1 |
Tekst podpisu. |
CropRegion
Region zidentyfikowany na potrzeby inteligentnego przycinania. Dla każdego żądanego współczynnika proporcji zostanie zwrócony jeden region.
| Nazwa | Typ | Opis |
|---|---|---|
| aspectRatio |
number (double) |
Współczynnik proporcji regionu przycinania. |
| boundingBox |
Pole ograniczenia obszaru wewnątrz obrazu. |
DenseCaption
Krótki opis obrazu.
| Nazwa | Typ | Opis |
|---|---|---|
| boundingBox |
Pole ograniczenia obszaru wewnątrz obrazu. |
|
| confidence |
number (double) minimum: 0maximum: 1 |
Poziom pewności, jaki usługa ma w podpisie. |
| text |
string minLength: 1 |
Tekst podpisu. |
DenseCaptionsResult
Lista podpisów.
| Nazwa | Typ | Opis |
|---|---|---|
| values |
Lista podpisów. |
DetectedObject
Opisuje wykryty obiekt na obrazie.
| Nazwa | Typ | Opis |
|---|---|---|
| boundingBox |
Pole ograniczenia obszaru wewnątrz obrazu. |
|
| id |
string minLength: 1 |
Identyfikator wykrytego obiektu. |
| tags |
Tag[] |
Klasyfikacja ufności wykrytego obiektu. |
DetectedPerson
Osoba wykryta na obrazie.
| Nazwa | Typ | Opis |
|---|---|---|
| boundingBox |
Pole ograniczenia obszaru wewnątrz obrazu. |
|
| confidence |
number (double) minimum: 0maximum: 1 |
Wskaźnik ufności obserwowanego osoby na obrazie jako wartość z zakresu od 0 do 1. |
DocumentLine
Obiekt wiersza zawartości składający się z sąsiedniej sekwencji elementów zawartości, takich jak wyrazy i znaczniki zaznaczenia.
| Nazwa | Typ | Opis |
|---|---|---|
| boundingBox |
number[] (double) |
Pole ograniczenia linii. |
| content |
string minLength: 1 |
Połączona zawartość zawartych elementów w kolejności odczytu. |
| spans |
Lokalizacja wiersza w kolejności odczytu łączy zawartość. |
DocumentPage
Elementy zawartości i układu wyodrębnione ze strony z danych wejściowych.
| Nazwa | Typ | Opis |
|---|---|---|
| angle |
number (double) |
Ogólna orientacja zawartości w kierunku wskazówek zegara mierzona w stopniach między (-180, 180). |
| height |
number (double) |
Wysokość obrazu/PLIKU PDF w pikselach/calach, odpowiednio. |
| lines |
Wyodrębnione wiersze ze strony, potencjalnie zawierające zarówno elementy tekstowe, jak i wizualne. |
|
| pageNumber |
integer (int32) |
Numer strony opartej na 1 w dokumencie wejściowym. |
| spans |
Lokalizacja strony w kolejności odczytu łączy zawartość. |
|
| width |
number (double) |
Szerokość obrazu/pliku PDF odpowiednio w pikselach/calach. |
| words |
Wyodrębnione wyrazy ze strony. |
DocumentSpan
Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość.
| Nazwa | Typ | Opis |
|---|---|---|
| length |
integer (int32) |
Liczba znaków w zawartości reprezentowanej przez zakres. |
| offset |
integer (int32) |
Indeks na podstawie zera zawartości reprezentowanej przez zakres. |
DocumentStyle
Obiekt reprezentujący obserwowane style tekstu.
| Nazwa | Typ | Opis |
|---|---|---|
| confidence |
number (double) |
Pewność prawidłowego identyfikowania stylu. |
| isHandwritten |
boolean |
Czy zawartość jest odręczna, czy nie. |
| spans |
Lokalizacja elementów tekstowych w łączonej zawartości, do których ma zastosowanie styl. |
DocumentWord
Obiekt wyrazu składający się z ciągłej sekwencji znaków. W przypadku języków rozdzielanych spacjami, takich jak chiński, japoński i koreański, każdy znak jest reprezentowany jako własny wyraz.
| Nazwa | Typ | Opis |
|---|---|---|
| boundingBox |
number[] (double) |
Pole ograniczenia wyrazu. |
| confidence |
number (double) |
Pewność poprawnego wyodrębnienia wyrazu. |
| content |
string minLength: 1 |
Zawartość tekstowa wyrazu. |
| span |
Ciągły region połączonej właściwości zawartości określony jako przesunięcie i długość. |
ErrorResponse
Odpowiedź zwrócona po wystąpieniu błędu.
| Nazwa | Typ | Opis |
|---|---|---|
| error |
Informacje o błędzie. |
ErrorResponseDetails
Informacje o błędzie.
| Nazwa | Typ | Opis |
|---|---|---|
| code |
string |
Kod błędu. |
| details |
Lista szczegółowych błędów. |
|
| innererror |
Szczegółowy błąd. |
|
| message |
string |
Komunikat o błędzie. |
| target |
string |
Element docelowy błędu. |
ErrorResponseInnerError
Szczegółowy błąd.
| Nazwa | Typ | Opis |
|---|---|---|
| code |
string |
Kod błędu. |
| innererror |
Szczegółowy błąd. |
|
| message |
string |
Komunikat o błędzie. |
ImageAnalysisResult
Opisz połączone wyniki różnych typów analizy obrazów.
| Nazwa | Typ | Opis |
|---|---|---|
| adultResult |
Obiekt opisujący, czy obraz zawiera zawartość zorientowaną dla dorosłych i/lub jest rasistą. |
|
| captionResult |
Krótki opis obrazu. |
|
| customModelResult |
Opisuje wynik przewidywania obrazu. |
|
| denseCaptionsResult |
Lista podpisów. |
|
| metadata |
Informacje o metadanych obrazu, takie jak wysokość i szerokość. |
|
| modelVersion |
string minLength: 1 |
Wersja modelu. |
| objectsResult |
Opisuje wykryte obiekty na obrazie. |
|
| peopleResult |
Obiekt opisujący, czy obraz zawiera osoby. |
|
| readResult |
Wyniki operacji odczytu. |
|
| smartCropsResult |
Wynik inteligentnego przycinania. |
|
| tagsResult |
Lista tagów z poziomem ufności. |
ImageMetadataApiModel
Informacje o metadanych obrazu, takie jak wysokość i szerokość.
| Nazwa | Typ | Opis |
|---|---|---|
| height |
integer (int32) minimum: 1 |
Wysokość obrazu w pikselach. |
| width |
integer (int32) minimum: 1 |
Szerokość obrazu w pikselach. |
ImagePredictionResult
Opisuje wynik przewidywania obrazu.
| Nazwa | Typ | Opis |
|---|---|---|
| objectsResult |
Opisuje wykryte obiekty na obrazie. |
|
| tagsResult |
Lista tagów z poziomem ufności. |
ObjectsResult
Opisuje wykryte obiekty na obrazie.
| Nazwa | Typ | Opis |
|---|---|---|
| values |
Tablica wykrytych obiektów. |
PeopleResult
Obiekt opisujący, czy obraz zawiera osoby.
| Nazwa | Typ | Opis |
|---|---|---|
| values |
Tablica wykrytych osób. |
ReadResult
Wyniki operacji odczytu.
| Nazwa | Typ | Opis |
|---|---|---|
| content |
string minLength: 1 |
Połącz reprezentację ciągu wszystkich elementów tekstowych i wizualnych w kolejności odczytu. |
| pages |
Lista analizowanych stron. |
|
| stringIndexType |
string minLength: 1 |
Metoda używana do obliczania przesunięcia i długości ciągu, możliwe wartości obejmują: "textElements", "unicodeCodePoint", "utf16CodeUnit" itp. |
| styles |
Wyodrębnione style czcionek. |
SmartCropsResult
Wynik inteligentnego przycinania.
| Nazwa | Typ | Opis |
|---|---|---|
| values |
Zalecane regiony do przycinania obrazu. |
Tag
Obserwacja jednostki na obrazie wraz z współczynnikiem ufności.
| Nazwa | Typ | Opis |
|---|---|---|
| confidence |
number (double) minimum: 0maximum: 1 |
Poziom pewności, że jednostka została zaobserwowana. |
| name |
string minLength: 1 |
Nazwa jednostki. |
TagsResult
Lista tagów z poziomem ufności.
| Nazwa | Typ | Opis |
|---|---|---|
| values |
Tag[] |
Lista tagów z poziomem ufności. |
VisualFeature
Żądane funkcje wizualne: tagi, obiekty, podpisy, gęsteCaptions, odczyt, smartCrops, osoby. Ten parametr należy określić, jeśli nie określono parametru "nazwa-modelu".
| Wartość | Opis |
|---|---|
| tags | |
| caption | |
| denseCaptions | |
| objects | |
| read | |
| smartCrops | |
| people |