Podpisy obrazów (wersja 4.0)
Podpisy obrazów w usłudze Image Analysis 4.0 są dostępne za pośrednictwem funkcji Caption i Dense Captions .
Funkcja Podpis generuje jednodniowy opis całej zawartości obrazu. Transkrypcje gęste zapewniają więcej szczegółów, generując opisy jednodniowe do 10 różnych regionów obrazu oprócz opisywania całego obrazu. Napisy gęste zwracają również współrzędne pola ograniczenia dla opisanych regionów obrazu. Obie te funkcje korzystają z najnowszych modeli sztucznej inteligencji opartych na Florencji.
Podpisy obrazów są dostępne tylko w języku angielskim.
Ważne
Podpisy obrazów w usłudze Image Analysis 4.0 są dostępne tylko w niektórych regionach centrum danych platformy Azure: zobacz Dostępność regionów. Aby uzyskać wyniki z funkcji Caption i Dense Captions, musisz użyć zasobu usługi Azure AI Vision znajdującego się w jednym z tych regionów.
Jeśli chcesz użyć zasobu usługi Vision poza tymi regionami do wygenerowania podpisów obrazów, użyj funkcji Image Analysis 3.2 , która jest dostępna we wszystkich regionach usługi Azure AI Vision.
Wypróbuj funkcje podpisów obrazów szybko i łatwo w przeglądarce przy użyciu programu Vision Studio.
Podpisy neutralne pod względem płci
Domyślnie podpisy zawierają terminy płci ("mężczyzna", "kobieta", "chłopiec" i "dziewczyna"). Możesz zastąpić te terminy ciągiem "person" w wynikach i otrzymywać podpisy neutralne pod względem płci. Możesz to zrobić, ustawiając opcjonalny parametr gender-neutral-caption
żądania interfejsu API na true
wartość w adresie URL żądania.
Przykłady podpisów i transkrysów gęstych
Poniższa odpowiedź JSON ilustruje, co interfejs API Analizy obrazów 4.0 zwraca podczas opisywania przykładowego obrazu na podstawie jego funkcji wizualnych.
"captions": [
{
"text": "a man pointing at a screen",
"confidence": 0.4891590476036072
}
]
Używanie interfejsu API
Funkcja transkrywowania obrazów jest częścią interfejsu API analizowania obrazu . Uwzględnij Caption
parametr zapytania funkcji . Następnie po otrzymaniu pełnej odpowiedzi JSON przeanalizuj ciąg zawartości "captionResult"
sekcji.
Następne kroki
- Poznaj powiązaną koncepcję wykrywania obiektów.
- Szybki start: interfejs API REST analizy obrazów lub biblioteki klienckie
- Wywoływanie interfejsu API analizowania obrazu