Udostępnij za pośrednictwem


Podpisy obrazów (wersja 4.0)

Podpisy obrazów w usłudze Image Analysis 4.0 są dostępne za pośrednictwem funkcji Caption i Dense Captions .

Funkcja Podpis generuje jednodniowy opis całej zawartości obrazu. Transkrypcje gęste zapewniają więcej szczegółów, generując opisy jednodniowe do 10 różnych regionów obrazu oprócz opisywania całego obrazu. Napisy gęste zwracają również współrzędne pola ograniczenia dla opisanych regionów obrazu. Obie te funkcje korzystają z najnowszych modeli sztucznej inteligencji opartych na Florencji.

Podpisy obrazów są dostępne tylko w języku angielskim.

Ważne

Podpisy obrazów w usłudze Image Analysis 4.0 są dostępne tylko w niektórych regionach centrum danych platformy Azure: zobacz Dostępność regionów. Aby uzyskać wyniki z funkcji Caption i Dense Captions, musisz użyć zasobu usługi Azure AI Vision znajdującego się w jednym z tych regionów.

Jeśli chcesz użyć zasobu usługi Vision poza tymi regionami do wygenerowania podpisów obrazów, użyj funkcji Image Analysis 3.2 , która jest dostępna we wszystkich regionach usługi Azure AI Vision.

Wypróbuj funkcje podpisów obrazów szybko i łatwo w przeglądarce przy użyciu programu Vision Studio.

Podpisy neutralne pod względem płci

Domyślnie podpisy zawierają terminy płci ("mężczyzna", "kobieta", "chłopiec" i "dziewczyna"). Możesz zastąpić te terminy ciągiem "person" w wynikach i otrzymywać podpisy neutralne pod względem płci. Możesz to zrobić, ustawiając opcjonalny parametr gender-neutral-caption żądania interfejsu API na true wartość w adresie URL żądania.

Przykłady podpisów i transkrysów gęstych

Poniższa odpowiedź JSON ilustruje, co interfejs API Analizy obrazów 4.0 zwraca podczas opisywania przykładowego obrazu na podstawie jego funkcji wizualnych.

Zdjęcie mężczyzny wskazującego na ekran

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

Używanie interfejsu API

Funkcja transkrywowania obrazów jest częścią interfejsu API analizowania obrazu . Uwzględnij Caption parametr zapytania funkcji . Następnie po otrzymaniu pełnej odpowiedzi JSON przeanalizuj ciąg zawartości "captionResult" sekcji.

Następne kroki