Podpis obrazów (wersja 4.0)

Podpis obrazów w usłudze Image Analysis 4.0 są dostępne za pośrednictwem funkcji Caption i Dense Captions.

Podpis generuje jednodniowy opis dla całej zawartości obrazu. Transkrypcje gęste zapewniają więcej szczegółów, generując opisy jednodniowe do 10 regionów obrazu oprócz opisywania całego obrazu. Napisy gęste zwracają również współrzędne pola ograniczenia dla opisanych regionów obrazu. Obie te funkcje korzystają z najnowszych przełomowych modeli sztucznej inteligencji opartych na Florencji.

Obecnie podpis obrazów jest dostępny tylko w języku angielskim.

Ważne

Obraz podpis w analizie obrazu 4.0 jest dostępny tylko w następujących regionach centrum danych platformy Azure: Wschodnie stany USA, Francja Środkowa, Korea Środkowa, Europa Północna, Azja Południowo-Wschodnia, Europa Zachodnia, Zachodnie stany USA, Azja Wschodnia. Aby uzyskać wyniki z funkcji Caption i Dense Captions, musisz użyć zasobu vision znajdującego się w jednym z tych regionów.

Jeśli musisz użyć zasobu przetwarzania obrazów poza tymi regionami do wygenerowania podpis obrazu, użyj narzędzia Image Analysis 3.2, który jest dostępny we wszystkich regionach usługi Azure AI Vision.

Wypróbuj obraz podpis funkcje szybko i łatwo w przeglądarce przy użyciu programu Vision Studio.

Podpis neutralne pod względem płci

Podpisy zawierają domyślnie terminy płci ("mężczyzna", "kobieta", "chłopiec" i "dziewczyna"). Możesz zastąpić te terminy ciągiem "person" w wynikach i otrzymać neutralne pod względem płci podpis. Można to zrobić, ustawiając opcjonalny parametr żądania interfejsu API, podpis neutralne pod względem płci w true adresie URL żądania.

Przykłady podpisów i transkrysów gęstych

Poniższa odpowiedź JSON ilustruje, co interfejs API analizy 4.0 zwraca podczas opisywania przykładowego obrazu na podstawie jego funkcji wizualnych.

Photo of a man pointing at a screen

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

Używanie interfejsu API

Funkcja podpis obrazu jest częścią interfejsu API analizowania obrazu. Uwzględnij Captionparametr zapytania funkcji . Następnie po otrzymaniu pełnej odpowiedzi JSON przeanalizuj ciąg zawartości "captionResult" sekcji.

Następne kroki