Podpis obrazów (wersja 4.0)

Artykuł
01/23/2024

Podpis obrazów w usłudze Image Analysis 4.0 są dostępne za pośrednictwem funkcji Caption i Dense Captions.

Podpis generuje jednodniowy opis dla całej zawartości obrazu. Transkrypcje gęste zapewniają więcej szczegółów, generując opisy jednodniowe do 10 regionów obrazu oprócz opisywania całego obrazu. Napisy gęste zwracają również współrzędne pola ograniczenia dla opisanych regionów obrazu. Obie te funkcje korzystają z najnowszych przełomowych modeli sztucznej inteligencji opartych na Florencji.

Obecnie podpis obrazów jest dostępny tylko w języku angielskim.

Ważne

Obraz podpis w analizie obrazu 4.0 jest dostępny tylko w następujących regionach centrum danych platformy Azure: Wschodnie stany USA, Francja Środkowa, Korea Środkowa, Europa Północna, Azja Południowo-Wschodnia, Europa Zachodnia, Zachodnie stany USA, Azja Wschodnia. Aby uzyskać wyniki z funkcji Caption i Dense Captions, musisz użyć zasobu vision znajdującego się w jednym z tych regionów.

Jeśli musisz użyć zasobu przetwarzania obrazów poza tymi regionami do wygenerowania podpis obrazu, użyj narzędzia Image Analysis 3.2, który jest dostępny we wszystkich regionach usługi Azure AI Vision.

Wypróbuj obraz podpis funkcje szybko i łatwo w przeglądarce przy użyciu programu Vision Studio.

Wypróbuj program Vision Studio

Podpis neutralne pod względem płci

Podpisy zawierają domyślnie terminy płci ("mężczyzna", "kobieta", "chłopiec" i "dziewczyna"). Możesz zastąpić te terminy ciągiem "person" w wynikach i otrzymać neutralne pod względem płci podpis. Można to zrobić, ustawiając opcjonalny parametr żądania interfejsu API, podpis neutralne pod względem płci w true adresie URL żądania.

Poniższa odpowiedź JSON ilustruje, co interfejs API analizy 4.0 zwraca podczas opisywania przykładowego obrazu na podstawie jego funkcji wizualnych.

Photo of a man pointing at a screen

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

Poniższa odpowiedź JSON ilustruje, co interfejs API analizy 4.0 zwraca podczas generowania gęstych podpis dla przykładowego obrazu.

Photo of a tractor on a farm

{
  "denseCaptionsResult": {
    "values": [
      {
        "text": "a man driving a tractor in a farm",
        "confidence": 0.535620927810669,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 850,
          "h": 567
        }
      },
      {
        "text": "a man driving a tractor in a field",
        "confidence": 0.5428450107574463,
        "boundingBox": {
          "x": 132,
          "y": 266,
          "w": 209,
          "h": 219
        }
      },
      {
        "text": "a blurry image of a tree",
        "confidence": 0.5139822363853455,
        "boundingBox": {
          "x": 147,
          "y": 126,
          "w": 76,
          "h": 131
        }
      },
      {
        "text": "a man riding a tractor",
        "confidence": 0.4799223840236664,
        "boundingBox": {
          "x": 206,
          "y": 264,
          "w": 64,
          "h": 97
        }
      },
      {
        "text": "a blue sky above a hill",
        "confidence": 0.35495415329933167,
        "boundingBox": {
          "x": 0,
          "y": 0,
          "w": 837,
          "h": 166
        }
      },
      {
        "text": "a tractor in a field",
        "confidence": 0.47338250279426575,
        "boundingBox": {
          "x": 0,
          "y": 243,
          "w": 838,
          "h": 311
        }
      }
    ]
  },
  "modelVersion": "2024-02-01",
  "metadata": {
    "width": 850,
    "height": 567
  }
}

Używanie interfejsu API

Podpis obrazów
Gęste podpis

Funkcja podpis obrazu jest częścią interfejsu API analizowania obrazu. Uwzględnij Captionparametr zapytania funkcji . Następnie po otrzymaniu pełnej odpowiedzi JSON przeanalizuj ciąg zawartości "captionResult" sekcji.

Następne kroki

Poznaj powiązaną koncepcję wykrywania obiektów.
Szybki start: interfejs API REST analizy obrazów lub biblioteki klienckie
Wywoływanie interfejsu API analizowania obrazu

Podpis obrazów (wersja 4.0)

Podpis neutralne pod względem płci

Przykłady podpisów i transkrysów gęstych

Używanie interfejsu API

Następne kroki

Dodatkowe zasoby