Bildbeschriftungen (Version 4.0)

Bildbeschriftungen in Bildanalyse 4.0 sind über die Features Beschriftung und Dichte Beschriftungen verfügbar.

„Beschriftung“ generiert eine Beschreibung in einem Satz für alle Bildinhalte. „Dichte Beschriftungen“ bietet mehr Details, indem zusätzlich zur Beschreibung des gesamten Bilds Beschreibungen von bis zu 10 Bereichen des Bilds in einem Satz generiert werden. Dense Captions gibt auch Begrenzungsrahmenkoordinaten der beschriebenen Bildbereiche zurück. Beide Features verwenden die neuesten bahnbrechenden, auf Florence basierenden KI-Modelle.

Derzeit ist die Bildbeschriftung nur in englischer Sprache verfügbar.

Wichtig

Bildbeschriftungen in Image Analysis 4.0 sind nur in den folgenden Azure-Rechenzentrumsregionen verfügbar: „USA, Osten“, „Frankreich, Mitte“, „Südkorea, Mitte“, „Europa, Norden“, „Asien, Südosten“, „Europa, Westen“, „USA, Westen“, „Asien, Osten“. Sie müssen eine Vision-Ressource in einer dieser Regionen verwenden, um Ergebnisse aus den Funktionen „Beschriftung“ und „Dichte Beschriftungen“ zu erhalten.

Wenn Sie eine Vision-Ressource außerhalb dieser Regionen verwenden müssen, um Bildbeschriftungen zu generieren, verwenden Sie die Bildanalyse 3.2, die in allen Azure KI Vision-Regionen verfügbar ist.

Testen Sie mithilfe von Vision Studio die Features zur Bilduntertitelung ganz schnell und einfach in Ihrem Browser.

Geschlechtsneutrale Beschriftungen

Alle Beschriftungen enthalten standardmäßig Geschlechtsbegriffe: „Mann“, „Frau“, „Junge“ und „Mädchen“. Sie haben die Möglichkeit, diese Begriffe in Ihren Ergebnissen durch „Person“ zu ersetzen und geschlechtsneutrale Bestimmungen zu erhalten. Hierzu können Sie den optionalen API-Anforderungsparameter gender-neutral-caption in der Anforderungs-URL auf true festlegen.

Beispiele für „Beschriftung“ und „Dichte Beschriftung“

Die folgende JSON-Antwort veranschaulicht, was die Analyse 4.0-API bei der Beschreibung des Beispielbilds anhand seiner visuellen Merkmale zurückgibt.

Photo of a man pointing at a screen

"captions": [
    {
        "text": "a man pointing at a screen",
        "confidence": 0.4891590476036072
    }
]

Verwenden der API

Die Bildbeschriftungsfunktion ist Teil der Bildanalyse-API. Beziehen Sie Caption in den Abfrageparameter features ein. Nachdem Sie die vollständige JSON-Antwort erhalten haben, analysieren Sie die Zeichenfolge auf die Inhalte im Abschnitt "captionResult".

Nächste Schritte