Bildkategorisierung

Zusätzlich zu Tags und einer Beschreibung gibt die Bildanalyse 3.2 die auf der Taxonomie basierenden Kategorien zurück, die in einem Bild erkannt wurden. Im Gegensatz zu Tags sind Kategorien in einer Über-/Unterordnungshierarchie organisiert. Außerdem gibt es weniger davon: 86 im Gegensatz zu Tausenden von Tags. Alle Kategorienamen sind in Englisch. Die Kategorisierung kann eigenständig oder parallel zum neueren Tagmodell erfolgen.

Die 86 Kategorien der Taxonomie

Azure KI Vision kann ein Bild mithilfe der in der folgenden Abbildung gezeigten Liste mit 86 Kategorien allgemein oder spezifisch kategorisieren. Die vollständige Taxonomie im Textformat finden Sie unter Kategorietaxonomie.

Grouped lists of all the categories in the category taxonomy

Beispiele für die Kategorisierung von Bildern

Die folgende JSON-Antwort veranschaulicht, was Azure KI Vision bei der Kategorisierung des Beispielbilds anhand seiner visuellen Merkmale zurückgibt.

A woman on the roof of an apartment building

{
    "categories": [
        {
            "name": "people_",
            "score": 0.81640625
        }
    ],
    "requestId": "bae7f76a-1cc7-4479-8d29-48a694974705",
    "metadata": {
        "height": 200,
        "width": 300,
        "format": "Jpeg"
    }
}

Die folgende Tabelle zeigt einen typischen Satz von Bildern und die von Azure KI Vision zurückgegebene Kategorie für jedes Bild.

Abbildung Kategorie
Four people posed together as a family people_group
A puppy sitting in a grassy field animal_dog
A person standing on a mountain rock at sunset outdoor_mountain
A pile of bread roles on a table food_bread

Verwenden der API

Das Kategorisierungsfeature ist Teil der Bildanalyse 3.2-API. Sie können diese API über ein natives SDK oder REST-Aufrufe aufrufen. Beziehen Sie Categories in den Abfrageparameter visualFeatures ein. Nachdem Sie die vollständige JSON-Antwort erhalten haben, analysieren Sie einfach die Zeichenfolge auf den Inhalt im Abschnitt "categories".

Nächste Schritte

Machen Sie sich mit den verwandten Konzepten Taggen von Bildern und Beschreiben von Bildern vertraut.