Zusammenfassung

1 Minute

In diesem Modul haben Sie mehr über visionsfähige generative KI-Modelle und die Implementierung von Chatlösungen gelernt, die bildbasierte Eingaben enthalten.

Mit visionsfähigen Modellen können Sie KI-Lösungen erstellen, die Bilder verstehen und auf verwandte Fragen oder Anweisungen reagieren können. Neben dem Identifizieren von Objekten in Bildern können einige Modelle auch basierend auf dem, was sie sehen, Gründe verwenden. Beispielsweise können sie ein Diagramm interpretieren oder bewerten, ob ein Objekt beschädigt ist.

Tipp

Weitere Informationen zum Arbeiten mit multimodalen Modellen in Microsoft Foundry finden Sie unter Verwenden von Bildern und Audio in Chatabschlussen mit Azure AI-Modellableitung und Schnellstart: Verwenden von Bildern in Ihren KI-Chats.

Feedback

War diese Seite hilfreich?