Grundlegendes zu den Bildgenerierungsfunktionen von OpenAI

5 Minuten

Bildgenerierungsmodelle können eine Äußerung, ein Basisimage oder beides entgegennehmen und etwas Neues erstellen. Diese generativen KI-Modelle können sowohl realistische als auch künstlerische Bilder erstellen, das Layout oder den Stil eines Bilds ändern und Variationen eines bereitgestellten Bilds erstellen.

DALL-E

Zusätzlich zu den Funktionen für natürliche Sprache können generative KI-Modelle Bilder bearbeiten und erstellen. Das mit Bildern funktionierende Modell heißt DALL-E. Ähnlich wie bei den GPT-Modellen werden nachfolgende Versionen von DALL-E an den Namen angefügt, z. B. DALL-E 2. Bildfunktionen fallen im Allgemeinen in die drei Kategorien Bilderstellung, Bearbeitung eines Bilds und Erstellen von Variationen eines Bilds.

Bildgenerierung

Originalbilder können generiert werden, indem Sie eine Textäußerung des gewünschten Bildinhalts bereitstellen. Je ausführlicher die Äußerung ist, desto wahrscheinlicher wird das Modell ein gewünschtes Ergebnis liefern.

Mit DALL-E können Sie sogar ein Bild in einem bestimmten Stil anfordern, z. B. „ein Hund im Stil von Vincent van Gogh“. Stile können auch für Bearbeitungen und Variationen verwendet werden.

Beispielsweise generiert das Modell nach der Äußerung „ein stehender Elefant mit einem Burger darauf, Stil Digitalkunst“ Digitalkunstbilder, die genau das Erfragte darstellen.

Four AI generated art depictions of an elephant with a burger on top of it.

Bei allgemeineren Äußerungen wie „ein rosa Fuchs“ sind die generierten Bilder vielfältiger und einfacher, während sie immer noch die Anforderungen erfüllen.

Four AI generated art depictions of different pink foxes.

Wenn die Äußerung jedoch spezifischer ausfällt, z. B. „ein rosa Fuchs, der durch ein Feld läuft, im Stil von Monet“, erstellt das Modell sehr viel ähnlichere detaillierte Bilder.

Four AI generated art depictions of a pink fox in the style of Monet.

Bearbeiten eines Bilds

Wenn ein Bild bereitgestellt wird, kann DALL-E dieses wie gewünscht bearbeiten: durch Ändern des Stils, Hinzufügen oder Entfernen von Elementen oder Generieren neuer zusätzlicher Inhalte. Bearbeitungen erfolgen durch Hochladen des Originalbilds und Angeben einer transparenten Maske, die angibt, welcher Bereich des Bilds bearbeitet werden soll. Zusammen mit dem Bild und der Maske weist eine Äußerung, die die gewünschten Bearbeitungen angibt, das Modell dann an, den entsprechenden Inhalt zum Ausfüllen des Bereichs zu generieren.

Mit einem der oben genannten Bilder eines rosafarbenen Fuchses, einer den Fuchs überdeckende Maske und der Äußerung „blauer Gorilla liest ein Buch in einem Feld“ erstellt das Modell Bearbeitungen des Bilds basierend auf der angegebenen Eingabe.

Four AI generated art depictions of a blue gorilla in a field.

Bildvariationen

Bildvariationen können erstellt werden, indem ein Bild bereitgestellt und angegeben wird, wie viele Variationen des Bilds gewünscht werden. Der allgemeine Inhalt des Bilds bleibt gleich, aber Aspekte werden angepasst, z. B. kann geändert werden, wo sich die Motive befinden und wohin sie ausgerichtet sind, die Hintergrundszene und die Farben.

Wenn Sie beispielsweise eines der Bilder des Elefanten mit einem Burger als Hut hochladen, erhalten Sie Variationen desselben Themas.

Four AI generated art variations of an elephant with a burger on its head.

Hinweis

Der Zugriff auf DALL-E wird derzeit nur auf Einladungsbasis gewährt.

Weiter

DALL-E

Bildgenerierung

Bearbeiten eines Bilds

Bildvariationen

Feedback