OpenAI'nin görüntü oluşturma özelliklerini anlama

Tamamlandı

Görüntü oluşturma modelleri bir istem, temel görüntü veya her ikisini birden alabilir ve yeni bir şey oluşturabilir. Bu üretken yapay zeka modelleri hem gerçekçi hem de artistik görüntüler oluşturabilir, görüntünün düzenini veya stilini değiştirebilir ve sağlanan bir görüntüde çeşitlemeler oluşturabilir.

DALL-E

Doğal dil özelliklerine ek olarak, üretken yapay zeka modelleri görüntüleri düzenleyebilir ve oluşturabilir. Görüntülerle çalışan modele DALL-E adı verilir. GPT modellerine çok benzer şekilde, DALL-E'nin sonraki sürümleri adın üzerine eklenir, örneğin DALL-E 2. Görüntü özellikleri genellikle üç resim oluşturma, bir görüntüyü düzenleme ve görüntünün varyasyonlarını oluşturma kategorilerine girer.

Görüntü oluşturma

Özgün görüntüler, resmin ne olmasını istediğinize ilişkin bir metin istemi sağlayarak oluşturulabilir. İstem ne kadar ayrıntılı olursa, modelin istenen sonucu verme olasılığı o kadar artar.

DALL-E ile, "Vincent van Gogh tarzında bir köpek" gibi belirli bir stilde bir resim bile isteyebilirsiniz. Stiller, düzenlemeler ve çeşitlemeler için de kullanılabilir.

Örneğin, "üstünde burger olan bir fil, stil dijital sanat" istemi verildiğinde model, tam olarak isteneni gösteren dijital sanat görüntüleri oluşturur.

Four AI generated art depictions of an elephant with a burger on top of it.

"Pembe tilki" gibi daha genel bir şey istendiğinde, oluşturulan görüntüler daha çeşitli ve daha basittir, ancak istenenleri yerine getirmeye devam eder.

Four AI generated art depictions of different pink foxes.

Ancak istemleri "alandan geçen, Monet stilindeki pembe bir tilki" gibi daha belirgin hale getirdiğimizde, model çok daha benzer ayrıntılı görüntüler oluşturur.

Four AI generated art depictions of a pink fox in the style of Monet.

Resmi düzenleme

Bir görüntü sağlandığında, DALL-E stilini değiştirerek, öğe ekleyerek veya kaldırarak ya da eklenecek yeni içerik oluşturarak görüntüyü istediğiniz gibi düzenleyebilir. Düzenlemeler, özgün görüntü karşıya yüklenerek ve resmin hangi alanının düzenleneceğini gösteren saydam bir maske belirtilerek yapılır. Görüntü ve maskenin yanı sıra, nelerin düzenlendiğini belirten bir istem, modelin alanı doldurmak için uygun içeriği oluşturmasını ister.

Yukarıdaki pembe tilki görüntülerinden biri, tilkiyi kapsayan bir maske ve "alanda kitap okuyan mavi goril" istemi verildiğinde, model sağlanan girişe göre görüntünün düzenlemelerini oluşturur.

Four AI generated art depictions of a blue gorilla in a field.

Görüntü varyasyonları

Görüntü varyasyonları, bir görüntü sağlanarak ve resmin kaç çeşitlemesi istediğinizi belirterek oluşturulabilir. Resmin genel içeriği aynı kalır, ancak konuların bulunduğu veya bakıldığı yer, arka plan sahnesi ve renkler değişebilir gibi yönler ayarlanır.

Örneğin, bir filin şapka olarak hamburger giyen görüntülerinden birini yüklersem, aynı konunun çeşitlemelerini elde ederim.

Four AI generated art variations of an elephant with a burger on its head.

Dekont

DALL-E erişimi şu anda yalnızca davet temelinde verilmiştir.