Aracılığıyla paylaş


Görüntü İşleme kavramlarıyla GPT-4 Turbo

Görüntü İşlemeli GPT-4 Turbo, OpenAI tarafından geliştirilen ve görüntüleri analiz eden ve bunlarla ilgili sorulara metinsel yanıtlar sağlayabilen büyük bir çok modüllü modeldir (LMM). Hem doğal dil işleme hem de görsel anlama özelliklerini içerir. Bu kılavuzda, GPT-4 Turbo with Vision'ın özellikleri ve sınırlamaları hakkında ayrıntılı bilgi sağlanır.

GpT-4 Turbo'yı Görüntü İşleme ile denemek için hızlı başlangıç bölümüne bakın.

Vizyonlu sohbetler

GpT-4 Görüntü İşlemeli Turbo modeli, yüklediğiniz görüntülerde veya videolarda neler olduğuyla ilgili genel soruları yanıtlar.

Özel fiyatlandırma bilgileri

Önemli

Fiyatlandırma ayrıntıları gelecekte değiştirilebilir.

Görüntü İşleme özellikli GPT-4 Turbo, diğer Azure OpenAI sohbet modelleri gibi ücretleri tahakkuk ettirir. Fiyatlandırma sayfasında ayrıntılı olarak belirtilen istemler ve tamamlamalar için belirteç başına ücret ödersiniz. Temel ücretler ve ek özellikler burada özetlenmiştir:

Vision özellikli GPT-4 Turbo için Temel Fiyatlandırma:

  • Giriş: 1000 belirteç başına 0,01 ABD doları
  • Çıkış: 1000 belirteç başına 0,03 ABD doları

Metin ve görüntülerin belirteçlere nasıl çevrildiği hakkında bilgi için genel bakışın Belirteçler bölümüne bakın.

Örnek resim fiyat hesaplaması

Önemli

Aşağıdaki içerik yalnızca bir örnektir ve fiyatlar gelecekte değişebilir.

Tipik bir kullanım örneği için hem görünür nesneler hem de metin içeren bir görüntü ve 100 belirteçli bir istem girişi alın. Hizmet istemi işlediğinde 100 çıkış belirteci oluşturur. Görüntüde hem metin hem de nesneler algılanabilir. Bu işlemin fiyatı şöyle olacaktır:

Kalem Ayrıntı Maliyet
Metin istemi girişi 100 metin belirteci 0,001 ABD doları
Örnek görüntü girişi (bkz. Görüntü belirteçleri) 170 + 85 görüntü belirteci 0,00255 USD
OCR için gelişmiş eklenti özellikleri $1,50 / 1000 işlem 0,0015 USD
Nesne Topraklama için gelişmiş eklenti özellikleri $1,50 / 1000 işlem 0,0015 USD
Çıkış Belirteçleri 100 belirteç (varsayılır) 0,003 ABD doları
Toplam 0,00955 USD

Örnek video fiyat hesaplaması

Önemli

Aşağıdaki içerik yalnızca bir örnektir ve fiyatlar gelecekte değişebilir.

Tipik bir kullanım örneği için 100 belirteçli istem girişi içeren 3 dakikalık bir video çekin. Videoda 100 belirteç uzunluğunda bir transkript bulunur ve hizmet istemi işlediğinde 100 çıkış belirteci oluşturur. Bu işlemin fiyatlandırması şöyle olacaktır:

Kalem Ayrıntı Maliyet
Görüntü İşleme giriş belirteçleri ile GPT-4 Turbo 100 metin belirteci 0,001 ABD doları
Çerçeveleri tanımlamak için Ek Maliyet 100 giriş belirteci + 700 belirteç + 1 Video Alma işlemi 0,00825 USD
Görüntü Girişleri ve Transkript Girişi 20 resim (her birinde 85 belirteç) + 100 transkript belirteci 0,018 USD
Çıkış Belirteçleri 100 belirteç (varsayılır) 0,003 ABD doları
Toplam 0,03025 USD

Ayrıca, bu 3 dakikalık video için Video Alma dizinini oluşturmak için tek seferlik 0,15 ABD doları dizin oluşturma maliyeti vardır. Bu dizin, Görüntü İşleme API'si çağrıları ile herhangi bir sayıda Video Alma ve GPT-4 Turbo arasında yeniden kullanılabilir.

Giriş sınırlamaları

Bu bölümde GPT-4 Turbo with Vision sınırlamaları açıklanmaktadır.

Görüntü desteği

  • Maksimum giriş görüntüsü boyutu: Giriş görüntülerinin boyut üst sınırı 20 MB ile sınırlıdır.
  • Düşük çözünürlük doğruluğu: Görüntüler "düşük çözünürlük" ayarı kullanılarak analiz edildiğinde, daha hızlı yanıtlara olanak tanır ve belirli kullanım örnekleri için daha az giriş belirteci kullanır. Ancak bu, görüntüdeki nesne ve metin tanımanın doğruluğunu etkileyebilir.
  • Görüntü sohbeti kısıtlaması: Azure AI Studio'da veya API'de görüntü yüklediğinizde, sohbet araması başına 10 resim sınırı vardır.

Video desteği

  • Düşük çözünürlük: Video kareleri, Görüntü İşleme'nin "düşük çözünürlük" ayarına sahip GPT-4 Turbo kullanılarak analiz edilir ve bu ayar videodaki küçük nesne ve metin tanımanın doğruluğunu etkileyebilir.
  • Video dosyası sınırları: Hem MP4 hem de MOV dosya türleri desteklenir. Azure AI Studio'da videoların 3 dakikadan kısa olması gerekir. API'yi kullandığınızda böyle bir sınırlama yoktur.
  • İstem sınırları: Video istemleri yalnızca bir video içerir ve görüntü içermez. Azure AI Studio'da başka bir video veya görüntü denemek için oturumu temizleyebilirsiniz.
  • Sınırlı çerçeve seçimi: Hizmet, videonun tamamından 20 kare seçer ve bu da tüm kritik anları veya ayrıntıları yakalamayabilir. Kare seçimi, istemine bağlı olarak video aracılığıyla yaklaşık olarak eşit bir şekilde yayılabilir veya belirli bir video alma sorgusu tarafından odaklanabilir.
  • Dil desteği: Hizmet öncelikle transkriptlerle temel oluşturma için İngilizceyi destekler. Transkriptler şarkılarda şarkı sözleri hakkında doğru bilgi sağlamaz.

Sonraki adımlar