Görüntü İşleme kavramlarıyla GPT-4 Turbo
Görüntü İşlemeli GPT-4 Turbo, OpenAI tarafından geliştirilen ve görüntüleri analiz eden ve bunlarla ilgili sorulara metinsel yanıtlar sağlayabilen büyük bir çok modüllü modeldir (LMM). Hem doğal dil işleme hem de görsel anlama özelliklerini içerir. Bu kılavuzda, GPT-4 Turbo with Vision'ın özellikleri ve sınırlamaları hakkında ayrıntılı bilgi sağlanır.
GpT-4 Turbo'yı Görüntü İşleme ile denemek için hızlı başlangıç bölümüne bakın.
Vizyonlu sohbetler
GpT-4 Görüntü İşlemeli Turbo modeli, yüklediğiniz görüntülerde veya videolarda neler olduğuyla ilgili genel soruları yanıtlar.
Özel fiyatlandırma bilgileri
Önemli
Fiyatlandırma ayrıntıları gelecekte değiştirilebilir.
Görüntü İşleme özellikli GPT-4 Turbo, diğer Azure OpenAI sohbet modelleri gibi ücretleri tahakkuk ettirir. Fiyatlandırma sayfasında ayrıntılı olarak belirtilen istemler ve tamamlamalar için belirteç başına ücret ödersiniz. Temel ücretler ve ek özellikler burada özetlenmiştir:
Vision özellikli GPT-4 Turbo için Temel Fiyatlandırma:
- Giriş: 1000 belirteç başına 0,01 ABD doları
- Çıkış: 1000 belirteç başına 0,03 ABD doları
Metin ve görüntülerin belirteçlere nasıl çevrildiği hakkında bilgi için genel bakışın Belirteçler bölümüne bakın.
Örnek resim fiyat hesaplaması
Önemli
Aşağıdaki içerik yalnızca bir örnektir ve fiyatlar gelecekte değişebilir.
Tipik bir kullanım örneği için hem görünür nesneler hem de metin içeren bir görüntü ve 100 belirteçli bir istem girişi alın. Hizmet istemi işlediğinde 100 çıkış belirteci oluşturur. Görüntüde hem metin hem de nesneler algılanabilir. Bu işlemin fiyatı şöyle olacaktır:
Kalem | Ayrıntı | Maliyet |
---|---|---|
Metin istemi girişi | 100 metin belirteci | 0,001 ABD doları |
Örnek görüntü girişi (bkz. Görüntü belirteçleri) | 170 + 85 görüntü belirteci | 0,00255 USD |
OCR için gelişmiş eklenti özellikleri | $1,50 / 1000 işlem | 0,0015 USD |
Nesne Topraklama için gelişmiş eklenti özellikleri | $1,50 / 1000 işlem | 0,0015 USD |
Çıkış Belirteçleri | 100 belirteç (varsayılır) | 0,003 ABD doları |
Toplam | 0,00955 USD |
Örnek video fiyat hesaplaması
Önemli
Aşağıdaki içerik yalnızca bir örnektir ve fiyatlar gelecekte değişebilir.
Tipik bir kullanım örneği için 100 belirteçli istem girişi içeren 3 dakikalık bir video çekin. Videoda 100 belirteç uzunluğunda bir transkript bulunur ve hizmet istemi işlediğinde 100 çıkış belirteci oluşturur. Bu işlemin fiyatlandırması şöyle olacaktır:
Kalem | Ayrıntı | Maliyet |
---|---|---|
Görüntü İşleme giriş belirteçleri ile GPT-4 Turbo | 100 metin belirteci | 0,001 ABD doları |
Çerçeveleri tanımlamak için Ek Maliyet | 100 giriş belirteci + 700 belirteç + 1 Video Alma işlemi | 0,00825 USD |
Görüntü Girişleri ve Transkript Girişi | 20 resim (her birinde 85 belirteç) + 100 transkript belirteci | 0,018 USD |
Çıkış Belirteçleri | 100 belirteç (varsayılır) | 0,003 ABD doları |
Toplam | 0,03025 USD |
Ayrıca, bu 3 dakikalık video için Video Alma dizinini oluşturmak için tek seferlik 0,15 ABD doları dizin oluşturma maliyeti vardır. Bu dizin, Görüntü İşleme API'si çağrıları ile herhangi bir sayıda Video Alma ve GPT-4 Turbo arasında yeniden kullanılabilir.
Giriş sınırlamaları
Bu bölümde GPT-4 Turbo with Vision sınırlamaları açıklanmaktadır.
Görüntü desteği
- Maksimum giriş görüntüsü boyutu: Giriş görüntülerinin boyut üst sınırı 20 MB ile sınırlıdır.
- Düşük çözünürlük doğruluğu: Görüntüler "düşük çözünürlük" ayarı kullanılarak analiz edildiğinde, daha hızlı yanıtlara olanak tanır ve belirli kullanım örnekleri için daha az giriş belirteci kullanır. Ancak bu, görüntüdeki nesne ve metin tanımanın doğruluğunu etkileyebilir.
- Görüntü sohbeti kısıtlaması: Azure AI Studio'da veya API'de görüntü yüklediğinizde, sohbet araması başına 10 resim sınırı vardır.
Video desteği
- Düşük çözünürlük: Video kareleri, Görüntü İşleme'nin "düşük çözünürlük" ayarına sahip GPT-4 Turbo kullanılarak analiz edilir ve bu ayar videodaki küçük nesne ve metin tanımanın doğruluğunu etkileyebilir.
- Video dosyası sınırları: Hem MP4 hem de MOV dosya türleri desteklenir. Azure AI Studio'da videoların 3 dakikadan kısa olması gerekir. API'yi kullandığınızda böyle bir sınırlama yoktur.
- İstem sınırları: Video istemleri yalnızca bir video içerir ve görüntü içermez. Azure AI Studio'da başka bir video veya görüntü denemek için oturumu temizleyebilirsiniz.
- Sınırlı çerçeve seçimi: Hizmet, videonun tamamından 20 kare seçer ve bu da tüm kritik anları veya ayrıntıları yakalamayabilir. Kare seçimi, istemine bağlı olarak video aracılığıyla yaklaşık olarak eşit bir şekilde yayılabilir veya belirli bir video alma sorgusu tarafından odaklanabilir.
- Dil desteği: Hizmet öncelikle transkriptlerle temel oluşturma için İngilizceyi destekler. Transkriptler şarkılarda şarkı sözleri hakkında doğru bilgi sağlamaz.
Sonraki adımlar
- Hızlı başlangıcı izleyerek GpT-4 Turbo'yi Görüntü İşleme ile kullanmaya başlayın.
- API'lere daha ayrıntılı bir bakış için ve sohbette video istemlerini kullanmak için nasıl yapılır kılavuzunu izleyin.
- Tamamlamalar ve eklemeler API başvurusuna bakın