Aracılığıyla paylaş


Azure OpenAI Service modelleri

Azure OpenAI Service, farklı özelliklere ve fiyat noktalarına sahip çeşitli modeller tarafından desteklenir. Model kullanılabilirliği bölgeye ve buluta göre değişir. Azure Kamu model kullanılabilirliği için lütfen openAI hizmeti Azure Kamu bakın.

Modeller Açıklama
o1-önizleme ve o1-mini Daha fazla odak ve yetenekle akıl yürütme ve sorun çözme görevlerini ele almak için özel olarak tasarlanmış sınırlı erişim modelleri.
GPT-4o & GPT-4o mini & GPT-4 Turbo Hem metin hem de görüntüleri giriş olarak kabul edebilen, çok modüllü sürümlere sahip en son en yetenekli Azure OpenAI modelleri.
GPT-4o ses Düşük gecikme süresi, "konuşma, konuşma dışarı" konuşma etkileşimlerini destekleyen bir GPT-4o modeli.
GPT-4 GPT-3.5'te iyileştiren ve doğal dil ve kod anlayıp oluşturabilen bir model kümesi.
GPT-3.5 GPT-3'te iyileştiren ve doğal dil ve kod anlayıp oluşturabilen bir model kümesi.
Eklemeler Metin benzerliğini kolaylaştırmak için metni sayısal vektör biçimine dönüştürebilen bir model kümesi.
DALL-E Doğal dilden özgün görüntüler oluşturabilen bir dizi model.
Fısıldamak Önizlemede konuşmayı metne dönüştürebilen ve çevirebilen bir dizi model.
Metin okuma (Önizleme) Önizlemede metinleri konuşmaya sentezleyebilecek bir dizi model.

o1-önizleme ve o1-mini modelleri sınırlı erişim

Azure OpenAI o1-preview ve o1-mini modelleri, daha fazla odak ve yetenekle akıl yürütme ve sorun çözme görevlerini ele almak için özel olarak tasarlanmıştır. Bu modeller kullanıcının isteğini işlemek ve anlamak için daha fazla zaman harcar ve bu da onları önceki yinelemelerle karşılaştırıldığında bilim, kodlama ve matematik gibi alanlarda son derece güçlü hale getirir.

Model Kimliği Açıklama Maksimum İstek (belirteçler) Eğitim Verileri (en fazla)
o1-preview (2024-09-12) Gelişmiş mantık yetenekleri sunan o1 serisinin en yetenekli modeli. Giriş: 128.000
Çıkış: 32.768
Ekim 2023
o1-mini (2024-09-12) Hız ve daha düşük kaynak tüketimi gerektiren görevleri kodlamak için ideal olan o1 serisinde daha hızlı ve daha uygun maliyetli bir seçenek. Giriş: 128.000
Çıkış: 65.536
Ekim 2023

Kullanılabilirlik

o1-preview ve o1-mini modelleri artık API erişimi ve model dağıtımı için kullanılabilir. Kayıt gereklidir ve Erişim Microsoft'un uygunluk ölçütlerine göre verilir.

Erişim isteme: sınırlı erişim modeli uygulaması

Erişim verildikten sonra her model için bir dağıtım oluşturmanız gerekir.

API desteği

API sürümünde 2024-09-01-previewo1 serisi modelleri için destek eklendi.

max_tokens parametresi kullanım dışı bırakıldı ve yeni max_completion_tokens parametreyle değiştirildi. o1 serisi modelleri yalnızca parametresiyle max_completion_tokens çalışır.

Kullanım

Bu modeller şu anda sohbet tamamlama API'sini kullanan diğer modellerle aynı parametre kümesini desteklememektedir. Şu anda yalnızca çok sınırlı bir alt küme desteklendiğinden, top_pgibi temperatureyaygın parametreler kullanılamaz ve bunları dahil etmek isteğinizin başarısız olmasına neden olur. o1-preview ve o1-mini modelleri de ileti dizisinin bir parçası olarak sistem ileti rolünü kabul etmeyecektir.

Yeni max_completion_tokens parametreden yararlanmak için OpenAI Python kitaplığı sürümünüzü yükseltmeniz gerekebilir.

pip install openai --upgrade

Kimlik doğrulaması için Microsoft Entra Id kullanmaya yeniyseniz bkz . Microsoft Entra Id kimlik doğrulaması ile Azure OpenAI Hizmetini yapılandırma.

from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider

token_provider = get_bearer_token_provider(
    DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)

client = AzureOpenAI(
  azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"), 
  azure_ad_token_provider=token_provider,
  api_version="2024-09-01-preview"
)

response = client.chat.completions.create(
    model="o1-preview-new", # replace with the model deployment name of your o1-preview, or o1-mini model
    messages=[
        {"role": "user", "content": "What steps should I think about when writing my first Python API?"},
    ],
    max_completion_tokens = 5000

)

print(response.model_dump_json(indent=2))

Bölgesel kullanılabilirlik

Onaylı müşteriler için Doğu ABD, Doğu ABD2, Orta Kuzey ABD, Orta Güney ABD, Orta İsveç, Batı ABD ve Batı ABD3'te standart ve küresel standart dağıtım için kullanılabilir.

GPT-4o ses

Model gpt-4o-realtime-preview , GPT-4o model ailesinin bir parçasıdır ve düşük gecikme süresi, "konuşma, konuşma dışarı" konuşma etkileşimlerini destekler. GPT-4o ses, gerçek zamanlı, düşük gecikme süreli konuşma etkileşimlerini işleyecek şekilde tasarlanmıştır ve bu da destek aracıları, yardımcılar, çevirmenler ve bir kullanıcıyla son derece hızlı yanıt veren diğer kullanım örnekleri için mükemmel bir uyum sağlar.

GPT-4o sesi Doğu ABD 2 (eastus2) ve İsveç Orta (swedencentral) bölgelerinde kullanılabilir. GPT-4o ses özelliğini kullanmak için desteklenen bölgelerden birinde mevcut bir kaynak oluşturmanız veya kullanmanız gerekir.

Kaynağınız oluşturulduğunda GPT-4o ses modelini dağıtabilirsiniz. Programlı dağıtım gerçekleştiriyorsanız, model adı olur gpt-4o-realtime-preview. GPT-4o ses kullanma hakkında daha fazla bilgi için GPT-4o ses belgelerine bakın.

En fazla istek belirteci ve eğitim verileri hakkındaki ayrıntılar aşağıdaki tabloda yer alır.

Model Kimliği Açıklama Maksimum İstek (belirteçler) Eğitim Verileri (en fazla)
gpt-4o-realtime-preview (2024-10-01-preview)
GPT-4o ses
Gerçek zamanlı ses işleme için ses modeli Giriş: 128.000
Çıkış: 4.096
Ekim 2023

GPT-4o ve GPT-4 Turbo

GPT-4o, metinleri ve görüntüleri tek bir modelde tümleştirerek birden çok veri türünü aynı anda işlemesini sağlar. Bu çok modüllü yaklaşım, insan-bilgisayar etkileşimlerinde doğruluğu ve yanıt hızını artırır. GPT-4o, İngilizce olmayan dillerde ve görüntü işlerinde üstün performans sunarak yapay zeka özellikleri için yeni karşılaştırmalar ayarlayarak İngilizce metin ve kodlama görevlerinde GPT-4 Turbo ile eşleşir.

GPT-4o ve GPT-4o mini modellerine Nasıl yaparım? erişin?

GPT-4o ve GPT-4o mini, standart ve küresel standart model dağıtımı için kullanılabilir.

Modelin kullanılabilir olduğu desteklenen bir standart veya genel standart bölgede mevcut bir kaynak oluşturmanız veya kullanmanız gerekir.

Kaynağınız oluşturulduğunda GPT-4o modellerini dağıtabilirsiniz. Programlı dağıtım gerçekleştiriyorsanız model adları şunlardır:

  • gpt-4oSürüm 2024-08-06
  • gpt-4o, Sürüm 2024-05-13
  • gpt-4o-miniSürüm 2024-07-18

GPT-4 Turbo

GPT-4 Turbo, OpenAI'nin önceki modellerinden daha yüksek doğrulukla zor sorunları çözebilen büyük bir çok modüllü modeldir (metin veya görüntü girişlerini kabul etme ve metin oluşturma). GPT-3.5 Turbo ve eski GPT-4 modelleri gibi GPT-4 Turbo da sohbet için optimize edilmiştir ve geleneksel tamamlama görevleri için iyi çalışır.

GPT-4 Turbo'nun en son GA sürümü:

  • gpt-4Sürüm: turbo-2024-04-09

Bu, aşağıdaki önizleme modellerinin yerini alır:

  • gpt-4Sürüm: 1106-Preview
  • gpt-4Sürüm: 0125-Preview
  • gpt-4Sürüm: vision-preview

OpenAI ile Azure OpenAI GPT-4 Turbo GA Modelleri Arasındaki Farklar

  • OpenAI'nin en son 0409 turbo modeli sürümü tüm çıkarım istekleri için JSON modunu ve işlev çağrısını destekler.
  • Azure OpenAI'nin en son turbo-2024-04-09 sürümü şu anda görüntü (görüntü) girişiyle çıkarım istekleri yaparken JSON modu ve işlev çağrısı kullanımını desteklememektedir. Metin tabanlı giriş istekleri (ve satır içi görüntüleri olmayan image_url istekler), JSON modunu ve işlev çağrılarını destekler.

gpt-4 vision-preview ile arasındaki farklar

  • Azure AI'ye özgü Görüntü İşleme geliştirmeleri ile GPT-4 Turbo ve Görüntü İşleme tümleştirmesi Şu Sürüm için gpt-4 desteklenmez: turbo-2024-04-09. Buna Optik Karakter Tanıma (OCR), nesne topraklama, video istemleri ve görüntülerle verilerinizin daha iyi işlenmesi dahildir.

GPT-4 Turbo tarafından sağlanan yönetilen kullanılabilirlik

  • gpt-4Sürüm: turbo-2024-04-09 hem standart hem de sağlanan dağıtımlar için kullanılabilir. Şu anda bu modelin sağlanan sürümü görüntü/görüntü çıkarım isteklerini desteklememektedir. Bu modelin sağlanan dağıtımları yalnızca metin girişini kabul eder. Standart model dağıtımları hem metin hem de görüntü/görüntü çıkarım isteklerini kabul eder.

Görüntü İşleme GA ile GPT-4 Turbo Dağıtma

Ga modelini Studio kullanıcı arabiriminden GPT-4 dağıtmak için açılan menüden turbo-2024-04-09 sürümü seçin ve ardından seçin. Model için gpt-4-turbo-2024-04-09 varsayılan kota, GPT-4-Turbo için geçerli kotayla aynı olacaktır. Bölgesel kota sınırlarına bakın.

GPT-4

GPT-4, GPT-4 Turbo'ya öncülüdür. Hem GPT-4 hem de GPT-4 Turbo modellerinin temel model adı vardır gpt-4. Model sürümünü inceleyerek GPT-4 ve Turbo modelleri arasında ayrım yapabilirsiniz.

  • gpt-4Sürüm 0314
  • gpt-4Sürüm 0613
  • gpt-4-32kSürüm 0613

Model özet tablosunda her model tarafından desteklenen belirteç bağlamı uzunluğunu görebilirsiniz.

GPT-4 ve GPT-4 Turbo modelleri

  • Bu modeller yalnızca Sohbet Tamamlama API'siyle kullanılabilir.

Azure OpenAI Hizmeti'nin model sürümü yükseltmelerini nasıl işlediğini ve GPT-4 dağıtımlarınızın model sürümü ayarlarını görüntülemeyi ve yapılandırmayı öğrenmek için modellerle çalışmayı öğrenmek için model sürümlerine bakın.

Model Kimliği Açıklama Maksimum İstek (belirteçler) Eğitim Verileri (en fazla)
gpt-4o (2024-08-06)
GPT-4o (Omni)
En son büyük GA modeli
- Yapılandırılmış çıkışlar
- Metin, görüntü işleme
- JSON Modu
- paralel işlev çağrısı
- Geliştirilmiş doğruluk ve yanıt hızı
- Görüntü İşlemeli GPT-4 Turbo ile karşılaştırıldığında İngilizce metin ve kodlama görevleriyle eşlik
- İngilizce olmayan dillerde ve görme görevlerinde üstün performans
Giriş: 128.000
Çıkış: 16.384
Ekim 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
En son küçük GA modeli
- GPT-3.5 Turbo serisi modelleri değiştirmek için ideal hızlı, ucuz, yetenekli model.
- Metin, görüntü işleme
- JSON Modu
- paralel işlev çağrısı
Giriş: 128.000
Çıkış: 16.384
Ekim 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
Metin, görüntü işleme
- JSON Modu
- paralel işlev çağrısı
- Geliştirilmiş doğruluk ve yanıt hızı
- Görüntü İşlemeli GPT-4 Turbo ile karşılaştırıldığında İngilizce metin ve kodlama görevleriyle eşlik
- İngilizce olmayan dillerde ve görme görevlerinde üstün performans
Giriş: 128.000
Çıkış: 4.096
Ekim 2023
gpt-4 (turbo-2024-04-09)
Görüntü İşlemeli GPT-4 Turbo
Yeni GA modeli
- Önceki tüm GPT-4 önizleme modellerinin (vision-preview, 1106-Preview, 0125-Preview) yerini alır.
- Özellik kullanılabilirliği şu anda giriş yöntemine ve dağıtım türüne bağlı olarak farklıdır.
Giriş: 128.000
Çıkış: 4.096
Aralık 2023
gpt-4 (0125-Önizleme)*
GPT-4 Turbo Önizleme
Önizleme Modeli
-1106-Preview'ın yerini alır
- Daha iyi kod oluşturma performansı
- Modelin bir görevi tamamlamadığı durumları azaltır
- JSON Modu
- paralel işlev çağrısı
- yeniden üretilebilir çıkış (önizleme)
Giriş: 128.000
Çıkış: 4.096
Aralık 2023
gpt-4 (görüntü önizleme)
Görüntü İşleme Önizleme ile GPT-4 Turbo
Önizleme modeli
- Metin ve görüntü girişini kabul eder.
- Geliştirmeleri destekler
- JSON Modu
- paralel işlev çağrısı
- yeniden üretilebilir çıkış (önizleme)
Giriş: 128.000
Çıkış: 4.096
Nisan 2023
gpt-4 (1106-Önizleme)
GPT-4 Turbo Önizleme
Önizleme Modeli
- JSON Modu
- paralel işlev çağrısı
- yeniden üretilebilir çıkış (önizleme)
Giriş: 128.000
Çıkış: 4.096
Nisan 2023
gpt-4-32k (0613) Eski GA modeli
- Araçlarla temel işlev çağrısı
32,768 Eylül 2021
gpt-4 (0613) Eski GA modeli
- Araçlarla temel işlev çağrısı
Kategori 8,192 Eylül 2021
gpt-4-32k(0314) Eski GA modeli
- Kullanımdan kaldırma bilgileri
32,768 Eylül 2021
gpt-4 (0314) Eski GA modeli
- Kullanımdan kaldırma bilgileri
Kategori 8,192 Eylül 2021

Dikkat

Üretimde önizleme modellerinin kullanılmasını önermiyoruz. Önizleme modellerinin tüm dağıtımlarını gelecekteki önizleme sürümlerine veya en son kararlı GA sürümüne yükselteceğiz. Belirlenen modeller önizlemesi standart Azure OpenAI modeli yaşam döngüsünü izlemez.

  • GPT-4 sürüm 0125-preview, daha önce sürüm 1106-preview olarak yayınlanan GPT-4 Turbo önizlemesinin güncelleştirilmiş bir sürümüdür.
  • GPT-4 sürüm 0125-preview, kod oluşturma gibi görevleri gpt-4-1106-preview ile karşılaştırıldığında tamamen tamamlar. Bu nedenle, göreve bağlı olarak müşteriler GPT-4-0125-preview sürümünün gpt-4-1106-preview ile karşılaştırıldığında daha fazla çıkış ürettiğini görebilir. Müşterilerin yeni modelin çıkışlarını karşılaştırmasını öneririz. GPT-4-0125-preview, İngilizce dışındaki diller için UTF-8 işleme ile gpt-4-1106-preview sürümündeki hataları da giderir.
  • GPT-4 sürümü turbo-2024-04-09 en son GA sürümüdür ve , 1106-previewve vision-previewsürümlerinin yerini alır0125-Preview.

Önemli

GPT-4 (gpt-4) sürümleri 1106-Preview, 0125-Previewve vision-preview gelecekte kararlı bir sürümüyle gpt-4 yükseltilecektir.

  • , 0125-Previewve vision-preview sürümlerinin 1106-Previewgpt-4 dağıtımları "Otomatik güncelleştirme varsayılana" olarak ayarlanır ve kararlı sürüm yayımlandıktan sonra "Süresi dolduğunda yükselt" yükseltilmeye başlar. Her dağıtım için, API çağrıları için hizmette kesinti olmadan bir model sürümü yükseltmesi gerçekleştirilir. Yükseltmeler bölgeye göre hazırlanır ve tam yükseltme işleminin 2 hafta sürmesi beklenir.
  • , ve vision-preview 0125-Previewsürümlerinin 1106-Previewgpt-4 "Otomatik yükseltme yok" olarak ayarlanmış dağıtımları yükseltilmeyecek ve önizleme sürümü bölgede yükseltildiğinde çalışmayı durduracaktır. Yükseltmenin zamanlaması hakkında daha fazla bilgi için bkz . Azure OpenAI modeli kullanımdan kaldırmalar ve kullanımdan kaldırmalar .

GPT-3.5

GPT-3.5 modelleri doğal dili veya kodu anlayabilir ve oluşturabilir. GPT-3.5 ailesindeki en yetenekli ve uygun maliyetli model, sohbet için iyileştirilmiş ve geleneksel tamamlama görevleri için de iyi çalışan GPT-3.5 Turbo'dur. GPT-3.5 Turbo, Sohbet Tamamlamaları API'siyle kullanılabilir. GPT-3.5 Turbo Yönergesi, Sohbet Tamamlamaları text-davinci-003 API'sinin yerine Tamamlamalar API'sini kullanmaya benzer özelliklere sahiptir. GPT-3.5 Turbo ve GPT-3.5 Turbo Instruct eski GPT-3.5 ve GPT-3 modellerini kullanmanızı öneririz.

Model Kimliği Açıklama Maksimum İstek (belirteçler) Eğitim Verileri (en fazla)
gpt-35-turbo (0125) YENİ En Son GA Modeli
- JSON Modu
- paralel işlev çağrısı
- yeniden üretilebilir çıkış (önizleme)
- İstenen biçimlerde yanıt vermede daha yüksek doğruluk.
- İngilizce olmayan işlev çağrıları için metin kodlama sorununa neden olan bir hata düzeltildi.
Giriş: 16.385
Çıkış: 4.096
Eylül 2021
gpt-35-turbo (1106) Eski GA Modeli
- JSON Modu
- paralel işlev çağrısı
- yeniden üretilebilir çıkış (önizleme)
Giriş: 16.385
Çıkış: 4.096
Eylül 2021
gpt-35-turbo-instruct (0914) Yalnızca tamamlama uç noktası
- Eski tamamlama modellerinin yerini alma
4,097 Eylül 2021
gpt-35-turbo-16k (0613) Eski GA Modeli
- Araçlarla temel işlev çağrısı
16,384 Eylül 2021
gpt-35-turbo (0613) Eski GA Modeli
- Araçlarla temel işlev çağrısı
4,096 Eylül 2021
gpt-35-turbo1 (0301) Eski GA Modeli
- Kullanımdan kaldırma bilgileri
4,096 Eylül 2021

GPT-3.5 Turbo ve Sohbet Tamamlamaları API'siyle etkileşim kurma hakkında daha fazla bilgi edinmek için ayrıntılı nasıl yapılır bilgilerimize göz atın.

1 Bu model 4.096 belirteç isteklerini > kabul eder. Modelin daha yeni sürümü 4.096 belirteçle eşlendiğinden 4.096 giriş belirteci sınırının aşılması önerilmez. Bu modelde 4.096 giriş belirtecini aştığınızda sorunlarla karşılaşırsanız bu yapılandırma resmi olarak desteklenmez.

Eklemeler

text-embedding-3-large en son ve en yetenekli ekleme modelidir. Ekleme modelleri arasında yükseltme mümkün değildir. uygulamasından sizin text-embedding-ada-002 kullanımınıza geçmek için text-embedding-3-large yeni eklemeler oluşturmanız gerekir.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Test aşamasında OpenAI hem büyük hem de küçük üçüncü nesil ekleme modellerinin MIRACL karşılaştırması ile daha iyi ortalama çok dilli alma performansı sunarken MTEB karşılaştırması ile İngilizce görevleri için performansı sürdürmeye devam eder.

Değerlendirme Karşılaştırması text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
MIRACL ortalaması 31.4 44.0 54.9
MTEB ortalaması 61.0 62.3 64.6

Üçüncü nesil ekleme modelleri, ekleme boyutunun yeni dimensions bir parametre aracılığıyla küçültülmesini destekler. Genellikle daha büyük ekleme işlemleri işlem, bellek ve depolama perspektifinden daha pahalıdır. Boyut sayısını ayarlayabilmek, genel maliyet ve performans üzerinde daha fazla denetime olanak tanır. dimensions Parametresi OpenAI 1.x Python kitaplığının tüm sürümlerinde desteklenmez; bu parametreden yararlanmak için en son sürüme yükseltmenizi öneririz: pip install openai --upgrade.

OpenAI'nin MTEB karşılaştırma testi, üçüncü nesil modelin boyutları 1.536'nın altına text-embeddings-ada-002 indiğinde bile performansın biraz daha iyi kaldığını tespit etti.

DALL-E

DALL-E modelleri, kullanıcının sağladığı metin istemlerinden görüntüler oluşturur. DALL-E 3 genellikle REST API'leri ile kullanılabilir. İstemci SDK'ları olan DALL-E 2 ve DALL-E 3 önizleme aşamasındadır.

Fısıldamak

Fısıltı modelleri konuşmayı metne dönüştürme için kullanılabilir.

Fısıltı modelini Azure AI Konuşma toplu transkripsiyon API'sini kullanarak da kullanabilirsiniz. Azure AI Konuşma ve Azure OpenAI Hizmeti'nin ne zaman kullanılacağı hakkında daha fazla bilgi edinmek için Fısıltı modeli nedir? konusuna göz atın.

Metin okuma (Önizleme)

Şu anda önizleme aşamasında olan OpenAI metin okuma modelleri, metni konuşmaya sentezlemek için kullanılabilir.

Ayrıca OpenAI metnini kullanarak Azure AI Konuşma aracılığıyla seslerini de paylaşabilirsiniz. Daha fazla bilgi edinmek için Bkz . Azure OpenAI Hizmeti aracılığıyla veya Azure AI Konuşma kılavuzu aracılığıyla OpenAI metni konuşma seslerine.

Model özet tablosu ve bölge kullanılabilirliği

Dağıtım türüne göre modeller

Azure OpenAI, müşterilere işletme ve kullanım düzenlerine uygun barındırma yapısıyla ilgili seçenekler sunar. Hizmet iki ana dağıtım türü sunar:

  • Standart , daha yüksek aktarım hızı sağlamak için trafiği genel olarak yönlendiren genel bir dağıtım seçeneğiyle sunulur.
  • Sağlanan, müşterilerin Azure genel altyapısında sağlanan aktarım hızı birimleri satın alıp dağıtmasına olanak sağlayan genel bir dağıtım seçeneğiyle de sunulur.

Tüm dağıtımlar tam olarak aynı çıkarım işlemlerini gerçekleştirebilir, ancak faturalama, ölçek ve performans önemli ölçüde farklıdır. Azure OpenAI dağıtım türleri hakkında daha fazla bilgi edinmek için dağıtım türleri kılavuzumuza bakın.

Genel standart model kullanılabilirliği

Bölge o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4o-realtime-preview, 2024-10-01 gpt-4, turbo-2024-04-09
australiaeast - - - -
Güney Brezilya - - - -
canadaeast - - - -
eastus -
eastus2
francecentral - - - -
germanywestcentral - - - -
japaneast - - - -
koreacentral - - - -
northcentralus -
Doğu Norveç - - - -
polonyamerkez - - - -
Güney Afrika'nın Kuzeyi - - - -
Orta Güney ABD -
southindia - - - -
spaincentral - - -
Orta İsveç
switzerlandnorth - - - -
uaenorth - - - -
uksouth - - - -
westeurope - - - -
westus -
westus3 -

Bu tablo bölgesel kullanılabilirlik bilgilerini ayarlamayı içermez. Bu bilgi için ince ayar bölümüne bakın.

Uç noktaya göre standart modeller

Sohbet tamamlamaları

Bölge o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, görüntü işleme önizleme gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
australiaeast - - - - - - - - -
canadaeast - - - - - - - - -
eastus - - - - -
eastus2 - - - - - -
francecentral - - - - - - - - -
japaneast - - - - - - - - - - - -
northcentralus - - - - - -
Doğu Norveç - - - - - - - - - - - - - - -
Orta Güney ABD - - - - - - -
southindia - - - - - - - - - - - - - -
Orta İsveç - - -
Kuzey İsviçre - - - - - - - - - - -
uksouth - - - - - - - - -
westeurope - - - - - - - - - - - - - - -
westus - - - - - -
westus3 - - - - - - - -

GPT-4 ve GPT-4 Turbo model kullanılabilirliği

Müşteri erişimini seçin

Yukarıdaki tüm Azure OpenAI müşterilerinin kullanabileceği bölgelere ek olarak, bazı belirli önceden var olan müşterilere ek bölgelerde GPT-4 sürümlerine erişim verilmiştir:

Model Bölge
gpt-4 (0314)
gpt-4-32k (0314)
Doğu ABD
Orta Fransa
Orta Güney ABD
Güney Birleşik Krallık
gpt-4 (0613)
gpt-4-32k (0613)
Doğu ABD
Doğu ABD 2
Doğu Japonya
Güney Birleşik Krallık

GPT-3.5 modelleri

Azure OpenAI Hizmeti'nin model sürümü yükseltmelerini nasıl işlediğini öğrenmek için model sürümlerine bakın ve GPT-3.5 Turbo dağıtımlarınızın model sürümü ayarlarını görüntülemeyi ve yapılandırmayı öğrenmek için modellerle çalışma.

Modellerde ince ayar

Not

gpt-35-turbo - Bu modelin ince ayarı bölgelerin bir alt kümesiyle sınırlıdır ve temel modelin kullanılabilir olduğu her bölgede kullanılamaz.

AI Studio projesinde Azure OpenAI modellerini kullanarak proje dışından farklı ayarlamalar yapmak için desteklenen bölgeler farklılık gösterebilir.

Model Kimliği Bölgelere ince ayar Maksimum istek (belirteçler) Eğitim Verileri (en fazla)
babbage-002 Orta Kuzey ABD
İsveç Orta
Batı İsviçre
16,384 Eylül 2021
davinci-002 Orta Kuzey ABD
İsveç Orta
Batı İsviçre
16,384 Eylül 2021
gpt-35-turbo (0613) Doğu ABD2
Orta Kuzey ABD
İsveç Orta
Batı İsviçre
4,096 Eylül 2021
gpt-35-turbo (1106) Doğu ABD2
Orta Kuzey ABD
İsveç Orta
Batı İsviçre
Giriş: 16.385
Çıkış: 4.096
Eylül 2021
gpt-35-turbo (0125) Doğu ABD2
Orta Kuzey ABD
İsveç Orta
Batı İsviçre
16,385 Eylül 2021
gpt-4 (0613) 1 Orta Kuzey ABD
Orta İsveç
8192 Eylül 2021
gpt-4o-mini1 (2024-07-18) Orta Kuzey ABD
Orta İsveç
Giriş: 128.000
Çıkış: 16.384
Eğitim örneği bağlam uzunluğu: 64.536
Ekim 2023
gpt-4o1 (2024-08-06) Doğu ABD2
Orta Kuzey ABD
Orta İsveç
Giriş: 128.000
Çıkış: 16.384
Eğitim örneği bağlam uzunluğu: 64.536
Ekim 2023

1 GPT-4 şu anda genel önizleme aşamasındadır.

Yardımcılar (Önizleme)

Yardımcılar için desteklenen bir modelin ve desteklenen bir bölgenin birleşimi gerekir. Bazı araçlar ve özellikler için en son modeller gerekir. Aşağıdaki modeller Yardımcılar API'sinde, SDK'da ve Azure AI Studio'da kullanılabilir. Aşağıdaki tablo kullandıkça öde tablosuna yöneliktir. Sağlanan Aktarım Hızı Birimi (PTU) kullanılabilirliği hakkında bilgi için bkz . sağlanan aktarım hızı. Listelenen modeller ve bölgeler hem Yardımcılar v1 hem de v2 ile kullanılabilir. Aşağıda listelenen bölgelerde destekleniyorsa genel standart modelleri kullanabilirsiniz.

Bölge gpt-35-turbo (0613) gpt-35-turbo (1106) fine tuned gpt-3.5-turbo-0125 gpt-4 (0613) gpt-4 (1106) gpt-4 (0125) gpt-4o (2024-05-13) gpt-4o-mini (2024-07-18)
Doğu Avustralya
Doğu ABD
Doğu ABD 2
Orta Fransa
Doğu Japonya
Norveç Doğu
Orta İsveç
Güney Birleşik Krallık
Batı ABD
Batı ABD 3

Modeli kullanımdan kaldırma

Model kullanımdan kaldırma hakkında en son bilgiler için modeli kullanımdan kaldırma kılavuzuna bakın.

Sonraki adımlar