Model Azure OpenAI Service

Azure OpenAI Service didukung oleh beragam rangkaian model dengan kemampuan dan titik harga berbeda. Ketersediaan model bervariasi menurut region. Untuk GPT-3 dan model-model lain yang berhenti pada Juli 2024, lihat Model-model lama Azure OpenAI Service.

Model Deskripsi
GPT-4 Serangkaian model yang meningkat pada GPT-3.5 dan dapat memahami dan menghasilkan bahasa dan kode alami.
GPT-3.5 Serangkaian model yang meningkat pada GPT-3 dan dapat memahami dan menghasilkan bahasa dan kode alami.
Penyematan Sekumpulan model yang dapat mengubah teks menjadi bentuk vektor numerik untuk memfasilitasi kesamaan teks.
DALL-E Serangkaian model yang dapat menghasilkan gambar asli dari bahasa alami.
Berbisik Serangkaian model dalam pratinjau yang dapat mentranskripsikan dan menerjemahkan ucapan ke teks.
Teks ke ucapan (Pratinjau) Serangkaian model dalam pratinjau yang dapat mensintesis teks ke ucapan.

Pratinjau GPT-4 dan GPT-4 Turbo

GPT-4 adalah model multimodal besar (menerima input teks atau gambar dan menghasilkan teks) yang dapat memecahkan masalah sulit dengan akurasi yang lebih besar daripada model OpenAI sebelumnya. Seperti GPT-3.5 Turbo, GPT-4 dioptimalkan untuk obrolan dan berfungsi dengan baik untuk tugas penyelesaian tradisional. Gunakan API Penyelesaian Obrolan untuk menggunakan GPT-4. Untuk mempelajari selengkapnya tentang cara berinteraksi dengan GPT-4 dan CHAT Completions API, lihat panduan mendalam kami.

GPT-4 Turbo with Vision adalah versi GPT-4 yang menerima input gambar. Ini tersedia sebagai vision-preview model .gpt-4

  • gpt-4
  • gpt-4-32k

Anda dapat melihat panjang konteks token yang didukung oleh setiap model dalam tabel ringkasan model.

GPT-3.5

Model GPT-3.5 dapat memahami dan menghasilkan bahasa atau kode alami. Model yang paling mampu dan hemat biaya dalam keluarga GPT-3.5 adalah GPT-3.5 Turbo, yang telah dioptimalkan untuk obrolan dan bekerja dengan baik untuk tugas penyelesaian tradisional juga. GPT-3.5 Turbo tersedia untuk digunakan dengan API Penyelesaian Obrolan. GPT-3.5 Turbo Instruct memiliki kemampuan serupa untuk text-davinci-003 menggunakan API Penyelesaian alih-alih API Penyelesaian Obrolan. Sebaiknya gunakan GPT-3.5 Turbo dan GPT-3.5 Turbo Instruksikan atas model GPT-3.5 dan GPT-3 warisan.

  • gpt-35-turbo
  • gpt-35-turbo-16k
  • gpt-35-turbo-instruct

Anda dapat melihat panjang konteks token yang didukung oleh setiap model dalam tabel ringkasan model.

Untuk mempelajari selengkapnya tentang cara berinteraksi dengan GPT-3.5 Turbo dan API Penyelesaian Obrolan, lihat panduan mendalam kami.

Penyematan

text-embedding-3-large adalah model penyematan terbaru dan paling mampu. Peningkatan antara model penyematan tidak dimungkinkan. Untuk berpindah dari penggunaan text-embedding-ada-002 ke text-embedding-3-large Anda perlu membuat penyematan baru.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Dalam pengujian, OpenAI melaporkan model penyematan generasi ketiga besar dan kecil menawarkan performa pengambilan multibahasa rata-rata yang lebih baik dengan tolok ukur MIRACL sambil tetap mempertahankan performa untuk tugas bahasa Inggris dengan tolok ukur MTEB .

Tolok Ukur Evaluasi text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Rata-rata MIRACL 31,4 44.0 54.9
Rata-rata MTEB 61.0 62,3 64.6

Model penyematan generasi ketiga mendukung pengurangan ukuran penyematan melalui parameter baru dimensions . Biasanya penyematan yang lebih besar lebih mahal dari perspektif komputasi, memori, dan penyimpanan. Mampu menyesuaikan jumlah dimensi memungkinkan lebih banyak kontrol atas biaya dan performa keseluruhan. Parameter dimensions tidak didukung di semua versi pustaka OpenAI 1.x Python, untuk memanfaatkan parameter ini, sebaiknya tingkatkan ke versi terbaru: pip install openai --upgrade.

Pengujian tolok ukur MTEB OpenAI menemukan bahwa bahkan ketika dimensi model generasi ketiga dikurangi menjadi kurang dari text-embeddings-ada-002 1.536 dimensi performa tetap sedikit lebih baik.

DALL-E

Model DALL-E menghasilkan gambar dari perintah teks yang disediakan pengguna. DALL-E 3 umumnya tersedia untuk digunakan dengan REST API. DALL-E 2 dan DALL-E 3 dengan SDK klien sedang dalam pratinjau.

Berbisik

Model Whisper dapat digunakan untuk ucapan ke teks.

Anda juga dapat menggunakan model Whisper melalui API transkripsi batch Ucapan Azure AI. Lihat Apa model Whisper? untuk mempelajari selengkapnya tentang kapan menggunakan Azure AI Speech vs. Azure OpenAI Service.

Teks ke ucapan (Pratinjau)

Teks OpenAI ke model ucapan, yang saat ini dalam pratinjau, dapat digunakan untuk mensintesis teks ke ucapan.

Anda juga dapat menggunakan teks OpenAI untuk suara ucapan melalui Azure AI Speech. Untuk mempelajari selengkapnya, lihat Teks OpenAI ke suara ucapan melalui Azure OpenAI Service atau melalui panduan Azure AI Speech .

Tabel ringkasan model dan ketersediaan wilayah

Catatan

Artikel ini hanya mencakup ketersediaan model/wilayah yang berlaku untuk semua pelanggan Azure OpenAI dengan jenis penyebaran Standar. Beberapa pelanggan tertentu memiliki akses ke kombinasi model/wilayah yang tidak tercantum dalam tabel terpadu di bawah ini. Tabel ini juga tidak berlaku untuk pelanggan yang hanya menggunakan jenis penyebaran yang disediakan yang memiliki matriks ketersediaan model/wilayah unik mereka sendiri. Untuk informasi selengkapnya tentang Penyebaran yang disediakan , lihat Panduan yang disediakan.

Ketersediaan model penyebaran standar

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4-32k, 0613 gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914 text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1 babbage-002, 1 dall-e-3, 3.0 davinci-002, 1 tts, 001 tts-hd, 001 whisper, 001
australiaeast - - - - - - - - - - - -
brazilsouth - - - - - - - - - - - - - - - - - - - -
canadaeast - - - - - - - - - - -
eastus - - - - - - - - - - -
eastus2 - - - - - - - - - - - - - -
FranceCentral - - - - - - - - - - - - -
japaneast - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - -
norwayeast - - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - -
southindia - - - - - - - - - - - - - - - - -
swedencentral - - - - - -
switzerlandnorth - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - - - - - - - -

Tabel ini tidak menyertakan ketersediaan regional penyempurnaan, lihat bagian penyempurnaan khusus untuk informasi ini.

Kuota model penyebaran standar

Kuota default untuk model bervariasi menurut model dan wilayah. Batas kuota default dapat berubah.

Kuota untuk penyebaran standar dijelaskan dalam hal Tokens-Per-Menit (TPM).

Wilayah GPT-4 GPT-4-32K GPT-4-Turbo GPT-4-Turbo-V GPT-35-Turbo GPT-35-Turbo-Instruct Text-Embedding-Ada-002 text-embedding-3-small text-embedding-3-large Babbage-002 Babbage-002 - finetune Davinci-002 Davinci-002 - finetune GPT-35-Turbo - finetune GPT-35-Turbo-1106 - finetune GPT-35-Turbo-0125 - finetune
australiaeast 40 K 80 K 80 K 30 K 300 K - 350 K - - - - - - - - -
brazilsouth - - - - - - 350 K - - - - - - - - -
canadaeast 40 K 80 K 80 K - 300 K - 350 K 350 K 350 K - - - - - - -
eastus - - 80 K - 240 K 240 K 240 K 350 K 350 K - - - - - - -
eastus2 - 80 K 80 K - 300 K - 350 K 350 K 350 K - - - - 250 K 250 K 250 K
FranceCentral 20 K 60 K 80 K - 240 K - 240 K - - - - - - - - -
japaneast - - - 30 K 300 K - 350 K - - - - - - - - -
northcentralus - - 80 K - 300 K - 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
norwayeast - - 150 K - - - 350 K - - - - - - - - -
southafricanorth - - - - - - 350 K - - - - - - - - -
southcentralus - - 80 K - 240 K - 240 K - - - - - - - - -
southindia - - 150 K - 300 K - 350 K - - - - - - - - -
swedencentral 40 K 80 K 150 K 30 K 300 K 240 K 350 K - - 240 K 250 K 240 K 250 K 250 K 250 K 250 K
switzerlandnorth 40 K 80 K - 30 K 300 K - 350 K - - - - - - - - -
switzerlandwest - - - - - - - - - - 250 K - 250 K 250 K 250 K 250 K
uksouth - - 80 K - 240 K - 350 K - - - - - - - - -
westeurope - - - - 240 K - 240 K - - - - - - - - -
westus - - 80 K 30 K 300 K - 350 K - - - - - - - - -
westus3 - - - - - - 350 K - - - - - - - - -

1 K = 1000 Token Per Menit (TPM). Hubungan antara TPM dan Requests Per Minute (RPM) saat ini didefinisikan sebagai 6 RPM per 1000 TPM.

Model Pratinjau GPT-4 dan GPT-4 Turbo

GPT-4, GPT-4-32k, dan GPT-4 Turbo dengan Vision sekarang tersedia untuk semua pelanggan Azure OpenAI Service. Ketersediaan bervariasi berdasarkan wilayah. Jika Anda tidak melihat GPT-4 di wilayah Anda, silakan periksa kembali nanti.

Model ini hanya dapat digunakan dengan API Penyelesaian Obrolan.

GPT-4 versi 0314 adalah versi pertama dari model yang dirilis. Versi 0613 adalah versi kedua dari model dan menambahkan dukungan panggilan fungsi.

Lihat versi model untuk mempelajari tentang cara Azure OpenAI Service menangani peningkatan versi model, dan bekerja dengan model untuk mempelajari cara melihat dan mengonfigurasi pengaturan versi model penyebaran GPT-4 Anda.

Catatan

gpt-4 Versi 0314 dan gpt-4-32k akan dihentikan tidak lebih awal dari 5 Juli 2024. gpt-4 Versi 0613 dan gpt-4-32k akan dihentikan tidak lebih awal dari 30 September 2024. Lihat pembaruan model untuk perilaku peningkatan model.

Pratinjau GPT-4 versi 0125 adalah versi terbaru dari pratinjau GPT-4 Turbo yang sebelumnya dirilis sebagai pratinjau versi 1106. Pratinjau GPT-4 versi 0125 menyelesaikan tugas seperti pembuatan kode lebih lengkap dibandingkan dengan gpt-4-1106-preview. Karena itu, tergantung pada tugas, pelanggan mungkin menemukan bahwa pratinjau GPT-4-0125 menghasilkan lebih banyak output dibandingkan dengan pratinjau gpt-4-1106. Sebaiknya pelanggan membandingkan output model baru. Pratinjau GPT-4-0125 juga membahas bug dalam gpt-4-1106-preview dengan penanganan UTF-8 untuk bahasa non-bahasa Inggris.

Penting

  • gpt-4 versi 1106-Preview dan 0125-Preview akan ditingkatkan dengan versi gpt-4 stabil di masa mendatang. Peningkatan penyebaran gpt-4 Pratinjau 1106 ke gpt-4 Pratinjau 0125 yang dijadwalkan pada 8 Maret 2024 tidak lagi berlangsung. Penyebaran gpt-4 versi 1106-Preview dan 0125-Preview diatur ke "Pembaruan otomatis ke default" dan "Tingkatkan ketika kedaluwarsa" akan mulai ditingkatkan setelah versi stabil dirilis. Untuk setiap penyebaran, peningkatan versi model terjadi tanpa gangguan dalam layanan untuk panggilan API. Peningkatan dipentaskan berdasarkan wilayah dan proses peningkatan penuh diperkirakan akan memakan waktu 2 minggu. Penyebaran gpt-4 versi 1106-Preview dan 0125-Preview diatur ke "Tidak ada autoupgrade" tidak akan ditingkatkan dan akan berhenti beroperasi ketika versi pratinjau ditingkatkan di wilayah tersebut.
ID Model Permintaan Maks (token) Data Pelatihan (hingga)
gpt-4 (0314) 8.192 Sep 2021
gpt-4-32k(0314) 32.768 Sep 2021
gpt-4 (0613) 8.192 Sep 2021
gpt-4-32k (0613) 32.768 Sep 2021
gpt-4 (Pratinjau 1106)1
Pratinjau GPT-4 Turbo
Input: 128.000
Output: 4.096
Apr 2023
gpt-4 (Pratinjau 0125)1
Pratinjau GPT-4 Turbo
Input: 128.000
Output: 4.096
Des 2023
gpt-4 (pratinjau visi)2
GPT-4 Turbo dengan Pratinjau Visi
Input: 128.000
Output: 4.096
Apr 2023

1 Pratinjau Turbo GPT-4 = gpt-4 (Pratinjau 0125) atau gpt-4 (Pratinjau 1106). Untuk menyebarkan model ini, di bawah Penyebaran pilih model gpt-4. Di bawah versi pilih (Pratinjau 0125) atau (Pratinjau 1106).

2 GPT-4 Turbo dengan Pratinjau Visi = gpt-4 (pratinjau visi). Untuk menyebarkan model ini, di bawah Penyebaran pilih model gpt-4. Untuk Versi model pilih vision-preview.

Perhatian

Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau di masa mendatang dan versi yang stabil. Pratinjau yang ditunjuk model tidak mengikuti siklus hidup model Azure OpenAI standar.

Catatan

Wilayah tempat GPT-4 (0314) & (0613) terdaftar sebagai tersedia memiliki akses ke model versi 8K dan 32K

Ketersediaan model Pratinjau GPT-4 dan GPT-4 Turbo

Wilayah cloud publik

Region gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, vision-preview gpt-4-32k, 0613
australiaeast -
canadaeast - -
eastus - - - -
eastus2 - - - -
FranceCentral - -
japaneast - - - -
northcentralus - - - -
norwayeast - - - -
southcentralus - - - -
southindia - - - -
swedencentral -
switzerlandnorth - -
uksouth - - - -
westus - - -

Pilih akses pelanggan

Selain wilayah di atas yang tersedia untuk semua pelanggan Azure OpenAI, beberapa pelanggan yang sudah ada sebelumnya telah diberikan akses ke versi GPT-4 di wilayah tambahan:

Model Wilayah
gpt-4 (0314) US Timur
Prancis Tengah
US Tengah Selatan
UK Selatan
gpt-4 (0613) US Timur
US Timur 2
Jepang Timur
UK Selatan

Kawasan Azure Government

Model GPT-4 berikut tersedia dengan Azure Government:

ID Model Ketersediaan Model
gpt-4 (Pratinjau 1106) US Gov Virginia
US Gov Arizona

Model GPT-3.5

Penting

Model BARU gpt-35-turbo (0125) memiliki berbagai peningkatan, termasuk akurasi yang lebih tinggi dalam merespons dalam format yang diminta dan perbaikan untuk bug yang menyebabkan masalah pengodean teks untuk panggilan fungsi non-bahasa Inggris.

GPT-3.5 Turbo digunakan bersamaan dengan API Chat Completion. GPT-3.5 Turbo versi 0301 juga dapat digunakan dengan API Penyelesaian, meskipun ini tidak disarankan. GPT-3.5 Turbo versi 0613 dan 1106 hanya mendukung API Penyelesaian Obrolan.

GPT-3.5 Turbo versi 0301 adalah versi pertama dari model yang dirilis. Versi 0613 adalah versi kedua dari model dan menambahkan dukungan panggilan fungsi.

Lihat versi model untuk mempelajari tentang cara Azure OpenAI Service menangani peningkatan versi model, dan bekerja dengan model untuk mempelajari cara melihat dan mengonfigurasi pengaturan versi model penyebaran GPT-3.5 Turbo Anda.

Catatan

gpt-35-turbo Versi 0613 dan gpt-35-turbo-16k akan dihentikan tidak lebih awal dari 1 Agustus 2024. gpt-35-turbo Versi 0301 akan dihentikan tidak lebih awal dari 1 Agustus 2024. Lihat pembaruan model untuk perilaku peningkatan model.

ID Model Permintaan Maks (token) Data Pelatihan (hingga)
gpt-35-turbo1 (0301) 4,096 Sep 2021
gpt-35-turbo (0613) 4,096 Sep 2021
gpt-35-turbo-16k (0613) 16,384 Sep 2021
gpt-35-turbo-instruct (0914) 4,097 Sep 2021
gpt-35-turbo (1106) Input: 16.385
Output: 4.096
Sep 2021
gpt-35-turbo (0125) BARU 16,385 Sep 2021

Ketersediaan model GPT-3.5-Turbo

Wilayah cloud publik

Region gpt-35-turbo, 0301 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613 gpt-35-turbo-instruct, 0914
australiaeast - - -
canadaeast - -
eastus - -
eastus2 - - - -
FranceCentral - -
japaneast - - - -
northcentralus - - -
southcentralus - - - -
southindia - - - - -
swedencentral - -
switzerlandnorth - - - -
uksouth - -
westeurope - - - - -
westus - - - - -

1 Model ini akan menerima permintaan > 4.096 token. Tidak disarankan untuk melebihi batas token input 4.096 karena versi model yang lebih baru dibatasi pada 4.096 token. Jika Anda mengalami masalah saat melebihi 4.096 token input dengan model ini, konfigurasi ini tidak didukung secara resmi.

Kawasan Azure Government

Model turbo GPT-3.5 berikut tersedia dengan Azure Government:

ID Model Ketersediaan Model
gpt-35-turbo (Pratinjau 1106) US Gov Virginia

Model penyematan

Model ini hanya dapat digunakan dengan permintaan Embedding API.

Catatan

text-embedding-3-large adalah model penyematan terbaru dan paling mampu. Peningkatan antara model penyematan tidak dimungkinkan. Untuk bermigrasi dari penggunaan text-embedding-ada-002 ke text-embedding-3-large Anda perlu menghasilkan penyematan baru.

ID Model Permintaan Maks (token) Dimensi Output Data Pelatihan (up-to)
text-embedding-ada-002 (versi 2) 8,191 1.536 Sep 2021
text-embedding-ada-002 (versi 1) 2,046 1.536 Sep 2021
text-embedding-3-large 8,191 3.072 Sep 2021
text-embedding-3-small 8,191 1.536 Sep 2021

Catatan

Saat mengirim array input untuk penyematan, jumlah maksimum item input dalam array per panggilan ke titik akhir penyematan adalah 2048.

Wilayah cloud publik

Region text-embedding-ada-002, 1 text-embedding-ada-002, 2 text-embedding-3-small, 1 text-embedding-3-large, 1
australiaeast - - -
brazilsouth - - -
canadaeast -
eastus
eastus2 -
FranceCentral - - -
japaneast - - -
northcentralus - - -
norwayeast - - -
southafricanorth - - -
southcentralus - -
southindia - - -
swedencentral - - -
switzerlandnorth - - -
uksouth - - -
westeurope - - -
westus - - -
westus3 - - -

Kawasan Azure Government

Model Embeddings berikut tersedia dengan Azure Government:

ID Model Ketersediaan Model
text-embedding-ada-002 (versi 2) US Gov Virginia
US Gov Arizona

Model DALL-E

ID Model Ketersediaan Fitur Permintaan Maks (karakter)
dalle2 (pratinjau) AS Timur 1,000
dall-e-3 US Timur, Australia Timur, Swedia Tengah 4.000

Menyempurnakan model

babbage-002 dan davinci-002 tidak dilatih untuk mengikuti instruksi. Mengkueri model dasar ini hanya boleh dilakukan sebagai titik referensi ke versi yang disempurnakan untuk mengevaluasi kemajuan pelatihan Anda.

gpt-35-turbo - penyempurnaan model ini terbatas pada subset wilayah, dan tidak tersedia di setiap wilayah model dasar tersedia.

ID Model Menyempurnakan Wilayah Permintaan Maks (token) Data Pelatihan (hingga)
babbage-002 US Tengah Utara
Swedia Tengah
Swiss Barat
16,384 Sep 2021
davinci-002 US Tengah Utara
Swedia Tengah
Swiss Barat
16,384 Sep 2021
gpt-35-turbo (0613) US Timur2
US Tengah Utara
Swedia Tengah
Swiss Barat
4,096 Sep 2021
gpt-35-turbo (1106) US Timur2
US Tengah Utara
Swedia Tengah
Swiss Barat
Input: 16.385
Output: 4.096
Sep 2021
gpt-35-turbo (0125) US Timur2
US Tengah Utara
Swedia Tengah
Swiss Barat
16,385 Sep 2021

Model bisikan

ID Model Ketersediaan Model Permintaan Maks (ukuran file audio)
whisper US Timur 2
US Tengah Utara
Norwegia Timur
India Selatan
Swedia Tengah
Eropa Barat
25 MB

Model teks ke ucapan (Pratinjau)

ID Model Ketersediaan Model
tts-1 US Tengah Utara
Swedia Tengah
tts-1-hd US Tengah Utara
Swedia Tengah

Asisten (Pratinjau)

Untuk Asisten, Anda memerlukan kombinasi model yang didukung, dan wilayah yang didukung. Alat dan kemampuan tertentu memerlukan model terbaru. Model berikut tersedia di Assistants API, SDK, Azure AI Studio, dan Azure OpenAI Studio. Tabel berikut ini adalah untuk bayar sesuai penggunaan. Untuk informasi tentang ketersediaan Unit Throughput yang Disediakan (PTU), lihat throughput yang disediakan.

Wilayah gpt-35-turbo (0613) gpt-35-turbo (1106) gpt-4 (0613) gpt-4 (1106) gpt-4 (0125)
Australia Timur
AS Timur
AS Timur 2
Prancis Tengah
Norwegia Timur
Swedia Tengah
UK Selatan

Langkah berikutnya