Model Azure OpenAI Service
Azure OpenAI Service didukung oleh beragam rangkaian model dengan kemampuan dan titik harga berbeda. Ketersediaan model bervariasi menurut region.
Model | Deskripsi |
---|---|
GPT-4o & GPT-4 Turbo | Model Azure OpenAI terbaru yang paling mampu dengan versi multimodal, yang dapat menerima teks dan gambar sebagai input. |
GPT-4 | Serangkaian model yang meningkat pada GPT-3.5 dan dapat memahami dan menghasilkan bahasa dan kode alami. |
GPT-3.5 | Serangkaian model yang meningkat pada GPT-3 dan dapat memahami dan menghasilkan bahasa dan kode alami. |
Penyematan | Sekumpulan model yang dapat mengubah teks menjadi bentuk vektor numerik untuk memfasilitasi kesamaan teks. |
DALL-E | Serangkaian model yang dapat menghasilkan gambar asli dari bahasa alami. |
Bisik | Serangkaian model dalam pratinjau yang dapat mentranskripsikan dan menerjemahkan ucapan ke teks. |
Teks ke ucapan (Pratinjau) | Serangkaian model dalam pratinjau yang dapat mensintesis teks ke ucapan. |
GPT-4o dan GPT-4 Turbo
GPT-4o mengintegrasikan teks dan gambar dalam satu model, memungkinkannya menangani beberapa jenis data secara bersamaan. Pendekatan multimodal ini meningkatkan akurasi dan responsivitas dalam interaksi manusia-komputer. GPT-4o cocok dengan GPT-4 Turbo dalam tugas teks dan pengodean bahasa Inggris sambil menawarkan performa unggul dalam tugas bahasa dan visi non-Bahasa Inggris, menetapkan tolok ukur baru untuk kemampuan AI.
Taman bermain akses awal
Pelanggan Azure OpenAI yang ada dapat menguji model mini GPT-4o BARU di Azure OpenAI Studio Early Access Playground (Pratinjau).
Untuk menguji model terbaru:
Catatan
Taman bermain akses awal mini GPT-4o saat ini hanya tersedia untuk sumber daya di US Barat 3 dan AS Timur, dan dibatasi hingga 10 permintaan setiap lima menit per langganan. Filter konten Azure OpenAI diaktifkan pada konfigurasi default dan tidak dapat dimodifikasi. GPT-4o mini adalah model pratinjau dan saat ini tidak tersedia untuk akses API penyebaran/langsung.
- Buka Azure OpenAI Studio di https://oai.azure.com/ dan masuk dengan kredensial yang memiliki akses ke sumber daya OpenAI Anda.
- Pilih sumber daya Azure OpenAI di wilayah US3 Barat atau US Timur. Jika Anda tidak memiliki sumber daya di salah satu wilayah ini, Anda harus membuat sumber daya.
- Dari halaman Utama Azure OpenAI Studio pilih tombol Early Access Playground (Pratinjau) dari bawah bagian Memulai . (Tombol ini hanya akan terlihat ketika sumber daya masuk US3 Barat atau US Timur dipilih.)
- Sekarang Anda dapat mulai mengajukan pertanyaan model seperti yang Anda lakukan sebelumnya di taman bermain obrolan yang ada.
Bagaimana cara mengakses model GPT-4o?
GPT-4o tersedia untuk penyebaran model standar dan standar global.
Anda perlu membuat atau menggunakan sumber daya yang ada di wilayah standar atau standar global yang didukung tempat model tersedia.
Saat sumber daya dibuat, Anda dapat menyebarkan model GPT-4o. Jika Anda melakukan penyebaran terprogram, nama modelnya adalah gpt-4o
, dan versinya adalah 2024-05-13
.
GPT-4 Turbo
GPT-4 Turbo adalah model multimodal besar (menerima input teks atau gambar dan menghasilkan teks) yang dapat memecahkan masalah sulit dengan akurasi yang lebih besar daripada model OpenAI sebelumnya. Seperti GPT-3.5 Turbo, dan model GPT-4 GPT-4 yang lebih lama GPT-4 Turbo dioptimalkan untuk obrolan dan berfungsi dengan baik untuk tugas penyelesaian tradisional.
Rilis GA terbaru dari GPT-4 Turbo adalah:
gpt-4
Versi:turbo-2024-04-09
Ini adalah pengganti untuk model pratinjau berikut:
gpt-4
Versi:1106-Preview
gpt-4
Versi:0125-Preview
gpt-4
Versi:vision-preview
Perbedaan antara OpenAI dan Azure OpenAI GPT-4 Turbo GA Model
- Versi OpenAI dari model turbo terbaru
0409
mendukung mode JSON dan panggilan fungsi untuk semua permintaan inferensi. - Versi
turbo-2024-04-09
Terbaru Azure OpenAI saat ini tidak mendukung penggunaan mode JSON dan panggilan fungsi saat membuat permintaan inferensi dengan input gambar (visi). Permintaan input berbasis teks (permintaan tanpaimage_url
dan gambar sebaris) mendukung mode JSON dan panggilan fungsi.
Perbedaan dari gpt-4 vision-preview
- Integrasi peningkatan Visi khusus Azure AI dengan GPT-4 Turbo dengan Visi tidak didukung untuk
gpt-4
Versi:turbo-2024-04-09
. Ini termasuk Pengenalan Karakter Optik (OCR), landasan objek, permintaan video, dan peningkatan penanganan data Anda dengan gambar.
Ketersediaan terkelola yang disediakan GPT-4 Turbo
gpt-4
Versi:turbo-2024-04-09
tersedia untuk penyebaran standar dan yang disediakan. Saat ini versi yang disediakan dari model ini tidak mendukung permintaan inferensi gambar/penglihatan. Penyebaran yang disediakan dari model ini hanya menerima input teks. Penyebaran model standar menerima permintaan inferensi teks dan gambar/visi.
Ketersediaan wilayah
Untuk informasi tentang ketersediaan regional model, lihat matriks model untuk penyebaran standar, dan yang disediakan.
Menyebarkan GPT-4 Turbo dengan Vision GA
Untuk menyebarkan model GA dari Studio UI, pilih GPT-4
lalu pilih turbo-2024-04-09
versi dari menu dropdown. Kuota default untuk gpt-4-turbo-2024-04-09
model akan sama dengan kuota saat ini untuk GPT-4-Turbo. Lihat batas kuota regional.
GPT-4
GPT-4 adalah pendahulu GPT-4 Turbo. Model GPT-4 dan GPT-4 Turbo memiliki nama gpt-4
model dasar . Anda dapat membedakan antara model GPT-4 dan Turbo dengan memeriksa versi model.
gpt-4
Versi0314
gpt-4
Versi0613
gpt-4-32k
Versi0613
Anda dapat melihat panjang konteks token yang didukung oleh setiap model dalam tabel ringkasan model.
Model GPT-4 dan GPT-4 Turbo
- Model ini hanya dapat digunakan dengan API Penyelesaian Obrolan.
Lihat versi model untuk mempelajari tentang cara Azure OpenAI Service menangani peningkatan versi model, dan bekerja dengan model untuk mempelajari cara melihat dan mengonfigurasi pengaturan versi model penyebaran GPT-4 Anda.
ID Model | Deskripsi | Permintaan Maks (token) | Data Pelatihan (hingga) |
---|---|---|---|
gpt-4o (2024-05-13) GPT-4o (Omni) |
Model GA terbaru - Teks, pemrosesan gambar - Mode JSON - panggilan fungsi paralel - Akurasi dan responsivitas yang ditingkatkan - Paritas dengan tugas teks dan pengodean bahasa Inggris dibandingkan dengan GPT-4 Turbo dengan Visi - Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi - Tidak mendukung penyempurnaan |
Input: 128.000 Output: 4.096 |
Okt 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo dengan Visi |
Model GA baru - Penggantian untuk semua model pratinjau GPT-4 sebelumnya ( vision-preview , , 1106-Preview 0125-Preview ). - Ketersediaan fitur saat ini berbeda tergantung pada metode input, dan jenis penyebaran. - Tidak mendukung penyempurnaan. |
Input: 128.000 Output: 4.096 |
Des 2023 |
gpt-4 (Pratinjau 0125)*Pratinjau GPT-4 Turbo |
Model Pratinjau -Mengganti 1106-Preview - Performa pembuatan kode yang lebih baik - Mengurangi kasus di mana model tidak menyelesaikan tugas - Mode JSON - panggilan fungsi paralel - output yang dapat direproduksi (pratinjau) |
Input: 128.000 Output: 4.096 |
Des 2023 |
gpt-4 (pratinjau visi)GPT-4 Turbo dengan Pratinjau Visi |
Model pratinjau - Menerima input teks dan gambar. - Mendukung penyempurnaan - Mode JSON - panggilan fungsi paralel - output yang dapat direproduksi (pratinjau) |
Input: 128.000 Output: 4.096 |
Apr 2023 |
gpt-4 (Pratinjau 1106)Pratinjau GPT-4 Turbo |
Model Pratinjau - Mode JSON - panggilan fungsi paralel - output yang dapat direproduksi (pratinjau) |
Input: 128.000 Output: 4.096 |
Apr 2023 |
gpt-4-32k (0613) |
Model GA yang lebih lama - Panggilan fungsi dasar dengan alat |
32.768 | Sep 2021 |
gpt-4 (0613) |
Model GA yang lebih lama - Panggilan fungsi dasar dengan alat |
8.192 | Sep 2021 |
gpt-4-32k (0314) |
Model GA yang lebih lama - Informasi penghentian |
32.768 | Sep 2021 |
gpt-4 (0314) |
Model GA yang lebih lama - Informasi penghentian |
8.192 | Sep 2021 |
Perhatian
Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi stabil/GA terbaru. Pratinjau yang ditunjuk model tidak mengikuti siklus hidup model Azure OpenAI standar.
- Pratinjau GPT-4 versi 0125 adalah versi terbaru dari pratinjau GPT-4 Turbo yang sebelumnya dirilis sebagai pratinjau versi 1106.
- Pratinjau GPT-4 versi 0125 menyelesaikan tugas seperti pembuatan kode lebih lengkap dibandingkan dengan gpt-4-1106-preview. Karena itu, tergantung pada tugas, pelanggan mungkin menemukan bahwa pratinjau GPT-4-0125 menghasilkan lebih banyak output dibandingkan dengan pratinjau gpt-4-1106. Sebaiknya pelanggan membandingkan output model baru. Pratinjau GPT-4-0125 juga membahas bug dalam gpt-4-1106-preview dengan penanganan UTF-8 untuk bahasa non-bahasa Inggris.
- Versi GPT-4
turbo-2024-04-09
adalah rilis0125-Preview
GA terbaru dan menggantikan , , dan .vision-preview
1106-preview
Penting
gpt-4
versi 1106-Preview, 0125-Preview, dan vision-preview akan ditingkatkan dengan versigpt-4
stabil di masa mendatang. Penyebarangpt-4
versi 1106-Preview, 0125-Preview, dan vision-preview diatur ke "Auto-update to default" dan "Upgrade when expired" akan mulai ditingkatkan setelah versi stabil dirilis. Untuk setiap penyebaran, peningkatan versi model terjadi tanpa gangguan dalam layanan untuk panggilan API. Peningkatan dipentaskan berdasarkan wilayah dan proses peningkatan penuh diperkirakan akan memakan waktu 2 minggu. Penyebarangpt-4
versi 1106-Preview, 0125-Preview, dan vision-preview diatur ke "Tidak ada autoupgrade" tidak akan ditingkatkan dan akan berhenti beroperasi ketika versi pratinjau ditingkatkan di wilayah tersebut. Lihat Penghentian dan penghentian model Azure OpenAI untuk informasi selengkapnya tentang waktu peningkatan.
GPT-3.5
Model GPT-3.5 dapat memahami dan menghasilkan bahasa atau kode alami. Model yang paling mampu dan hemat biaya dalam keluarga GPT-3.5 adalah GPT-3.5 Turbo, yang telah dioptimalkan untuk obrolan dan bekerja dengan baik untuk tugas penyelesaian tradisional juga. GPT-3.5 Turbo tersedia untuk digunakan dengan API Penyelesaian Obrolan. GPT-3.5 Turbo Instruct memiliki kemampuan serupa untuk text-davinci-003
menggunakan API Penyelesaian alih-alih API Penyelesaian Obrolan. Sebaiknya gunakan GPT-3.5 Turbo dan GPT-3.5 Turbo Instruksikan atas model GPT-3.5 dan GPT-3 warisan.
ID Model | Deskripsi | Permintaan Maks (token) | Data Pelatihan (hingga) |
---|---|---|---|
gpt-35-turbo (0125) BARU |
Model GA Terbaru - Mode JSON - panggilan fungsi paralel - output yang dapat direproduksi (pratinjau) - Akurasi yang lebih tinggi dalam merespons dalam format yang diminta. - Perbaikan untuk bug yang menyebabkan masalah pengodean teks untuk panggilan fungsi non-bahasa Inggris. |
Input: 16.385 Output: 4.096 |
Sep 2021 |
gpt-35-turbo (1106) |
Model GA Yang Lebih Lama - Mode JSON - panggilan fungsi paralel - output yang dapat direproduksi (pratinjau) |
Input: 16.385 Output: 4.096 |
Sep 2021 |
gpt-35-turbo-instruct (0914) |
Titik akhir penyelesaian saja - Penggantian untuk model penyelesaian warisan |
4,097 | Sep 2021 |
gpt-35-turbo-16k (0613) |
Model GA Yang Lebih Lama - Panggilan fungsi dasar dengan alat |
16,384 | Sep 2021 |
gpt-35-turbo (0613) |
Model GA Yang Lebih Lama - Panggilan fungsi dasar dengan alat |
4,096 | Sep 2021 |
gpt-35-turbo 1 (0301) |
Model GA Yang Lebih Lama - Informasi penghentian |
4,096 | Sep 2021 |
Untuk mempelajari selengkapnya tentang cara berinteraksi dengan GPT-3.5 Turbo dan API Penyelesaian Obrolan, lihat panduan mendalam kami.
1 Model ini akan menerima permintaan > 4.096 token. Tidak disarankan untuk melebihi batas token input 4.096 karena versi model yang lebih baru dibatasi pada 4.096 token. Jika Anda mengalami masalah saat melebihi 4.096 token input dengan model ini, konfigurasi ini tidak didukung secara resmi.
Penyematan
text-embedding-3-large
adalah model penyematan terbaru dan paling mampu. Peningkatan antara model penyematan tidak dimungkinkan. Untuk berpindah dari penggunaan text-embedding-ada-002
ke text-embedding-3-large
Anda perlu membuat penyematan baru.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Dalam pengujian, OpenAI melaporkan model penyematan generasi ketiga besar dan kecil menawarkan performa pengambilan multibahasa rata-rata yang lebih baik dengan tolok ukur MIRACL sambil tetap mempertahankan performa untuk tugas bahasa Inggris dengan tolok ukur MTEB .
Tolok Ukur Evaluasi | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Rata-rata MIRACL | 31,4 | 44.0 | 54.9 |
Rata-rata MTEB | 61.0 | 62,3 | 64.6 |
Model penyematan generasi ketiga mendukung pengurangan ukuran penyematan melalui parameter baru dimensions
. Biasanya penyematan yang lebih besar lebih mahal dari perspektif komputasi, memori, dan penyimpanan. Mampu menyesuaikan jumlah dimensi memungkinkan lebih banyak kontrol atas biaya dan performa keseluruhan. Parameter dimensions
tidak didukung di semua versi pustaka OpenAI 1.x Python, untuk memanfaatkan parameter ini, sebaiknya tingkatkan ke versi terbaru: pip install openai --upgrade
.
Pengujian tolok ukur MTEB OpenAI menemukan bahwa bahkan ketika dimensi model generasi ketiga dikurangi menjadi kurang dari text-embeddings-ada-002
1.536 dimensi performa tetap sedikit lebih baik.
DALL-E
Model DALL-E menghasilkan gambar dari perintah teks yang disediakan pengguna. DALL-E 3 umumnya tersedia untuk digunakan dengan REST API. DALL-E 2 dan DALL-E 3 dengan SDK klien sedang dalam pratinjau.
Bisik
Model Whisper dapat digunakan untuk ucapan ke teks.
Anda juga dapat menggunakan model Whisper melalui API transkripsi batch Ucapan Azure AI. Lihat Apa model Whisper? untuk mempelajari selengkapnya tentang kapan menggunakan Azure AI Speech vs. Azure OpenAI Service.
Teks ke ucapan (Pratinjau)
Teks OpenAI ke model ucapan, yang saat ini dalam pratinjau, dapat digunakan untuk mensintesis teks ke ucapan.
Anda juga dapat menggunakan teks OpenAI untuk suara ucapan melalui Azure AI Speech. Untuk mempelajari selengkapnya, lihat Teks OpenAI ke suara ucapan melalui Azure OpenAI Service atau melalui panduan Azure AI Speech .
Tabel ringkasan model dan ketersediaan wilayah
Catatan
Artikel ini terutama mencakup ketersediaan model/wilayah yang berlaku untuk semua pelanggan Azure OpenAI dengan jenis penyebaran Standar. Beberapa pelanggan tertentu memiliki akses ke kombinasi model/wilayah yang tidak tercantum dalam tabel terpadu di bawah ini. Untuk informasi selengkapnya tentang Penyebaran yang disediakan, lihat Panduan yang disediakan.
Ketersediaan model penyebaran standar
Wilayah | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4-32k, 0613 | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | penyematan teks-3-kecil, 1 | text-embedding-3-large, 1 | dall-e-2, 2.0 | dall-e-3, 3.0 | babbage-002, 1 | davinci-002, 1 | tts, 001 | tts-hd, 001 | bisikan, 001 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | ✅ | - | ✅ | - | - | ✅ | - | - | - | ✅ | - | - | - | - | - |
brazilsouth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
canadaeast | ✅ | ✅ | - | - | - | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
eastus | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ |
FranceCentral | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
japaneast | - | - | - | ✅ | - | - | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
northcentralus | - | - | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | ✅ | - | - | ✅ | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
southafricanorth | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - | - |
southindia | - | ✅ | - | - | - | - | - | - | - | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | ✅ |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | - | ✅ | - | ✅ | - | - | ✅ | - | - | ✅ | - | - | - | - | - | - | - | - | - |
uksouth | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ |
westus | - | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - |
westus3 | - | ✅ | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - |
Tabel ini tidak menyertakan ketersediaan regional penyebaran model standar global untuk GPT-4o, atau menyempurnakan informasi ketersediaan regional. Lihat bagian penyebaran standar global khusus dan bagian penyempurnaan untuk informasi ini.
Kuota model penyebaran standar dan global
Wilayah | GPT-4 | GPT-4-32K | GPT-4-Turbo | GPT-4-Turbo-V | gpt-4o | gpt-4o - GlobalStandard | GPT-35-Turbo | GPT-35-Turbo-Instruct | Text-Embedding-Ada-002 | text-embedding-3-small | text-embedding-3-large | Babbage-002 | Babbage-002 - finetune | Davinci-002 | Davinci-002 - finetune | GPT-35-Turbo - finetune | GPT-35-Turbo-1106 - finetune | GPT-4 - finetune | GPT-35-Turbo-0125 - finetune |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
australiaeast | 40 K | 80 K | 80 K | 30 K | - | 450 K 10 M |
300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
brazilsouth | - | - | - | - | - | 450 K 10 M |
- | - | 350 K | - | - | - | - | - | - | - | - | - | - |
canadaeast | 40 K | 80 K | 80 K | - | - | 450 K 10 M |
300 K | - | 350 K | 350 K | 350 K | - | - | - | - | - | - | - | - |
eastus | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
240 K | 240 K | 240 K | 350 K | 350 K | - | - | - | - | - | - | - | - |
eastus2 | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
300 K | - | 350 K | 350 K | 350 K | - | - | - | - | 250 K | 250 K | - | 250 K |
FranceCentral | 20 K | 60 K | 80 K | - | - | 450 K 10 M |
240 K | - | 240 K | - | 350 K | - | - | - | - | - | - | - | - |
germanywestcentral | - | - | - | - | - | 450 K 10 M |
- | - | - | - | - | - | - | - | - | - | - | - | - |
japaneast | - | - | - | 30 K | - | 450 K 10 M |
300 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
koreacentral | - | - | - | - | - | 450 K 10 M |
- | - | - | - | - | - | - | - | - | - | - | - | - |
northcentralus | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
300 K | - | 350 K | - | - | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 100 K | 250 K |
norwayeast | - | - | 150 K | - | - | 450 K 10 M |
- | - | 350 K | - | - | - | - | - | - | - | - | - | - |
polandcentral | - | - | - | - | - | 450 K 10 M |
- | - | - | - | - | - | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | 450 K 10 M |
- | - | 350 K | - | - | - | - | - | - | - | - | - | - |
southcentralus | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
240 K | - | 240 K | - | - | - | - | - | - | - | - | - | - |
southindia | - | - | 150 K | - | - | 450 K 10 M |
300 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
swedencentral | 40 K | 80 K | 150 K | 30 K | 150 K 1 M |
450 K 10 M |
300 K | 240 K | 350 K | - | 350 K | 240 K | 250 K | 240 K | 250 K | 250 K | 250 K | 100 K | 250 K |
switzerlandnorth | 40 K | 80 K | - | 30 K | - | 450 K 10 M |
300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
switzerlandwest | - | - | - | - | - | - | - | - | - | - | - | - | 250 K | - | 250 K | 250 K | 250 K | - | 250 K |
uksouth | - | - | 80 K | - | - | 450 K 10 M |
240 K | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | 450 K 10 M |
240 K | - | 240 K | - | - | - | - | - | - | - | - | - | - |
westus | - | - | 80 K | 30 K | 150 K 1 M |
450 K 10 M |
300 K | - | 350 K | - | - | - | - | - | - | - | - | - | - |
westus3 | - | - | 80 K | - | 150 K 1 M |
450 K 10 M |
- | - | 350 K | - | 350 K | - | - | - | - | - | - | - | - |
Ketersediaan model penyebaran yang disediakan
Wilayah | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4-32k, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
brazilsouth | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | - |
canadacentral | ✅ | - | - | - | - | ✅ | - | ✅ |
canadaeast | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | - |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
FranceCentral | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ |
germanywestcentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
japaneast | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ |
koreacentral | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | - |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
norwayeast | ✅ | - | ✅ | - | - | ✅ | - | - |
polandcentral | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ |
southafricanorth | ✅ | ✅ | - | - | - | ✅ | ✅ | - |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
southindia | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
switzerlandwest | - | - | - | - | - | - | - | ✅ |
uksouth | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Catatan
Versi Versi yang disediakan gpt-4
: turbo-2024-04-09
saat ini hanya terbatas pada teks.
Bagaimana cara mendapatkan akses ke Provisioned?
Anda perlu berbicara dengan tim penjualan/akun Microsoft Anda untuk memperoleh throughput yang disediakan. Jika Anda tidak memiliki tim penjualan/akun, sayangnya saat ini, Anda tidak dapat membeli throughput yang disediakan.
Untuk informasi selengkapnya tentang Penyebaran yang disediakan, lihat Panduan yang disediakan.
Ketersediaan model standar global
Model yang didukung:
gpt-4o
Versi:2024-05-13
Wilayah yang didukung:
- australiaeast
- brazilsouth
- canadaeast
- eastus
- eastus2
- FranceCentral
- germanywestcentral
- japaneast
- koreacentral
- northcentralus
- norwayeast
- polandcentral
- southafricanorth
- southcentralus
- southindia
- swedencentral
- switzerlandnorth
- uksouth
- westeurope
- westus
- westus3
Ketersediaan model GPT-4 dan GPT-4 Turbo
Wilayah cloud publik
Wilayah | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, vision-preview | gpt-4, turbo-2024-04-09 | gpt-4o, 2024-05-13 | gpt-4-32k, 0613 |
---|---|---|---|---|---|---|---|
australiaeast | ✅ | ✅ | - | ✅ | - | - | ✅ |
canadaeast | ✅ | ✅ | - | - | - | - | ✅ |
eastus | - | - | ✅ | - | - | ✅ | - |
eastus2 | - | ✅ | - | - | ✅ | ✅ | - |
FranceCentral | ✅ | ✅ | - | - | - | - | ✅ |
japaneast | - | - | - | ✅ | - | - | - |
northcentralus | - | - | ✅ | - | - | ✅ | - |
norwayeast | - | ✅ | - | - | - | - | - |
southcentralus | - | - | ✅ | - | - | ✅ | - |
southindia | - | ✅ | - | - | - | - | - |
swedencentral | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ |
switzerlandnorth | ✅ | - | - | ✅ | - | - | ✅ |
uksouth | - | ✅ | ✅ | - | - | - | - |
westus | - | ✅ | - | ✅ | - | ✅ | - |
westus3 | - | ✅ | - | - | - | ✅ | - |
Pilih akses pelanggan
Selain wilayah di atas yang tersedia untuk semua pelanggan Azure OpenAI, beberapa pelanggan yang sudah ada sebelumnya telah diberikan akses ke versi GPT-4 di wilayah tambahan:
Model | Wilayah |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
US Timur Prancis Tengah US Tengah Selatan UK Selatan |
gpt-4 (0613) gpt-4-32k (0613) |
US Timur US Timur 2 Jepang Timur UK Selatan |
Kawasan Azure Government
Model GPT-4 berikut tersedia dengan Azure Government:
ID Model | Ketersediaan Model |
---|---|
gpt-4 (Pratinjau 1106) |
US Gov Virginia US Gov Arizona |
Model GPT-3.5
Penting
Model BARU gpt-35-turbo (0125)
memiliki berbagai peningkatan, termasuk akurasi yang lebih tinggi dalam merespons dalam format yang diminta dan perbaikan untuk bug yang menyebabkan masalah pengodean teks untuk panggilan fungsi non-bahasa Inggris.
GPT-3.5 Turbo digunakan bersamaan dengan API Chat Completion. GPT-3.5 Turbo versi 0301 juga dapat digunakan dengan API Penyelesaian, meskipun ini tidak disarankan. GPT-3.5 Turbo versi 0613 dan 1106 hanya mendukung API Penyelesaian Obrolan.
GPT-3.5 Turbo versi 0301 adalah versi pertama dari model yang dirilis. Versi 0613 adalah versi kedua dari model dan menambahkan dukungan panggilan fungsi.
Lihat versi model untuk mempelajari tentang cara Azure OpenAI Service menangani peningkatan versi model, dan bekerja dengan model untuk mempelajari cara melihat dan mengonfigurasi pengaturan versi model penyebaran GPT-3.5 Turbo Anda.
Ketersediaan model GPT-3.5-Turbo
Wilayah cloud publik
Wilayah | gpt-35-turbo, 0301 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 | gpt-35-turbo-instruct, 0914 |
---|---|---|---|---|---|---|
australiaeast | - | ✅ | ✅ | - | ✅ | - |
canadaeast | - | ✅ | ✅ | ✅ | ✅ | - |
eastus | ✅ | ✅ | - | - | ✅ | ✅ |
eastus2 | - | ✅ | - | - | ✅ | - |
FranceCentral | ✅ | ✅ | ✅ | - | ✅ | - |
japaneast | - | ✅ | - | - | ✅ | - |
northcentralus | - | ✅ | - | ✅ | ✅ | - |
southcentralus | ✅ | - | - | ✅ | - | - |
southindia | - | - | ✅ | - | - | - |
swedencentral | - | ✅ | ✅ | - | ✅ | ✅ |
switzerlandnorth | - | ✅ | - | - | ✅ | - |
uksouth | ✅ | ✅ | ✅ | - | ✅ | - |
westeurope | ✅ | - | - | - | - | - |
westus | - | - | ✅ | - | - | - |
Kawasan Azure Government
Model turbo GPT-3.5 berikut tersedia dengan Azure Government:
ID Model | Ketersediaan Model |
---|---|
gpt-35-turbo (Pratinjau 1106) |
US Gov Virginia |
Model penyematan
Model ini hanya dapat digunakan dengan permintaan Embedding API.
Catatan
text-embedding-3-large
adalah model penyematan terbaru dan paling mampu. Peningkatan antara model penyematan tidak dimungkinkan. Untuk bermigrasi dari penggunaan text-embedding-ada-002
ke text-embedding-3-large
Anda perlu menghasilkan penyematan baru.
ID Model | Permintaan Maks (token) | Dimensi Output | Data Pelatihan (up-to) |
---|---|---|---|
text-embedding-ada-002 (versi 2) |
8,191 | 1.536 | Sep 2021 |
text-embedding-ada-002 (versi 1) |
2,046 | 1.536 | Sep 2021 |
text-embedding-3-large |
8,191 | 3.072 | Sep 2021 |
text-embedding-3-small |
8,191 | 1.536 | Sep 2021 |
Catatan
Saat mengirim array input untuk penyematan, jumlah maksimum item input dalam array per panggilan ke titik akhir penyematan adalah 2048.
Wilayah cloud publik
Wilayah | text-embedding-ada-002, 1 | text-embedding-ada-002, 2 | penyematan teks-3-kecil, 1 | text-embedding-3-large, 1 |
---|---|---|---|---|
australiaeast | - | ✅ | - | - |
brazilsouth | - | ✅ | - | - |
canadaeast | - | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ |
eastus2 | - | ✅ | ✅ | ✅ |
FranceCentral | - | ✅ | - | ✅ |
japaneast | - | ✅ | - | ✅ |
northcentralus | - | ✅ | - | - |
norwayeast | - | ✅ | - | - |
southafricanorth | - | ✅ | - | - |
southcentralus | ✅ | ✅ | - | - |
southindia | - | ✅ | - | ✅ |
swedencentral | - | ✅ | - | ✅ |
switzerlandnorth | - | ✅ | - | - |
uksouth | - | ✅ | - | ✅ |
westeurope | - | ✅ | - | - |
westus | - | ✅ | - | - |
westus3 | - | ✅ | - | ✅ |
Kawasan Azure Government
Model Embeddings berikut tersedia dengan Azure Government:
ID Model | Ketersediaan Model |
---|---|
text-embedding-ada-002 (versi 2) |
US Gov Virginia US Gov Arizona |
Model DALL-E
ID Model | Ketersediaan Fitur | Permintaan Maks (karakter) |
---|---|---|
dalle2 (pratinjau) | AS Timur | 1,000 |
dall-e-3 | US Timur, Australia Timur, Swedia Tengah | 4.000 |
Menyempurnakan model
babbage-002
dan davinci-002
tidak dilatih untuk mengikuti instruksi. Mengkueri model dasar ini hanya boleh dilakukan sebagai titik referensi ke versi yang disempurnakan untuk mengevaluasi kemajuan pelatihan Anda.
gpt-35-turbo
- penyempurnaan model ini terbatas pada subset wilayah, dan tidak tersedia di setiap wilayah model dasar tersedia.
ID Model | Menyempurnakan Wilayah | Permintaan Maks (token) | Data Pelatihan (hingga) |
---|---|---|---|
babbage-002 |
US Tengah Utara Swedia Tengah Swiss Barat |
16,384 | Sep 2021 |
davinci-002 |
US Tengah Utara Swedia Tengah Swiss Barat |
16,384 | Sep 2021 |
gpt-35-turbo (0613) |
US Timur2 US Tengah Utara Swedia Tengah Swiss Barat |
4,096 | Sep 2021 |
gpt-35-turbo (1106) |
US Timur2 US Tengah Utara Swedia Tengah Swiss Barat |
Input: 16.385 Output: 4.096 |
Sep 2021 |
gpt-35-turbo (0125) |
US Timur2 US Tengah Utara Swedia Tengah Swiss Barat |
16,385 | Sep 2021 |
gpt-4 (0613) 1 |
US Tengah Utara Swedia Tengah |
8192 | Sep 2021 |
11 Penyempurnaan GPT-4 saat ini dalam pratinjau publik. Lihat panduan evaluasi keselamatan penyempurnaan GPT-4 kami untuk informasi selengkapnya.
Model bisikan
ID Model | Ketersediaan Model | Permintaan Maks (ukuran file audio) |
---|---|---|
whisper |
US Timur 2 US Tengah Utara Norwegia Timur India Selatan Swedia Tengah Eropa Barat |
25 MB |
Model teks ke ucapan (Pratinjau)
ID Model | Ketersediaan Model |
---|---|
tts-1 |
US Tengah Utara Swedia Tengah |
tts-1-hd |
US Tengah Utara Swedia Tengah |
Asisten (Pratinjau)
Untuk Asisten, Anda memerlukan kombinasi model yang didukung, dan wilayah yang didukung. Alat dan kemampuan tertentu memerlukan model terbaru. Model berikut tersedia di Assistants API, SDK, Azure AI Studio, dan Azure OpenAI Studio. Tabel berikut ini adalah untuk bayar sesuai penggunaan. Untuk informasi tentang ketersediaan Unit Throughput yang Disediakan (PTU), lihat throughput yang disediakan. Model dan wilayah yang tercantum dapat digunakan dengan Asisten v1 dan v2.
Wilayah | gpt-35-turbo (0613) |
gpt-35-turbo (1106) |
fine tuned gpt-3.5-turbo-0125 |
gpt-4 (0613) |
gpt-4 (1106) |
gpt-4 (0125) |
gpt-4o (2024-05-13) |
---|---|---|---|---|---|---|---|
Australia Timur | ✅ | ✅ | ✅ | ✅ | |||
AS Timur | ✅ | ✅ | ✅ | ||||
AS Timur 2 | ✅ | ✅ | ✅ | ✅ | ✅ | ||
Prancis Tengah | ✅ | ✅ | ✅ | ✅ | |||
Jepang Timur | ✅ | ||||||
Norwegia Timur | ✅ | ||||||
Swedia Tengah | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | |
UK Selatan | ✅ | ✅ | ✅ | ✅ | |||
US Barat | ✅ | ✅ | ✅ | ||||
AS Barat 3 | ✅ | ✅ |
Penghentian model
Untuk informasi terbaru tentang penghentian model, lihat panduan penghentian model.
Langkah berikutnya
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk