Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Azure OpenAI didukung oleh beragam model dengan kemampuan dan titik harga yang berbeda. Ketersediaan model bervariasi menurut wilayah dan cloud. Untuk ketersediaan model Azure Government, silakan merujuk ke Layanan OpenAI Azure Government.
Model | Deskripsi |
---|---|
codex-mini | Versi o4-mini yang disempurnakan. |
Seri GPT-4.1 | Rilis model terbaru dari Azure OpenAI |
model router | Model yang secara cerdas memilih dari sekumpulan model obrolan yang mendasar untuk menanggapi perintah tertentu. |
pratinjau-penggunaan-komputer | Model eksperimental yang dilatih untuk digunakan dengan alat API Respons untuk penggunaan komputer. |
Pratinjau GPT-4.5 | Model GPT terbaru yang unggul pada tugas teks dan gambar yang beragam. |
model seri o | Model penalaran dengan pemecahan masalah tingkat lanjut dan peningkatan fokus dan kemampuan. |
GPT-4o & GPT-4o mini & GPT-4 Turbo | Model Azure OpenAI terbaru yang paling mampu dengan versi multimodal, yang dapat menerima teks dan gambar sebagai input. |
GPT-4 | Serangkaian model yang meningkat pada GPT-3.5 dan dapat memahami dan menghasilkan bahasa dan kode alami. |
GPT-3.5 | Serangkaian model yang meningkat pada GPT-3 dan dapat memahami dan menghasilkan bahasa dan kode alami. |
Embedding | Sekumpulan model yang dapat mengubah teks menjadi bentuk vektor numerik untuk memfasilitasi kesamaan teks. |
Pembuatan gambar | Serangkaian model yang dapat menghasilkan gambar asli dari bahasa alami. |
Audio | Serangkaian model untuk dari ucapan ke teks, terjemahan, dan dari teks ke ucapan. Model audio GPT-4o mendukung latensi rendah, interaksi percakapan "ucapan masuk, ucapan keluar" atau pembuatan audio. |
Seri GPT 4.1
Ketersediaan regional
Modél | Wilayah |
---|---|
gpt-4.1 (2025-04-14) |
Lihat tabel model. |
gpt-4.1-nano (2025-04-14) |
Lihat tabel model. |
gpt-4.1-mini (2025-04-14) |
Lihat tabel model. |
Kemampuan
Identifikasi Model | Deskripsi | Jendela Kontekstual | Token Output Maksimum | Data Pelatihan (sampai) |
---|---|---|---|---|
gpt-4.1 (2025-04-14) |
- Input teks dan gambar Hasil Teks - API penyelesaian otomatis obrolan - Respons API -Streaming - Pemanggilan fungsi Output terstruktur (hasil akhir percakapan) |
- 1,047,576 - 128.000 (penempatan terkelola yang ditentukan) - 300.000 (penyebaran batch) |
32.768 | Mei 31, 2024 |
gpt-4.1-nano (2025-04-14) |
- Input teks dan gambar Hasil Teks - API penyelesaian otomatis obrolan - Respons API -Streaming - Pemanggilan fungsi Output terstruktur (hasil akhir percakapan) |
- 1,047,576 - 128.000 (penempatan terkelola yang ditentukan) - 300.000 (penyebaran batch) |
32.768 | Mei 31, 2024 |
gpt-4.1-mini (2025-04-14) |
- Input teks dan gambar Hasil Teks - API penyelesaian otomatis obrolan - Respons API -Streaming - Pemanggilan fungsi Output terstruktur (hasil akhir percakapan) |
- 1,047,576 - 128.000 (penempatan terkelola yang ditentukan) - 300.000 (penyebaran batch) |
32.768 | Mei 31, 2024 |
router model
Model yang secara cerdas memilih dari sekumpulan model obrolan yang mendasar untuk menanggapi perintah tertentu.
Ketersediaan regional
Modél | Wilayah |
---|---|
model-router (2025-05-19) |
US Timur 2 (Standar Global), Swedia Tengah (Standar Global) |
Kemampuan
Identifikasi Model | Deskripsi | Jendela Kontekstual | Token Output Maksimum | Data Pelatihan (sampai) |
---|---|---|---|---|
model-router (2025-05-19) |
Model yang secara cerdas memilih dari sekumpulan model obrolan yang mendasar untuk menanggapi perintah tertentu. | 200,000* | 32768 (seri GPT 4.1) 100 K (o4-mini) |
Mei 31, 2024 |
*Jendela konteks yang lebih besar kompatibel dengan beberapa model yang mendasar, yang berarti panggilan API dengan konteks yang lebih besar hanya akan berhasil jika prompt kebetulan dirutekan ke model yang tepat, jika tidak, panggilan akan gagal.
pratinjau penggunaan komputer
Model eksperimental yang dilatih untuk digunakan dengan alat API Respons untuk penggunaan komputer. Ini dapat digunakan bersama pustaka pihak ketiga untuk memungkinkan model mengontrol input mouse dan keyboard sambil mendapatkan konteks dari tangkapan layar lingkungan saat ini.
Perhatian
Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi GA stabil terbaru. Model yang berlabel pratinjau tidak mengikuti siklus hidup model standar Azure OpenAI.
Ketersediaan
Untuk mendapatkan akses ke computer-use-preview
pendaftaran diperlukan, dan akses akan diberikan berdasarkan kriteria kelayakan yang ditentukan oleh Microsoft. Pelanggan yang memiliki akses ke model akses terbatas lainnya masih perlu meminta akses untuk model ini.
Minta akses: computer-use-preview
aplikasi model akses terbatas
Setelah akses diberikan, Anda harus membuat penerapan untuk model tersebut.
Ketersediaan regional
Modél | Wilayah |
---|---|
computer-use-preview |
Lihat tabel model. |
Kemampuan
Identifikasi Model | Deskripsi | Jendela Kontekstual | Token Output Maksimum | Data Pelatihan (sampai) |
---|---|---|---|---|
computer-use-preview (2025-03-11) |
Model khusus untuk digunakan dengan API Responses sebagai alat penggunaan komputer. -Alat -Penyiaran Langsung -Teks (input/output) - Gambar(masukan) |
8,192 | 1,024 | Okt 2023 |
Pratinjau GPT-4.5
Ketersediaan regional
Modél | Wilayah |
---|---|
gpt-4.5-preview |
Lihat tabel model. |
Kemampuan
Identifikasi Model | Deskripsi | Jendela Kontekstual | Token Output Maksimum | Data Pelatihan (sampai) |
---|---|---|---|---|
gpt-4.5-preview (2025-02-27) Pratinjau GPT-4.5 |
GPT 4.1 adalah pengganti yang direkomendasikan untuk model ini. Unggul dalam berbagai tugas teks dan gambar. - Output terstruktur - Penyimpanan sementara prompt -Perkakas -Streaming - Teks(masuk/keluar) - Gambar(masukan) |
128.000 | 16,384 | Okt 2023 |
Nota
Perilaku yang diharapkan adalah bahwa model memang tidak dapat menjawab pertanyaan tentang dirinya sendiri. Jika Anda ingin mengetahui kapan batas pengetahuan untuk data pelatihan model, atau detail lain mengenai model, Anda harus merujuk ke dokumentasi model di atas.
model dari seri o
Model seri o* Azure OpenAI dirancang khusus untuk mengatasi tugas penalaran dan pemecahan masalah dengan peningkatan fokus dan kemampuan. Model-model ini menghabiskan lebih banyak waktu untuk memproses dan memahami permintaan pengguna, membuatnya sangat kuat di bidang-bidang seperti sains, pengodean, dan matematika dibandingkan dengan iterasi sebelumnya.
Identifikasi Model | Deskripsi | Permintaan Maksimum (token) | Data Pelatihan (sampai) |
---|---|---|---|
codex-mini (2025-05-16) |
Versi o4-mini yang disempurnakan. - API Tanggapan Hasil yang terstruktur - Teks, pemrosesan gambar - Fungsi/Alat Ringkasan lengkap kemampuan |
Masukan: 200.000 Keluaran: 100.000 |
Mei 31, 2024 |
o3-pro (2025-06-10) |
-
API Tanggapan Hasil yang terstruktur - Teks, pemrosesan gambar - Fungsi/Alat Ringkasan lengkap kemampuan |
Masukan: 200.000 Keluaran: 100.000 |
Mei 31, 2024 |
o4-mini (2025-04-16) |
-
Model penalaran BARU, menawarkan kemampuan penalaran yang ditingkatkan. - API Penyelesaian Percakapan - API Tanggapan Hasil yang terstruktur - Teks, pemrosesan gambar - Fungsi/Alat Ringkasan lengkap kemampuan |
Masukan: 200.000 Keluaran: 100.000 |
Mei 31, 2024 |
o3 (2025-04-16) |
-
Model penalaran BARU, menawarkan kemampuan penalaran yang ditingkatkan. - API Penyelesaian Percakapan - API Tanggapan Hasil yang terstruktur - Teks, pemrosesan gambar - Fungsi/Peralatan/Pemanggilan alat paralel Ringkasan lengkap kemampuan |
Masukan: 200.000 Keluaran: 100.000 |
Mei 31, 2024 |
o3-mini (2025-01-31) |
-
Kemampuan penalaran yang ditingkatkan. Hasil yang terstruktur - Pemrosesan teks saja - Fungsi/Alat |
Masukan: 200.000 Keluaran: 100.000 |
Okt 2023 |
o1 (2024-12-17) |
-
Kemampuan penalaran yang ditingkatkan. Hasil yang terstruktur - Teks, pemrosesan gambar - Fungsi/Alat |
Masukan: 200.000 Keluaran: 100.000 |
Okt 2023 |
o1-preview (2024-09-12) |
Versi pratinjau yang lebih lama | Masukan: 128.000 Keluaran: 32.768 |
Okt 2023 |
o1-mini (2024-09-12) |
Opsi yang lebih cepat dan lebih hemat biaya dalam seri o1, ideal untuk tugas pengkodan yang membutuhkan kecepatan dan konsumsi sumber daya yang lebih rendah. Penyebaran standar global tersedia secara default. Penyebaran standar (regional) saat ini hanya tersedia bagi pelanggan tertentu yang telah mendapat akses melalui rilis akses terbatas o1-preview . |
Masukan: 128.000 Keluaran: 65.536 |
Okt 2023 |
Ketersediaan
Untuk mempelajari selengkapnya tentang model tingkat lanjut o-series
, lihat mulai menggunakan model penalaran.
Ketersediaan regional
Modél | Wilayah |
---|---|
codex-mini |
US Timur2 dan Swedia Tengah (Standar Global) |
o3-pro |
US Timur2 dan Swedia Tengah (Standar Global) |
o4-mini |
Lihat tabel model. |
o3 |
Lihat tabel model. |
o3-mini |
Lihat tabel model. |
o1 |
Lihat tabel model. |
o1-preview |
Lihat tabel model. Model ini hanya tersedia untuk pelanggan yang diberikan akses sebagai bagian dari akses terbatas asli |
o1-mini |
Lihat tabel model. |
GPT-4o dan GPT-4 Turbo
GPT-4o mengintegrasikan teks dan gambar dalam satu model, memungkinkannya menangani beberapa jenis data secara bersamaan. Pendekatan multimodal ini meningkatkan akurasi dan responsivitas dalam interaksi manusia-komputer. GPT-4o sejajar dengan GPT-4 Turbo dalam tugas teks dan pengodean berbahasa Inggris sekaligus memberikan performa unggul dalam tugas berbahasa non-Inggris dan tugas visi, menetapkan standar baru untuk kemampuan AI.
Bagaimana cara mengakses model GPT-4o dan GPT-4o mini?
GPT-4o dan GPT-4o mini tersedia untuk penyebaran model standar dan standar global .
Anda perlu membuat atau menggunakan sumber daya yang ada pada standar yang didukung atau wilayah standar global di mana model tersedia.
Setelah sumber daya Anda dibuat, Anda dapat menyebarkan model GPT-4o. Jika Anda melakukan penyebaran terprogram, nama modelnya adalah:
-
gpt-4o
Versi2024-11-20
-
gpt-4o
Versi2024-08-06
-
gpt-4o
Versi2024-05-13
-
gpt-4o-mini
Versi2024-07-18
GPT-4 Turbo
GPT-4 Turbo adalah model multimodal besar (menerima input teks atau gambar dan menghasilkan teks) yang dapat memecahkan masalah sulit dengan akurasi yang lebih besar daripada model OpenAI sebelumnya. Seperti GPT-3.5 Turbo, model GPT-4 yang lebih baru, dan model GPT-4 yang lebih lama, GPT-4 Turbo dioptimalkan untuk obrolan dan berfungsi dengan baik untuk tugas penyelesaian tradisional.
GPT-4
GPT-4 adalah pendahulu GPT-4 Turbo. Model GPT-4 dan GPT-4 Turbo memiliki nama model dasar gpt-4
. Anda dapat membedakan antara model GPT-4 dan Turbo dengan memeriksa versi model.
-
gpt-4
Versi0314
-
gpt-4
Versi0613
-
gpt-4-32k
Versi0613
Anda dapat melihat panjang konteks token yang didukung oleh setiap model dalam tabel ringkasan model.
Model GPT-4 dan GPT-4 Turbo
- Model ini hanya dapat digunakan dengan API Penyelesaian Obrolan.
Lihat versi model untuk mempelajari tentang cara Azure OpenAI menangani peningkatan versi model, dan bekerja dengan model untuk mempelajari cara melihat dan mengonfigurasi pengaturan versi model penyebaran GPT-4 Anda.
Identifikasi Model | Deskripsi | Permintaan Maksimum (token) | Data Pelatihan (sampai) |
---|---|---|---|
gpt-4o (2024-11-20) GPT-4o (Omni) |
Model GA besar terbaru Hasil yang terstruktur - Teks, pemrosesan gambar - Mode JSON - panggilan fungsi paralel - Akurasi dan responsivitas yang ditingkatkan - Kesetaraan dengan tugas teks dan pengodean dalam bahasa Inggris dibandingkan dengan GPT-4 Turbo dengan Visi - Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi. - Kemampuan penulisan kreatif yang ditingkatkan |
Masukan: 128.000 Keluaran: 16.384 |
Okt 2023 |
gpt-4o (2024-08-06) GPT-4o (Omni) |
Hasil yang terstruktur - Teks, pemrosesan gambar - Mode JSON - panggilan fungsi paralel - Akurasi dan responsivitas yang ditingkatkan - Kesetaraan dengan tugas teks dan pengodean dalam bahasa Inggris dibandingkan dengan GPT-4 Turbo dengan Visi - Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi |
Masukan: 128.000 Output: 16.384 |
Okt 2023 |
gpt-4o-mini (2024-07-18) GPT-4o mini |
Model GA kecil terbaru - Model yang cepat, murah, dan mampu ideal untuk mengganti model seri GPT-3.5 Turbo. - Teks, pemrosesan gambar - Mode JSON - panggilan fungsi paralel |
Masukan: 128.000 Output: 16,384 |
Okt 2023 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
Teks, pemrosesan gambar - Mode JSON - panggilan fungsi paralel - Akurasi dan responsivitas yang ditingkatkan - Kesetaraan dengan tugas teks dan pengodean dalam bahasa Inggris dibandingkan dengan GPT-4 Turbo dengan Visi - Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi |
Masukan: 128.000 Keluaran: 4.096 |
Okt 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo dengan Fitur Penglihatan |
Model GA baru - Penggantian untuk semua model pratinjau GPT-4 sebelumnya ( vision-preview , 1106-Preview , 0125-Preview ). - Ketersediaan fitur saat ini berbeda tergantung pada metode input, dan jenis penyebaran. |
Masukan: 128.000 Keluaran: 4.096 |
Desember 2023 |
gpt-4-32k (0613) |
Model GA yang lebih lama - Pemanggilan fungsi dasar dengan alat |
32.768 | Sep 2021 |
gpt-4 (0613) |
Model GA yang lebih lama - Pemanggilan fungsi dasar dengan alat |
8,192 | Sep 2021 |
gpt-4-32k (0314) |
Model GA yang lebih lama - Informasi penghentian |
32.768 | Sep 2021 |
gpt-4 (0314) |
Model GA yang lebih lama - Informasi penghentian |
8,192 | Sep 2021 |
Perhatian
Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi GA stabil terbaru. Model yang berlabel pratinjau tidak mengikuti siklus hidup model standar Azure OpenAI.
GPT-3.5
Model GPT-3.5 dapat memahami dan menghasilkan bahasa atau kode alami. Model yang paling mampu dan hemat biaya dalam keluarga GPT-3.5 adalah GPT-3.5 Turbo, yang telah dioptimalkan untuk obrolan dan bekerja dengan baik untuk tugas penyelesaian tradisional juga. GPT-3.5 Turbo tersedia untuk digunakan dengan API Penyelesaian Obrolan. GPT-3.5 Turbo Instruct memiliki kemampuan serupa dengan text-davinci-003
menggunakan API Penyelesaian alih-alih API Penyelesaian Percakapan. Sebaiknya gunakan GPT-3.5 Turbo dan GPT-3.5 Turbo Instruct dibandingkan dengan model GPT-3.5 dan GPT-3 versi lama.
Identifikasi Model | Deskripsi | Permintaan Maksimum (token) | Data Pelatihan (sampai) |
---|---|---|---|
gpt-35-turbo (0125) BARU |
Model GA Terbaru - Mode JSON - panggilan fungsi paralel - hasil yang dapat direproduksi (pratinjau) - Akurasi yang lebih tinggi dalam merespons dalam format yang diminta. - Perbaikan untuk bug yang menyebabkan masalah pengodean teks untuk panggilan fungsi dalam bahasa selain Inggris. |
Input: 16,385 Keluaran: 4.096 |
Sep 2021 |
gpt-35-turbo (1106) |
Model GA Yang Lebih Lama - Mode JSON - panggilan fungsi paralel - hasil yang dapat direproduksi (pratinjau) |
Input: 16.385 Keluaran: 4.096 |
Sep 2021 |
gpt-35-turbo-instruct (0914) |
Titik akhir penyelesaian saja - Penggantian untuk model penyelesaian lama |
4,097 | Sep 2021 |
Untuk mempelajari selengkapnya tentang cara berinteraksi dengan GPT-3.5 Turbo dan API Penyelesaian Obrolan, lihat panduan mendalam kami.
1 Model ini akan menerima permintaan > 4.096 token. Tidak disarankan untuk melebihi batas token input 4.096 karena versi model yang lebih baru dibatasi pada 4.096 token. Jika Anda mengalami masalah saat melebihi 4.096 token input dengan model ini, konfigurasi ini tidak didukung secara resmi.
Pemadatan
text-embedding-3-large
adalah model penyisipan terbaru dan terkuat. Perpindahan atau peningkatan antar model penyematan tidak dimungkinkan. Untuk berpindah dari penggunaan text-embedding-ada-002
ke text-embedding-3-large
Anda perlu membuat penyematan baru.
text-embedding-3-large
text-embedding-3-small
text-embedding-ada-002
Dalam pengujian, OpenAI melaporkan model penyematan generasi ketiga besar dan kecil menawarkan performa pengambilan multibahasa rata-rata yang lebih baik dengan tolok ukur MIRACL sambil tetap mempertahankan performa untuk tugas bahasa Inggris dengan tolok ukur MTEB .
Tolok Ukur Penilaian | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
---|---|---|---|
Rata-rata MIRACL | 31,4 | 44.0 | 54.9 |
Rata-rata MTEB | 61.0 | 62,3 | 64.6 |
Model penyematan generasi ketiga mendukung pengurangan ukuran penyematan melalui parameter baru dimensions
. Biasanya penyematan yang lebih besar lebih mahal dari perspektif komputasi, memori, dan penyimpanan. Mampu menyesuaikan jumlah dimensi memungkinkan lebih banyak kontrol atas biaya dan performa keseluruhan. Parameter dimensions
tidak didukung di semua versi pustaka OpenAI 1.x Python, untuk memanfaatkan parameter ini, sebaiknya tingkatkan ke versi terbaru: pip install openai --upgrade
.
Pengujian tolok ukur MTEB OpenAI menemukan bahwa meskipun dimensi dari model generasi ketiga dikurangi untuk menjadi kurang dari text-embeddings-ada-002
1.536 dimensi, performanya masih sedikit lebih baik.
Model pembuatan gambar
Model pembuatan gambar menghasilkan gambar dari perintah teks yang disediakan pengguna. GPT-image-1 sedang dalam pratinjau publik dengan akses terbatas. DALL-E 3 umumnya tersedia untuk digunakan dengan REST API. DALL-E 2 dan DALL-E 3 dengan SDK klien masing-masing sedang dalam pratinjau.
Ketersediaan
Untuk mendapatkan akses ke gpt-image-1
pendaftaran diperlukan, dan akses akan diberikan berdasarkan kriteria kelayakan yang ditentukan oleh Microsoft. Pelanggan yang memiliki akses ke model akses terbatas lainnya masih perlu meminta akses untuk model ini.
Minta akses: gpt-image-1
aplikasi model akses terbatas
Setelah akses diberikan, Anda harus membuat penerapan untuk model tersebut.
Ketersediaan regional
Modél | Wilayah |
---|---|
dall-e-3 |
US Timur Australia Timur Swedia Tengah |
gpt-image-1 |
Wilayah Barat AS 3 (Standar Global) UAE Utara (Standar Global) Polandia Tengah (Standar Global) |
Model pembuatan video
Sora adalah model AI dari OpenAI yang dapat menciptakan adegan video yang realistis dan imajinatif dari instruksi teks. Sora sedang dalam tahap pratinjau publik.
Ketersediaan regional
Modél | Wilayah |
---|---|
sora |
US Timur 2 |
Model audio
Model audio di Azure OpenAI tersedia melalui realtime
API , , completions
dan audio
.
Model GPT-4o audio
Model audio GPT 4o adalah bagian dari keluarga model GPT-4o dan mendukung interaksi percakapan atau pembuatan audio latensi rendah, "ucapan masuk, ucapan keluar".
Perhatian
Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi GA stabil terbaru. Model yang berlabel pratinjau tidak mengikuti siklus hidup model standar Azure OpenAI.
Detail tentang token permintaan maksimum dan data pelatihan tersedia dalam tabel berikut.
Identifikasi Model | Deskripsi | Permintaan Maksimum (token) | Data Pelatihan (sampai) |
---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17) GPT-4o Audio |
Model audio untuk pembuatan audio dan teks. | Masukan: 128.000 Keluaran: 4.096 |
Okt 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) GPT-4o Audio |
Model audio untuk pemrosesan audio real time. | Masukan: 128.000 Keluaran: 4.096 |
Okt 2023 |
gpt-4o-audio-preview (2024-12-17) GPT-4o Audio |
Model audio untuk pembuatan audio dan teks. | Masukan: 128.000 Keluaran: 4.096 |
Okt 2023 |
gpt-4o-realtime-preview (2024-12-17) GPT-4o Audio |
Model audio untuk pemrosesan audio real time. | Masukan: 128.000 Keluaran: 4.096 |
Okt 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) GPT-4o Audio |
Model audio untuk pemrosesan audio real time. | Masukan: 128.000 Keluaran: 4.096 |
Okt 2023 |
Untuk membandingkan ketersediaan model audio GPT-4o di semua wilayah, lihat tabel model.
Audio API
Model audio melalui /audio
API dapat digunakan untuk ucapan ke teks, terjemahan, dan teks ke ucapan.
Model ucapan ke teks
Identifikasi Model | Deskripsi | Permintaan Maksimum (ukuran file audio) |
---|---|---|
whisper |
Model pengenalan ucapan tujuan umum. | 25 MB |
gpt-4o-transcribe |
Konversi suara ke teks ditenagai oleh GPT-4o. | 25 MB |
gpt-4o-mini-transcribe |
Konversi ucapan ke teks ditenagai oleh GPT-4o mini. | 25 MB |
Model terjemahan ucapan
Identifikasi Model | Deskripsi | Permintaan Maksimum (ukuran file audio) |
---|---|---|
whisper |
Model pengenalan ucapan tujuan umum. | 25 MB |
Model teks ke ucapan (Pratinjau)
Identifikasi Model | Deskripsi |
---|---|
tts |
Teknologi teks ke ucapan dioptimalkan untuk kecepatan tinggi. |
tts-hd |
Teks ke suara dioptimalkan untuk kualitas. |
gpt-4o-mini-tts |
Model teks ke ucapan yang didukung oleh GPT-4o mini. Anda dapat memandu suara untuk berbicara dengan gaya atau nada. |
Untuk informasi selengkapnya lihat Ketersediaan wilayah model audio di artikel ini.
Tabel ringkasan model dan ketersediaan wilayah
Model menurut jenis penyebaran
Azure OpenAI memberi pelanggan pilihan pada struktur hosting yang sesuai dengan pola bisnis dan penggunaan mereka. Layanan ini menawarkan dua jenis penyebaran utama:
- Standar ditawarkan dengan opsi penyebaran global, merutekan lalu lintas secara global untuk memberikan throughput yang lebih tinggi.
- Provisioned juga ditawarkan dengan opsi penyebaran global, memungkinkan pelanggan untuk membeli dan menyebarkan unit throughput yang disediakan di seluruh infrastruktur global Azure.
Semua penyebaran dapat melakukan operasi inferensi yang persis sama, namun penagihan, skala, dan performanya berbeda secara signifikan. Untuk mempelajari selengkapnya tentang jenis penyebaran Azure OpenAI, lihat panduan jenis penyebaran kami.
- Standar Global
- Dikelola Secara Global
- Global Batch
- Standar Data Zona
- Zona Data Yang Disediakan Terkelola
- Pengelolaan Kumpulan Data
- Standar
- Pengelolaan yang Disediakan
Ketersediaan model standar global
Wilayah | o3-pro, 2025-06-10 | codex-mini, 2025-05-16 | model-router, 2025-05-19 | o3, 2025-04-16 | o4-mini, 2025-04-16 | gpt-image-1, 2025-04-15 | gpt-4.1, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | pratinjau-penggunaan-komputer, 2025-03-11 | gpt-4.5-preview, 2025-02-27 | o3-mini, 2025-01-31 | o1, 2024-12-17 | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | gpt-4, turbo-2024-04-09 | penyematan teks-3-kecil, 1 | text-embedding-3-large, 1 | text-embedding-ada-002, 2 | gpt-4o-realtime-preview, 2024-12-17 | gpt-4o-audio-preview, 2024-12-17 | gpt-4o-mini-realtime-preview, 2024-12-17 | gpt-4o-mini-audio-preview, 2024-12-17 | gpt-4o-transcribe, 2025-03-20 | gpt-4o-mini-tts, 2025-03-20 | gpt-4o-mini-transcribe, 2025-03-20 |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
Australia bagian timur | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Brasil Selatan | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
kanada timur | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
eastus | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | - | - | - |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
FranceCentral | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Jerman Barat Tengah | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Italia Utara | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Jepang Timur | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
koreacentral | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
northcentralus | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Norwegia Timur | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
polandcentral | - | - | - | - | - | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
southafricanorth | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
southcentralus | - | - | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
India Selatan | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
spaincentral | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | ✅ |
Swiss bagian Utara | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
uaenorth | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
uksouth | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westeurope | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westus | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
westus3 | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - |
Nota
o1-mini
saat ini tersedia untuk semua pelanggan untuk penyebaran standar global.
Pelanggan tertentu diberikan akses untuk penyebaran standar (regional) pada o1-mini
sebagai bagian dari rilis akses terbatas o1-preview
. Saat ini, akses ke penyebaran standar (regional) o1-mini
belum diperluas.
Tabel ini tidak menyertakan informasi ketersediaan regional yang terperinci. Lihat bagian penyempurnaan untuk informasi ini.
Model penyebaran standar (regional) menurut titik akhir
Penyelesaian percakapan
Wilayah | o1-preview, 2024-09-12 | o1-mini, 2024-09-12 | gpt-4o, 2024-05-13 | gpt-4o, 2024-11-20 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, turbo-2024-04-09 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|---|
Australia bagian timur | - | - | - | ✅ | - | - | - | ✅ | ✅ |
kanada timur | - | - | - | ✅ | - | - | - | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
FranceCentral | - | - | - | ✅ | - | - | - | ✅ | ✅ |
Jepang Timur | - | - | - | ✅ | - | - | - | - | ✅ |
northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Norwegia Timur | - | - | - | ✅ | - | - | - | - | - |
southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
India Selatan | - | - | - | ✅ | - | - | - | ✅ | ✅ |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
Swiss bagian Utara | - | - | - | ✅ | - | - | - | - | ✅ |
uksouth | - | - | - | ✅ | - | - | - | ✅ | ✅ |
westeurope | - | - | - | - | - | - | - | - | ✅ |
westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ |
Nota
o1-mini
saat ini tersedia untuk semua pelanggan untuk penyebaran standar global.
Pelanggan tertentu diberikan akses untuk penyebaran standar (regional) pada o1-mini
sebagai bagian dari rilis akses terbatas o1-preview
. Saat ini, akses ke penyebaran standar (regional) o1-mini
belum diperluas.
Ketersediaan model GPT-4 dan GPT-4 Turbo
Pilih akses pelanggan
Selain wilayah di atas yang tersedia untuk semua pelanggan Azure OpenAI, beberapa pelanggan tertentu yang sudah ada sebelumnya telah diberikan akses ke versi GPT-4 di wilayah tambahan:
Modél | Wilayah |
---|---|
gpt-4 (0314) gpt-4-32k (0314) |
US Timur Prancis Tengah Wilayah Selatan Tengah AS UK Selatan |
gpt-4 (0613) gpt-4-32k (0613) |
US Timur US Timur 2 Jepang Timur UK Selatan |
Model GPT-3.5
Lihat versi model untuk mempelajari tentang cara Azure OpenAI menangani peningkatan versi model, dan bekerja dengan model untuk mempelajari cara melihat dan mengonfigurasi pengaturan versi model penyebaran GPT-3.5 Turbo Anda.
Menyempurnakan model
Nota
gpt-35-turbo
- Penyesuaian model ini terbatas pada wilayah tertentu dan tidak tersedia di semua wilayah yang dapat menggunakan model dasar.
Wilayah yang didukung untuk penyempurnaan mungkin bervariasi jika Anda menggunakan model Azure OpenAI dalam proyek Azure AI Foundry versus di luar proyek.
Identifikasi Model | Wilayah Pelatihan Standar | Pelatihan Global (Pratinjau) | Permintaan maksimal jumlah token | Data Pelatihan (sampai) | Modalitas |
---|---|---|---|---|---|
gpt-35-turbo (1106) |
US Timur 2 US Tengah Utara Swedia Tengah Swiss Barat |
- | Input: 16.385 Keluaran: 4.096 |
Sep 2021 | Teks ke Teks |
gpt-35-turbo (0125) |
US Timur 2 US Tengah Utara Swedia Tengah Swiss Barat |
- | 16,385 | Sep 2021 | Teks ke Teks |
gpt-4o-mini (2024-07-18) |
US Tengah Utara Swedia Tengah |
- | Masukan: 128.000 Keluaran: 16,384 Panjang konteks contoh pelatihan: 65.536 |
Okt 2023 | Teks ke Teks |
gpt-4o (2024-08-06) |
US Timur 2 US Tengah Utara Swedia Tengah |
- | Masukan: 128.000 Keluaran: 16,384 Panjang konteks contoh pelatihan: 65.536 |
Okt 2023 | Teks & Visi ke Teks |
gpt-4.1 (2025-04-14) |
US Tengah Utara Swedia Tengah |
✅ | Masukan: 128.000 Keluaran: 16,384 Panjang konteks contoh pelatihan: 65.536 |
Mei 2024 | Teks & Visi ke Teks |
gpt-4.1-mini (2025-04-14) |
US Tengah Utara Swedia Tengah |
✅ | Masukan: 128.000 Keluaran: 16,384 Panjang konteks contoh pelatihan: 65.536 |
Mei 2024 | Teks ke Teks |
gpt-4.1-nano (2025-04-14) |
US Tengah Utara Swedia Tengah |
- | Masukan: 128.000 Keluaran: 16,384 Panjang konteks contoh pelatihan: 32.768 |
Mei 2024 | Teks ke Teks |
o4-mini (2025-04-16) |
US Timur 2 Swedia Tengah |
- | Masukan: 128.000 Keluaran: 16,384 Panjang konteks contoh pelatihan: 65.536 |
Mei 2024 | Teks ke Teks |
Nota
Pelatihan global (dalam Pratinjau Publik) menyediakan pelatihan per token yang lebih terjangkau, tetapi tidak menawarkan lokasi penyimpanan data. Saat ini tersedia untuk sumber daya Azure OpenAI di wilayah berikut, dengan lebih banyak wilayah segera hadir:
- Australia Timur
- Brasil Selatan
- US Timur
- Amerika Serikat Timur2
- Prancis Tengah
- Jerman Barat Tengah
- Italia Utara
- Jepang Timur (tidak ada dukungan visi)
- Korea Tengah
- US Tengah Utara
- Norwegia Timur
- Polandia Tengah
- Asia Tenggara
- Afrika Selatan Utara
- US Tengah Selatan
- Spanyol Tengah
- Swedia Tengah
- Swiss Barat
- Swiss Utara
- UK Selatan
- Eropa Barat
- US Barat
- US Barat 3
Asisten (Pratinjau)
Untuk Asisten, Anda memerlukan kombinasi model yang didukung, dan wilayah yang didukung. Alat dan kemampuan tertentu memerlukan model terbaru. Model berikut tersedia di Assistants API, SDK, dan Azure AI Foundry. Tabel berikut ini adalah untuk penyebaran standar. Untuk informasi tentang ketersediaan Provisioned Throughput Unit (PTU), lihat provisioned throughput. Model dan wilayah yang tercantum dapat digunakan dengan Asisten v1 dan v2. Anda dapat menggunakan model standar global jika didukung di wilayah yang tercantum di bawah ini.
Wilayah | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
Australia bagian timur | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
eastus | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
FranceCentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
Jepang Timur | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
Norwegia Timur | - | - | - | - | ✅ | - | - | - | - | - | - | - |
India Selatan | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
uksouth | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
westus | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
Pensiun Model
Untuk informasi terbaru tentang penghentian model, lihat panduan penghentian model.