Bagikan melalui


Azure OpenAI dalam Model Azure AI Foundry

Azure OpenAI didukung oleh beragam model dengan kemampuan dan titik harga yang berbeda. Ketersediaan model bervariasi menurut wilayah dan cloud. Untuk ketersediaan model Azure Government, silakan merujuk ke Layanan OpenAI Azure Government.

Model Deskripsi
codex-mini Versi o4-mini yang disempurnakan.
Seri GPT-4.1 Rilis model terbaru dari Azure OpenAI
model router Model yang secara cerdas memilih dari sekumpulan model obrolan yang mendasar untuk menanggapi perintah tertentu.
pratinjau-penggunaan-komputer Model eksperimental yang dilatih untuk digunakan dengan alat API Respons untuk penggunaan komputer.
Pratinjau GPT-4.5 Model GPT terbaru yang unggul pada tugas teks dan gambar yang beragam.
model seri o Model penalaran dengan pemecahan masalah tingkat lanjut dan peningkatan fokus dan kemampuan.
GPT-4o & GPT-4o mini & GPT-4 Turbo Model Azure OpenAI terbaru yang paling mampu dengan versi multimodal, yang dapat menerima teks dan gambar sebagai input.
GPT-4 Serangkaian model yang meningkat pada GPT-3.5 dan dapat memahami dan menghasilkan bahasa dan kode alami.
GPT-3.5 Serangkaian model yang meningkat pada GPT-3 dan dapat memahami dan menghasilkan bahasa dan kode alami.
Embedding Sekumpulan model yang dapat mengubah teks menjadi bentuk vektor numerik untuk memfasilitasi kesamaan teks.
Pembuatan gambar Serangkaian model yang dapat menghasilkan gambar asli dari bahasa alami.
Audio Serangkaian model untuk dari ucapan ke teks, terjemahan, dan dari teks ke ucapan. Model audio GPT-4o mendukung latensi rendah, interaksi percakapan "ucapan masuk, ucapan keluar" atau pembuatan audio.

Seri GPT 4.1

Ketersediaan regional

Modél Wilayah
gpt-4.1 (2025-04-14) Lihat tabel model.
gpt-4.1-nano (2025-04-14) Lihat tabel model.
gpt-4.1-mini (2025-04-14) Lihat tabel model.

Kemampuan

Identifikasi Model Deskripsi Jendela Kontekstual Token Output Maksimum Data Pelatihan (sampai)
gpt-4.1 (2025-04-14) - Input teks dan gambar
Hasil Teks
- API penyelesaian otomatis obrolan
- Respons API
-Streaming
- Pemanggilan fungsi
Output terstruktur (hasil akhir percakapan)
- 1,047,576
- 128.000 (penempatan terkelola yang ditentukan)
- 300.000 (penyebaran batch)
32.768 Mei 31, 2024
gpt-4.1-nano (2025-04-14) - Input teks dan gambar
Hasil Teks
- API penyelesaian otomatis obrolan
- Respons API
-Streaming
- Pemanggilan fungsi
Output terstruktur (hasil akhir percakapan)
- 1,047,576
- 128.000 (penempatan terkelola yang ditentukan)
- 300.000 (penyebaran batch)
32.768 Mei 31, 2024
gpt-4.1-mini (2025-04-14) - Input teks dan gambar
Hasil Teks
- API penyelesaian otomatis obrolan
- Respons API
-Streaming
- Pemanggilan fungsi
Output terstruktur (hasil akhir percakapan)
- 1,047,576
- 128.000 (penempatan terkelola yang ditentukan)
- 300.000 (penyebaran batch)
32.768 Mei 31, 2024

router model

Model yang secara cerdas memilih dari sekumpulan model obrolan yang mendasar untuk menanggapi perintah tertentu.

Ketersediaan regional

Modél Wilayah
model-router (2025-05-19) US Timur 2 (Standar Global), Swedia Tengah (Standar Global)

Kemampuan

Identifikasi Model Deskripsi Jendela Kontekstual Token Output Maksimum Data Pelatihan (sampai)
model-router (2025-05-19) Model yang secara cerdas memilih dari sekumpulan model obrolan yang mendasar untuk menanggapi perintah tertentu. 200,000* 32768 (seri GPT 4.1)
100 K (o4-mini)
Mei 31, 2024

*Jendela konteks yang lebih besar kompatibel dengan beberapa model yang mendasar, yang berarti panggilan API dengan konteks yang lebih besar hanya akan berhasil jika prompt kebetulan dirutekan ke model yang tepat, jika tidak, panggilan akan gagal.

pratinjau penggunaan komputer

Model eksperimental yang dilatih untuk digunakan dengan alat API Respons untuk penggunaan komputer. Ini dapat digunakan bersama pustaka pihak ketiga untuk memungkinkan model mengontrol input mouse dan keyboard sambil mendapatkan konteks dari tangkapan layar lingkungan saat ini.

Perhatian

Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi GA stabil terbaru. Model yang berlabel pratinjau tidak mengikuti siklus hidup model standar Azure OpenAI.

Ketersediaan

Untuk mendapatkan akses ke computer-use-preview pendaftaran diperlukan, dan akses akan diberikan berdasarkan kriteria kelayakan yang ditentukan oleh Microsoft. Pelanggan yang memiliki akses ke model akses terbatas lainnya masih perlu meminta akses untuk model ini.

Minta akses: computer-use-preview aplikasi model akses terbatas

Setelah akses diberikan, Anda harus membuat penerapan untuk model tersebut.

Ketersediaan regional

Modél Wilayah
computer-use-preview Lihat tabel model.

Kemampuan

Identifikasi Model Deskripsi Jendela Kontekstual Token Output Maksimum Data Pelatihan (sampai)
computer-use-preview (2025-03-11) Model khusus untuk digunakan dengan API Responses sebagai alat penggunaan komputer.

-Alat
-Penyiaran Langsung
-Teks (input/output)
- Gambar(masukan)
8,192 1,024 Okt 2023

Pratinjau GPT-4.5

Ketersediaan regional

Modél Wilayah
gpt-4.5-preview Lihat tabel model.

Kemampuan

Identifikasi Model Deskripsi Jendela Kontekstual Token Output Maksimum Data Pelatihan (sampai)
gpt-4.5-preview (2025-02-27)
Pratinjau GPT-4.5
GPT 4.1 adalah pengganti yang direkomendasikan untuk model ini. Unggul dalam berbagai tugas teks dan gambar.
- Output terstruktur
- Penyimpanan sementara prompt
-Perkakas
-Streaming
- Teks(masuk/keluar)
- Gambar(masukan)
128.000 16,384 Okt 2023

Nota

Perilaku yang diharapkan adalah bahwa model memang tidak dapat menjawab pertanyaan tentang dirinya sendiri. Jika Anda ingin mengetahui kapan batas pengetahuan untuk data pelatihan model, atau detail lain mengenai model, Anda harus merujuk ke dokumentasi model di atas.

model dari seri o

Model seri o* Azure OpenAI dirancang khusus untuk mengatasi tugas penalaran dan pemecahan masalah dengan peningkatan fokus dan kemampuan. Model-model ini menghabiskan lebih banyak waktu untuk memproses dan memahami permintaan pengguna, membuatnya sangat kuat di bidang-bidang seperti sains, pengodean, dan matematika dibandingkan dengan iterasi sebelumnya.

Identifikasi Model Deskripsi Permintaan Maksimum (token) Data Pelatihan (sampai)
codex-mini (2025-05-16) Versi o4-mini yang disempurnakan.
- API Tanggapan
Hasil yang terstruktur
- Teks, pemrosesan gambar
- Fungsi/Alat
Ringkasan lengkap kemampuan
Masukan: 200.000
Keluaran: 100.000
Mei 31, 2024
o3-pro (2025-06-10) - API Tanggapan
Hasil yang terstruktur
- Teks, pemrosesan gambar
- Fungsi/Alat
Ringkasan lengkap kemampuan
Masukan: 200.000
Keluaran: 100.000
Mei 31, 2024
o4-mini (2025-04-16) - Model penalaran BARU, menawarkan kemampuan penalaran yang ditingkatkan.

- API Penyelesaian Percakapan
- API Tanggapan
Hasil yang terstruktur
- Teks, pemrosesan gambar
- Fungsi/Alat
Ringkasan lengkap kemampuan
Masukan: 200.000
Keluaran: 100.000
Mei 31, 2024
o3 (2025-04-16) - Model penalaran BARU, menawarkan kemampuan penalaran yang ditingkatkan.

- API Penyelesaian Percakapan
- API Tanggapan
Hasil yang terstruktur
- Teks, pemrosesan gambar
- Fungsi/Peralatan/Pemanggilan alat paralel
Ringkasan lengkap kemampuan
Masukan: 200.000
Keluaran: 100.000
Mei 31, 2024
o3-mini (2025-01-31) - Kemampuan penalaran yang ditingkatkan.
Hasil yang terstruktur
- Pemrosesan teks saja
- Fungsi/Alat
Masukan: 200.000
Keluaran: 100.000
Okt 2023
o1 (2024-12-17) - Kemampuan penalaran yang ditingkatkan.
Hasil yang terstruktur
- Teks, pemrosesan gambar
- Fungsi/Alat
Masukan: 200.000
Keluaran: 100.000
Okt 2023
o1-preview (2024-09-12) Versi pratinjau yang lebih lama Masukan: 128.000
Keluaran: 32.768
Okt 2023
o1-mini (2024-09-12) Opsi yang lebih cepat dan lebih hemat biaya dalam seri o1, ideal untuk tugas pengkodan yang membutuhkan kecepatan dan konsumsi sumber daya yang lebih rendah.

Penyebaran standar global tersedia secara default.

Penyebaran standar (regional) saat ini hanya tersedia bagi pelanggan tertentu yang telah mendapat akses melalui rilis akses terbatas o1-preview.
Masukan: 128.000
Keluaran: 65.536
Okt 2023

Ketersediaan

Untuk mempelajari selengkapnya tentang model tingkat lanjut o-series, lihat mulai menggunakan model penalaran.

Ketersediaan regional

Modél Wilayah
codex-mini US Timur2 dan Swedia Tengah (Standar Global)
o3-pro US Timur2 dan Swedia Tengah (Standar Global)
o4-mini Lihat tabel model.
o3 Lihat tabel model.
o3-mini Lihat tabel model.
o1 Lihat tabel model.
o1-preview Lihat tabel model. Model ini hanya tersedia untuk pelanggan yang diberikan akses sebagai bagian dari akses terbatas asli
o1-mini Lihat tabel model.

GPT-4o dan GPT-4 Turbo

GPT-4o mengintegrasikan teks dan gambar dalam satu model, memungkinkannya menangani beberapa jenis data secara bersamaan. Pendekatan multimodal ini meningkatkan akurasi dan responsivitas dalam interaksi manusia-komputer. GPT-4o sejajar dengan GPT-4 Turbo dalam tugas teks dan pengodean berbahasa Inggris sekaligus memberikan performa unggul dalam tugas berbahasa non-Inggris dan tugas visi, menetapkan standar baru untuk kemampuan AI.

Bagaimana cara mengakses model GPT-4o dan GPT-4o mini?

GPT-4o dan GPT-4o mini tersedia untuk penyebaran model standar dan standar global .

Anda perlu membuat atau menggunakan sumber daya yang ada pada standar yang didukung atau wilayah standar global di mana model tersedia.

Setelah sumber daya Anda dibuat, Anda dapat menyebarkan model GPT-4o. Jika Anda melakukan penyebaran terprogram, nama modelnya adalah:

  • gpt-4o Versi2024-11-20
  • gpt-4o Versi2024-08-06
  • gpt-4o Versi2024-05-13
  • gpt-4o-mini Versi2024-07-18

GPT-4 Turbo

GPT-4 Turbo adalah model multimodal besar (menerima input teks atau gambar dan menghasilkan teks) yang dapat memecahkan masalah sulit dengan akurasi yang lebih besar daripada model OpenAI sebelumnya. Seperti GPT-3.5 Turbo, model GPT-4 yang lebih baru, dan model GPT-4 yang lebih lama, GPT-4 Turbo dioptimalkan untuk obrolan dan berfungsi dengan baik untuk tugas penyelesaian tradisional.

GPT-4

GPT-4 adalah pendahulu GPT-4 Turbo. Model GPT-4 dan GPT-4 Turbo memiliki nama model dasar gpt-4. Anda dapat membedakan antara model GPT-4 dan Turbo dengan memeriksa versi model.

  • gpt-4 Versi0314
  • gpt-4 Versi0613
  • gpt-4-32k Versi0613

Anda dapat melihat panjang konteks token yang didukung oleh setiap model dalam tabel ringkasan model.

Model GPT-4 dan GPT-4 Turbo

  • Model ini hanya dapat digunakan dengan API Penyelesaian Obrolan.

Lihat versi model untuk mempelajari tentang cara Azure OpenAI menangani peningkatan versi model, dan bekerja dengan model untuk mempelajari cara melihat dan mengonfigurasi pengaturan versi model penyebaran GPT-4 Anda.

Identifikasi Model Deskripsi Permintaan Maksimum (token) Data Pelatihan (sampai)
gpt-4o (2024-11-20)
GPT-4o (Omni)
Model GA besar terbaru
Hasil yang terstruktur
- Teks, pemrosesan gambar
- Mode JSON
- panggilan fungsi paralel
- Akurasi dan responsivitas yang ditingkatkan
- Kesetaraan dengan tugas teks dan pengodean dalam bahasa Inggris dibandingkan dengan GPT-4 Turbo dengan Visi
- Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi.
- Kemampuan penulisan kreatif yang ditingkatkan
Masukan: 128.000
Keluaran: 16.384
Okt 2023
gpt-4o (2024-08-06)
GPT-4o (Omni)
Hasil yang terstruktur
- Teks, pemrosesan gambar
- Mode JSON
- panggilan fungsi paralel
- Akurasi dan responsivitas yang ditingkatkan
- Kesetaraan dengan tugas teks dan pengodean dalam bahasa Inggris dibandingkan dengan GPT-4 Turbo dengan Visi
- Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi
Masukan: 128.000
Output: 16.384
Okt 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
Model GA kecil terbaru
- Model yang cepat, murah, dan mampu ideal untuk mengganti model seri GPT-3.5 Turbo.
- Teks, pemrosesan gambar
- Mode JSON
- panggilan fungsi paralel
Masukan: 128.000
Output: 16,384
Okt 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
Teks, pemrosesan gambar
- Mode JSON
- panggilan fungsi paralel
- Akurasi dan responsivitas yang ditingkatkan
- Kesetaraan dengan tugas teks dan pengodean dalam bahasa Inggris dibandingkan dengan GPT-4 Turbo dengan Visi
- Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi
Masukan: 128.000
Keluaran: 4.096
Okt 2023
gpt-4 (turbo-2024-04-09)
GPT-4 Turbo dengan Fitur Penglihatan
Model GA baru
- Penggantian untuk semua model pratinjau GPT-4 sebelumnya (vision-preview, 1106-Preview, 0125-Preview).
- Ketersediaan fitur saat ini berbeda tergantung pada metode input, dan jenis penyebaran.
Masukan: 128.000
Keluaran: 4.096
Desember 2023
gpt-4-32k (0613) Model GA yang lebih lama
- Pemanggilan fungsi dasar dengan alat
32.768 Sep 2021
gpt-4 (0613) Model GA yang lebih lama
- Pemanggilan fungsi dasar dengan alat
8,192 Sep 2021
gpt-4-32k(0314) Model GA yang lebih lama
- Informasi penghentian
32.768 Sep 2021
gpt-4 (0314) Model GA yang lebih lama
- Informasi penghentian
8,192 Sep 2021

Perhatian

Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi GA stabil terbaru. Model yang berlabel pratinjau tidak mengikuti siklus hidup model standar Azure OpenAI.

GPT-3.5

Model GPT-3.5 dapat memahami dan menghasilkan bahasa atau kode alami. Model yang paling mampu dan hemat biaya dalam keluarga GPT-3.5 adalah GPT-3.5 Turbo, yang telah dioptimalkan untuk obrolan dan bekerja dengan baik untuk tugas penyelesaian tradisional juga. GPT-3.5 Turbo tersedia untuk digunakan dengan API Penyelesaian Obrolan. GPT-3.5 Turbo Instruct memiliki kemampuan serupa dengan text-davinci-003 menggunakan API Penyelesaian alih-alih API Penyelesaian Percakapan. Sebaiknya gunakan GPT-3.5 Turbo dan GPT-3.5 Turbo Instruct dibandingkan dengan model GPT-3.5 dan GPT-3 versi lama.

Identifikasi Model Deskripsi Permintaan Maksimum (token) Data Pelatihan (sampai)
gpt-35-turbo (0125) BARU Model GA Terbaru
- Mode JSON
- panggilan fungsi paralel
- hasil yang dapat direproduksi (pratinjau)
- Akurasi yang lebih tinggi dalam merespons dalam format yang diminta.
- Perbaikan untuk bug yang menyebabkan masalah pengodean teks untuk panggilan fungsi dalam bahasa selain Inggris.
Input: 16,385
Keluaran: 4.096
Sep 2021
gpt-35-turbo (1106) Model GA Yang Lebih Lama
- Mode JSON
- panggilan fungsi paralel
- hasil yang dapat direproduksi (pratinjau)
Input: 16.385
Keluaran: 4.096
Sep 2021
gpt-35-turbo-instruct (0914) Titik akhir penyelesaian saja
- Penggantian untuk model penyelesaian lama
4,097 Sep 2021

Untuk mempelajari selengkapnya tentang cara berinteraksi dengan GPT-3.5 Turbo dan API Penyelesaian Obrolan, lihat panduan mendalam kami.

1 Model ini akan menerima permintaan > 4.096 token. Tidak disarankan untuk melebihi batas token input 4.096 karena versi model yang lebih baru dibatasi pada 4.096 token. Jika Anda mengalami masalah saat melebihi 4.096 token input dengan model ini, konfigurasi ini tidak didukung secara resmi.

Pemadatan

text-embedding-3-large adalah model penyisipan terbaru dan terkuat. Perpindahan atau peningkatan antar model penyematan tidak dimungkinkan. Untuk berpindah dari penggunaan text-embedding-ada-002 ke text-embedding-3-large Anda perlu membuat penyematan baru.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Dalam pengujian, OpenAI melaporkan model penyematan generasi ketiga besar dan kecil menawarkan performa pengambilan multibahasa rata-rata yang lebih baik dengan tolok ukur MIRACL sambil tetap mempertahankan performa untuk tugas bahasa Inggris dengan tolok ukur MTEB .

Tolok Ukur Penilaian text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Rata-rata MIRACL 31,4 44.0 54.9
Rata-rata MTEB 61.0 62,3 64.6

Model penyematan generasi ketiga mendukung pengurangan ukuran penyematan melalui parameter baru dimensions . Biasanya penyematan yang lebih besar lebih mahal dari perspektif komputasi, memori, dan penyimpanan. Mampu menyesuaikan jumlah dimensi memungkinkan lebih banyak kontrol atas biaya dan performa keseluruhan. Parameter dimensions tidak didukung di semua versi pustaka OpenAI 1.x Python, untuk memanfaatkan parameter ini, sebaiknya tingkatkan ke versi terbaru: pip install openai --upgrade.

Pengujian tolok ukur MTEB OpenAI menemukan bahwa meskipun dimensi dari model generasi ketiga dikurangi untuk menjadi kurang dari text-embeddings-ada-002 1.536 dimensi, performanya masih sedikit lebih baik.

Model pembuatan gambar

Model pembuatan gambar menghasilkan gambar dari perintah teks yang disediakan pengguna. GPT-image-1 sedang dalam pratinjau publik dengan akses terbatas. DALL-E 3 umumnya tersedia untuk digunakan dengan REST API. DALL-E 2 dan DALL-E 3 dengan SDK klien masing-masing sedang dalam pratinjau.

Ketersediaan

Untuk mendapatkan akses ke gpt-image-1 pendaftaran diperlukan, dan akses akan diberikan berdasarkan kriteria kelayakan yang ditentukan oleh Microsoft. Pelanggan yang memiliki akses ke model akses terbatas lainnya masih perlu meminta akses untuk model ini.

Minta akses: gpt-image-1 aplikasi model akses terbatas

Setelah akses diberikan, Anda harus membuat penerapan untuk model tersebut.

Ketersediaan regional

Modél Wilayah
dall-e-3 US Timur
Australia Timur
Swedia Tengah
gpt-image-1 Wilayah Barat AS 3 (Standar Global)
UAE Utara (Standar Global)
Polandia Tengah (Standar Global)

Model pembuatan video

Sora adalah model AI dari OpenAI yang dapat menciptakan adegan video yang realistis dan imajinatif dari instruksi teks. Sora sedang dalam tahap pratinjau publik.

Ketersediaan regional

Modél Wilayah
sora US Timur 2

Model audio

Model audio di Azure OpenAI tersedia melalui realtimeAPI , , completionsdan audio .

Model GPT-4o audio

Model audio GPT 4o adalah bagian dari keluarga model GPT-4o dan mendukung interaksi percakapan atau pembuatan audio latensi rendah, "ucapan masuk, ucapan keluar".

Perhatian

Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi GA stabil terbaru. Model yang berlabel pratinjau tidak mengikuti siklus hidup model standar Azure OpenAI.

Detail tentang token permintaan maksimum dan data pelatihan tersedia dalam tabel berikut.

Identifikasi Model Deskripsi Permintaan Maksimum (token) Data Pelatihan (sampai)
gpt-4o-mini-audio-preview (2024-12-17)
GPT-4o Audio
Model audio untuk pembuatan audio dan teks. Masukan: 128.000
Keluaran: 4.096
Okt 2023
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o Audio
Model audio untuk pemrosesan audio real time. Masukan: 128.000
Keluaran: 4.096
Okt 2023
gpt-4o-audio-preview (2024-12-17)
GPT-4o Audio
Model audio untuk pembuatan audio dan teks. Masukan: 128.000
Keluaran: 4.096
Okt 2023
gpt-4o-realtime-preview (2024-12-17)
GPT-4o Audio
Model audio untuk pemrosesan audio real time. Masukan: 128.000
Keluaran: 4.096
Okt 2023
gpt-4o-mini-realtime-preview (2024-12-17)
GPT-4o Audio
Model audio untuk pemrosesan audio real time. Masukan: 128.000
Keluaran: 4.096
Okt 2023

Untuk membandingkan ketersediaan model audio GPT-4o di semua wilayah, lihat tabel model.

Audio API

Model audio melalui /audio API dapat digunakan untuk ucapan ke teks, terjemahan, dan teks ke ucapan.

Model ucapan ke teks

Identifikasi Model Deskripsi Permintaan Maksimum (ukuran file audio)
whisper Model pengenalan ucapan tujuan umum. 25 MB
gpt-4o-transcribe Konversi suara ke teks ditenagai oleh GPT-4o. 25 MB
gpt-4o-mini-transcribe Konversi ucapan ke teks ditenagai oleh GPT-4o mini. 25 MB

Model terjemahan ucapan

Identifikasi Model Deskripsi Permintaan Maksimum (ukuran file audio)
whisper Model pengenalan ucapan tujuan umum. 25 MB

Model teks ke ucapan (Pratinjau)

Identifikasi Model Deskripsi
tts Teknologi teks ke ucapan dioptimalkan untuk kecepatan tinggi.
tts-hd Teks ke suara dioptimalkan untuk kualitas.
gpt-4o-mini-tts Model teks ke ucapan yang didukung oleh GPT-4o mini.

Anda dapat memandu suara untuk berbicara dengan gaya atau nada.

Untuk informasi selengkapnya lihat Ketersediaan wilayah model audio di artikel ini.

Tabel ringkasan model dan ketersediaan wilayah

Model menurut jenis penyebaran

Azure OpenAI memberi pelanggan pilihan pada struktur hosting yang sesuai dengan pola bisnis dan penggunaan mereka. Layanan ini menawarkan dua jenis penyebaran utama:

  • Standar ditawarkan dengan opsi penyebaran global, merutekan lalu lintas secara global untuk memberikan throughput yang lebih tinggi.
  • Provisioned juga ditawarkan dengan opsi penyebaran global, memungkinkan pelanggan untuk membeli dan menyebarkan unit throughput yang disediakan di seluruh infrastruktur global Azure.

Semua penyebaran dapat melakukan operasi inferensi yang persis sama, namun penagihan, skala, dan performanya berbeda secara signifikan. Untuk mempelajari selengkapnya tentang jenis penyebaran Azure OpenAI, lihat panduan jenis penyebaran kami.

Ketersediaan model standar global

Wilayah o3-pro, 2025-06-10 codex-mini, 2025-05-16 model-router, 2025-05-19 o3, 2025-04-16 o4-mini, 2025-04-16 gpt-image-1, 2025-04-15 gpt-4.1, 2025-04-14 gpt-4.1-nano, 2025-04-14 gpt-4.1-mini, 2025-04-14 pratinjau-penggunaan-komputer, 2025-03-11 gpt-4.5-preview, 2025-02-27 o3-mini, 2025-01-31 o1, 2024-12-17 o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o, 2024-11-20 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 penyematan teks-3-kecil, 1 text-embedding-3-large, 1 text-embedding-ada-002, 2 gpt-4o-realtime-preview, 2024-12-17 gpt-4o-audio-preview, 2024-12-17 gpt-4o-mini-realtime-preview, 2024-12-17 gpt-4o-mini-audio-preview, 2024-12-17 gpt-4o-transcribe, 2025-03-20 gpt-4o-mini-tts, 2025-03-20 gpt-4o-mini-transcribe, 2025-03-20
Australia bagian timur - - - - - - - - - - - - - - - - - -
Brasil Selatan - - - - - - - - - - - - - - - - -
kanada timur - - - - - - - - - - - - - - - - -
eastus - - - - - - - - - - - - - - -
eastus2 -
FranceCentral - - - - - - - - - - - - - - - - -
Jerman Barat Tengah - - - - - - - - - - - - - - - - -
Italia Utara - - - - - - - - - - - - - - - - - - - -
Jepang Timur - - - - - - - - - - - - - - - - -
koreacentral - - - - - - - - - - - - - - - - -
northcentralus - - - - - - - - - - - - - - -
Norwegia Timur - - - - - - - - - - - - - - - - - -
polandcentral - - - - - - - - - - - - - - - - -
southafricanorth - - - - - - - - - - - - - - - - - -
southcentralus - - - - - - - - - - - - - - - -
India Selatan - - - - - - - - - - - - - - - - -
spaincentral - - - - - - - - - - - - - - - - -
swedencentral - - -
Swiss bagian Utara - - - - - - - - - - - - - - - - -
uaenorth - - - - - - - - - - - - - - - -
uksouth - - - - - - - - - - - - - - - - -
westeurope - - - - - - - - - - - - - - - - -
westus - - - - - - - - - - - - - - -
westus3 - - - - - - - - - - - - - -

Nota

o1-mini saat ini tersedia untuk semua pelanggan untuk penyebaran standar global.

Pelanggan tertentu diberikan akses untuk penyebaran standar (regional) pada o1-mini sebagai bagian dari rilis akses terbatas o1-preview. Saat ini, akses ke penyebaran standar (regional) o1-mini belum diperluas.

Tabel ini tidak menyertakan informasi ketersediaan regional yang terperinci. Lihat bagian penyempurnaan untuk informasi ini.

Model penyebaran standar (regional) menurut titik akhir

Penyelesaian percakapan

Wilayah o1-preview, 2024-09-12 o1-mini, 2024-09-12 gpt-4o, 2024-05-13 gpt-4o, 2024-11-20 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, turbo-2024-04-09 gpt-35-turbo, 1106 gpt-35-turbo, 0125
Australia bagian timur - - - - - -
kanada timur - - - - - -
eastus -
eastus2 -
FranceCentral - - - - - -
Jepang Timur - - - - - - -
northcentralus -
Norwegia Timur - - - - - - - -
southcentralus -
India Selatan - - - - - -
swedencentral
Swiss bagian Utara - - - - - - -
uksouth - - - - - -
westeurope - - - - - - - -
westus
westus3 -

Nota

o1-mini saat ini tersedia untuk semua pelanggan untuk penyebaran standar global.

Pelanggan tertentu diberikan akses untuk penyebaran standar (regional) pada o1-mini sebagai bagian dari rilis akses terbatas o1-preview. Saat ini, akses ke penyebaran standar (regional) o1-mini belum diperluas.

Ketersediaan model GPT-4 dan GPT-4 Turbo

Pilih akses pelanggan

Selain wilayah di atas yang tersedia untuk semua pelanggan Azure OpenAI, beberapa pelanggan tertentu yang sudah ada sebelumnya telah diberikan akses ke versi GPT-4 di wilayah tambahan:

Modél Wilayah
gpt-4 (0314)
gpt-4-32k (0314)
US Timur
Prancis Tengah
Wilayah Selatan Tengah AS
UK Selatan
gpt-4 (0613)
gpt-4-32k (0613)
US Timur
US Timur 2
Jepang Timur
UK Selatan

Model GPT-3.5

Lihat versi model untuk mempelajari tentang cara Azure OpenAI menangani peningkatan versi model, dan bekerja dengan model untuk mempelajari cara melihat dan mengonfigurasi pengaturan versi model penyebaran GPT-3.5 Turbo Anda.

Menyempurnakan model

Nota

gpt-35-turbo - Penyesuaian model ini terbatas pada wilayah tertentu dan tidak tersedia di semua wilayah yang dapat menggunakan model dasar.

Wilayah yang didukung untuk penyempurnaan mungkin bervariasi jika Anda menggunakan model Azure OpenAI dalam proyek Azure AI Foundry versus di luar proyek.

Identifikasi Model Wilayah Pelatihan Standar Pelatihan Global (Pratinjau) Permintaan maksimal jumlah token Data Pelatihan (sampai) Modalitas
gpt-35-turbo (1106) US Timur 2
US Tengah Utara
Swedia Tengah
Swiss Barat
- Input: 16.385
Keluaran: 4.096
Sep 2021 Teks ke Teks
gpt-35-turbo (0125) US Timur 2
US Tengah Utara
Swedia Tengah
Swiss Barat
- 16,385 Sep 2021 Teks ke Teks
gpt-4o-mini (2024-07-18) US Tengah Utara
Swedia Tengah
- Masukan: 128.000
Keluaran: 16,384
Panjang konteks contoh pelatihan: 65.536
Okt 2023 Teks ke Teks
gpt-4o (2024-08-06) US Timur 2
US Tengah Utara
Swedia Tengah
- Masukan: 128.000
Keluaran: 16,384
Panjang konteks contoh pelatihan: 65.536
Okt 2023 Teks & Visi ke Teks
gpt-4.1 (2025-04-14) US Tengah Utara
Swedia Tengah
Masukan: 128.000
Keluaran: 16,384
Panjang konteks contoh pelatihan: 65.536
Mei 2024 Teks & Visi ke Teks
gpt-4.1-mini (2025-04-14) US Tengah Utara
Swedia Tengah
Masukan: 128.000
Keluaran: 16,384
Panjang konteks contoh pelatihan: 65.536
Mei 2024 Teks ke Teks
gpt-4.1-nano (2025-04-14) US Tengah Utara
Swedia Tengah
- Masukan: 128.000
Keluaran: 16,384
Panjang konteks contoh pelatihan: 32.768
Mei 2024 Teks ke Teks
o4-mini (2025-04-16) US Timur 2
Swedia Tengah
- Masukan: 128.000
Keluaran: 16,384
Panjang konteks contoh pelatihan: 65.536
Mei 2024 Teks ke Teks

Nota

Pelatihan global (dalam Pratinjau Publik) menyediakan pelatihan per token yang lebih terjangkau, tetapi tidak menawarkan lokasi penyimpanan data. Saat ini tersedia untuk sumber daya Azure OpenAI di wilayah berikut, dengan lebih banyak wilayah segera hadir:

  • Australia Timur
  • Brasil Selatan
  • US Timur
  • Amerika Serikat Timur2
  • Prancis Tengah
  • Jerman Barat Tengah
  • Italia Utara
  • Jepang Timur (tidak ada dukungan visi)
  • Korea Tengah
  • US Tengah Utara
  • Norwegia Timur
  • Polandia Tengah
  • Asia Tenggara
  • Afrika Selatan Utara
  • US Tengah Selatan
  • Spanyol Tengah
  • Swedia Tengah
  • Swiss Barat
  • Swiss Utara
  • UK Selatan
  • Eropa Barat
  • US Barat
  • US Barat 3

Asisten (Pratinjau)

Untuk Asisten, Anda memerlukan kombinasi model yang didukung, dan wilayah yang didukung. Alat dan kemampuan tertentu memerlukan model terbaru. Model berikut tersedia di Assistants API, SDK, dan Azure AI Foundry. Tabel berikut ini adalah untuk penyebaran standar. Untuk informasi tentang ketersediaan Provisioned Throughput Unit (PTU), lihat provisioned throughput. Model dan wilayah yang tercantum dapat digunakan dengan Asisten v1 dan v2. Anda dapat menggunakan model standar global jika didukung di wilayah yang tercantum di bawah ini.

Wilayah gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
Australia bagian timur - - - - -
eastus - - - -
eastus2 - - - -
FranceCentral - - - - - -
Jepang Timur - - - - - - - - -
Norwegia Timur - - - - - - - - - - -
India Selatan - - - - - - - - -
swedencentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Pensiun Model

Untuk informasi terbaru tentang penghentian model, lihat panduan penghentian model.

Langkah selanjutnya