Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Artikel ini mencantumkan pilihan Model Microsoft Foundry yang dijual langsung oleh Azure beserta kemampuannya, jenis penyebaran, dan wilayah ketersediaan, tidak termasuk model deprecated dan usang. Untuk melihat daftar model OpenAI Azure yang didukung oleh Foundry Agent Service, lihat Models yang didukung oleh Agent Service. Model yang dijual langsung oleh Azure mencakup semua model OpenAI Azure dan model tertentu yang dipilih dari penyedia teratas. Model ini ditagih melalui langganan Azure Anda, dicakup oleh perjanjian tingkat layanan Azure, dan didukung oleh Microsoft. Untuk model yang ditawarkan oleh mitra di luar daftar ini, lihat Model Foundry dari mitra dan komunitas.
Gunakan tab di bagian atas halaman ini untuk beralih antara Azure model OpenAI dan kumpulan model lainnya dari penyedia seperti Cohere, DeepSeek, Meta, Mistral AI, dan xAI.
Model Foundry tersedia untuk penyebaran standar ke sumber daya Foundry.
Untuk mengetahui lebih lanjut tentang atribut Model Foundry yang dijual langsung oleh Azure, lihat Explore Foundry Models.
Nota
Model Foundry yang dijual langsung oleh Azure juga mencakup model tertentu dari penyedia model teratas, seperti:
- Black Forest Labs:
FLUX.2-flex,FLUX.2-pro,FLUX.1-Kontext-pro,FLUX-1.1-pro - Cohere:
Cohere-command-a,embed-v-4-0,Cohere-rerank-v4.0-pro,Cohere-rerank-v4.0-fast - DeepSeek:
DeepSeek-V3.2,DeepSeek-V3.2-Speciale,DeepSeek-V3.1,DeepSeek-V3-0324,DeepSeek-R1-0528,DeepSeek-R1 - Moonshot AI:
Kimi-K2.5,Kimi-K2-Thinking - Meta:
Llama-4-Maverick-17B-128E-Instruct-FP8,Llama-3.3-70B-Instruct - Microsoft:
MAI-DS-R1,model-router - Mistral:
mistral-document-ai-2512,mistral-document-ai-2505,Mistral-Large-3 - xAI:
grok-code-fast-1, ,grok-3grok-3-mini,grok-4-fast-reasoning,grok-4-fast-non-reasoning,grok-4, ,grok-4.1-fast-reasoninggrok-4.1-fast-non-reasoning
Untuk mempelajari tentang model ini, beralihlah ke Koleksi model lain di bagian atas artikel ini.
Azure OpenAI dalam model Microsoft Foundry
Azure OpenAI didukung oleh beragam model dengan kemampuan dan titik harga yang berbeda. Ketersediaan model bervariasi menurut wilayah dan cloud. Untuk ketersediaan model Azure Government, lihat Azure OpenAI di Azure Government.
| Models | Deskripsi |
|---|---|
| Seri GPT-5.4 |
BARUgpt-5.4, gpt-5.4-pro |
| Seri GPT-5.3 |
BARUgpt-5.3-codex |
| Seri GPT-5.2 |
BARUgpt-5.2-codex, gpt-5.2, gpt-5.2-chat (Pratinjau) |
| Seri GPT-5.1 |
BARUgpt-5.1, gpt-5.1-chat, gpt-5.1-codex, gpt-5.1-codex-mini |
| Sora | SORA-2 BARU |
| Seri GPT-5 | gpt-5, gpt-5-mini, gpt-5-nano, gpt-5-chat |
| gpt-oss | model penalaran dengan bobot terbuka |
| codex-mini | Versi o4-mini yang disempurnakan. |
| Seri GPT-4.1 | gpt-4.1, gpt-4.1-mini, gpt-4.1-nano |
| pratinjau-penggunaan-komputer | Model eksperimental yang dilatih untuk digunakan dengan alat API Respons untuk penggunaan komputer. |
| model seri o | Model penalaran dengan pemecahan masalah tingkat lanjut dan peningkatan fokus dan kemampuan. |
| GPT-4o, GPT-4o mini, dan GPT-4 Turbo | Mampu Azure model OpenAI dengan versi multimodal, yang dapat menerima teks dan gambar sebagai input. |
| Embeddings | Sekumpulan model yang dapat mengubah teks menjadi bentuk vektor numerik untuk memfasilitasi kesamaan teks. |
| Pembuatan gambar | Serangkaian model yang dapat menghasilkan gambar asli dari bahasa alami. |
Video generation |
Model yang dapat menghasilkan adegan video asli dari instruksi teks. |
| Audio | Serangkaian model untuk dari ucapan ke teks, terjemahan, dan dari teks ke ucapan. Model audio GPT-4o mendukung interaksi percakapan dengan latensi rendah ucapan masuk, ucapan keluar atau generasi audio. |
GPT-5.4
| Model | Wilayah |
|---|---|
gpt-5.4 |
Lihat tabel model |
gpt-5.4-pro |
Lihat tabel model |
| Identifikasi Model | Deskripsi | Jendela Kontekstual | Token Output Maksimum | Data Pelatihan (sampai) |
|---|---|---|---|---|
gpt-5.4 (2026-03-05) |
-
Penalaran - API Respons. - API Penyelesaian Chat. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi, alat, dan pemanggilan alat paralel. - Penggunaan komputer - Ringkasan lengkap kemampuan. |
1.050.000 Jendela Konteks | 128.000 | Agustus 2025 |
gpt-5.4-pro (2026-03-05) |
-
Penalaran - API Respons. - Pemrosesan teks dan gambar. - Fungsi & alat - Ringkasan lengkap kemampuan. |
400,000 Input: 272.000 Output: 128.000 1.050.000 Jendela Konteks (Segera Hadir!) |
128.000 | Agustus 2025 |
GPT-5.3
| Model | Wilayah |
|---|---|
gpt-5.3-codex |
Lihat tabel model |
| Identifikasi Model | Deskripsi | Jendela Kontekstual | Token Output Maksimum | Data Pelatihan (sampai) |
|---|---|---|---|---|
gpt-5.3-codex (2026-02-24) |
-
Penalaran - API Respons. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi, alat, dan pemanggilan alat paralel. - Ringkasan lengkap kemampuan. - Dioptimalkan untuk Ekstensi Codex CLI & Codex VS Code |
400,000 Input: 272.000 Keluaran: 128.000 |
128.000 | Agustus 2025 |
GPT-5.2
Ketersediaan regional
| Model | Wilayah |
|---|---|
gpt-5.2 |
Lihat tabel model. |
gpt-5.2-chat |
Lihat tabel model. |
gpt-5.2-codex |
Lihat tabel model |
Akses akan diberikan berdasarkan kriteria kelayakan Microsoft. Pelanggan yang sebelumnya menerapkan dan menerima akses ke model akses terbatas, tidak perlu menerapkan kembali karena langganan yang disetujui akan secara otomatis diberikan akses setelah rilis model.
| Identifikasi Model | Deskripsi | Jendela Kontekstual | Token Output Maksimum | Data Pelatihan (sampai) |
|---|---|---|---|---|
gpt-5.2-codex (2026-01-14) |
-
Penalaran - API Respons. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi, alat, dan pemanggilan alat paralel. - Ringkasan lengkap kemampuan. - Dioptimalkan untuk Ekstensi Codex CLI & Codex VS Code |
400,000 Input: 272.000 Keluaran: 128.000 |
128.000 | |
gpt-5.2 (2025-12-11) |
-
Penalaran - API Penyelesaian Chat. - API Respons. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi, alat, dan pemanggilan alat paralel. - Ringkasan lengkap kemampuan. |
400,000 Input: 272.000 Keluaran: 128.000 |
128.000 | Agustus 2025 |
gpt-5.2-chat (2025-12-11)Preview |
- API Penyelesaian Chat. - API Respons. - Output terstruktur - Fungsi, alat, dan pemanggilan alat paralel. |
128,000 Input: 111.616 Keluaran: 16.384 |
16,384 | Agustus 2025 |
gpt-5.2-chat (2026-02-10)Preview |
- API Penyelesaian Chat. - API Respons. - Output terstruktur - Fungsi, alat, dan pemanggilan alat paralel. |
128,000 Input: 111.616 Keluaran: 16.384 |
16,384 | Agustus 2025 |
Perhatian
Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi terbaru yang stabil dan tersedia secara umum. Model yang berstatus pratinjau tidak mengikuti siklus hidup model OpenAI Azure standar.
GPT-5.1
Ketersediaan regional
| Model | Wilayah |
|---|---|
gpt-5.1 |
Lihat tabel model. |
gpt-5.1-chat |
Lihat tabel model. |
gpt-5.1-codex |
Lihat tabel model. |
gpt-5.1-codex-mini |
Lihat tabel model. |
gpt-5.1-codex-max |
Lihat tabel model. |
| Identifikasi Model | Deskripsi | Jendela Kontekstual | Token Output Maksimum | Data Pelatihan (sampai) |
|---|---|---|---|---|
gpt-5.1 (2025-11-13) |
-
Penalaran - API Penyelesaian Chat. - API Respons. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi, alat, dan pemanggilan alat paralel. - Ringkasan lengkap kemampuan. |
400,000 Input: 272.000 Keluaran: 128.000 |
128.000 | 30 September 2024 |
gpt-5.1-chat (2025-11-13) Preview |
-
Penalaran - API Penyelesaian Chat. - API Respons. - Output terstruktur - Fungsi, alat, dan pemanggilan alat paralel. |
128,000 Input: 111.616 Keluaran: 16.384 |
16,384 | 30 September 2024 |
gpt-5.1-codex (2025-11-13) |
-
Api respons saja. - Pemrosesan teks dan gambar - Output terstruktur. - Fungsi, alat, dan pemanggilan alat paralel. - Ringkasan lengkap kemampuan - Dioptimalkan untuk Ekstensi Codex CLI & Codex VS Code |
400,000 Input: 272.000 Keluaran: 128.000 |
128.000 | 30 September 2024 |
gpt-5.1-codex-mini (2025-11-13) |
-
Api respons saja. - Pemrosesan teks dan gambar - Output terstruktur. - Fungsi, alat, dan pemanggilan alat paralel. - Ringkasan lengkap kemampuan - Dioptimalkan untuk Ekstensi Codex CLI & Codex VS Code |
400,000 Input: 272.000 Keluaran: 128.000 |
128.000 | 30 September 2024 |
gpt-5.1-codex-max (2025-12-04) |
-
Api respons saja. - Pemrosesan teks dan gambar - Output terstruktur. - Fungsi, alat, dan pemanggilan alat paralel. - Ringkasan lengkap kemampuan - Dioptimalkan untuk Ekstensi Codex CLI & Codex VS Code |
400,000 Input: 272.000 Keluaran: 128.000 |
128.000 | 30 September 2024 |
Perhatian
Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi terbaru yang stabil dan tersedia secara umum. Model yang berstatus pratinjau tidak mengikuti siklus hidup model OpenAI Azure standar.
Penting
gpt-5.1reasoning_effortdiset secara default kenone. Saat meningkatkan dari model penalaran sebelumnya kegpt-5.1, perlu diingat bahwa Anda mungkin perlu memperbarui kode Anda untuk meneruskan tingkatreasoning_effortsecara eksplisit jika Anda ingin penalaran terjadi.gpt-5.1-chatmenambahkan kemampuan penalaran bawaan. Seperti model penalaran lainnya, model tersebut tidak mendukung parameter sepertitemperature. Jika Anda meningkatkan dari menggunakangpt-5-chat(yang bukan model penalaran) untukgpt-5.1-chatmemastikan Anda menghapus parameter kustom sepertitemperaturedari kode Anda yang tidak didukung oleh model penalaran.gpt-5.1-codex-maxmenambahkan dukungan untuk pengaturanreasoning_effortkexhigh. Upaya penalaran dengannonetidak didukunggpt-5.1-codex-max.
GPT-5
Ketersediaan regional
| Model | Wilayah |
|---|---|
gpt-5 (2025-08-07) |
Lihat tabel model. |
gpt-5-mini (2025-08-07) |
Lihat tabel model. |
gpt-5-nano (2025-08-07) |
Lihat tabel model. |
gpt-5-chat (2025-08-07) |
Lihat tabel model. |
gpt-5-chat (2025-10-03) |
Lihat tabel model. |
gpt-5-codex (2025-09-11) |
Lihat tabel model. |
gpt-5-pro (2025-10-06) |
Lihat tabel model. |
| Identifikasi Model | Deskripsi | Jendela Kontekstual | Token Output Maksimum | Data Pelatihan (sampai) |
|---|---|---|---|---|
gpt-5 (2025-08-07) |
-
Penalaran - API Penyelesaian Chat. - API Respons. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi, alat, dan pemanggilan alat paralel. - Ringkasan lengkap kemampuan. |
400,000 Input: 272.000 Keluaran: 128.000 |
128.000 | 30 September 2024 |
gpt-5-mini (2025-08-07) |
-
Penalaran - API Penyelesaian Chat. - API Respons. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi, alat, dan pemanggilan alat paralel. - Ringkasan lengkap kemampuan. |
400,000 Input: 272.000 Keluaran: 128.000 |
128.000 | Mei 31, 2024 |
gpt-5-nano (2025-08-07) |
-
Penalaran - API Penyelesaian Chat. - API Respons. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi, alat, dan pemanggilan alat paralel. - Ringkasan lengkap kemampuan. |
400,000 Input: 272.000 Keluaran: 128.000 |
128.000 | Mei 31, 2024 |
gpt-5-chat (2025-08-07)Preview |
- API Penyelesaian Chat. - API Respons. - Input: Teks/Gambar - Output: Hanya teks |
128.000 | 16,384 | 30 September 2024 |
gpt-5-chat (2025-10-03)Pratinjau1 |
- API Penyelesaian Chat. - API Respons. - Input: Teks/Gambar - Output: Hanya teks |
128.000 | 16,384 | 30 September 2024 |
gpt-5-codex (2025-09-11) |
-
Api respons saja. - Input: Teks/Gambar - Output: Hanya teks - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi, alat, dan pemanggilan alat paralel. - Ringkasan lengkap kemampuan - Dioptimalkan untuk Ekstensi Codex CLI & Codex VS Code |
400,000 Input: 272.000 Keluaran: 128.000 |
128.000 | - |
gpt-5-pro (2025-10-06) |
-
Penalaran - API Respons. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi dan alat - Ringkasan lengkap kemampuan. |
400,000 Input: 272.000 Keluaran: 128.000 |
128.000 | 30 September 2024 |
Nota
Versi 1gpt-5-chat2025-10-03 memperkenalkan peningkatan signifikan yang berfokus pada kecerdasan emosional dan kemampuan kesehatan mental. Peningkatan ini mengintegrasikan himpunan data khusus dan strategi respons yang disempurnakan untuk meningkatkan kemampuan model untuk:
- Memahami dan menafsirkan konteks emosional secara lebih akurat, memungkinkan interaksi bernuansa dan empatik.
- Memberikan respons yang mendukung dan bertanggung jawab dalam percakapan yang terkait dengan kesehatan mental, memastikan sensitivitas dan kepatuhan terhadap praktik terbaik.
Peningkatan ini bertujuan untuk membuat obrolan GPT-5 lebih sadar konteks, berpusat pada manusia, dan dapat diandalkan dalam skenario di mana nada emosional dan pertimbangan kesejahteraan sangat penting.
Perhatian
Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi terbaru yang stabil dan tersedia secara umum. Model yang berstatus pratinjau tidak mengikuti siklus hidup model OpenAI Azure standar.
gpt-oss
Ketersediaan regional
| Model | Wilayah |
|---|---|
gpt-oss-120b |
Semua wilayah di Azure OpenAI |
Capabilities
| Identifikasi Model | Deskripsi | Jendela Kontekstual | Token Output Maksimum | Data Pelatihan (sampai) |
|---|---|---|---|---|
gpt-oss-120b (Pratinjau) |
- Teks masuk/teks keluar saja - API Penyelesaian Percakapan -Streaming - Pemanggilan fungsi - Output terstruktur -Penalaran - Tersedia untuk penyebaran1 serta melalui komputasi terkelola |
131,072 | 131,072 | Mei 31, 2024 |
gpt-oss-20b (Pratinjau) |
- Teks masuk/teks keluar saja - API Penyelesaian Percakapan -Streaming - Pemanggilan fungsi - Output terstruktur -Penalaran - Tersedia melalui komputasi terkelola dan Foundry Local |
131,072 | 131,072 | Mei 31, 2024 |
1 Tidak seperti model OpenAI Azure lainnya gpt-oss-120b memerlukan proyek Foundry untuk menyebarkan model.
Menyebarkan dengan kode
az cognitiveservices account deployment create \
--name "Foundry-project-resource" \
--resource-group "test-rg" \
--deployment-name "gpt-oss-120b" \
--model-name "gpt-oss-120b" \
--model-version "1" \
--model-format "OpenAI-OSS" \
--sku-capacity 10 \
--sku-name "GlobalStandard"
Seri GPT-4.1
Ketersediaan regional
| Model | Wilayah |
|---|---|
gpt-4.1 (2025-04-14) |
Lihat tabel model. |
gpt-4.1-nano (2025-04-14) |
Lihat tabel model. |
gpt-4.1-mini (2025-04-14) |
Lihat tabel model. |
Capabilities
Penting
Masalah yang diketahui memengaruhi semua model seri GPT 4.1. Definisi panggilan alat atau fungsi besar yang melebihi 300.000 token akan mengakibatkan kegagalan, meskipun batas konteks token 1 juta model tidak tercapai.
Kesalahan dapat bervariasi berdasarkan panggilan API dan karakteristik payload yang mendasar.
Berikut adalah pesan kesalahan untuk API Penyelesaian Obrolan:
Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}
Berikut adalah pesan kesalahan untuk API Respons:
Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}
| Identifikasi Model | Deskripsi | Jendela kontekstual | Token output maksimal | Data pelatihan (hingga) |
|---|---|---|---|---|
gpt-4.1 (2025-04-14) |
- Input teks dan gambar Hasil Teks - API penyelesaian otomatis obrolan - Respons API -Streaming - Pemanggilan fungsi - Output terstruktur (penyelesaian percakapan) |
- 1,047,576 - 128,000 (penyebaran terkelola standar dan disediakan) - 300.000 (penyebaran batch) |
32,768 | Mei 31, 2024 |
gpt-4.1-nano (2025-04-14) |
- Input teks dan gambar Hasil Teks - API penyelesaian otomatis obrolan - Respons API -Streaming - Pemanggilan fungsi - Output terstruktur (penyelesaian percakapan) |
- 1,047,576 - 128,000 (penyebaran terkelola standar dan disediakan) - 300.000 (penyebaran batch) |
32,768 | Mei 31, 2024 |
gpt-4.1-mini (2025-04-14) |
- Input teks dan gambar Hasil Teks - API penyelesaian otomatis obrolan - Respons API -Streaming - Pemanggilan fungsi - Output terstruktur (penyelesaian percakapan) |
- 1,047,576 - 128,000 (penyebaran terkelola standar dan disediakan) - 300.000 (penyebaran batch) |
32,768 | Mei 31, 2024 |
pratinjau-penggunaan-komputer
Model eksperimental yang dilatih untuk digunakan dengan alat API Respons untuk penggunaan komputer.
Ini dapat digunakan dengan pustaka pihak ketiga untuk memungkinkan model mengontrol input mouse dan keyboard, sambil mendapatkan konteks dari cuplikan layar lingkungan saat ini.
Perhatian
Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi terbaru yang stabil dan tersedia secara umum. Model yang berstatus pratinjau tidak mengikuti siklus hidup model OpenAI Azure standar.
Pendaftaran diperlukan untuk mengakses computer-use-preview. Akses diberikan berdasarkan kriteria kelayakan Microsoft. Pelanggan yang memiliki akses ke model akses terbatas lainnya masih perlu meminta akses untuk model ini.
Untuk meminta akses, buka computer-use-preview aplikasi model akses terbatas. Saat akses diberikan, Anda perlu membuat penerapan untuk model.
Ketersediaan regional
| Model | Wilayah |
|---|---|
computer-use-preview |
Lihat tabel model. |
Capabilities
| Identifikasi Model | Deskripsi | Jendela kontekstual | Token output maksimal | Data pelatihan (hingga) |
|---|---|---|---|---|
computer-use-preview (2025-03-11) |
Model khusus untuk digunakan dengan API Responses sebagai alat penggunaan komputer. -Perkakas -Streaming - Teks (masukan/keluaran) - Gambar (input) |
8,192 | 1,024 | Oktober 2023 |
model seri o
Model seri o OpenAI Azure dirancang untuk mengatasi tugas penalaran dan pemecahan masalah dengan peningkatan fokus dan kemampuan. Model-model ini menghabiskan lebih banyak waktu untuk memproses dan memahami permintaan pengguna, membuatnya sangat kuat di bidang-bidang seperti sains, pengodean, dan matematika, dibandingkan dengan iterasi sebelumnya.
| Identifikasi Model | Deskripsi | Permintaan maksimal jumlah token | Data pelatihan (hingga) |
|---|---|---|---|
codex-mini (2025-05-16) |
Versi yang disempurnakan dari o4-mini. - API Respons. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi dan alat. Ringkasan lengkap kemampuan. |
Masukan: 200.000 Keluaran: 100.000 |
Mei 31, 2024 |
o3-pro (2025-06-10) |
-
API Respons. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi dan alat. Ringkasan lengkap kemampuan. |
Masukan: 200.000 Keluaran: 100.000 |
Mei 31, 2024 |
o4-mini (2025-04-16) |
-
Model penalaran baru, menawarkan kemampuan penalaran yang ditingkatkan. - API Penyelesaian Chat. - API Respons. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi dan alat. Ringkasan lengkap kemampuan. |
Masukan: 200.000 Keluaran: 100.000 |
Mei 31, 2024 |
o3 (2025-04-16) |
-
Model penalaran baru, menawarkan kemampuan penalaran yang ditingkatkan. - API Penyelesaian Chat. - API Respons. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi, alat, dan pemanggilan alat paralel. Ringkasan lengkap kemampuan. |
Masukan: 200.000 Keluaran: 100.000 |
Mei 31, 2024 |
o3-mini (2025-01-31) |
-
Kemampuan penalaran yang ditingkatkan. - Output terstruktur. - Pemrosesan teks saja. - Fungsi dan alat. |
Masukan: 200.000 Keluaran: 100.000 |
Oktober 2023 |
o1 (2024-12-17) |
-
Kemampuan penalaran yang ditingkatkan. - Output terstruktur. - Pemrosesan teks dan gambar. - Fungsi dan alat. |
Masukan: 200.000 Keluaran: 100.000 |
Oktober 2023 |
o1-preview (2024-09-12) |
Versi pratinjau yang lebih lama. | Masukan: 128.000 Keluaran: 32.768 |
Oktober 2023 |
o1-mini (2024-09-12) |
Opsi yang lebih cepat dan lebih hemat biaya dalam seri o1, ideal untuk tugas pengkodan yang membutuhkan kecepatan dan konsumsi sumber daya yang lebih rendah. - Penyebaran Standar Global tersedia secara default. - Penyebaran standar (regional) saat ini hanya tersedia untuk pelanggan tertentu yang menerima akses sebagai bagian dari rilis akses terbatas o1-preview. |
Masukan: 128.000 Keluaran: 65.536 |
Oktober 2023 |
Untuk mempelajari selengkapnya tentang model seri o tingkat lanjut, lihat Mulai menggunakan model penalaran.
Ketersediaan regional
| Model | Wilayah |
|---|---|
codex-mini |
US Timur2 & Swedia Tengah (Standar Internasional) |
o3-pro |
US Timur2 & Swedia Tengah (Standar Internasional) |
o4-mini |
Lihat tabel model. |
o3 |
Lihat tabel model. |
o3-mini |
Lihat tabel model. |
o1 |
Lihat tabel model. |
o1-preview |
Lihat tabel model. Model ini hanya tersedia untuk pelanggan yang diberikan akses sebagai bagian dari akses terbatas asli. |
o1-mini |
Lihat tabel model. |
GPT-4o dan GPT-4 Turbo
GPT-4o mengintegrasikan teks dan gambar dalam satu model, yang memungkinkannya menangani beberapa jenis data secara bersamaan. Pendekatan multimodal ini meningkatkan akurasi dan responsivitas dalam interaksi manusia-komputer. GPT-4o cocok dengan GPT-4 Turbo dalam tugas teks dan pengodean bahasa Inggris sambil menawarkan performa unggul dalam tugas bahasa non-bahasa Inggris dan tugas visi, menetapkan tolok ukur baru untuk kemampuan AI.
Model GPT-4 dan GPT-4 Turbo
Model ini hanya dapat digunakan dengan API Penyelesaian Obrolan.
Lihat versi Model untuk mempelajari tentang bagaimana Azure OpenAI menangani peningkatan versi model. Lihat Bekerja dengan model untuk mempelajari cara melihat dan mengonfigurasi pengaturan versi model penyebaran GPT-4 Anda.
| Identifikasi Model | Deskripsi | Permintaan maksimal jumlah token | Data pelatihan (hingga) |
|---|---|---|---|
gpt-4o (2024-11-20) GPT-4o (Omni) |
- Output terstruktur. - Pemrosesan teks dan gambar. - Mode JSON. - Panggilan fungsi paralel. - Akurasi dan responsivitas yang ditingkatkan. - Kesetaraan dengan tugas pemrosesan teks dan pengodean bahasa Inggris dibandingkan dengan GPT-4 Turbo dengan Vision. - Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi. - Kemampuan menulis kreatif yang ditingkatkan. |
Masukan: 128.000 Keluaran: 16.384 |
Oktober 2023 |
gpt-4o (2024-08-06) GPT-4o (Omni) |
- Output terstruktur. - Pemrosesan teks dan gambar. - Mode JSON. - Panggilan fungsi paralel. - Akurasi dan responsivitas yang ditingkatkan. - Kesetaraan dengan tugas pemrosesan teks dan pengodean bahasa Inggris dibandingkan dengan GPT-4 Turbo dengan Vision. - Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi. |
Masukan: 128.000 Keluaran: 16.384 |
Oktober 2023 |
gpt-4o-mini (2024-07-18) GPT-4o Mini |
- Model yang cepat, murah, dan mampu ideal untuk mengganti model seri GPT-3.5 Turbo. - Pemrosesan teks dan gambar. - Mode JSON. - Panggilan fungsi paralel. |
Masukan: 128.000 Keluaran: 16.384 |
Oktober 2023 |
gpt-4o (2024-05-13) GPT-4o (Omni) |
- Pemrosesan teks dan gambar. - Mode JSON. - Panggilan fungsi paralel. - Akurasi dan responsivitas yang ditingkatkan. - Kesetaraan dengan tugas pemrosesan teks dan pengodean bahasa Inggris dibandingkan dengan GPT-4 Turbo dengan Vision. - Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi. |
Masukan: 128.000 Keluaran: 4.096 |
Oktober 2023 |
gpt-4 (turbo-2024-04-09) GPT-4 Turbo dengan Kemampuan Visual |
Model baru yang tersedia secara umum. - Penggantian untuk semua model pratinjau GPT-4 sebelumnya ( vision-preview, 1106-Preview, 0125-Preview). - Ketersediaan fitur saat ini berbeda, tergantung pada metode input dan jenis penyebaran. |
Masukan: 128.000 Keluaran: 4.096 |
Desember 2023 |
Perhatian
Kami tidak menyarankan Anda menggunakan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi terbaru yang stabil dan tersedia secara umum. Model yang berstatus pratinjau tidak mengikuti siklus hidup model OpenAI Azure standar.
Embeddings
text-embedding-3-large adalah model penyisipan terbaru dan terkuat. Anda tidak dapat memperbarui dari satu model penyematan ke model lainnya. Untuk berpindah dari menggunakan text-embedding-ada-002 ke text-embedding-3-large, Anda perlu membuat penyematan baru.
text-embedding-3-largetext-embedding-3-smalltext-embedding-ada-002
Laporan OpenAI menunjukkan bahwa pengujian memperlihatkan model penyematan generasi ketiga besar dan kecil menawarkan performa pengambilan informasi multibahasa yang lebih baik secara rata-rata dengan menggunakan tolok ukur MIRACL. Mereka masih mempertahankan performa untuk tugas bahasa Inggris dengan tolok ukur MTEB.
| Tolok ukur evaluasi | text-embedding-ada-002 |
text-embedding-3-small |
text-embedding-3-large |
|---|---|---|---|
| Rata-rata MIRACL | 31.4 | 44.0 | 54.9 |
| Rata-rata MTEB | 61.0 | 62.3 | 64.6 |
Model penyematan generasi ketiga mendukung pengurangan ukuran penyematan melalui parameter baru dimensions . Biasanya, penyematan yang lebih besar lebih mahal dari perspektif komputasi, memori, dan penyimpanan. Ketika Anda dapat menyesuaikan jumlah dimensi, Anda mendapatkan lebih banyak kontrol atas biaya dan performa keseluruhan. Parameter dimensions tidak didukung di semua versi pustaka Python OpenAI 1.x. Untuk memanfaatkan parameter ini, kami sarankan Anda meningkatkan ke versi terbaru: pip install openai --upgrade.
Pengujian tolok ukur MTEB OpenAI menemukan bahwa bahkan ketika dimensi model generasi ketiga dikurangi menjadi kurang dari 1.536 dimensi text-embeddings-ada-002, performa tetap sedikit lebih baik.
Model pembuatan gambar
Model pembuatan gambar menghasilkan gambar dari perintah teks yang disediakan pengguna. Model seri GPT-image-1 berada dalam pratinjau akses terbatas. DALL-E 3 umumnya tersedia untuk digunakan dengan REST API. DALL-E 2 dan DALL-E 3 dengan SDK klien masing-masing sedang dalam pratinjau.
Pendaftaran diperlukan untuk mengakses gpt-image-1, gpt-image-1-mini, atau gpt-image-1.5. Akses diberikan berdasarkan kriteria kelayakan Microsoft. Pelanggan yang memiliki akses ke model akses terbatas lainnya masih perlu meminta akses untuk model ini.
Untuk meminta akses, isi formulir: Ajukan akses ke GPT-image-1; Ajukan akses ke GPT-image-1.5. Saat akses diberikan, Anda perlu membuat penerapan untuk model.
Ketersediaan regional
| Model | Wilayah |
|---|---|
dall-e-3 |
Lihat tabel model |
gpt-image-1 |
Lihat tabel model |
gpt-image-1-mini |
Lihat tabel model |
gpt-image-1.5 |
Lihat tabel model |
Model pembuatan video
Sora adalah model AI dari OpenAI yang dapat menciptakan adegan video yang realistis dan imajinatif dari instruksi teks. Sora sedang dalam pratinjau.
Ketersediaan regional
| Model | Wilayah |
|---|---|
sora |
Lihat tabel model |
sora-2 |
Lihat tabel model |
Model audio
Model audio di Azure OpenAI tersedia melalui API realtime, completions, dan audio.
Model GPT-4o audio
Model audio GPT-4o adalah bagian dari keluarga model GPT-4o dan mendukung latensi rendah, ucapan masuk, interaksi percakapan atau pembuatan audio.
Perhatian
Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi terbaru yang stabil dan tersedia secara umum. Model yang berstatus pratinjau tidak mengikuti siklus hidup model OpenAI Azure standar.
Detail tentang token permintaan maksimum dan data pelatihan tersedia dalam tabel berikut:
| Identifikasi Model | Deskripsi | Permintaan maksimal jumlah token | Data pelatihan (hingga) |
|---|---|---|---|
gpt-4o-mini-audio-preview (2024-12-17) GPT-4o Audio |
Model audio untuk pembuatan audio dan teks. | Masukan: 128.000 Keluaran: 16.384 |
September 2023 |
gpt-4o-audio-preview (2024-12-17) GPT-4o Audio |
Model audio untuk pembuatan audio dan teks. | Masukan: 128.000 Keluaran: 16.384 |
September 2023 |
gpt-4o-realtime-preview (2025-06-03) GPT-4o Audio |
Model suara untuk pemrosesan audio waktu nyata. | Masukan: 128.000 Keluaran: 4.096 |
Oktober 2023 |
gpt-4o-realtime-preview (2024-12-17) GPT-4o Audio |
Model suara untuk pemrosesan audio waktu nyata. | Masukan: 128.000 Keluaran: 4.096 |
Oktober 2023 |
gpt-4o-mini-realtime-preview (2024-12-17) GPT-4o Audio |
Model suara untuk pemrosesan audio waktu nyata. | Masukan: 128.000 Keluaran: 4.096 |
Oktober 2023 |
gpt-realtime (28-08-2025) (GA)gpt-realtime-mini (2025-10-06)gpt-realtime-mini-2025-12-15 (2025-12-15) gpt-realtime-1.5-2026-02-23 (2026-02-23)gpt-audio(28-08-2025)gpt-audio-mini(6 Oktober 2025)gpt-audio-1.5-2026-02-23 (2026-02-23) |
Model suara untuk pemrosesan audio waktu nyata. | Input: 28.672 Keluaran: 4.096 |
Oktober 2023 |
Untuk membandingkan ketersediaan model audio GPT-4o di semua wilayah, lihat tabel model.
Audio API
Model audio melalui /audio API dapat digunakan untuk ucapan ke teks, terjemahan, dan teks ke ucapan.
Model ucapan ke teks
| Identifikasi Model | Deskripsi | Permintaan maksimum (ukuran file audio) |
|---|---|---|
whisper |
Model pengenalan ucapan tujuan umum. | 25 MB |
gpt-4o-transcribe |
Model ucapan ke teks didukung oleh GPT-4o. | 25 MB |
gpt-4o-mini-transcribe |
Model ucapan ke teks didukung oleh GPT-4o mini. | 25 MB |
gpt-4o-transcribe-diarize |
Model ucapan ke teks dengan pengenalan ucapan otomatis. | 25 MB |
gpt-4o-mini-transcribe-2025-12-15 |
Model ucapan ke teks dengan pengenalan ucapan otomatis. Peningkatan akurasi dan ketahanan transkripsi. | 25 MB |
Model terjemahan ucapan
| Identifikasi Model | Deskripsi | Permintaan maksimum (ukuran file audio) |
|---|---|---|
whisper |
Model pengenalan ucapan tujuan umum. | 25 MB |
Model teks ke ucapan (pratinjau)
| Identifikasi Model | Deskripsi |
|---|---|
tts |
Model teks ke ucapan dioptimalkan untuk kecepatan. |
tts-hd |
Model teks ke ucapan dioptimalkan untuk kualitas. |
gpt-4o-mini-tts |
Model teks ke ucapan didukung oleh GPT-4o mini. Anda dapat memandu suara untuk berbicara dengan gaya atau nada tertentu. |
gpt-4o-mini-tts-2025-12-15 |
Model teks ke ucapan didukung oleh GPT-4o mini. Anda dapat memandu suara untuk berbicara dengan gaya atau nada tertentu. |
Tabel ringkasan model dan ketersediaan wilayah
Model menurut jenis penyebaran
Azure OpenAI memberi pelanggan pilihan pada struktur hosting yang sesuai dengan pola bisnis dan penggunaan mereka. Layanan ini menawarkan dua jenis penyebaran utama:
- Standar: Memiliki opsi penyebaran global, merutekan lalu lintas secara global untuk memberikan throughput yang lebih tinggi.
- Provisioned: Juga memiliki opsi penyebaran global, memungkinkan pelanggan untuk membeli dan menyebarkan unit throughput yang disediakan di seluruh infrastruktur global Azure.
Semua penyebaran dapat melakukan operasi inferensi yang persis sama, namun penagihan, skalabilitas, dan kinerja sangat berbeda. Untuk mempelajari selengkapnya tentang jenis penyebaran Azure OpenAI, lihat panduan jenis Penyebaran kami.
- Standar Global
- Terkelola Diprakarsai Global
- Global Batch
- Standar Data Zona
- Zona Data yang Dicadangkan dan Dikelola
- Pengelolaan Kumpulan Data
- Standar
- Dikelola yang telah disediakan
Ketersediaan model standar global
| Wilayah | gpt-5.4, 2026-03-05 | gpt-5.4-pro, 2026-03-05 | gpt-5.3-codex, 2026-02-24 | gpt-5.3-chat, 2026-03-03 | gpt-5.2-codex, 2026-01-14 | gpt-5.2, 2025-12-11 | gpt-5.2-chat, 2025-12-11 | gpt-5.2-chat, 2026-02-10 | gpt-5.1-codex-max, 2025-12-04 | gpt-5.1, 2025-11-13 | gpt-5.1-chat, 2025-11-13 | gpt-5.1-codex, 2025-11-13 | gpt-5.1-codex-mini, 2025-11-13 | gpt-5-pro, 2025-10-06 | gpt-5-codex, 2025-09-15 | gpt-5, 2025-08-07 | gpt-5-mini, 2025-08-07 | gpt-5-nano, 2025-08-07 | gpt-5-chat, 2025-08-07 | gpt-5-chat, 2025-10-03 | o3-pro, 2025-06-10 | codex-mini, 2025-05-16 | sora, 2025-05-02 | model-router, 2025-08-07 | model-router, 2025-05-19 | model-router, 2025-11-18 | o3, 2025-04-16 | o4-mini, 2025-04-16 | gpt-image-1, 2025-04-15 | gpt-4.1, 2025-04-14 | gpt-4.1-nano, 2025-04-14 | gpt-4.1-mini, 2025-04-14 | pratinjau-penggunaan-komputer, 2025-03-11 | o3-mini, 2025-01-31 | o1, 2024-12-17 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | text-embedding-3-small, 1 | text-embedding-3-large, 1 | text-embedding-ada-002, 2 | gpt-4o-realtime-preview, 2024-12-17 | gpt-4o-audio-preview, 2024-12-17 | gpt-4o-mini-realtime-preview, 2024-12-17 | gpt-4o-mini-audio-preview, 2024-12-17 | gpt-4o-transcribe, 2025-03-20 | gpt-4o-mini-tts, 2025-03-20 | gpt-4o-mini-tts, 2025-12-15 | gpt-4o-mini-transcribe, 2025-03-20 | gpt-4o-mini-transcribe, 2025-12-15 | gpt-audio, 2025-08-28 | gpt-audio-mini, 2025-10-06 | gpt-audio-mini, 2025-12-15 | gpt-audio-1.5, 2026-02-23 | gpt-4o-transcribe-diarize, 2025-10-15 | gpt-image-1-mini, 2025-10-06 | gpt-realtime, 2025-08-28 | o3-deep-research, 2025-06-26 | gpt-image-1.5, 2025-12-16 | gpt-realtime-1.5, 2026-02-23 | sora-2, 2025-10-06 | gpt-realtime-mini, 2025-10-06 | gpt-realtime-mini, 2025-12-15 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Australia bagian timur | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| Brasil Selatan | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| kanadacentral | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | - | ✅ | ✅ |
| kanada timur | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| centralus | - | - | ✅ | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | - | ✅ | ✅ |
| eastus | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ |
| FranceCentral | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | - | ✅ | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | ✅ | - | ✅ | ✅ |
| Jerman Barat Tengah | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| Italia Utara | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| Jepang Timur | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| koreacentral | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| Northcentralus | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| Norwegia Timur | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - |
| polandcentral | ✅ | ✅ | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | ✅ | - | - | - | - |
| southafricanorth | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| southcentralus | ✅ | ✅ | ✅ | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| southeastasia | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| India Selatan | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| spaincentral | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ |
| Swiss bagian Utara | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| switzerlandwest | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | - | - | - | ✅ | ✅ | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | ✅ | - | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| uaenorth | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | ✅ | - | - | - | - |
| uksouth | - | - | - | - | - | ✅ | - | - | - | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| westeurope | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
| westus | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | ✅ | ✅ | - | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | - | - | - |
| westus3 | - | - | - | - | - | ✅ | - | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - | - | - | - | - | - | - | - | - | - | - | - | - | - | ✅ | - | - | ✅ | - | - | - | - |
Nota
o3-deep-research saat ini hanya tersedia dengan Foundry Agent Service. Untuk mempelajari lebih lanjut, lihat panduan alat Deep Research.
Tabel ini tidak menyertakan informasi ketersediaan regional yang terperinci. Lihat bagian penyempurnaan untuk informasi ini.
Model pembobotan
Model ini hanya dapat digunakan dengan permintaan Embedding API.
Nota
text-embedding-3-large adalah model penyisipan terbaru dan terkuat. Anda tidak dapat melakukan upgrade di antara model embedding. Untuk bermigrasi dari menggunakan text-embedding-ada-002 ke text-embedding-3-large, Anda perlu membuat penyematan baru.
| Identifikasi Model | Permintaan maksimal jumlah token | Dimensi output | Data pelatihan (hingga) |
|---|---|---|---|
text-embedding-ada-002 (versi 2) |
8,192 | 1,536 | Sep 2021 |
text-embedding-ada-002 (versi 1) |
2,046 | 1,536 | Sep 2021 |
text-embedding-3-large |
8,192 | 3,072 | Sep 2021 |
text-embedding-3-small |
8,192 | 1,536 | Sep 2021 |
Nota
Saat Anda mengirim array input untuk penyematan, jumlah maksimum item input dalam array per panggilan ke titik akhir penyematan adalah 2.048.
Model pembuatan gambar
| Identifikasi Model | Permintaan maks (karakter) |
|---|---|
gpt-image-1 |
4.000 |
gpt-image-1-mini |
4.000 |
gpt-image-1.5 |
4.000 |
dall-e-3 |
4.000 |
Model pembuatan video
| Identifikasi Model | Permintaan Maksimum (karakter) |
|---|---|
| sora | 4.000 |
Menyempurnakan model
Model berikut didukung untuk penyempurnaan:
| Identifikasi Model | Wilayah standar | Global | Pengembang | Metode | Kedudukan | Modality |
|---|---|---|---|---|---|---|
gpt-4o-mini (2024-07-18) |
US Tengah Utara Swedia Tengah |
✅ | ✅ | SFT | GA | Teks ke teks |
gpt-4o (2024-08-06) |
US Timur 2 US Tengah Utara Swedia Tengah |
✅ | ✅ | SFT, DPO | GA | Teks dan visi ke teks |
gpt-4.1 (2025-04-14) |
US Tengah Utara Swedia Tengah |
✅ | ✅ | SFT, DPO | GA | Teks dan visi ke teks |
gpt-4.1-mini (2025-04-14) |
US Tengah Utara Swedia Tengah |
✅ | ✅ | SFT, DPO | GA | Teks ke teks |
gpt-4.1-nano (2025-04-14) |
US Tengah Utara Swedia Tengah |
✅ | ✅ | SFT, DPO | GA | Teks ke teks |
o4-mini (2025-04-16) |
US Timur 2 Swedia Tengah |
✅ | ❌ | RFT | GA | Teks ke teks |
gpt-5 (2025-08-07) |
US Tengah Utara Swedia Tengah |
✅ | ✅ | RFT | Pratinjau pribadi | Teks ke teks |
Ministral-3B (2411) |
Tidak didukung | ✅ | ❌ | SFT | Pratinjau umum | Teks ke teks |
Qwen-32B |
Tidak didukung | ✅ | ❌ | SFT | Pratinjau umum | Teks ke teks |
Llama-3.3-70B-Instruct |
Tidak didukung | ✅ | ❌ | SFT | Pratinjau umum | Teks ke teks |
gpt-oss-20b |
Tidak didukung | ✅ | ❌ | SFT | Pratinjau umum | Teks ke teks |
Atau Anda dapat melakukan penyempurnaan lebih lanjut pada model yang sebelumnya telah disempurnakan, yang diformat sebagai base-model.ft-{jobid}.
Nota
Model sumber terbuka (Ministral-3B, Qwen-32B, Llama-3.3-70B-Instruct, gpt-oss-20b) hanya didukung pada sumber daya Foundry dan di UI Foundry baru.
Nota
Pelatihan global menyediakan pelatihan per token yang lebih terjangkau, tetapi tidak menawarkan penyimpanan data. Saat ini tersedia untuk sumber daya Foundry di wilayah berikut:
- Australia Timur
- Brasil Selatan
- Kanada Tengah
- Kanada Timur
- US Timur
- Amerika Serikat Timur2
- Prancis Tengah
- Jerman Barat Tengah
- Italia Utara
- Jepang Timur (tidak ada dukungan visi)
- Korea Tengah
- US Tengah Utara
- Norwegia Timur
- Polandia Tengah (tidak ada dukungan 4.1-nano)
- Asia Tenggara
- Afrika Selatan Utara
- US Tengah Selatan
- India Selatan
- Spanyol Tengah
- Swedia Tengah
- Swiss Barat
- Swiss Utara
- UK Selatan
- Eropa Barat
- US Barat
- US Barat 3
Asisten (pratinjau)
Untuk Asisten, Anda memerlukan kombinasi model yang didukung dan wilayah yang didukung. Alat dan kemampuan tertentu memerlukan model terbaru. Model berikut tersedia di Assistants API, SDK, dan Foundry. Tabel berikut ini adalah untuk penyebaran standar. Untuk informasi tentang ketersediaan unit throughput, lihat Throughput yang dialokasikan. Model dan wilayah yang tercantum dapat digunakan dengan Asisten v1 dan v2. Anda dapat menggunakan model Standar Global jika didukung di wilayah berikut.
| Wilayah | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, 1106-Preview | gpt-4, 0125-Preview | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 | gpt-35-turbo-16k, 0613 |
|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Australia bagian timur | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ | ✅ |
| eastus | ✅ | ✅ | ✅ | - | - | ✅ | ✅ | - | ✅ | - | ✅ | ✅ |
| eastus2 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | ✅ | - | ✅ | ✅ |
| FranceCentral | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | - | ✅ |
| Jepang Timur | - | - | - | - | - | - | - | - | ✅ | - | ✅ | ✅ |
| Norwegia Timur | - | - | - | - | ✅ | - | - | - | - | - | - | - |
| India Selatan | - | - | - | - | ✅ | - | - | - | - | ✅ | ✅ | - |
| swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | - | ✅ | ✅ | ✅ | ✅ | - | ✅ |
| uksouth | - | - | - | - | ✅ | ✅ | - | - | ✅ | ✅ | ✅ | ✅ |
| westus | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | ✅ | ✅ | - |
| westus3 | ✅ | ✅ | ✅ | - | ✅ | - | ✅ | - | - | - | ✅ | - |
Pensiun Model
Untuk informasi terbaru tentang penghentian model, lihat panduan penghentian model.
Konten terkait
Nota
Model Foundry yang dijual langsung oleh Azure juga mencakup semua model OpenAI Azure. Untuk mempelajari tentang model ini, beralihlah ke Azure model OpenAI koleksi di bagian atas artikel ini.
Model Black Forest Labs dijual langsung oleh Azure
Koleksi model pembuatan gambar Black Forest Labs (BFL) mencakup FLUX.2 [flex] dan FLUX.2 [pro] untuk pembuatan gambar dan pengeditan melalui perintah teks dan gambar, FLUX.1 Kontext [pro] untuk pembuatan dan pengeditan dalam konteks, dan FLUX1.1 [pro] untuk pembuatan teks ke gambar.
Anda dapat menjalankan model ini melalui API penyedia layanan BFL dan melalui titik akhir gambar/generasi dan gambar/edit.
| Model | Ketik & titik akhir API | Capabilities | Jenis penyebaran (ketersediaan wilayah) |
|---|---|---|---|
FLUX.2-flex |
Pembuatan gambar - API penyedia layanan BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-flex |
-
Input: teks dan gambar (32.000 token dan hingga 10 gambari) - Hasil: Satu Gambar - Pemanggilan alat: Tidak - Format respons: Gambar (PNG dan JPG) - Fitur utama: Kontrol halus; dukungan multi-referensi hingga 10 gambar - Parameter tambahan: guidance: Mengontrol seberapa dekat output mengikuti perintah. Minimum: 1.5, maksimum: 10, default: 4.5. Lebih tinggi = kepatuhan pada permintaan yang lebih ketat. steps: Jumlah langkah inferensi. Maksimum: 50, default: 50. Lebih tinggi = lebih detail, lebih lambat. |
- Standar global (semua wilayah) |
FLUX.2-pro |
Pembuatan gambar - API penyedia layanan BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-pro |
-
Input: teks dan gambar (32.000 token dan hingga 8 gambarii) - Hasil: Satu Gambar - Pemanggilan alat: Tidak - Format respons: Gambar (PNG dan JPG) - Fitur utama: Dukungan multi-referensi hingga 8 gambar; lebih membumi dalam pengetahuan dunia nyata; fleksibilitas output yang lebih besar; performa yang ditingkatkan - Parameter tambahan:(Hanya di API khusus penyedia) Mendukung semua parameter. |
- Standar global (semua wilayah) |
FLUX.1-Kontext-pro |
Pembuatan gambar - API Gambar: https://<resource-name>/openai/deployments/{deployment-id}/images/generations dan https://<resource-name>/openai/deployments/{deployment-id}/images/edits - API penyedia layanan BFL: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview |
-
Input: teks dan gambar (5.000 token dan 1 gambar) - Hasil: Satu Gambar - Pemanggilan alat: Tidak - Format respons: Gambar (PNG dan JPG) - Fitur utama: Konsistensi karakter, pengeditan tingkat lanjut - Parameter tambahan:(Hanya di API khusus penyedia) seed, , aspect ratio, input_imageprompt_unsampling, , safety_toleranceoutput_format |
- Standar global (semua wilayah) |
FLUX-1.1-pro |
Pembuatan gambar - API Gambar: https://<resource-name>/openai/deployments/{deployment-id}/images/generations - API penyedia layanan BFL: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview |
-
Input: teks (5.000 token dan 1 gambar) - Hasil: Satu Gambar - Pemanggilan alat: Tidak - Format respons: Gambar (PNG dan JPG) - Fitur utama: Kecepatan inferensi cepat, kepatuhan prompt yang kuat, harga kompetitif, generasi yang dapat diskalakan - Parameter tambahan:(Hanya di API khusus penyedia) width, , height, prompt_unsamplingseed, , safety_toleranceoutput_format |
- Standar global (semua wilayah) |
i,ii Dukungan untuk beberapa gambar referensi tersedia untuk FLUX.2 [pro] dan FLUX.2 [flex] dengan menggunakan API, tetapi tidak di taman bermain. Lihat sampel Kode berikut untuk model FLUX.2.
Nota
Lihat sampel GitHub untuk pembuatan gambar dengan model FLUX di Microsoft Foundry dan notebook terkait yang menampilkan cara membuat gambar berkualitas tinggi dari perintah tekstual.
Sampel kode untuk model FLUX.2
Sampel kode ini menggunakan FLUX.2 [pro] untuk ilustrasi. Untuk menggunakan FLUX.2 [flex], ganti API dan model dalam kode berikut.
Pembuatan gambar
- Input: Teks
- Output: Satu gambar
curl -X POST https://<your-resource-name>.api.cognitive.microsoft.com/providers/blackforestlabs/v1/flux-2-pro?api-version=preview \
-H "Content-Type: application/json" \
-H "Authorization: Bearer {API_KEY}" \
-d '{
"model": "FLUX.2-pro",
"prompt": "A photograph of a red fox in an autumn forest",
"width": 1024,
"height": 1024,
"seed": 42,
"safety_tolerance": 2,
"output_format": "jpeg"
}'
Pengeditan gambar
- Input: Beberapa gambar yang dikodekan bit-64 (gambar maks: 8 untuk FLUX.2[pro] dan 10 untuk FLUX.2[flex])
- Output: Satu gambar
curl -X POST https://<your-resource-name>.api.cognitive.microsoft.com/providers/blackforestlabs/v1/flux-2-pro?api-version=preview \
-H "Content-Type: application/json" \
-H "Authorization: Bearer {API_KEY}" \
-d '{
"model": "FLUX.2-pro",
"prompt": "Apply a cinematic, moody lighting effect to all photos. Make them look like scenes from a sci-fi noir film",
"output_format": "jpeg",
"input_image" : "/9j/4AAQSkZJRgABAQAAAQABAAD/2wBDA.......",
"input_image_2" : "iVBORw0KGgoAAAANSUhEUgAABAAAAAQACAIAAADwf........"
}'
Lihat koleksi model ini di portal Microsoft Foundry.
Model Cohere dijual langsung oleh Azure
Keluarga model Cohere mencakup berbagai model yang dioptimalkan untuk kasus penggunaan yang berbeda, termasuk penyelesaian obrolan, klasifikasi rerank/teks, dan penyematan. Model Cohere dioptimalkan untuk berbagai kasus penggunaan yang mencakup penalaran, ringkasan, dan jawaban atas pertanyaan.
| Model | Tipe | Capabilities | Jenis penyebaran (ketersediaan wilayah) |
|---|---|---|---|
| Cohere-rerank-v4.0-pro | Klasifikasi Teks (Pemeringkatan Ulang) |
-
Input: teks - Keluaran: teks - Bahasa: en, fr, , esit, de, pt-br, ja, zh-cn, ar, vi, , hi, ru, , id, dannl - Pemanggilan alat: Tidak - Format tanggapan: JSON |
- Standar global (semua wilayah) - Layanan komputasi terkelola |
| Cohere-rerank-v4.0-fast | Klasifikasi Teks (Pemeringkatan Ulang) |
-
Input: teks - Keluaran: teks - Bahasa: en, fr, , esit, de, pt-br, ja, zh-cn, ar, vi, , hi, ru, , id, dannl - Pemanggilan alat: Tidak - Format tanggapan: JSON |
- Standar global (semua wilayah) - Layanan komputasi terkelola |
Cohere-command-a |
chat-completion |
-
Input: teks (131.072 token) - Output: teks (8,182 token) - Bahasa: en, fr, , esit, de, pt-br, ja, ko, , zh-cndanar - Panggilan alat: Ya - Format respons: Teks, JSON |
- Standar global (semua wilayah) |
embed-v-4-0 |
embeddings |
-
Input: teks (512 token) dan gambar (piksel 2MM) - Hasil: Vektor (256, 512, 1024, 1536 dim.) - Bahasa: en, fr, , esit, de, pt-br, ja, ko, , zh-cndanar |
- Standar global (semua wilayah) |
Lihat koleksi model Cohere di portal Foundry.
Model DeepSeek dijual langsung oleh Azure
Keluarga model DeepSeek mencakup beberapa model penalaran, yang unggul dalam tugas penalaran dengan menggunakan proses pelatihan langkah demi langkah, seperti bahasa, penalaran ilmiah, dan tugas pengkodan.
| Model | Tipe | Capabilities | Jenis penyebaran (ketersediaan wilayah) |
|---|---|---|---|
DeepSeek-V3.2-Speciale |
chat-completion (dengan konten yang penuh pertimbangan) |
-
Masukan: text (128,000 tokens) - Output: teks (128.000 token) - Bahasa: en dan zh - Pemanggilan alat: Tidak - Format respons: Teks, JSON |
- Standar global (semua wilayah) |
DeepSeek-V3.2 |
chat-completion (dengan konten yang penuh pertimbangan) |
-
Masukan: text (128,000 tokens) - Output: teks (128.000 token) - Bahasa: en dan zh - Pemanggilan alat: Tidak - Format respons: Teks, JSON |
- Standar global (semua wilayah) |
DeepSeek-V3.1 |
chat-completion (dengan konten yang penuh pertimbangan) |
-
Input: teks (131.072 token) - Output: teks (131,072 token) - Bahasa: en dan zh - Panggilan alat: Ya - Format respons: Teks, JSON |
- Standar global (semua wilayah) |
DeepSeek-R1-0528 |
chat-completion (dengan konten yang penuh pertimbangan) |
-
Input: teks (163.840 token) - Output: teks (163.840 token) - Bahasa: en dan zh - Pemanggilan alat: Tidak - Format respons: Teks |
- Standar global (semua wilayah) - Penyediaan global (semua wilayah) |
DeepSeek-V3-0324 |
chat-completion |
-
Input: teks (131.072 token) - Output: teks (131,072 token) - Bahasa: en dan zh - Panggilan alat: Ya - Format respons: Teks, JSON |
- Standar global (semua wilayah) - Penyediaan global (semua wilayah) |
DeepSeek-R1 |
chat-completion (dengan konten yang penuh pertimbangan) |
-
Input: teks (163.840 token) - Output: teks (163.840 token) - Bahasa: en dan zh - Pemanggilan alat: Tidak - Format respons: Teks |
- Standar global (semua wilayah) - Penyediaan global (semua wilayah) |
Lihat koleksi model ini di portal Foundry.
Model meta dijual secara langsung oleh Azure
Model dan alat Meta Llama adalah kumpulan teks AI dan model penalaran gambar generatif yang telah dilatih dan disempurnakan. Rentang skala model meta mencakup:
- Model bahasa kecil (SLM) seperti model Base 1B dan 3B serta model Instruct untuk inferensi pada perangkat dan edge
- Model bahasa besar berukuran sedang (LLM) seperti model Dasar dan Instruksi 7B, 8B, dan 70B
- Model berperforma tinggi seperti Meta Llama 3.1-405B Instruct untuk pembuatan data sintetis dan penggunaan distilasi.
| Model | Tipe | Capabilities | Jenis penyebaran (ketersediaan wilayah) |
|---|---|---|---|
Llama-4-Maverick-17B-128E-Instruct-FP8 |
chat-completion |
-
Input: teks dan gambar (token 1M) - Output: teks (1 juta token) - Bahasa: ar, en, , frde, hi, id, it, pt, es, , tl, th, danvi - Pemanggilan alat: Tidak - Format respons: Teks |
- Standar global (semua wilayah) |
Llama-3.3-70B-Instruct |
chat-completion |
-
Masukan: text (128,000 tokens) - Output: teks (8,192 token) - Bahasa: en, de, fr, it, pt, hi, , esdan th - Pemanggilan alat: Tidak - Format respons: Teks |
- Standar global (semua wilayah) - Penyediaan global (semua wilayah) |
Lihat koleksi model ini di portal Foundry. Anda juga dapat menemukan beberapa model Meta yang tersedia dari mitra dan komunitas.
Model Microsoft dijual langsung oleh Azure
Model Microsoft mencakup berbagai grup model seperti Router Model, model MAI, model Phi, model AI perawatan kesehatan, dan banyak lagi. Lihat koleksi model Microsoft di portal Foundry. Anda juga dapat menemukan beberapa model Microsoft yang tersedia dari mitra dan komunitas.
| Model | Tipe | Capabilities | Jenis penyebaran (ketersediaan wilayah) |
|---|---|---|---|
| model-router1 | chat-completion | Rincian lebih lanjut dapat ditemukan dalam gambaran umum Model router. - Input: teks, gambar - Output: teks (jumlah token keluaran bervariasi sampai2) Jendela konteks: 200.0003 - Bahasa: en |
- Standar global (US Timur 2, Swedia Tengah) - Standar Zona Data4 (US Timur 2, Swedia Tengah) |
MAI-DS-R1 |
chat-completion (dengan konten yang penuh pertimbangan) |
-
Input: teks (163.840 token) - Output: teks (163.840 token) - Bahasa: en dan zh - Pemanggilan alat: Tidak - Format respons: Teks |
- Standar global (semua wilayah) |
1Versi model router2025-11-18. Versi sebelumnya (2025-08-07 dan 2025-05-19) juga tersedia.
2Token keluaran maksimum bervariasi untuk model yang mendasari di router model. Misalnya, 32.768 (GPT-4.1 series), 100.000 (o4-mini), 128.000 (gpt-5 reasoning models), dan 16.384 (gpt-5-chat).
3Jendela konteks yang lebih besar kompatibel dengan beberapa model mendasar dari Model Router. Itu berarti panggilan API dengan konteks yang lebih besar hanya berhasil jika perintah dirutekan ke salah satu model tersebut. Jika tidak, panggilan gagal.
4 Penagihan untuk penyebaran model router Data Zone Standard dimulai tidak lebih awal dari 1 November 2025.
Model Mistral dijual langsung oleh Azure
| Model | Tipe | Capabilities | Jenis penyebaran (ketersediaan wilayah) |
|---|---|---|---|
mistral-document-ai-2512 |
Gambar ke Teks |
-
Input: halaman gambar atau PDF (30 halaman, file PDF maks 30MB) - Keluaran: teks - Bahasa: en - Panggilan alat: tidak - Format respons: Teks, JSON, Markdown |
- Standar global (semua wilayah) - Standar zona data (AS dan UE) |
mistral-document-ai-2505 |
Gambar ke Teks |
-
Input: halaman gambar atau PDF (30 halaman, file PDF maks 30MB) - Keluaran: teks - Bahasa: en - Panggilan alat: tidak - Format respons: Teks, JSON, Markdown |
- Standar global (semua wilayah) - Standar zona data (AS dan UE) |
Mistral-Large-3 |
chat-completion |
-
Input: teks, gambar - Keluaran: teks - Bahasa: en, fr, , dees, it, pt, nl, zh, ja, , ko, danar - Panggilan alat: Ya - Format respons: Teks, JSON |
- Standar global (semua wilayah) - Standar zona data (AS dan UE) |
Lihat koleksi model Mistral di portal Foundry. Anda juga dapat menemukan beberapa model Mistral yang tersedia dari mitra dan komunitas.
Model Moonshot AI dijual langsung oleh Azure
Model Moonshot AI termasuk Kimi K2.5 dan Kimi K2 Thinking. Kimi K2.5 adalah model penalaran multimodal yang menerima input teks dan gambar, sementara Kimi K2 Thinking adalah versi terbaru dari model pemikiran sumber terbuka yang paling mampu.
| Model | Tipe | Capabilities | Jenis penyebaran (ketersediaan wilayah) |
|---|---|---|---|
Kimi-K2.5 |
chat-completion (dengan konten yang penuh pertimbangan) |
-
Input: teks dan gambar (262.144 token) - Output: teks (262.144 token) - Bahasa: en dan zh - Panggilan alat: Ya - Format respons: Teks |
- Standar global (semua wilayah) |
Kimi-K2-Thinking |
chat-completion (dengan konten yang penuh pertimbangan) |
-
Input: teks (262.144 token) - Output: teks (262.144 token) - Bahasa: en dan zh - Panggilan alat: Ya - Format respons: Teks |
- Standar global (semua wilayah) |
Lihat koleksi model ini di portal Foundry.
Model xAI dijual langsung oleh Azure
Model-Model Grok xAI dalam Foundry Models mencakup serangkaian model penalaran dan non-penalaran yang beragam yang dirancang untuk kasus penggunaan perusahaan seperti pengambilan data, pengodean, ringkasan teks, dan aplikasi berbasis agen.
Pendaftaran diperlukan untuk mendapatkan akses kegrok-code-fast-1 dan grok-4.
| Model | Tipe | Capabilities | Jenis penyebaran (ketersediaan wilayah) |
|---|---|---|---|
grok-4.1-fast-reasoning |
chat-completion |
-
Input: teks, gambar (128.000 token) - Output: teks (128.000 token) - Bahasa: en - Panggilan alat: ya - Format respons: teks |
- Standar global (semua wilayah) |
grok-4.1-fast-non-reasoning |
chat-completion |
-
Input: teks, gambar (128.000 token) - Output: teks (128.000 token) - Bahasa: en - Panggilan alat: ya - Format respons: teks |
- Standar global (semua wilayah) |
grok-4 |
chat-completion |
-
Input: teks (262.000 token) - Output: teks (8,192 token) - Bahasa: en - Panggilan alat: ya - Format respons: teks |
- Standar global (semua wilayah) |
grok-4-fast-reasoning |
chat-completion |
-
Input: teks, gambar (128.000 token) - Output: teks (128.000 token) - Bahasa: en - Panggilan alat: ya - Format respons: teks |
- Standar global (semua wilayah) - Standar zona data (AS) |
grok-4-fast-non-reasoning |
chat-completion |
-
Input: teks, gambar (128.000 token) - Output: teks (128.000 token) - Bahasa: en - Panggilan alat: ya - Format respons: teks |
- Standar global (semua wilayah) - Standar zona data (AS) |
grok-code-fast-1 |
chat-completion |
-
Input: teks (256.000 token) - Output: teks (8,192 token) - Bahasa: en - Panggilan alat: ya - Format respons: teks |
- Standar global (semua wilayah) |
grok-3 |
chat-completion |
-
Input: teks (131.072 token) - Output: teks (131,072 token) - Bahasa: en - Panggilan alat: ya - Format respons: teks |
- Standar global (semua wilayah) - Standar zona data (AS) |
grok-3-mini |
chat-completion |
-
Input: teks (131.072 token) - Output: teks (131,072 token) - Bahasa: en - Panggilan alat: ya - Format respons: teks |
- Standar global (semua wilayah) - Standar zona data (AS) |
Lihat koleksi model xAI di portal Foundry.
Ketersediaan wilayah model berdasarkan jenis penyebaran
Model Foundry memberi Anda pilihan untuk struktur hosting yang sesuai dengan pola bisnis dan penggunaan Anda. Layanan ini menawarkan dua jenis penyebaran utama:
- Standar: Memiliki opsi penyebaran global, merutekan lalu lintas secara global untuk memberikan throughput yang lebih tinggi.
- Provisioned: Juga memiliki opsi penyebaran global, memungkinkan Anda membeli dan menyebarkan unit throughput yang disediakan di seluruh infrastruktur global Azure.
Semua penyebaran melakukan operasi inferensi yang sama, tetapi penagihan, skala, dan performa berbeda. Untuk informasi selengkapnya tentang jenis penyebaran, lihat Jenis penyebaran di Model Foundry.
Ketersediaan model standar global
| Wilayah | cohere-command-a | Cohere-rerank-v4.0-fast | Cohere-rerank-v4.0-pro | embed-v-4-0 | DeepSeek-R1 | DeepSeek-R1-0528 | DeepSeek-V3-0324 | DeepSeek-V3.1 | DeepSeek-V3.2 | DeepSeek-V3.2-Speciale | FLUX-1.1-pro | FLUX.1-Kontext-pro | FLUX.2-pro | grok-3 | grok-3-mini | grok-4-fast-non-reasoning | grok-4-penalaran cepat | grok-4.1-fast-non-reasoning | grok-4.1-alasan cepat | Kimi-K2-Thinking | Kimi-K2.5 | Llama-3.3-70B-Instruct | Llama-4-Maverick-17B-128E-Instruct-FP8 | MAI-DS-R1 | Meta-Llama-3-70B-Instruct | Meta-Llama-3-70B-Instruct | Meta-Llama-3-70B-Instruct | Meta-Llama-3-70B-Instruct | mistral-document-ai-2505 | mistral-document-ai-2512 | Mistral-Large-3 | model-router |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Australia bagian timur | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Brasil Selatan | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| kanadacentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| kanada timur | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| centralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| eastus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| eastus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| FranceCentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Jerman Barat Tengah | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Italia Utara | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Jepang Timur | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Jepang Barat | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| koreacentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Northcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Norwegia Timur | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| polandcentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| southafricanorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| southcentralus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| India Selatan | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| spaincentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| swedencentral | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| Swiss bagian Utara | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| switzerlandwest | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| uaenorth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| uksouth | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| Pusat Barat | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| westeurope | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| westus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| westus2 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |
| westus3 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ | - |