Model-model Foundry yang dijual langsung oleh Azure (klasik)

Sedang menampilkan:Versi - Beralih ke versi untuk portal Foundry baru

Catatan

Tautan dalam artikel ini mungkin membuka konten dalam dokumentasi Microsoft Foundry baru alih-alih dokumentasi Foundry (klasik) yang Anda lihat sekarang.

Microsoft Model Foundry dalam katalog model terdiri dari dua kategori utama, yaitu model Foundry yang dijual langsung oleh Azure dan model Foundry dari mitra dan komunitas. Artikel ini mencantumkan pilihan Model Foundry yang dijual langsung oleh Azure, bersama dengan kemampuannya, jenis deployment, dan wilayah ketersediaan, tidak termasuk model yang tidak digunakan lagi dan dihentikan. Model Foundry yang dijual langsung oleh Azure juga disebut sebagai Model Langsung dari Azure atau Model Langsung Azure.

Model yang dijual langsung oleh Azure juga dihosting oleh Azure dan dioperasikan oleh Azure sebagai bagian dari layanan Foundry Models. Model tersebut mencakup semua model OpenAI Azure dan model spesifik pilih dari penyedia teratas. Model ini ditagih melalui langganan Azure Anda, dicakup oleh perjanjian tingkat layanan Azure, dan didukung oleh Microsoft. Untuk melihat daftar Model Foundry yang didukung oleh Foundry Agent Service, lihat Model yang didukung oleh Agent Service, dan untuk daftar Model Foundry dari mitra, lihat Model Foundry dari mitra dan komunitas.

Tips

Gunakan tab di bagian atas halaman ini untuk beralih antara Azure model OpenAI dan Kumpulan model lain dari penyedia seperti Cohere, DeepSeek, Meta, Mistral AI, dan xAI.

Azure OpenAI dalam model Microsoft Foundry

Azure OpenAI didukung oleh beragam model dengan kemampuan dan titik harga yang berbeda. Ketersediaan model bervariasi menurut wilayah dan cloud.

Sorotan model

Model Deskripsi
GPT-chat-terbaru (pratinjau) BARUgpt-chat-latestTinjauan
Seri GPT-5.5 BARUgpt-5.5
Seri GPT-5.4 gpt-5.4-mini, gpt-5.4-nano, , gpt-5.4gpt-5.4-pro
Seri GPT-5.3 gpt-5.3-chat, gpt-5.3-codex
Seri GPT-5.2 gpt-5.2-codex, , gpt-5.2gpt-5.2-chatPratinjau
Seri GPT-5.1 gpt-5.1, gpt-5.1-chatPratinjau, gpt-5.1-codex, gpt-5.1-codex-mini
Sora SORA-2 BARU
Seri GPT-5 gpt-5, , gpt-5-minigpt-5-nano, gpt-5-chatPratinjau
gpt-oss model penalaran dengan bobot terbuka
codex-mini Versi yang disempurnakan dari o4-mini.
Seri GPT-4.1 gpt-4.1, gpt-4.1-mini, gpt-4.1-nano
pratinjau-penggunaan-komputer Model eksperimental yang dilatih untuk digunakan dengan alat API Respons untuk penggunaan komputer.
o-series models Model penalaran dengan pemecahan masalah tingkat lanjut dan peningkatan fokus dan kemampuan.
GPT-4o, GPT-4o mini, dan GPT-4 Turbo Mampu Azure model OpenAI dengan versi multimodal, yang dapat menerima teks dan gambar sebagai input.
Embeddings Sekumpulan model yang dapat mengonversi teks menjadi bentuk vektor numerik untuk memfasilitasi kesamaan teks.
Pembuatan gambar Serangkaian model yang dapat menghasilkan gambar asli dari bahasa alami.
Video generation Model yang dapat menghasilkan adegan video asli dari instruksi teks.
Audio Serangkaian model untuk ucapan ke teks, terjemahan, dan teks ke ucapan. Model audio GPT-4o mendukung interaksi percakapan dengan ucapan latensi rendah, baik ucapan masuk maupun ucapan keluar, atau pembuatan audio.

GPT Chat versi terbaru

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori penyebaran, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Kemampuan

Identifikasi Model Deskripsi Jendela Konteks Output Token Maksimum Data Pelatihan (sampai dengan)
gpt-chat-latest (2026-05-05)
Tinjauan
- Penalaran
- API Penyelesaian Obrolan.
- API Respons.
- Output terstruktur
- Fungsi, alat, dan pemanggilan alat secara paralel.
128,000

Input: 111,616
Keluaran: 16.384
16,384 Agustus 2025

Catatan

Anda mungkin juga melihat model ini disebut oleh OpenAI sebagai GPT-5.5 Instant atau di OpenAI API sebagai chat-latest. Di Microsoft Foundry, kami memperkenalkan gpt-chat-latest sebagai nama produk untuk rilis ini. Model ini tetap mengikuti siklus hidup pratinjau dan periode pemberitahuan standar yang ada. Kami juga mengevaluasi cara untuk menyederhanakan bagaimana pelanggan mengakses model yang terus diperbarui dari waktu ke waktu, tetapi perilaku saat ini tetap tidak berubah saat pekerjaan tersebut berlanjut.

GPT-5.5

Untuk ketersediaan model di seluruh wilayah, yang dikelompokkan menurut kategori penyebaran, lihat Ketersediaan wilayah untuk Foundry Models yang dijual langsung oleh Azure.

Kemampuan

Identifikasi Model Deskripsi Jendela Konteks Output Token Maksimum Data Pelatihan (sampai dengan)
gpt-5.5 (2026-04-24) - Penalaran
- API Respons.
- API Penyelesaian Obrolan.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Penggunaan komputer
- Ringkasan lengkap kemampuan.
1.050.000 br>
Input: 922.000
Output: 128.000
128,000 Desember 2025

Catatan

Beberapa tingkat kuota akan memerlukan permintaan gpt-5.5 kuota agar dapat menyebarkan model ini. Langganan Tingkat 5 dan Tingkat 6 memiliki kuota secara default.

GPT-5.4

Untuk ketersediaan model di semua wilayah, yang dikelompokkan menurut kategori deployment, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Kemampuan

Identifikasi Model Deskripsi Jendela Konteks Output Token Maksimum Data Pelatihan (sampai dengan)
gpt-5.4 (2026-03-05) - Penalaran
- API Respons.
- API Penyelesaian Obrolan.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Penggunaan komputer
- Ringkasan lengkap kemampuan.
1,050,000 128,000 Agustus 2025
gpt-5.4-pro (2026-03-05) - Penalaran
- API Respons.
- Pemrosesan teks dan gambar.
- Fungsi & alat
- Ringkasan lengkap kemampuan.
1,050,000 128,000 Agustus 2025
gpt-5.4-mini (2026-03-17) - Penalaran
- API Respons.
- API Penyelesaian Obrolan.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Penggunaan komputer
- Ringkasan lengkap kemampuan.
400,000

Input: 272.000
Output: 128.000
128,000 Agustus 2025
gpt-5.4-nano (2026-03-17) - Penalaran
- API Respons.
- API Penyelesaian Obrolan.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Ringkasan lengkap kemampuan.
400,000

Input: 272.000
Output: 128.000
128,000 Agustus 2025

GPT-5.3

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori penyebaran, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Kemampuan

Identifikasi Model Deskripsi Jendela Konteks Output Token Maksimum Data Pelatihan (sampai dengan)
gpt-5.3-codex (2026-02-24) - Penalaran
- API Respons.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Ringkasan lengkap kemampuan.
- Dioptimalkan untuk Ekstensi Codex CLI & Codex VS Code
400,000

Input: 272.000
Output: 128.000
128,000 Agustus 2025
gpt-5.3-chat (2026-03-03)
Tinjauan
- API Penyelesaian Obrolan.
- API Respons.
- Output terstruktur
- Fungsi, alat, dan pemanggilan alat secara paralel.
128,000

Input: 111,616
Keluaran: 16.384
16,384 Agustus 2025

GPT-5.2

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori deployment, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Kemampuan

Identifikasi Model Deskripsi Jendela Konteks Output Token Maksimum Data Pelatihan (sampai dengan)
gpt-5.2-codex (2026-01-14) - Penalaran
- API Respons.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Ringkasan lengkap kemampuan.
- Dioptimalkan untuk Ekstensi Codex CLI & Codex VS Code
400,000

Input: 272.000
Output: 128.000
128,000
gpt-5.2 (2025-12-11) - Penalaran
- API Penyelesaian Obrolan.
- API Respons.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Ringkasan lengkap kemampuan.
400,000

Input: 272.000
Output: 128.000
128,000 Agustus 2025
gpt-5.2-chat (2025-12-11)
Tinjauan
- API Penyelesaian Obrolan.
- API Respons.
- Output terstruktur
- Fungsi, alat, dan pemanggilan alat secara paralel.
128,000

Input: 111,616
Keluaran: 16.384
16,384 Agustus 2025
gpt-5.2-chat (2026-02-10)
Tinjauan
- API Penyelesaian Obrolan.
- API Respons.
- Output terstruktur
- Fungsi, alat, dan pemanggilan alat secara paralel.
128,000

Input: 111,616
Keluaran: 16.384
16,384 Agustus 2025

Perhatian

Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi terbaru yang stabil dan tersedia secara umum. Model yang ditunjuk sebagai pratinjau tidak mengikuti siklus hidup model Azure OpenAI standar.

GPT-5.1

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori penerapan, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Kemampuan

Identifikasi Model Deskripsi Jendela Konteks Output Token Maksimum Data Pelatihan (sampai dengan)
gpt-5.1 (2025-11-13) - Penalaran
- API Penyelesaian Obrolan.
- API Respons.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Ringkasan lengkap kemampuan.
400,000

Input: 272.000
Output: 128.000
128,000 30 September 2024
gpt-5.1-chat (2025-11-13)
Tinjauan
- Penalaran
- API Penyelesaian Obrolan.
- API Respons.
- Output terstruktur
- Fungsi, alat, dan pemanggilan alat secara paralel.
128,000

Input: 111,616
Keluaran: 16.384
16,384 30 September 2024
gpt-5.1-codex (2025-11-13) - Api respons saja.
- Pemrosesan teks dan gambar
- Output terstruktur.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Ringkasan lengkap kemampuan
- Dioptimalkan untuk Ekstensi Codex CLI & Codex VS Code
400,000

Input: 272.000
Output: 128.000
128,000 30 September 2024
gpt-5.1-codex-mini (2025-11-13) - Api respons saja.
- Pemrosesan teks dan gambar
- Output terstruktur.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Ringkasan lengkap kemampuan
- Dioptimalkan untuk Ekstensi Codex CLI & Codex VS Code
400,000

Input: 272.000
Output: 128.000
128,000 30 September 2024
gpt-5.1-codex-max (2025-12-04) - Api respons saja.
- Pemrosesan teks dan gambar
- Output terstruktur.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Ringkasan lengkap kemampuan
- Dioptimalkan untuk Ekstensi Codex CLI & Codex VS Code
400,000

Input: 272.000
Output: 128.000
128,000 30 September 2024

Perhatian

Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi terbaru yang stabil dan tersedia secara umum. Model yang ditunjuk sebagai pratinjau tidak mengikuti siklus hidup model Azure OpenAI standar.

Penting

  • gpt-5.1 reasoning_effort diatur ke default none. Saat meningkatkan dari model penalaran sebelumnya ke gpt-5.1, perlu diingat bahwa Anda mungkin perlu memperbarui kode Anda untuk secara eksplisit meneruskan reasoning_effort level jika Anda ingin memungkinkan penalaran terjadi.

  • gpt-5.1-chat menambahkan kemampuan penalaran bawaan. Seperti model penalaran lainnya, model tersebut tidak mendukung parameter seperti temperature. Jika Anda meningkatkan dari menggunakan gpt-5-chat (yang bukan model penalaran) untuk gpt-5.1-chat memastikan Anda menghapus parameter kustom seperti temperature dari kode Anda yang tidak didukung oleh model penalaran.

  • gpt-5.1-codex-max menambahkan dukungan untuk pengaturan reasoning_effort ke xhigh. Penalaran none tidak didukung oleh gpt-5.1-codex-max.

GPT-5

Untuk ketersediaan model di semua wilayah, yang dikelompokkan menurut kategori deployment, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Kemampuan

Identifikasi Model Deskripsi Jendela Konteks Output Token Maksimum Data Pelatihan (sampai dengan)
gpt-5 (2025-08-07) - Penalaran
- API Penyelesaian Obrolan.
- API Respons.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Ringkasan lengkap kemampuan.
400,000

Input: 272.000
Output: 128.000
128,000 30 September 2024
gpt-5-mini (2025-08-07) - Penalaran
- API Penyelesaian Obrolan.
- API Respons.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Ringkasan lengkap kemampuan.
400,000

Input: 272.000
Output: 128.000
128,000 Mei 31, 2024
gpt-5-nano (2025-08-07) - Penalaran
- API Penyelesaian Obrolan.
- API Respons.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Ringkasan lengkap kemampuan.
400,000

Input: 272.000
Output: 128.000
128,000 Mei 31, 2024
gpt-5-chat (2025-08-07)
Tinjauan
- API Penyelesaian Obrolan.
- API Respons.
- Input: Teks/Gambar
- Output: Hanya teks
128,000 16,384 30 September 2024
gpt-5-chat (2025-10-03)
Pratinjau1
- API Penyelesaian Obrolan.
- API Respons.
- Input: Teks/Gambar
- Output: Hanya teks
128,000 16,384 30 September 2024
gpt-5-codex (2025-09-11) - Api respons saja.
- Input: Teks/Gambar
- Output: Hanya teks
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
- Ringkasan lengkap kemampuan
- Dioptimalkan untuk Ekstensi Codex CLI & Codex VS Code
400,000

Input: 272.000
Output: 128.000
128,000 -
gpt-5-pro (2025-10-06) - Penalaran
- API Respons.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi dan alat
- Ringkasan lengkap kemampuan.
400,000

Input: 272.000
Output: 128.000
128,000 30 September 2024

Catatan

Versi 1gpt-5-chat2025-10-03 memperkenalkan peningkatan signifikan yang berfokus pada kecerdasan emosional dan kemampuan kesehatan mental. Peningkatan ini mengintegrasikan himpunan data khusus dan strategi respons yang disempurnakan untuk meningkatkan kemampuan model untuk:

  • Memahami dan menafsirkan konteks emosional secara lebih akurat, memungkinkan interaksi bernuansa dan empatik.
  • Memberikan respons yang mendukung dan bertanggung jawab dalam percakapan yang terkait dengan kesehatan mental, memastikan sensitivitas dan kepatuhan terhadap praktik terbaik.

Peningkatan ini bertujuan untuk membuat obrolan GPT-5 lebih sadar konteks, berpusat pada manusia, dan dapat diandalkan dalam skenario di mana nada emosional dan pertimbangan kesejahteraan sangat penting.

Perhatian

Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi terbaru yang stabil dan tersedia secara umum. Model yang ditunjuk sebagai pratinjau tidak mengikuti siklus hidup model Azure OpenAI standar.

gpt-oss

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori deployment, lihat Ketersediaan wilayah untuk model Foundry yang dijual langsung oleh Azure.

Kemampuan

Identifikasi Model Deskripsi Jendela Konteks Output Token Maksimum Data Pelatihan (sampai dengan)
gpt-oss-120b 1 (Pratinjau) - Teks masuk/teks keluar saja
- API Penyelesaian Obrolan
-Streaming
- Pemanggilan fungsi
- Output terstruktur
- Penalaran
- Tersedia untuk penggunaan1 dan melalui komputasi terkelola
131,072 131,072 Mei 31, 2024
gpt-oss-20b (Pratinjau) - Teks masuk/teks keluar saja
- API Penyelesaian Obrolan
-Streaming
- Pemanggilan fungsi
- Output terstruktur
- Penalaran
- Tersedia melalui komputasi terkelola dan Foundry Local
131,072 131,072 Mei 31, 2024

1 Tidak seperti model OpenAI Azure lainnya gpt-oss-120b memerlukan proyek Foundry untuk menyebarkan model.

Menyebarkan dengan kode

az cognitiveservices account deployment create \
  --name "Foundry-project-resource" \
  --resource-group "test-rg" \
  --deployment-name "gpt-oss-120b" \
  --model-name "gpt-oss-120b" \
  --model-version "1" \
  --model-format "OpenAI-OSS" \
  --sku-capacity 10 \
  --sku-name "GlobalStandard"

Seri GPT-4.1

Untuk mengetahui ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori penyebaran, lihat Ketersediaan wilayah untuk Foundry Models yang dijual langsung oleh Azure.

Kemampuan

Identifikasi Model Deskripsi Jendela konteks Token keluaran maksimum Data pelatihan (sampai dengan)
gpt-4.1 (2025-04-14) - Input teks dan gambar
- Output teks
- API pelengkap obrolan
- API Respons
-Streaming
- Pemanggilan fungsi
- Output terstruktur (kompletisasi obrolan)
- 1,047,576
- 300.000 (penyebaran terkelola standar & disediakan)
- 128.000 (penyebaran batch)
32,768 Mei 31, 2024
gpt-4.1-nano (2025-04-14) - Input teks dan gambar
- Output teks
- API pelengkap obrolan
- API Respons
-Streaming
- Pemanggilan fungsi
- Output terstruktur (kompletisasi obrolan)
- 1,047,576
- 300.000 (penyebaran terkelola standar & disediakan)
- 128.000 (penyebaran batch)
32,768 Mei 31, 2024
gpt-4.1-mini (2025-04-14) - Input teks dan gambar
- Output teks
- API pelengkap obrolan
- API Respons
-Streaming
- Pemanggilan fungsi
- Output terstruktur (kompletisasi obrolan)
- 1,047,576
- 300.000 (penyebaran terkelola standar & disediakan)
- 128.000 (penyebaran batch)
32,768 Mei 31, 2024

Masalah yang diketahui

Masalah yang diketahui memengaruhi semua model seri GPT 4.1. Definisi panggilan alat atau fungsi besar yang melebihi 300.000 token akan mengakibatkan kegagalan, meskipun batas konteks token 1 juta model tidak tercapai.

Kesalahan dapat bervariasi berdasarkan panggilan API dan karakteristik payload yang mendasar.

Berikut adalah pesan kesalahan untuk API Penyelesaian Obrolan:

  • Error code: 400 - {'error': {'message': "This model's maximum context length is 300000 tokens. However, your messages resulted in 350564 tokens (100 in the messages, 350464 in the functions). Please reduce the length of the messages or functions.", 'type': 'invalid_request_error', 'param': 'messages', 'code': 'context_length_exceeded'}}

  • Error code: 400 - {'error': {'message': "Invalid 'tools[0].function.description': string too long. Expected a string with maximum length 1048576, but got a string with length 2778531 instead.", 'type': 'invalid_request_error', 'param': 'tools[0].function.description', 'code': 'string_above_max_length'}}

Berikut adalah pesan kesalahan untuk API Respons:

  • Error code: 500 - {'error': {'message': 'The server had an error processing your request. Sorry about that! You can retry your request, or contact us through an Azure support request at: https://go.microsoft.com/fwlink/?linkid=2213926 if you keep seeing this error. (Please include the request ID d2008353-291d-428f-adc1-defb5d9fb109 in your email.)', 'type': 'server_error', 'param': None, 'code': None}}

pratinjau-penggunaan-komputer

Model eksperimental yang dilatih untuk digunakan dengan API Respons sebagai alat untuk penggunaan komputer.

Ini dapat digunakan dengan pustaka pihak ketiga untuk memungkinkan model mengontrol input mouse dan keyboard, sambil mendapatkan konteks dari tangkapan layar lingkungan yang sedang digunakan.

Perhatian

Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi terbaru yang stabil dan tersedia secara umum. Model yang ditunjuk sebagai pratinjau tidak mengikuti siklus hidup model Azure OpenAI standar.

Pendaftaran diperlukan untuk mengakses computer-use-preview. Akses diberikan berdasarkan kriteria kelayakan Microsoft. Pelanggan yang memiliki akses ke model akses terbatas lainnya masih perlu meminta akses untuk model ini.

Untuk meminta akses, buka computer-use-preview aplikasi model akses terbatas. Saat akses diberikan, Anda perlu membuat penyebaran untuk model.

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori penyebaran, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Kemampuan

Identifikasi Model Deskripsi Jendela konteks Token keluaran maksimum Data pelatihan (sampai dengan)
computer-use-preview (2025-03-11) Model khusus untuk digunakan dengan Responses API alat untuk penggunaan komputer

-Alat
-Streaming
- Teks (input/output)
- Gambar (input)
8,192 1,024 Oktober 2023

Model Seri O

Model seri o OpenAI Azure dirancang untuk mengatasi tugas penalaran dan pemecahan masalah dengan peningkatan fokus dan kemampuan. Model-model ini menghabiskan lebih banyak waktu untuk memproses dan memahami permintaan pengguna, membuatnya sangat kuat di bidang-bidang seperti sains, pengodean, dan matematika, dibandingkan dengan iterasi sebelumnya.

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori penyebaran, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Kemampuan

Identifikasi Model Deskripsi Permintaan maksimal (token) Data pelatihan (sampai dengan)
codex-mini (2025-05-16) Versi yang disempurnakan dari o4-mini.
- API Respons.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi dan alat.
Ringkasan lengkap kemampuan.
Input: 200.000
Output: 100.000
Mei 31, 2024
o3-pro (2025-06-10) - API Respons.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi dan alat.
Ringkasan lengkap kemampuan.
Input: 200.000
Output: 100.000
Mei 31, 2024
o4-mini (2025-04-16) - Model penalaran baru, menawarkan kemampuan penalaran yang ditingkatkan.
- API Penyelesaian Obrolan.
- API Respons.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi dan alat.
Ringkasan lengkap kemampuan.
Input: 200.000
Output: 100.000
Mei 31, 2024
o3 (2025-04-16) - Model penalaran baru, menawarkan kemampuan penalaran yang ditingkatkan.
- API Penyelesaian Obrolan.
- API Respons.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi, alat, dan pemanggilan alat secara paralel.
Ringkasan lengkap kemampuan.
Input: 200.000
Output: 100.000
Mei 31, 2024
o3-mini (2025-01-31) - Kemampuan penalaran yang ditingkatkan.
- Output terstruktur.
- Pemrosesan teks saja.
- Fungsi dan alat.
Input: 200.000
Output: 100.000
Oktober 2023
o1 (2024-12-17) - Kemampuan penalaran yang ditingkatkan.
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Fungsi dan alat.
Input: 200.000
Output: 100.000
Oktober 2023
o1-preview 1 (2024-09-12) Versi pratinjau yang lebih lama. Input: 128.000
Output: 32.768
Oktober 2023
o1-mini 2 (2024-09-12) Opsi yang lebih cepat dan lebih hemat biaya dalam seri o1, ideal untuk tugas pengkodan yang membutuhkan kecepatan dan konsumsi sumber daya yang lebih rendah.
- Penyebaran Standar Global tersedia secara default.
- Penyebaran standar (regional) saat ini hanya tersedia untuk pelanggan tertentu yang menerima akses sebagai bagian dari o1-preview rilis akses terbatas.
Input: 128.000
Keluaran: 65.536
Oktober 2023

1o1-preview hanya tersedia untuk pelanggan yang diberikan akses sebagai bagian dari akses terbatas asli.

2o1-mini saat ini tersedia untuk semua pelanggan untuk penyebaran Standar Global. Pelanggan terpilih diberikan akses penyebaran standar (regional) o1-mini sebagai bagian dari rilis akses terbatas o1-preview. Saat ini, akses ke o1-mini penyebaran standar (regional) tidak ditingkatkan lebih lanjut.

o3-deep-research saat ini hanya tersedia dengan Foundry Agent Service. Untuk mempelajari lebih lanjut, lihat panduan alat Deep Research.

Untuk mempelajari selengkapnya tentang model seri o tingkat lanjut, lihat Mulai menggunakan model penalaran.

GPT-4o dan GPT-4 Turbo

GPT-4o mengintegrasikan teks dan gambar dalam satu model, yang memungkinkannya menangani beberapa jenis data secara bersamaan. Pendekatan multimodal ini meningkatkan akurasi dan responsivitas dalam interaksi manusia-komputer. GPT-4o cocok dengan GPT-4 Turbo dalam tugas teks dan pengodean bahasa Inggris sambil menawarkan performa unggul dalam tugas bahasa non-bahasa Inggris dan tugas visi, menetapkan tolok ukur baru untuk kemampuan AI.

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori penyebaran, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Model GPT-4 dan GPT-4 Turbo

Model ini hanya dapat digunakan dengan API Penyelesaian Obrolan. Lihat versi Model untuk mempelajari tentang bagaimana Azure OpenAI menangani peningkatan versi model. Lihat Bekerja dengan model untuk mempelajari cara melihat dan mengonfigurasi pengaturan versi model penyebaran GPT-4 Anda.

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori penyebaran, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Kemampuan

Identifikasi Model Deskripsi Permintaan maksimal (token) Data pelatihan (sampai dengan)
gpt-4o (2024-11-20)
GPT-4o (Omni)
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Mode JSON.
- Panggilan fungsi paralel.
- Akurasi dan responsivitas yang ditingkatkan.
- Kesetaraan dengan tugas teks dan pengodean berbahasa Inggris dibandingkan dengan kemampuan GPT-4 Turbo dengan fitur Vision.
- Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi.
- Kemampuan menulis kreatif yang ditingkatkan.
Input: 128.000
Keluaran: 16.384
Oktober 2023
gpt-4o (2024-08-06)
GPT-4o (Omni)
- Output terstruktur.
- Pemrosesan teks dan gambar.
- Mode JSON.
- Panggilan fungsi paralel.
- Akurasi dan responsivitas yang ditingkatkan.
- Kesetaraan dengan tugas teks dan pengodean berbahasa Inggris dibandingkan dengan kemampuan GPT-4 Turbo dengan fitur Vision.
- Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi.
Input: 128.000
Keluaran: 16.384
Oktober 2023
gpt-4o-mini (2024-07-18)
GPT-4o mini
- Model yang cepat, murah, dan mampu ideal untuk mengganti model seri GPT-3.5 Turbo.
- Pemrosesan teks dan gambar.
- Mode JSON.
- Panggilan fungsi paralel.
Input: 128.000
Keluaran: 16.384
Oktober 2023
gpt-4o (2024-05-13)
GPT-4o (Omni)
- Pemrosesan teks dan gambar.
- Mode JSON.
- Panggilan fungsi paralel.
- Akurasi dan responsivitas yang ditingkatkan.
- Kesetaraan dengan tugas teks dan pengodean berbahasa Inggris dibandingkan dengan kemampuan GPT-4 Turbo dengan fitur Vision.
- Performa unggul dalam bahasa non-Bahasa Inggris dan dalam tugas visi.
Input: 128.000
Output: 4.096
Oktober 2023
gpt-4 1 (turbo-2024-04-09)
GPT-4 Turbo dengan Visi
Model baru yang tersedia secara umum.
- Pengganti untuk semua model pratinjau GPT-4 sebelumnya (vision-preview, 1106-Preview, 0125-Preview).
- Ketersediaan fitur saat ini berbeda, tergantung pada metode input dan jenis penyebaran.
Input: 128.000
Output: 4.096
Desember 2023

1 Versi gpt-4 versi turbo-2024-04-09 yang disediakan saat ini hanya terbatas pada teks. Untuk informasi selengkapnya tentang penyebaran yang disediakan, lihat Panduan yang disediakan.

Perhatian

Kami tidak menyarankan Anda menggunakan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi terbaru yang stabil dan tersedia secara umum. Model yang ditunjuk sebagai pratinjau tidak mengikuti siklus hidup model Azure OpenAI standar.

Penyematan

text-embedding-3-large adalah model penyematan terbaru dan paling mampu. Anda tidak dapat melakukan upgrade antar model embedding. Untuk berpindah dari menggunakan text-embedding-ada-002 ke text-embedding-3-large, Anda perlu membuat penyematan baru.

  • text-embedding-3-large
  • text-embedding-3-small
  • text-embedding-ada-002

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori penyebaran, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Kemampuan

Laporan dari OpenAI menunjukkan bahwa pengujian memperlihatkan kedua model penyematan generasi ketiga, baik yang besar maupun yang kecil, menawarkan performa pengambilan data multibahasa rata-rata yang lebih baik dengan tolok ukur MIRACL. Mereka masih mempertahankan performa untuk tugas bahasa Inggris dengan tolok ukur MTEB .

Tolok ukur evaluasi text-embedding-ada-002 text-embedding-3-small text-embedding-3-large
Rata-rata MIRACL 31.4 44.0 54.9
Rata-rata MTEB 61.0 62.3 64.6

Model penyematan generasi ketiga mendukung pengurangan ukuran penyematan melalui parameter baru dimensions . Biasanya, penyematan yang lebih besar lebih mahal dari perspektif komputasi, memori, dan penyimpanan. Ketika Anda dapat menyesuaikan jumlah dimensi, Anda mendapatkan lebih banyak kontrol atas biaya dan performa keseluruhan. Parameter dimensions tidak didukung di semua versi pustaka Python OpenAI 1.x. Untuk memanfaatkan parameter ini, kami sarankan Anda meningkatkan ke versi terbaru: pip install openai --upgrade.

Pengujian tolok ukur MTEB OpenAI menemukan bahwa bahkan ketika dimensi model generasi ketiga dikurangi menjadi kurang dari 1.536 dimensi text-embeddings-ada-002, performa tetap sedikit lebih baik.

Model ini hanya dapat digunakan dengan permintaan Embedding API.

Identifikasi Model Permintaan maksimal (token) Dimensi output Data pelatihan (sampai dengan)
text-embedding-ada-002 (versi 2) 8,192 1,536 Sep 2021
text-embedding-ada-002 (versi 1) 2,046 1,536 Sep 2021
text-embedding-3-large 8,192 3,072 Sep 2021
text-embedding-3-small 8,192 1,536 Sep 2021

Catatan

Saat Anda mengirim array input untuk penyematan, jumlah maksimum item input dalam array per panggilan ke titik akhir penyematan adalah 2.048.

Model pembuatan gambar

Model pembuatan gambar menghasilkan gambar dari perintah teks yang disediakan pengguna. Model pembuatan gambar meliputi gpt-image-1, , gpt-image-1-minigpt-image-1.5, dan gpt-image-2.

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori penyebaran, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Identifikasi Model Permintaan maks (karakter)
gpt-image-1 4,000
gpt-image-1-mini 4,000
gpt-image-1.5 4,000

Model pembuatan video

Sora adalah model AI dari OpenAI yang dapat menciptakan adegan video yang realistis dan imajinatif dari instruksi teks. Sora sedang dalam pratinjau.

Model pembuatan video meliputi sora dan sora-2.

Identifikasi Model Permintaan Maksimal (karakter)
Sora 4,000

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori penyebaran, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Model audio

Model audio di Azure OpenAI tersedia melalui API realtime, completions, dan audio.

Untuk ketersediaan model di semua wilayah, yang dikelompokkan berdasarkan kategori penyebaran, lihat Ketersediaan wilayah untuk Model Foundry yang dijual langsung oleh Azure.

Model audio GPT-4o

Model audio GPT-4o adalah bagian dari keluarga model GPT-4o dan mendukung latensi rendah, ucapan masuk, interaksi percakapan atau pembuatan audio.

Perhatian

Kami tidak merekomendasikan penggunaan model pratinjau dalam produksi. Kami akan meningkatkan semua penyebaran model pratinjau ke versi pratinjau mendatang atau ke versi terbaru yang stabil dan tersedia secara umum. Model yang ditunjuk sebagai pratinjau tidak mengikuti siklus hidup model Azure OpenAI standar.

Detail tentang token permintaan maksimum dan data pelatihan tersedia dalam tabel berikut:

Identifikasi Model Deskripsi Permintaan maksimal (token) Data pelatihan (sampai dengan)
gpt-4o-mini-audio-preview (2024-12-17)
Tinjauan
Model audio untuk pembuatan audio dan teks. Input: 128.000
Keluaran: 16.384
September 2023
gpt-4o-audio-preview (2024-12-17) Model audio untuk pembuatan audio dan teks. Input: 128.000
Keluaran: 16.384
September 2023
gpt-4o-realtime-preview (2025-06-03) Model audio untuk pemrosesan audio secara real-time. Input: 32.000
Output: 4.096
Oktober 2023
gpt-4o-realtime-preview (2024-12-17) Model audio untuk pemrosesan audio secara real-time. Masukan: 16.000
Output: 4.096
Oktober 2023
gpt-4o-mini-realtime-preview (2024-12-17)
Tinjauan
Model audio untuk pemrosesan audio secara real-time. Input: 128.000
Output: 4.096
Oktober 2023
gpt-audio(28-08-2025)
gpt-audio-mini(6 Oktober 2025)
Model audio untuk pembuatan audio dan teks. Input: 128.00
Keluaran: 16.384
Oktober 2023
gpt-realtime (28-08-2025) (GA)
gpt-realtime-mini (2025-10-06)
gpt-realtime-mini (2025-12-15)
Model audio untuk pemrosesan audio secara real-time. Input: 32.00
Output: 4.096
Oktober 2023
gpt-audio-1.5 (2026-02-23) Model audio untuk pembuatan audio dan teks. Input: 128.00
Keluaran: 16.384
September 2024
gpt-realtime-1.5 (2026-02-23) Model audio untuk pemrosesan audio secara real-time. Input: 32.00
Output: 4.096
September 2024

Audio API

Model audio melalui /audio API dapat digunakan untuk ucapan ke teks, terjemahan, dan teks ke ucapan.

Model ucapan ke teks

Identifikasi Model Deskripsi Permintaan maksimum (ukuran maksimum file audio)
whisper Model pengenalan ucapan tujuan umum. 25 MB
gpt-4o-transcribe (2025-03-20)
Tinjauan
Model ucapan ke teks didukung oleh GPT-4o. 25 MB
gpt-4o-mini-transcribe (2025-03-20)
Tinjauan
Model ucapan ke teks didukung oleh GPT-4o mini. 25 MB
gpt-4o-transcribe-diarize (2025-10-15)
Tinjauan
Model ucapan ke teks dengan pengenalan ucapan otomatis. 25 MB
gpt-4o-mini-transcribe (2025-12-15)
Tinjauan
Model ucapan ke teks dengan pengenalan ucapan otomatis. Peningkatan akurasi dan ketahanan transkripsi. 25 MB

Model terjemahan ucapan

Identifikasi Model Deskripsi Permintaan maksimum (ukuran maksimum file audio)
whisper Model pengenalan ucapan tujuan umum. 25 MB

Model teks ke ucapan (pratinjau)

Identifikasi Model Deskripsi
tts
Tinjauan
Model teks ke ucapan dioptimalkan untuk kecepatan.
tts-hd
Tinjauan
Model teks ke ucapan dioptimalkan untuk kualitas.
gpt-4o-mini-tts (2025-03-20) Model teks ke suara didukung oleh GPT-4o mini.

Anda dapat memandu suara untuk berbicara dengan gaya atau nada tertentu.
gpt-4o-mini-tts (2025-12-15) Model teks ke suara didukung oleh GPT-4o mini.

Anda dapat memandu suara untuk berbicara dengan gaya atau nada tertentu.

Menyempurnakan model

Model berikut didukung untuk penyempurnaan:

Identifikasi Model Wilayah standar Global Pengembang Metode Status Modalitas
gpt-4o-mini
(2024-07-18)
US Tengah Utara
Swedia Tengah
SFT GA Teks ke teks
gpt-4o
(2024-08-06)
US Timur2
US Tengah Utara
Swedia Tengah
SFT, DPO GA Teks dan visi ke teks
gpt-4.1
(2025-04-14)
US Tengah Utara
Swedia Tengah
SFT, DPO GA Teks dan visi ke teks
gpt-4.1-mini
(2025-04-14)
US Tengah Utara
Swedia Tengah
SFT, DPO GA Teks ke teks
gpt-4.1-nano (2025-04-14) US Tengah Utara
Swedia Tengah
SFT, DPO GA Teks ke teks
o4-mini
(2025-04-16)
US Timur2
Swedia Tengah
RFT GA Teks ke teks
gpt-5
(2025-08-07)
US Tengah Utara
Swedia Tengah
RFT Pratinjau tertutup Teks ke teks
Ministral-3B
(2411)
Tidak didukung SFT Pratinjau publik Teks ke teks
Qwen-32B Tidak didukung SFT Pratinjau publik Teks ke teks
Llama-3.3-70B-Instruct Tidak didukung SFT Pratinjau publik Teks ke teks
gpt-oss-20b Tidak didukung SFT Pratinjau publik Teks ke teks

Atau Anda dapat menyempurnakan model yang sudah disempurnakan sebelumnya, dengan format base-model.ft-{jobid}.

Catatan

Model sumber terbuka (Ministral-3B, Qwen-32B, Llama-3.3-70B-Instruct, gpt-oss-20b) hanya didukung pada sumber daya Foundry dan di UI Foundry baru.

Catatan

Pelatihan global menyediakan pelatihan yang lebih terjangkau per token, tetapi tidak menawarkan residensi data. Saat ini tersedia untuk sumber daya Foundry di wilayah berikut:

  • Australia Timur
  • Brasil Selatan
  • Kanada Tengah
  • Kanada Timur
  • US Timur
  • US Timur2
  • Prancis Tengah
  • Jerman Barat Tengah
  • Italia Utara
  • Jepang Timur (tidak ada dukungan visi)
  • Korea Tengah
  • US Tengah Utara
  • Norwegia Timur
  • Polandia Tengah (tidak ada dukungan 4.1-nano)
  • Asia Tenggara
  • Afrika Selatan Utara
  • US Tengah Selatan
  • India Selatan
  • Spanyol Tengah
  • Swedia Tengah
  • Swiss Barat
  • Swiss Utara
  • UK Selatan
  • Eropa Barat
  • US Barat
  • Barat US 3

Asisten (pratinjau)

Untuk Asisten, Anda memerlukan kombinasi model yang didukung dan wilayah yang didukung. Alat dan kemampuan tertentu memerlukan model terbaru. Model berikut tersedia di Assistants API, SDK, dan Foundry. Tabel berikut ini adalah untuk penyebaran standar. Untuk informasi tentang ketersediaan unit throughput yang disediakan, lihat Model throughput yang disediakan. Model dan wilayah yang tercantum dapat digunakan dengan Asisten v1 dan v2. Anda dapat menggunakan model Standar Global jika didukung di wilayah berikut.

Wilayah gpt-4o, 2024-05-13 gpt-4o, 2024-08-06 gpt-4o-mini, 2024-07-18 gpt-4, 0613 gpt-4, 1106-Preview gpt-4, 0125-Preview gpt-4, turbo-2024-04-09 gpt-4-32k, 0613 gpt-35-turbo, 0613 gpt-35-turbo, 1106 gpt-35-turbo, 0125 gpt-35-turbo-16k, 0613
australiaeast - - - - -
eastus - - - -
eastus2 - - - -
francecentral - - - - - -
japaneast - - - - - - - - -
norwayeast - - - - - - - - - - -
India Selatan - - - - - - - - -
swedencentral - -
uksouth - - - - - -
westus - - - - -
westus3 - - - - - -

Penghentian model

Untuk informasi terbaru tentang penghentian model, lihat Jadwal penghentian model.

Model Black Forest Labs dijual langsung oleh Azure

Model FLUX Black Forest Labs (BFL) menghadirkan pembuatan gambar canggih ke Microsoft Foundry, memungkinkan Anda menghasilkan dan mengedit gambar berkualitas tinggi dari perintah teks dan gambar referensi. Model FLUX mendukung berbagai kemampuan termasuk pembuatan teks ke gambar, pengeditan gambar multi-referensi, dan pembuatan dan pengeditan dalam konteks.

Anda dapat menjalankan model ini melalui API penyedia layanan BFL dan endpoint images/generations serta images/edits.

Untuk bekerja dengan model FLUX di Foundry, lihat Deploy dan gunakan model FLUX di Microsoft Foundry.

Model Ketik & titik akhir API Kemampuan Jenis penyebaran (ketersediaan wilayah)
FLUX.2-flex
Tinjauan
Pembuatan gambar
- API penyedia layanan BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-flex
- Input: teks dan gambar (32.000 token dan hingga 10 gambari)
- Output: Satu Gambar
- Panggilan alat: Tidak
- Format respons: Gambar (PNG dan JPG)
- Fitur utama: Kontrol halus; dukungan multi-referensi hingga 10 gambar
- Parameter tambahan:
guidance: Mengontrol seberapa dekat output mengikuti perintah. Minimum: 1.5, maksimum: 10, default: 4.5. Lebih tinggi = kedisiplinan waktu yang lebih dekat.
steps: Jumlah langkah inferensi. Maksimum: 50, default: 50. Lebih tinggi = lebih detail, lebih lambat.
- Standar global (semua wilayah)
FLUX.2-pro
Tinjauan
Pembuatan gambar
- API penyedia layanan BFL: <resource-name>/providers/blackforestlabs/v1/flux-2-pro
- Input: teks dan gambar (32.000 token dan hingga 8 gambarii)
- Output: Satu Gambar
- Panggilan alat: Tidak
- Format respons: Gambar (PNG dan JPG)
- Fitur utama: Dukungan multi-referensi hingga 8 gambar; lebih membumi dalam pengetahuan dunia nyata; fleksibilitas output yang lebih besar; performa yang ditingkatkan
- Parameter tambahan:(Hanya di API khusus penyedia) Mendukung semua parameter.
- Standar global (semua wilayah)
FLUX.1-Kontext-pro
Tinjauan
Pembuatan gambar
- API Gambar: https://<resource-name>/openai/deployments/{deployment-id}/images/generations
Dan
https://<resource-name>/openai/deployments/{deployment-id}/images/edits

- API penyedia layanan BFL: <resource-name>/providers/blackforestlabs/v1/flux-kontext-pro?api-version=preview
- Input: teks dan gambar (5.000 token dan 1 gambar)
- Output: Satu Gambar
- Panggilan alat: Tidak
- Format respons: Gambar (PNG dan JPG)
- Fitur utama: Konsistensi karakter, pengeditan tingkat lanjut
- Parameter tambahan:(Hanya di API khusus penyedia)seed, , aspect ratio, input_imageprompt_unsampling, , safety_toleranceoutput_format
- Standar global (semua wilayah)
FLUX-1.1-pro
Tinjauan
Pembuatan gambar
- API Gambar: https://<resource-name>/openai/deployments/{deployment-id}/images/generations

- API penyedia layanan BFL: <resource-name>/providers/blackforestlabs/v1/flux-pro-1.1?api-version=preview
- Input: teks (5.000 token dan 1 gambar)
- Output: Satu Gambar
- Panggilan alat: Tidak
- Format respons: Gambar (PNG dan JPG)
- Fitur utama: Kecepatan inferensi cepat, kepatuhan prompt yang kuat, harga kompetitif, generasi yang dapat diskalakan
- Parameter tambahan:(Hanya di API khusus penyedia)width, , height, prompt_unsamplingseed, , safety_toleranceoutput_format
- Standar global (semua wilayah)

i,ii Dukungan untuk beberapa gambar referensi tersedia untuk FLUX.2 [pro] (Pratinjau) dan FLUX.2 [flex] (Pratinjau) dengan menggunakan API, tetapi tidak di taman bermain.

Model Cohere dijual langsung oleh Azure

Keluarga model Cohere mencakup berbagai model yang dioptimalkan untuk berbagai kasus penggunaan, termasuk penyelesaian obrolan, klasifikasi teks/rerank, dan embedding. Model Cohere dioptimalkan untuk berbagai kasus penggunaan yang mencakup penalaran, ringkasan, dan jawaban atas pertanyaan.

Model Jenis Kemampuan Jenis penyebaran (ketersediaan wilayah)
Cohere-rerank-v4.0-pro klasifikasi teks (rerank) - Input: teks
- Output: teks
- Bahasa:en, fr, , esit, de, pt-br, ja, zh-cn, ar, vi, , hi, ru, , id, dannl
- Panggilan alat: Tidak
- Format tanggapan: JSON
- Standar global (semua wilayah)
Komputasi yang dikelola
Cohere-rerank-v4.0-fast klasifikasi teks (rerank) - Input: teks
- Output: teks
- Bahasa:en, fr, , esit, de, pt-br, ja, zh-cn, ar, vi, , hi, ru, , id, dannl
- Panggilan alat: Tidak
- Format tanggapan: JSON
- Standar global (semua wilayah)
Komputasi yang dikelola
Cohere-command-a penyelesaian chat - Input: teks (131.072 token)
- Output: teks (8.182 token)
- Bahasa:en, fr, , esit, de, pt-br, ja, ko, , zh-cndanar
- Panggilan alat: Ya
- Format respons: Teks, JSON
- Standar global (semua wilayah)
embed-v-4-0 penyematan - Input: teks (512 token) dan gambar (piksel 2MM)
- Output: Vektor (256, 512, 1024, 1536 dim.)
- Bahasa:en, fr, , esit, de, pt-br, ja, ko, , zh-cndanar
- Standar global (semua wilayah)

Model DeepSeek dijual langsung oleh Azure

Keluarga model DeepSeek mencakup beberapa model penalaran, yang unggul dalam tugas penalaran dengan menggunakan proses pelatihan langkah demi langkah, seperti bahasa, penalaran ilmiah, dan tugas pengkodan.

Model Jenis Kemampuan Jenis penyebaran (ketersediaan wilayah)
DeepSeek-V4-Flash
Tinjauan
penyelesaian percakapan
(dengan konten penalaran)
- Input: teks (1.000.000 token)
- Output: teks (384.000 token)
- Bahasa:en Dan zh
- Panggilan alat: Tidak
- Format respons: Teks, JSON
- Standar global (semua wilayah)
DeepSeek-V3.2-Speciale
Tinjauan
penyelesaian percakapan
(dengan konten penalaran)
- Input: teks (128.000 token)
- Output: teks (128.000 token)
- Bahasa:en Dan zh
- Panggilan alat: Tidak
- Format respons: Teks, JSON
- Standar global (semua wilayah)
DeepSeek-V3.2
Tinjauan
penyelesaian percakapan
(dengan konten penalaran)
- Input: teks (128.000 token)
- Output: teks (128.000 token)
- Bahasa:en Dan zh
- Panggilan alat: Tidak
- Format respons: Teks, JSON
- Standar global (semua wilayah)
DeepSeek-V3.1
Tinjauan
penyelesaian percakapan
(dengan konten penalaran)
- Input: teks (131.072 token)
- Output: teks (131,072 token)
- Bahasa:en Dan zh
- Panggilan alat: Ya
- Format respons: Teks, JSON
- Standar global (semua wilayah)
DeepSeek-R1-0528
Tinjauan
penyelesaian percakapan
(dengan konten penalaran)
- Input: teks (163.840 token)
- Output: teks (163.840 token)
- Bahasa:en Dan zh
- Panggilan alat: Tidak
- Format respons: Teks
- Standar global (semua wilayah)
- Penyediaan global (semua wilayah)
DeepSeek-V3-0324
Tinjauan
penyelesaian chat - Input: teks (131.072 token)
- Output: teks (131,072 token)
- Bahasa:en Dan zh
- Panggilan alat: Ya
- Format respons: Teks, JSON
- Standar global (semua wilayah)
- Penyediaan global (semua wilayah)
DeepSeek-R1 penyelesaian percakapan
(dengan konten penalaran)
- Input: teks (163.840 token)
- Output: teks (163.840 token)
- Bahasa:en Dan zh
- Panggilan alat: Tidak
- Format respons: Teks
- Standar global (semua wilayah)
- Penyediaan global (semua wilayah)

Azure menjual langsung model meta

Model dan alat Meta Llama adalah kumpulan teks AI dan model penalaran gambar generatif yang telah dilatih dan disempurnakan. Rentang model meta berkisar dalam skala yang mencakup:

  • Model bahasa berskala kecil (SLM) seperti 1B dan 3B Base dan model Instruct untuk inference pada perangkat lokal dan di tepi jaringan
  • Model bahasa berskala besar berukuran sedang (LLM) seperti model Dasar dan Instruksi 7B, 8B, dan 70B
  • Model berperforma tinggi seperti Meta Llama 3.1-405B Instruct digunakan untuk pembuatan data sintetis dan kasus penggunaan distilasi.
Model Jenis Kemampuan Jenis penyebaran (ketersediaan wilayah)
Llama-4-Maverick-17B-128E-Instruct-FP8
Tinjauan
penyelesaian chat - Input: teks dan gambar (token 1M)
- Output: teks (1 juta token)
- Bahasa:ar, en, , frde, hi, id, it, pt, es, , tl, th, danvi
- Panggilan alat: Tidak
- Format respons: Teks
- Standar global (semua wilayah)
Llama-3.3-70B-Instruct
Tinjauan
penyelesaian chat - Input: teks (128.000 token)
- Output: teks (8.192 token)
- Bahasa:en, de, fr, it, pt, hi, , esdan th
- Panggilan alat: Tidak
- Format respons: Teks
- Standar global (semua wilayah)
- Penyediaan global (semua wilayah)

Beberapa model Meta juga tersedia dari mitra dan komunitas.

Model produk Microsoft dijual langsung oleh Azure

model Microsoft mencakup berbagai grup model seperti Model Router, model MAI, model Phi, model AI layanan kesehatan, dan banyak lagi. Beberapa model Microsoft juga tersedia dari mitra dan komunitas.

Untuk bekerja dengan model pembuatan teks ke gambar MAI-Image-2e dan MAI-Image-2 di Foundry, lihat Deploy dan gunakan model MAI di Microsoft Foundry.

Model Jenis Kemampuan Jenis penyebaran (ketersediaan wilayah)
MAI-Image-2e
Tinjauan
Teks ke Gambar. Lihat Titik akhir API untuk detailnya. - Input: teks
- Output: Satu gambar
- Panjang konteks: 32.000 token
- Panggilan alat: Tidak
- Format respons: Gambar (PNG)
- Bahasa:en
- Fitur utama: Pembuatan teks ke gambar berkualitas tinggi; sintesis gambar fotorealistik dengan struktur visual yang konsisten; sangat cocok untuk citra produk, visual pemasaran, aset merek, dan alur kerja kreatif komersial.
- Parameter:width, height, prompt
Minimal 768×768 piksel; jumlah total piksel maksimum 1.048.576 (setara dengan 1024×1024). Salah satu dimensi dapat melebihi 1024 selama jumlah piksel total tetap dalam batas (misalnya, 768×1365).
- Standar global (US Tengah Barat, AS Timur, AS Barat, Eropa Barat, Swedia Tengah, India Selatan)
MAI-Image-2
Tinjauan
Teks ke Gambar. Lihat Titik akhir API untuk detailnya. - Input: teks
- Output: Satu gambar
- Panjang konteks: 32.000 token
- Panggilan alat: Tidak
- Format respons: Gambar (PNG)
- Bahasa:en
- Fitur utama: Pembuatan teks ke gambar berkualitas tinggi; sintesis gambar fotorealistik dengan struktur visual yang konsisten; sangat cocok untuk citra produk, visual pemasaran, aset merek, dan alur kerja kreatif komersial.
- Parameter:width, height, prompt
Minimal 768×768 piksel; jumlah total piksel maksimum 1.048.576 (setara dengan 1024×1024). Salah satu dimensi dapat melebihi 1024 selama jumlah piksel total tetap dalam batas (misalnya, 768×1365).
- Standar global (US Tengah Barat, AS Timur, AS Barat, Eropa Barat, Swedia Tengah, India Selatan)
model-router 1 penyelesaian chat Lebih banyak detail di Gambaran Umum Model Router.
- Input: teks, gambar
- Keluaran: teks (jumlah token maksimal bervariasi2)
Jendela konteks: 200.0003
- Bahasa:en
- Standar global (US Timur 2, Swedia Tengah)
- Standar Zona Data4 (US Timur 2, Swedia Tengah)

1Model router versi2025-11-18. Versi sebelumnya (2025-08-07 dan 2025-05-19) juga tersedia.

2Token keluaran maksimum bervariasi untuk model dasar di router model. Misalnya, 32.768 (GPT-4.1 series), 100.000 (o4-mini), 128.000 (gpt-5 reasoning models), dan 16.384 (gpt-5-chat).

Jendela konteks yang lebih besar 3 kompatibel dengan beberapa model dasar dari Model Router. Itu berarti panggilan API dengan konteks yang lebih besar hanya berhasil jika perintah dirutekan ke salah satu model tersebut. Jika tidak, panggilan gagal.

4 Penagihan untuk penyebaran router model Standar Zona Data dimulai tidak lebih awal dari 1 November 2025.

Model Mistral dijual langsung oleh Azure

Model Jenis Kemampuan Jenis penyebaran (ketersediaan wilayah)
mistral-document-ai-2512 Gambar ke Teks - Input: halaman gambar atau PDF (30 halaman, file PDF maks 30MB)
- Output: teks
- Bahasa:en
- Pemanggilan Alat: tidak
- Format respons: Teks, JSON, Markdown
- Standar global (semua wilayah)
- Standar zona data (AS dan UE)
mistral-document-ai-2505
Tinjauan
Gambar ke Teks - Input: halaman gambar atau PDF (30 halaman, file PDF maks 30MB)
- Output: teks
- Bahasa:en
- Pemanggilan Alat: tidak
- Format respons: Teks, JSON, Markdown
- Standar global (semua wilayah)
- Standar zona data (AS dan UE)
Mistral-Large-3
Tinjauan
penyelesaian chat - Input: teks, gambar
- Output: teks
- Bahasa:en, fr, , dees, it, pt, nl, zh, ja, , ko, danar
- Panggilan alat: Ya
- Format respons: Teks, JSON
- Standar global (semua wilayah)
- Standar zona data (AS dan UE)

Beberapa model Mistral juga tersedia dari mitra dan komunitas.

Model Moonshot AI dijual langsung oleh Azure

Model Moonshot AI termasuk Kimi K2.6 (Pratinjau) dan Kimi K2.5 (Pratinjau), model penalaran multimodal yang menerima input teks dan gambar.

Model Jenis Kemampuan Jenis penyebaran (ketersediaan wilayah)
Kimi-K2.6
Tinjauan
penyelesaian percakapan
(dengan konten penalaran)
- Input: teks dan gambar (262.144 token)
- Output: teks (262.144 token)
- Bahasa:en Dan zh
- Panggilan alat: Ya
- Format respons: Teks
- Standar global (semua wilayah)
Kimi-K2.5
Tinjauan
penyelesaian percakapan
(dengan konten penalaran)
- Input: teks dan gambar (262.144 token)
- Output: teks (262.144 token)
- Bahasa:en Dan zh
- Panggilan alat: Ya
- Format respons: Teks
- Standar global (semua wilayah)

Lihat koleksi model ini di portal Foundry.

Model xAI dijual langsung oleh Azure

Model Grok xAI dalam Foundry Models mencakup beragam model penalaran dan non-penalaran yang dirancang untuk berbagai kasus penggunaan perusahaan seperti ekstraksi data, pengodean, ringkasan teks, dan aplikasi berbasis agen.

Pendaftaran diperlukan untuk akses kegrok-code-fast-1 (Pratinjau) dan grok-4.

Model Jenis Kemampuan Jenis penyebaran (ketersediaan wilayah)
grok-4.3
Tinjauan
penyelesaian chat - Input: teks (200.000 token)
- Output: teks (8.192 token)
- Bahasa:en
- Panggilan alat: ya
- Format respons: teks
- Standar global (semua wilayah)
grok-4-20-reasoning
Tinjauan
penyelesaian chat - Input: teks (262.000 token)
- Output: teks (8.192 token)
- Bahasa:en
- Panggilan alat: ya
- Format respons: teks
- Standar global (semua wilayah)
grok-4-20-non-reasoning
Tinjauan
penyelesaian chat - Input: teks (262.000 token)
- Output: teks (8.192 token)
- Bahasa:en
- Panggilan alat: ya
- Format respons: teks
- Standar global (semua wilayah)
grok-4.1-fast-reasoning
Tinjauan
penyelesaian chat - Input: teks, gambar (128.000 token)
- Output: teks (128.000 token)
- Bahasa:en
- Panggilan alat: ya
- Format respons: teks
- Standar global (semua wilayah)
grok-4.1-fast-non-reasoning
Tinjauan
penyelesaian chat - Input: teks, gambar (128.000 token)
- Output: teks (128.000 token)
- Bahasa:en
- Panggilan alat: ya
- Format respons: teks
- Standar global (semua wilayah)
grok-4 penyelesaian chat - Input: teks (262.000 token)
- Output: teks (8.192 token)
- Bahasa:en
- Panggilan alat: ya
- Format respons: teks
- Standar global (semua wilayah)
grok-code-fast-1
Tinjauan
penyelesaian chat - Input: teks (256.000 token)
- Output: teks (8.192 token)
- Bahasa:en
- Panggilan alat: ya
- Format respons: teks
- Standar global (semua wilayah)

Ketersediaan wilayah model berdasarkan jenis penyebaran

Microsoft Foundry memberi pelanggan pilihan pada struktur hosting yang sesuai dengan pola bisnis dan penggunaan mereka. Layanan ini menawarkan dua kategori penyebaran utama:

  • Standar: Memiliki opsi penyebaran global, merutekan lalu lintas secara global untuk memberikan throughput yang lebih tinggi.
  • Provisioned: Juga memiliki opsi penyebaran global, memungkinkan pelanggan untuk membeli dan menyebarkan unit throughput yang disediakan di seluruh infrastruktur global Azure.

Kategori penyebaran lain seperti batch juga tersedia. Untuk mempelajari tentang semua tipe deployment model yang tersedia, lihat Tipe Deployment untuk Model Foundry Microsoft.

Ketersediaan model standar global

Wilayah FLUX.2-flex FLUX.2-pro FLUX.1-Kontext-pro FLUX-1.1-pro Cohere-rerank-v4.0-pro Cohere-rerank-v4.0-fast cohere-command-a embed-v-4-0 DeepSeek-V3.2-Speciale DeepSeek-V3.2 DeepSeek-V3.1 DeepSeek-R1-0528 DeepSeek-V3-0324 DeepSeek-R1 Llama-4-Maverick-17B-128E-Instruct-FP8 Llama-3.3-70B-Instruct MAI-Image-2 model-router mistral-document-ai-2512 mistral-document-ai-2505 Mistral-Large-3 Kimi-K2.5 grok-4-1-penalaran-cepat grok-4-1-fast-non-reasoning grok-4-fast-reasoning grok-4-fast-non-reasoning grok-3 grok-3-mini
australiaeast - -
brasilouth - -
kanadacentral - -
kanada timur - -
centralus - -
eastus -
eastus2 -
francecentral - -
germanywestcentral - -
italynorth - -
japaneast - -
japanwest - -
koreacentral - -
northcentralus - -
norwayeast - -
polandcentral - -
southafricanorth - -
southcentralus - -
India Selatan -
spaincentral - -
swedencentral
SwitzerlandNorth - -
swisswest - -
uaenorth - -
uksouth - -
westcentralus -
westeurope -
westus -
westus2 - -
westus3 - -