Catatan
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba masuk atau mengubah direktori.
Akses ke halaman ini memerlukan otorisasi. Anda dapat mencoba mengubah direktori.
Agen didukung oleh beragam model dengan kemampuan dan rentang harga yang berbeda. Ketersediaan model bervariasi menurut wilayah dan cloud. Alat dan kemampuan tertentu memerlukan model terbaru. Model berikut tersedia di REST API dan SDK.
Azure OpenAI Model
Azure OpenAI memberi pelanggan pilihan pada struktur hosting yang sesuai dengan pola bisnis dan penggunaan mereka. Layanan ini menawarkan dua jenis penyebaran utama:
- Standar ditawarkan dengan opsi penyebaran global, merutekan lalu lintas secara global untuk memberikan throughput yang lebih tinggi.
- Provisioned juga ditawarkan dengan opsi penyebaran global, memungkinkan pelanggan untuk membeli dan menyebarkan unit throughput yang disediakan di seluruh infrastruktur global Azure.
Semua penyebaran dapat melakukan operasi inferensi yang persis sama, namun penagihan, skala, dan performanya berbeda secara signifikan. Untuk mempelajari selengkapnya tentang jenis penyebaran Azure OpenAI, lihat panduan jenis penyebaran.
Azure AI Foundry Agent Service mendukung model Azure OpenAI berikut di wilayah yang tercantum.
Nota
- Tabel berikut ini untuk ketersediaan penyebaran API tanpa server. Untuk informasi mengenai ketersediaan Unit Throughput yang Disediakan (PTU), lihat provisioned throughput dalam dokumentasi Azure OpenAI.
GlobalStandard
pelanggan juga memiliki akses ke model standar global. - Proyek berbasis hub terbatas pada model berikut: gpt-4o, gpt-4o-mini, gpt-4, gpt-35-turbo
WILAYAH | o3-deep-research, 2025-06-26 | gpt-4o, 2024-05-13 | gpt-4o, 2024-08-06 | gpt-4o, 2024-11-20 | gpt-4o-mini, 2024-07-18 | gpt-4, 0613 | gpt-4, turbo-2024-04-09 | gpt-4-32k, 0613 | gpt-35-turbo, 1106 | gpt-35-turbo, 0125 |
---|---|---|---|---|---|---|---|---|---|---|
Australia bagian timur | X | X | X | X | X | |||||
kanada timur | X | X | X | X | X | |||||
eastus | X | X | X | X | X | X | X | |||
eastus2 | X | X | X | X | X | X | X | |||
FranceCentral | X | X | X | X | X | |||||
Jepang Timur | X | X | ||||||||
Norwegia Timur | X | X | ||||||||
India Selatan | X | X | ||||||||
swedencentral | X | X | X | X | X | X | X | X | X | |
Swiss bagian Utara | X | X | X | X | ||||||
uksouth | X | X | X | |||||||
westus | X | X | X | X | X | X | X | |||
westus3 | X | X | X | X | X |
Model bukan Microsoft
Azure AI Foundry Agent Service juga mendukung model berikut dari katalog model Azure AI Foundry.
- Meta-Llama-405B-Instruct
Untuk menggunakan model ini, Anda dapat menggunakan portal Azure AI Foundry untuk membuat penyebaran, lalu mereferensikan nama penyebaran di agen Anda. Contohnya:
agent = project_client.agents.create_agent( model="llama-3", name="my-agent", instructions="You are a helpful agent" )
Model Azure AI Foundry
Model dengan fitur pemanggilan alat
Untuk mendukung skenario agenik terbaik, sebaiknya gunakan model yang mendukung panggilan alat. Azure AI Foundry Agent Service saat ini mendukung semua model yang kompatibel dengan agen dari katalog model Azure AI Foundry.
Untuk menggunakan model ini, gunakan portal Azure AI Foundry untuk membuat penyebaran model, lalu referensikan nama penyebaran di agen Anda. Contohnya:
agent = project_client.agents.create_agent( model="llama-3", name="my-agent", instructions="You are a helpful agent")
Nota
Opsi ini hanya boleh digunakan untuk model sumber terbuka (misalnya, Cepstral, Mistral, Llama) dan bukan untuk model OpenAI, yang didukung secara asli dalam layanan. Opsi ini juga hanya boleh digunakan untuk model yang mendukung panggilan alat.
Model tanpa pemanggilan alat
Meskipun dukungan panggilan alat adalah kemampuan inti untuk skenario agenik, kami sekarang menyediakan kemampuan untuk menggunakan model yang tidak mendukung panggilan alat di API dan SDK kami. Opsi ini dapat membantu ketika Anda memiliki kasus penggunaan tertentu yang tidak memerlukan panggilan alat.
Langkah-langkah berikut akan memungkinkan Anda untuk menggunakan model penyelesaian obrolan apa pun yang tersedia melalui API tanpa server:
Sebarkan model yang Anda inginkan melalui API tanpa server. Model akan muncul di halaman Model + Titik Akhir Anda.
Klik nama model untuk melihat detail model, tempat Anda akan menemukan URI dan kunci target model Anda.
Buat koneksi Tanpa Server baru di halaman Sumber Daya Tersambung , menggunakan URI target dan kunci.
Model sekarang dapat dirujuk dalam kode Anda (Target URI
+ @
+ Model Name
), misalnya:
Model=https://Phi-4-mejco.eastus.models.ai.azure.com/@Phi-4-mejco