Not
Bu sayfaya erişim yetkilendirme gerektiriyor. Oturum açmayı veya dizinleri değiştirmeyi deneyebilirsiniz.
Bu sayfaya erişim yetkilendirme gerektiriyor. Dizinleri değiştirmeyi deneyebilirsiniz.
Anlık modeller, desteklenen herhangi bir modeli ada göre çağırmanıza olanak tanır; dağıtım gerekmez. Bir Dökümhane projesi oluşturun, kodlamaya başlayın ve kullanılabilir herhangi bir modeli hemen kullanın.
Prerequisites
- Azure aboneliği. Ücretsiz bir tane oluşturun.
-
Microsoft Foundry'ye giriş yapın.
Yeni Dökümhane seçeneğinin açık olduğundan emin olun. Bu adımlar Foundry (yeni) için geçerlidir.
- Batı ABD 3'teki bir Foundry projesi (önizleme sırasında anlık modeller için desteklenen tek bölge). Proje oluşturmanız gerekiyorsa bkz. Proje oluşturma.
- Projede veya hesapta Foundry User rolü.
Important
Foundry RBAC rolleri yakın zamanda yeniden adlandırıldı. Foundry User, Foundry Owner, Foundry Hesabı Sahibi ve Foundry Project Manager daha önce Azure Yapay Zeka Kullanıcısı, Azure Yapay Zeka Sahibi, Azure Yapay Zeka Hesabı Sahibi ve Azure Yapay Zeka Project Yöneticisi olarak adlandırıldı. Yeniden adlandırma kullanıma sunulmaya devam ederken bazı yerlerde önceki adları görmeye devam edebilirsiniz. Rol kimlikleri ve temel izinler yeniden adlandırma ile değiştirilmez.
Modelleri anında kullanmaya başlama
Anlık modellerle iş akışı basittir; kodunuzda desteklenen bir anlık model adı kullanın. Dağıtım gerekmez. Dağıtımlar için zaten kullandığınız API, SDK ve istemci, anlık modellerle çalışır. İkinci SDK yok, ayrı istemci yok, yapılandırma değişikliği yok.
Dağıtım tabanlı koddan tek değişiklik parametresidir model . Aşağıdaki kodda `"gpt-5-mini"` öğesini herhangi bir anlık modelin adıyla değiştirin.
from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient
# Format: "https://resource_name.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"
# Create project and openai clients to call Foundry API
project = AIProjectClient(
endpoint=PROJECT_ENDPOINT,
credential=DefaultAzureCredential(),
)
openai = project.get_openai_client()
# Run a responses API call
response = openai.responses.create(
model="gpt-5-mini",
input="What is the size of France in square miles?",
)
print(f"Response output: {response.output_text}")
Anlık modeller neden önemlidir?
-
Tek bir dizeyi değiştirerek modelleri değiştirin ; dağıtım oluşturmadan veya silmeden satırdaki
model=herhangi bir anlık model adını kullanın. - Aynı API ve SDK — aynı çağrılar hem anlık modeller hem de dağıtımlar için çalışır.
- Geliştirme araçlarınızla çalışır — anında modeller, Foundry CLI, VS Code ve CI/CD işlem hatlarıyla dağıtımlarda olduğu gibi aynı şekilde tümleşir.
Dağıtım süreçleri ortadan kalkmıyor. Ayrılmış aktarım hızı, özel içerik filtreleri, veri yerleşimi veya gelişmiş kurumsal yapılandırmalara ihtiyacınız olduğunda bunlar doğru seçenek olmaya devam eder. Anlık modeller, başlangıç sürecini kolaylaştırarak dağıtımları, bir modeli kullanmadan önce geçmeniz gereken bir engel değil, zamanla ulaştığınız bir aşama hâline getirir.
Desteklenen modeller
Yeni modeller yayımlandıklarında varsayılan olarak anında erişimi destekler. Ek modeller için destek, müşteri talebine göre değerlendirilir.
Anlık erişimi destekleyen tüm modelleri görmek için:
- Yeni Foundry deneyiminde Batı ABD 3'te bir proje açın,
- Sağ üst köşede Keşfet'i, ardından sol panelde Modeller'i seçin.
- Model kataloğunda, kullanılabilir anlık modelleri görüntülemek için Geliştirme seçenekleri'nin altında Anında'yı seçin.
Anlık modelleri program aracılığıyla da listeleyebilirsiniz:
SUBSCRIPTION_ID="<your-subscription-id>"
LOCATION="westus3"
az rest --method get \
--url "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/providers/Microsoft.CognitiveServices/locations/$LOCATION/models?api-version=2025-06-01" \
--output json \
| jq -r '(.value // .models // .)[]
| select((.model.capabilities.instant // "false" | tostring | ascii_downcase) == "true")
| .model.name' \
| sort -u
Note
Önizleme sırasında anlık modeller yalnızca Batı ABD 3'teki projelerde kullanılabilir.
Aboneliğinizin kotası olmasa bile bazı anlık modeller listede görünebilir. Daha fazla bilgi için Foundry Modelleri için kotalar ve sınırlar bölümüne bakın.
Anlık modellerin ve dağıtımların ne zaman kullanılacağı
| Scenario | Önerilen yaklaşım |
|---|---|
| Başlarken, prototip oluşturma veya deneme | Anlık modeller |
| Yayından hemen sonra en son modeli kullanma | Anlık modeller |
| Ayrılmış kapasite veya öngörülebilir aktarım hızı gerekiyor | Deployment |
| Sağlanan aktarım hızı (PTU) gerektirir | Deployment |
| Belirli bir bölgede veri yerleşimi gerekiyor | Deployment |
| Model başına özel içerik filtreleme ilkeleri | Deployment |
| Model başına özel korumalar | Deployment |
| Uç noktaya özgü yapılandırma (örneğin, uç nokta başına sürüm kilitleri) | Deployment |
| Ekipler arasında ayrıntılı kota bölümleme | Deployment |
| Hassas ayarlanmış modeller | Deployment |
Anlık modeller ve dağıtımlar aynı projede bir arada bulunabilir. Anlık modellerle başlayabilir ve gereksinimleriniz geliştikçe daha sonra dağıtımlar oluşturabilirsiniz.
Model sürümleri
Varsayılan olarak, anlık modeller modelin en son yeşil sürümüne yönlendirilir. Belirli bir sürüme sabitlemek için sürüm tarihini model adının sonuna kısa çizgiyle ayrılmış bir sonek olarak ekleyin:
model olarak ilettiğiniz şey |
Davranış |
|---|---|
model-name |
En son sürüme yönlendirir |
model-name-2025-04-01 |
Belirli bir sürüme yönlendirir |
Sürüm sabitleme isteğe bağlıdır. Uygulamanız kararlılık gerektiriyorsa sürüm son ekini ekleyin. Aksi takdirde, her zaman en son sürümü otomatik olarak alırsınız.
Kota nasıl tüketilir?
Anlık modeller, aboneliğinize atanan model başına genel kota havuzundan gelir. Bu kota, standart dağıtımlar tarafından kullanılan bölgesel kotadan ayrıdır.
- Genel kota ayırmaz veya bölümlemezsiniz; aboneliğinizdeki tüm anlık model kullanımı arasında otomatik olarak paylaştırılabilir.
- Global Standard dağıtımları, genel kotanızın bir kısmını ayırtır. Anlık modeller kalan kapasiteyi kullanır.
- Diğer dağıtım türleri (Bölgesel Standart, Sağlanan) ayrı bölgesel kota kullanır ve anlık model kapasitenizi etkilemez.
- Anlık model istekleri hız sınırlamasına tabi tutulursa kota artışı talebinde bulunabilir veya ayrılmış kapasiteye sahip bir dağıtım oluşturabilirsiniz.
Genel ve bölgesel kotaların nasıl etkileşimde olduğu hakkında daha fazla bilgi için bkz. Kotaları yönetme ve artırma.
Kurumsal denetimler
| Kapasite | Nasıl çalışır? |
|---|---|
| Belirli modelleri veya sağlayıcıları engelleme | Azure İlkesi tanımları, dağıtımlara uygulandıkları şekilde anlık modeller için de geçerlidir |
| Model sürümüne sabitle | Sürüm son ekini model adına ekleyin (bkz . Model sürümleri) |
| Anlık modelleri tamamen devre dışı bırakma | Yöneticiler, Azure İlkesi aracılığıyla anlık modelleri abonelik düzeyinde kapatabilir |
Hesaptan anlık modelleri kaldırmak için ayarları Bicep veya ARM REST aracılığıyla yapılandırın.
Hesabınızı şu şekilde güncelleştirin:
PATCH https://management.azure.com/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}?api-version=2026-01-15-preview
Authorization: Bearer {arm_token}
Content-Type: application/json
Anlık model erişimini etkin bir şekilde kapatmak için bu istek gövdesini kullanın:
{
"properties": {
"instant": {
"raiPolicyName": "Microsoft.DefaultV2",
"modelAllowList": []
}
}
}
Important
Tüm anlık modeller varsayılan korumaları ve içerik filtrelerini kullanır. Ancak, anlık modeller için model başına özel korumalar veya Sorumlu Yapay Zeka (RAI) ilkeleri yapılandıramazsınız. API aracılığıyla hesap düzeyinde bir varsayılan RAI ilkesi ayarlayabilirsiniz, ancak bu ilke tüm anlık modeller için tekdüzen olarak uygulanır. Tek tek modeller için farklı içerik filtreleme ilkelerine ihtiyacınız varsa bir dağıtım kullanın.
Dağıtım adı çakışmaları
Yeni dağıtımlar mevcut model adıyla eşleşen bir ad kullanamaz. Adı bir model adıyla çakışan mevcut bir dağıtımınız varsa, dağıtıma öncelik verilir ve bu proje içinde o model adı için anlık model erişimi kullanılamaz.
Önizleme sırasındaki sınırlamalar
- Yalnızca Batı ABD 3'te kullanılabilir.
- hassas ayarlı modeller desteklenmez. Hassas ayarlı bir model kullanmak için bir dağıtım oluşturun.
- Korumalar, özel RAI ilkeleri ve içerik filtreleri anlık modeller için yapılandırılamaz.
- Yalnızca Desteklenen modeller bölümünde listelenen modeller uygundur.