Microsoft Foundry'de anlık modeller (önizleme)

Anlık modeller, desteklenen herhangi bir modeli ada göre çağırmanıza olanak tanır; dağıtım gerekmez. Bir Dökümhane projesi oluşturun, kodlamaya başlayın ve kullanılabilir herhangi bir modeli hemen kullanın.

Prerequisites

  • Azure aboneliği. Ücretsiz bir tane oluşturun.
  • Microsoft Foundry'ye giriş yapın. Yeni Dökümhane seçeneğinin açık olduğundan emin olun. Bu adımlar Foundry (yeni) için geçerlidir.
  • Batı ABD 3'teki bir Foundry projesi (önizleme sırasında anlık modeller için desteklenen tek bölge). Proje oluşturmanız gerekiyorsa bkz. Proje oluşturma.
  • Projede veya hesapta Foundry User rolü.

Important

Foundry RBAC rolleri yakın zamanda yeniden adlandırıldı. Foundry User, Foundry Owner, Foundry Hesabı Sahibi ve Foundry Project Manager daha önce Azure Yapay Zeka Kullanıcısı, Azure Yapay Zeka Sahibi, Azure Yapay Zeka Hesabı Sahibi ve Azure Yapay Zeka Project Yöneticisi olarak adlandırıldı. Yeniden adlandırma kullanıma sunulmaya devam ederken bazı yerlerde önceki adları görmeye devam edebilirsiniz. Rol kimlikleri ve temel izinler yeniden adlandırma ile değiştirilmez.

Modelleri anında kullanmaya başlama

Anlık modellerle iş akışı basittir; kodunuzda desteklenen bir anlık model adı kullanın. Dağıtım gerekmez. Dağıtımlar için zaten kullandığınız API, SDK ve istemci, anlık modellerle çalışır. İkinci SDK yok, ayrı istemci yok, yapılandırma değişikliği yok.

Dağıtım tabanlı koddan tek değişiklik parametresidir model . Aşağıdaki kodda `"gpt-5-mini"` öğesini herhangi bir anlık modelin adıyla değiştirin.

from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient

# Format: "https://resource_name.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"

# Create project and openai clients to call Foundry API
project = AIProjectClient(
    endpoint=PROJECT_ENDPOINT,
    credential=DefaultAzureCredential(),
)
openai = project.get_openai_client()

# Run a responses API call
response = openai.responses.create(
    model="gpt-5-mini",
    input="What is the size of France in square miles?",
)
print(f"Response output: {response.output_text}")

Anlık modeller neden önemlidir?

  • Tek bir dizeyi değiştirerek modelleri değiştirin ; dağıtım oluşturmadan veya silmeden satırdaki model= herhangi bir anlık model adını kullanın.
  • Aynı API ve SDK — aynı çağrılar hem anlık modeller hem de dağıtımlar için çalışır.
  • Geliştirme araçlarınızla çalışır — anında modeller, Foundry CLI, VS Code ve CI/CD işlem hatlarıyla dağıtımlarda olduğu gibi aynı şekilde tümleşir.

Dağıtım süreçleri ortadan kalkmıyor. Ayrılmış aktarım hızı, özel içerik filtreleri, veri yerleşimi veya gelişmiş kurumsal yapılandırmalara ihtiyacınız olduğunda bunlar doğru seçenek olmaya devam eder. Anlık modeller, başlangıç sürecini kolaylaştırarak dağıtımları, bir modeli kullanmadan önce geçmeniz gereken bir engel değil, zamanla ulaştığınız bir aşama hâline getirir.

Desteklenen modeller

Yeni modeller yayımlandıklarında varsayılan olarak anında erişimi destekler. Ek modeller için destek, müşteri talebine göre değerlendirilir.

Anlık erişimi destekleyen tüm modelleri görmek için:

  1. Yeni Foundry deneyiminde Batı ABD 3'te bir proje açın,
  2. Sağ üst köşede Keşfet'i, ardından sol panelde Modeller'i seçin.
  3. Model kataloğunda, kullanılabilir anlık modelleri görüntülemek için Geliştirme seçenekleri'nin altında Anında'yı seçin.

Anlık modelleri program aracılığıyla da listeleyebilirsiniz:

SUBSCRIPTION_ID="<your-subscription-id>"
LOCATION="westus3"

az rest --method get \
  --url "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/providers/Microsoft.CognitiveServices/locations/$LOCATION/models?api-version=2025-06-01" \
  --output json \
| jq -r '(.value // .models // .)[]
  | select((.model.capabilities.instant // "false" | tostring | ascii_downcase) == "true")
  | .model.name' \
| sort -u

Note

Önizleme sırasında anlık modeller yalnızca Batı ABD 3'teki projelerde kullanılabilir.

Aboneliğinizin kotası olmasa bile bazı anlık modeller listede görünebilir. Daha fazla bilgi için Foundry Modelleri için kotalar ve sınırlar bölümüne bakın.

Anlık modellerin ve dağıtımların ne zaman kullanılacağı

Scenario Önerilen yaklaşım
Başlarken, prototip oluşturma veya deneme Anlık modeller
Yayından hemen sonra en son modeli kullanma Anlık modeller
Ayrılmış kapasite veya öngörülebilir aktarım hızı gerekiyor Deployment
Sağlanan aktarım hızı (PTU) gerektirir Deployment
Belirli bir bölgede veri yerleşimi gerekiyor Deployment
Model başına özel içerik filtreleme ilkeleri Deployment
Model başına özel korumalar Deployment
Uç noktaya özgü yapılandırma (örneğin, uç nokta başına sürüm kilitleri) Deployment
Ekipler arasında ayrıntılı kota bölümleme Deployment
Hassas ayarlanmış modeller Deployment

Anlık modeller ve dağıtımlar aynı projede bir arada bulunabilir. Anlık modellerle başlayabilir ve gereksinimleriniz geliştikçe daha sonra dağıtımlar oluşturabilirsiniz.

Model sürümleri

Varsayılan olarak, anlık modeller modelin en son yeşil sürümüne yönlendirilir. Belirli bir sürüme sabitlemek için sürüm tarihini model adının sonuna kısa çizgiyle ayrılmış bir sonek olarak ekleyin:

model olarak ilettiğiniz şey Davranış
model-name En son sürüme yönlendirir
model-name-2025-04-01 Belirli bir sürüme yönlendirir

Sürüm sabitleme isteğe bağlıdır. Uygulamanız kararlılık gerektiriyorsa sürüm son ekini ekleyin. Aksi takdirde, her zaman en son sürümü otomatik olarak alırsınız.

Kota nasıl tüketilir?

Anlık modeller, aboneliğinize atanan model başına genel kota havuzundan gelir. Bu kota, standart dağıtımlar tarafından kullanılan bölgesel kotadan ayrıdır.

  • Genel kota ayırmaz veya bölümlemezsiniz; aboneliğinizdeki tüm anlık model kullanımı arasında otomatik olarak paylaştırılabilir.
  • Global Standard dağıtımları, genel kotanızın bir kısmını ayırtır. Anlık modeller kalan kapasiteyi kullanır.
  • Diğer dağıtım türleri (Bölgesel Standart, Sağlanan) ayrı bölgesel kota kullanır ve anlık model kapasitenizi etkilemez.
  • Anlık model istekleri hız sınırlamasına tabi tutulursa kota artışı talebinde bulunabilir veya ayrılmış kapasiteye sahip bir dağıtım oluşturabilirsiniz.

Genel ve bölgesel kotaların nasıl etkileşimde olduğu hakkında daha fazla bilgi için bkz. Kotaları yönetme ve artırma.

Kurumsal denetimler

Kapasite Nasıl çalışır?
Belirli modelleri veya sağlayıcıları engelleme Azure İlkesi tanımları, dağıtımlara uygulandıkları şekilde anlık modeller için de geçerlidir
Model sürümüne sabitle Sürüm son ekini model adına ekleyin (bkz . Model sürümleri)
Anlık modelleri tamamen devre dışı bırakma Yöneticiler, Azure İlkesi aracılığıyla anlık modelleri abonelik düzeyinde kapatabilir

Hesaptan anlık modelleri kaldırmak için ayarları Bicep veya ARM REST aracılığıyla yapılandırın.

Hesabınızı şu şekilde güncelleştirin:

PATCH https://management.azure.com/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}?api-version=2026-01-15-preview
Authorization: Bearer {arm_token}
Content-Type: application/json

Anlık model erişimini etkin bir şekilde kapatmak için bu istek gövdesini kullanın:

{
  "properties": {
    "instant": {
      "raiPolicyName": "Microsoft.DefaultV2",
      "modelAllowList": []
    }
  }
}

Important

Tüm anlık modeller varsayılan korumaları ve içerik filtrelerini kullanır. Ancak, anlık modeller için model başına özel korumalar veya Sorumlu Yapay Zeka (RAI) ilkeleri yapılandıramazsınız. API aracılığıyla hesap düzeyinde bir varsayılan RAI ilkesi ayarlayabilirsiniz, ancak bu ilke tüm anlık modeller için tekdüzen olarak uygulanır. Tek tek modeller için farklı içerik filtreleme ilkelerine ihtiyacınız varsa bir dağıtım kullanın.

Dağıtım adı çakışmaları

Yeni dağıtımlar mevcut model adıyla eşleşen bir ad kullanamaz. Adı bir model adıyla çakışan mevcut bir dağıtımınız varsa, dağıtıma öncelik verilir ve bu proje içinde o model adı için anlık model erişimi kullanılamaz.

Önizleme sırasındaki sınırlamalar

  • Yalnızca Batı ABD 3'te kullanılabilir.
  • hassas ayarlı modeller desteklenmez. Hassas ayarlı bir model kullanmak için bir dağıtım oluşturun.
  • Korumalar, özel RAI ilkeleri ve içerik filtreleri anlık modeller için yapılandırılamaz.
  • Yalnızca Desteklenen modeller bölümünde listelenen modeller uygundur.