Microsoft Foundry 中的即時模型（預覽版）

即時模型允許你以名稱呼叫任何支援的模型——無需部署。建立一個 Foundry 專案，開始寫程式，並立即使用任何可用的模型。

先決條件

Azure 訂用帳戶。免費創建一個。
登入 Microsoft Foundry。確定 新鑄造廠 的開關是開啟的。這些步驟參考 Foundry (新)。
位於 West US 3 的 Foundry 專案（這是預覽期間唯一支援即時模型的區域）。如果你需要建立專案，請參見建立專案。
專案或帳戶上的 Foundry 使用者 角色。

Important

Foundry RBAC 角色最近已重新命名。 Foundry 用戶、Foundry 擁有者、Foundry Account Owner 以及 Foundry Project Manager 先前分別被稱為 Azure AI 使用者、Azure AI 擁有者、Azure AI 帳戶擁有者及 Azure AI Project 管理者。在更名期間，你可能還會在某些地方看到之前的名字。角色 ID 與核心權限不會因命名而改變。

立即開始使用模型

使用即時模型時，工作流程很簡單——在程式碼中使用支援的即時模型名稱。不需要部署。你已經用來部署的同一個 API、SDK 和客戶端，也能用在即時模型上。沒有第二個 SDK，沒有獨立的客戶端，也沒有設定變更。

與以部署為基礎的程式碼相比，唯一的差異是 model 參數。在下方程式碼中，請以任何即時模型的名稱取代 "gpt-5-mini"。

from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient

# Format: "https://resource_name.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"

# Create project and openai clients to call Foundry API
project = AIProjectClient(
    endpoint=PROJECT_ENDPOINT,
    credential=DefaultAzureCredential(),
)
openai = project.get_openai_client()

# Run a responses API call
response = openai.responses.create(
    model="gpt-5-mini",
    input="What is the size of France in square miles?",
)
print(f"Response output: {response.output_text}")

與以部署為基礎的程式碼相比，唯一的差異是 model 參數。在下方程式碼中，請以任何即時模型的名稱取代 "gpt-5-mini"。

using Azure.Identity;
using Azure.AI.Projects;
using Azure.AI.Extensions.OpenAI;
using OpenAI.Responses;

#pragma warning disable OPENAI001

// Format: "https://resource_name.ai.azure.com/api/projects/project_name"
var ProjectEndpoint = "your_project_endpoint";

// Create project client to call Foundry API
AIProjectClient projectClient = new(
    endpoint: new Uri(ProjectEndpoint),
    tokenProvider: new DefaultAzureCredential());

// Run a responses API call
ProjectResponsesClient responseClient = projectClient.ProjectOpenAIClient.GetProjectResponsesClientForModel("gpt-5-mini"); 
ResponseResult response = await responseClient.CreateResponseAsync(
    "What is the size of France in square miles?");
Console.WriteLine(response.GetOutputText());

與以部署為基礎的程式碼相比，唯一的差異是 model 參數。在下方程式碼中，請以任何即時模型的名稱取代 "gpt-5-mini"。

import { DefaultAzureCredential } from "@azure/identity";
import { AIProjectClient } from "@azure/ai-projects";

// Format: "https://resource_name.ai.azure.com/api/projects/project_name"
const PROJECT_ENDPOINT = "your_project_endpoint";

async function main(): Promise<void> {
    // Create project and openai clients to call Foundry API
    const project = new AIProjectClient(PROJECT_ENDPOINT, new DefaultAzureCredential());
    const openai = project.getOpenAIClient();

    // Run a responses API call
    const response = await openai.responses.create({
        model: "gpt-5-mini",
        input: "What is the size of France in square miles?",
    });
    console.log(`Response output: ${response.output_text}`);
}

main().catch(console.error);

與以部署為基礎的程式碼相比，唯一的差異是 model 參數。在下方程式碼中，請以任何即時模型的名稱取代 "gpt-5-mini"。

package com.azure.ai.agents;

import com.azure.identity.DefaultAzureCredentialBuilder;
import com.openai.models.responses.Response;
import com.openai.models.responses.ResponseCreateParams;

public class CreateResponse {
    public static void main(String[] args) {
        // Format: "https://resource_name.ai.azure.com/api/projects/project_name"
        String ProjectEndpoint = "your_project_endpoint";

        // Create responses client to call Foundry API
        ResponsesClient responsesClient = new AgentsClientBuilder()
                .credential(new DefaultAzureCredentialBuilder().build())
                .endpoint(ProjectEndpoint)
                .buildResponsesClient();

        // Run a responses API call
        ResponseCreateParams responseRequest = new ResponseCreateParams.Builder()
                .input("What is the size of France in square miles?")
                .model("gpt-5-mini")
                .build();
        Response response = responsesClient.getResponseService().create(responseRequest);
        System.out.println(response.output());
    }
}

與以部署為基礎的程式碼相比，唯一的差異是 model 參數。在下方程式碼中，請以任何即時模型的名稱取代 "gpt-5-mini"。同時用你的價值觀來替換 YOUR-FOUNDRY-RESOURCE-NAME ：

curl -X POST https://YOUR-FOUNDRY-RESOURCE-NAME.services.ai.azure.com/api/projects/YOUR-PROJECT-NAME/openai/v1/responses \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer $AZURE_AI_AUTH_TOKEN" \
-d '{
        "model": "gpt-5.1-mini",
        "input": "What is the size of France in square miles?"
}'

為什麼即時模型很重要

透過更改一個字串來切換模型——使用該行中model=的任何即時模型名稱，無需建立或刪除部署。
相同的 API 和 SDK — 同樣的呼叫適用於即時模型和部署。
可與你的開發工具搭配運作 — 即時模型能像部署一樣，與 Foundry CLI、VS Code 和 CI/CD 管線整合。

部署不會消失。當你需要保留吞吐量、自訂內容過濾器、資料駐留或進階企業設定時，它們依然是正確的選擇。即時模型簡化了入門體驗，讓部署成為你升級的目標，而非必須通過的門檻才能使用模型。

支援的模型

新機型在上市時預設支援即時存取。根據客戶需求，會考慮支援更多型號。

要查看所有支援即時存取的型號：

在新的 Foundry 體驗中，在 West US 3 開啟一個專案，
在右上角的導覽中選擇 「發現 」，然後在左側窗格選擇 「型號 」。
在模型目錄中，選擇「開發選項」中的「即時」即可查看可用的即時模型。

你也可以程式化列出即時模型：

SUBSCRIPTION_ID="<your-subscription-id>"
LOCATION="westus3"

az rest --method get \
  --url "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/providers/Microsoft.CognitiveServices/locations/$LOCATION/models?api-version=2025-06-01" \
  --output json \
| jq -r '(.value // .models // .)[]
  | select((.model.capabilities.instant // "false" | tostring | ascii_downcase) == "true")
  | .model.name' \
| sort -u

Note

預覽期間，即時模型僅在 西美國3 區的專案中提供。

即使訂閱沒有配額，有些即時模特兒也可能出現在名單中。欲了解更多資訊，請參閱鑄造廠模型的配額與限制。

何時使用即時模型與部署方式

劇本	建議方法
開始、原型製作或實驗	即時模型
在最新模型發布後立即使用	即時模型
需要保留容量或可預測的吞吐量	部署
需要佈建輸送量（PTU）	部署
需要在特定地區擁有資料駐留權	部署
各模型自訂內容過濾政策	部署
針對每個模型的自訂防護機制	部署
端點專屬配置（例如，每個端點的版本鎖定）	部署
跨團隊的配額細粒度劃分	部署
微調模型	部署

即時模型與部署可以共存於同一專案中。你可以先從即時模型開始，隨著需求演變後再建立部署。

車型版本

預設為，即時模型會路由至模型的最新持續更新版本。要釘選特定版本，請在型號名稱後加上連字號後綴版本日期：

你傳遞為 `model` 的內容是什麼	行為
`model-name`	通往最新版本的路由
`model-name-2025-04-01`	前往該特定版本的路徑

版本釘選需自行啟用。如果你的應用程式需要穩定性，請加上版本後綴。否則，你總是會自動拿到最新版本。

配額如何被消耗

即時模型會從分配給你訂閱的 每個模型全球配額 池中抽取。此配額與標準部署所使用的區域配額是分開的。

你不需要分配或分割全球配額——配額會自動分配到你訂閱中所有即時模型使用量。
Global Standard 部署會預留您的部分全域配額。即時模型會用剩餘的容量。
其他部署類型（區域標準、配置）則使用獨立的區域配額，不會影響你的即時模型容量。
如果即時模型要求受到限速，你可以申請提高配額，或建立具有保留容量的部署。

欲了解更多全球與區域配額互動的細節，請參見「管理與增加配額」。

企業控制

能力	運作原理
封鎖特定模型或供應商	Azure 原則定義套用至即時模型的方式與套用至部署相同
固定到模型版本	在型號名稱後加上版本後綴（參見型號版本）
完全關閉即時模型	管理員可以透過 Azure 原則在訂閱層關閉即時模型

要從帳號移除即時模型，請透過 Bicep 或 ARM REST 設定。

REST API
Bicep

使用以下資訊更新您的帳號：

PATCH https://management.azure.com/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}?api-version=2026-01-15-preview
Authorization: Bearer {arm_token}
Content-Type: application/json

利用此請求體有效關閉即時模型存取：

{
  "properties": {
    "instant": {
      "raiPolicyName": "Microsoft.DefaultV2",
      "modelAllowList": []
    }
  }
}

使用 instant 區塊更新您現有的帳戶資源：

resource account 'Microsoft.CognitiveServices/accounts@2026-01-15-preview' = {
  name: accountName
  location: location
  kind: 'AIServices'
  sku: {
    name: 'S0'
  }
  // Keep your existing account properties and add instant settings.
  properties: {
    instant: {
      raiPolicyName: 'Microsoft.DefaultV2'
      modelAllowList: []
    }
  }
}

Important

所有即時模型都使用預設的護欄和內容過濾器。然而，對於即時型模型，你無法為每個模型分別設定自訂防護機制或負責任的 AI（RAI）政策。你可以透過 API 在帳號層設定預設的 RAI 政策，但該政策對所有即時模型都適用。如果您需要為個別模型設定不同的內容篩選原則，請使用部署。

部署名稱衝突

新部署不能使用與現有模型名稱相符的名稱。如果您現有的部署名稱與模型名稱衝突，則會以該部署為優先，因此在該專案中無法使用該模型名稱的即時模型存取。

預覽期間的限制

僅在 美國西部 3 提供。
不支援微調模型。若要使用微調模型，請建立部署。
Guardrails、自訂 RAI 政策和內容篩選器皆無法針對即時模型進行設定。
只有支援模型中列出的模型才符合資格。

意見反應

此頁面對您有幫助嗎？

Last updated on 2026-06-03

Microsoft Foundry 中的即時模型（預覽版）

先決條件

立即開始使用模型

為什麼即時模型很重要

支援的模型

何時使用即時模型與部署方式

車型版本

配額如何被消耗

企業控制

部署名稱衝突

預覽期間的限制

相關內容

意見反應

其他資源