Directe toegang tot modellen in Microsoft Foundry (preview)

Met directe toegang tot modellen kunt u elk ondersteund model op naam aanroepen. Er is geen implementatie vereist. Maak een Foundry-project, begin met coderen en gebruik onmiddellijk elk beschikbaar model.

Prerequisites

  • Een Azure-abonnement. Maak er gratis een.
  • Meld u aan bij Microsoft Foundry. Zorg ervoor dat de wisselknop New Foundry is ingeschakeld. Deze stappen verwijzen naar Foundry (nieuw).
  • Een Foundry-project in VS - west 3 (de enige ondersteunde regio voor directe toegang tijdens de preview). Zie Een project maken als u een project wilt maken.
  • De rol Foundry User voor het project of account.

Important

De rollen Foundry RBAC zijn onlangs hernoemd. Foundry User, Foundry Owner, Foundry Account Owner en Foundry Project Manager zijn eerder benoemd Azure AI-gebruiker, Azure AI-eigenaar Azure AI-accounteigenaar en Azure AI Project Manager. Het kan zijn dat u op sommige plekken nog steeds de vorige namen ziet terwijl de naamswijziging wordt doorgevoerd. De rol-id's en basismachtigingen worden niet gewijzigd door de naamswijziging.

Direct aan de slag met modellen

Met onmiddellijke toegang is de workflow eenvoudig: gebruik in uw code de naam van een ondersteund instant-model. Er is geen implementatie nodig. Dezelfde API, SDK en client die u al gebruikt voor implementaties, werken met modellen voor directe toegang. Geen tweede SDK, geen afzonderlijke client, geen configuratiewijzigingen.

De enige wijziging van op implementatie gebaseerde code is de model parameter. Vervang in de onderstaande "gpt-5-mini" code (een geïmplementeerd model) door de naam van elk model voor directe toegang, zoals chat-gpt-latest.

from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient

# Format: "https://resource_name.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"

# Create project and openai clients to call Foundry API
project = AIProjectClient(
    endpoint=PROJECT_ENDPOINT,
    credential=DefaultAzureCredential(),
)
openai = project.get_openai_client()

# Run a responses API call
response = openai.responses.create(
    model="gpt-5-mini",
    input="What is the size of France in square miles?",
)
print(f"Response output: {response.output_text}")

Waarom directe toegang belangrijk is

  • Schakel tussen modellen door één tekenreeks te wijzigen : gebruik een willekeurige naam van een direct model in de model= regel, zonder implementaties te maken of te verwijderen.
  • Dezelfde API en SDK : dezelfde aanroepen werken voor zowel directe toegang als implementaties.
  • Werkt met uw ontwikkelhulpprogramma's : directe toegang kan worden geïntegreerd met Foundry CLI, VS Code en CI/CD-pijplijnen op dezelfde manier als bij implementaties.

Implementaties gaan niet weg. Ze blijven de juiste keuze wanneer u gereserveerde doorvoer, aangepaste inhoudsfilters, gegevenslocatie of geavanceerde bedrijfsconfiguraties nodig hebt. Directe toegang vereenvoudigt de eerste stappen, zodat deployments iets zijn waar u naartoe groeit, en geen drempel die u eerst over moet voordat u een model kunt gebruiken.

Ondersteunde modellen

Nieuwe modellen bieden standaard ondersteuning voor directe toegang wanneer ze worden vrijgegeven. Ondersteuning voor aanvullende modellen wordt overwogen op basis van de vraag van de klant.

Alle modellen weergeven die directe toegang ondersteunen:

  1. Open een project in VS - west 3 in de nieuwe Foundry-ervaring,
  2. Selecteer Ontdekken in de navigatie rechtsboven en vervolgens Modellen in het linkerdeelvenster.
  3. Selecteer Direct onder Ontwikkelingsopties in de modelcatalogus om de beschikbare modellen voor directe toegang weer te geven.

U kunt ook programmatisch modellen voor directe toegang opsommen:

SUBSCRIPTION_ID="<your-subscription-id>"
LOCATION="westus3"

az rest --method get \
  --url "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/providers/Microsoft.CognitiveServices/locations/$LOCATION/models?api-version=2025-06-01" \
  --output json \
| jq -r '(.value // .models // .)[]
  | select((.model.capabilities.instant // "false" | tostring | ascii_downcase) == "true")
  | .model.name' \
| sort -u

Opmerking

Tijdens de preview zijn modellen voor directe toegang alleen beschikbaar in projecten in VS - west 3 .

Sommige modellen voor directe toegang worden mogelijk weergegeven in de lijst, zelfs als uw abonnement geen quotum voor deze modellen heeft. Zie Quota en limieten voor Foundry Models voor meer informatie.

Wanneer gebruikt u directe toegang versus implementaties

Scenario Aanbevolen aanpak
Aan de slag, prototypen of experimenten Directe toegang
Het nieuwste model direct na de release gebruiken Directe toegang
Gereserveerde capaciteit of voorspelbare doorvoer nodig Deployment
Ingerichte doorvoercapaciteit vereisen (PTU) Deployment
Gegevenslocatie in een specifieke regio nodig Deployment
Aangepast beleid voor inhoudsfilters per model Deployment
Aangepaste beveiligingsrails per model Deployment
Eindpuntspecifieke configuratie (bijvoorbeeld versievergrendelingen per eindpunt) Deployment
Fijnmazige quotapartitionering tussen teams Deployment
Nauwkeurig afgestemde modellen Deployment

Directe toegang en implementaties kunnen naast elkaar bestaan in hetzelfde project. U kunt beginnen met een model voor directe toegang en later een implementatie maken naarmate uw vereisten zich ontwikkelen.

Modelversies

Instant Access maakt standaard gebruik van de nieuwste versie van een model. Als u een specifieke versie wilt vastmaken, voegt u de versiedatum toe aan de modelnaam als een afbreekstreepje:

Wat u doorgeeft als model Gedrag
model-name Routes naar de nieuwste versie
model-name-2025-04-01 Routes naar die specifieke versie

Versievastzetting is optioneel. Als voor uw toepassing stabiliteit is vereist, neemt u het versieachtervoegsel op. Anders krijgt u altijd automatisch de nieuwste versie.

Hoe quotum wordt verbruikt

Directe toegang maakt gebruik van een globale quotumgroep per model die is toegewezen aan uw abonnement. Dit quotum is gescheiden van het regionale quotum dat wordt gebruikt door standaardimplementaties.

  • U kunt geen globaal quotum toewijzen of partitioneren. Het wordt automatisch gedeeld voor al het gebruik van direct modellen in uw abonnement.
  • Global Standard-implementaties reserveren een deel van uw globale quotum. Modellen voor directe toegang maken gebruik van de capaciteit die overblijft.
  • Andere implementatietypen (regionale standaard, ingericht) maken gebruik van afzonderlijke regionale quota en hebben geen invloed op uw directe modelcapaciteit.
  • Als aanvragen voor direct model worden beperkt, kunt u een quotumverhoging aanvragen of een implementatie maken met gereserveerde capaciteit.

Zie Quota beheren en verhogen voor meer informatie over de interactie tussen globale en regionale quota.

Beheeropties voor ondernemingen

Vermogen Hoe werkt het?
Specifieke modellen of aanbieders blokkeren Azure Policy definities gelden voor directe toegang op dezelfde manier als voor implementaties
Vastmaken aan een modelversie Voeg het versieachtervoegsel toe aan de modelnaam (zie Modelversies)
Directe toegang volledig uitschakelen Beheerders kunnen directe toegang op abonnementsniveau uitschakelen via Azure Policy

Als u directe toegang van een account wilt verwijderen, configureert u de instellingen via Bicep of ARM REST.

Werk uw account bij met:

PATCH https://management.azure.com/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}?api-version=2026-01-15-preview
Authorization: Bearer {arm_token}
Content-Type: application/json

Gebruik deze aanvraagbody om de directe modeltoegang effectief uit te schakelen:

{
  "properties": {
    "instant": {
      "raiPolicyName": "Microsoft.DefaultV2",
      "modelAllowList": []
    }
  }
}

Important

Alle modellen voor directe toegang maken gebruik van standaardbeveiligingen en inhoudsfilters . U kunt echter geen aangepaste kaders of verantwoordelijke AI-beleidsregels (RAI) per model configureren voor directe toegang. U kunt een standaard RAI-beleid instellen op accountniveau via de API, maar dat beleid is uniform van toepassing op alle modellen voor directe toegang. Als u verschillende beleidsregels voor inhoudsfiltering voor afzonderlijke modellen nodig hebt, gebruikt u een implementatie.

Conflicten tussen implementatienamen

Nieuwe implementaties kunnen geen naam gebruiken die overeenkomt met een bestaande modelnaam. Als u een bestaande implementatie hebt waarvan de naam conflicteert met een modelnaam, heeft de implementatie voorrang en is directe modeltoegang voor die modelnaam niet beschikbaar in dat project.

Beperkingen tijdens preview

  • Alleen beschikbaar in VS - west 3 .
  • Gefinetunede modellen worden niet ondersteund. Als u een nauwkeurig afgestemd model wilt gebruiken, maakt u een implementatie.
  • Kaders, aangepaste RAI-beleidsregels en inhoudsfilters kunnen niet worden geconfigureerd voor directe toegang.
  • Alleen de modellen die worden vermeld in ondersteunde modellen komen in aanmerking.