Notitie
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen u aan te melden of de directory te wijzigen.
Voor toegang tot deze pagina is autorisatie vereist. U kunt proberen de mappen te wijzigen.
Met directe toegang tot modellen kunt u elk ondersteund model op naam aanroepen. Er is geen implementatie vereist. Maak een Foundry-project, begin met coderen en gebruik onmiddellijk elk beschikbaar model.
Prerequisites
- Een Azure-abonnement. Maak er gratis een.
- Meld u aan bij Microsoft Foundry. Zorg ervoor dat de wisselknop New Foundry is ingeschakeld. Deze stappen verwijzen naar Foundry (nieuw).
- Een Foundry-project in VS - west 3 (de enige ondersteunde regio voor directe toegang tijdens de preview). Zie Een project maken als u een project wilt maken.
- De rol Foundry User voor het project of account.
Important
De rollen Foundry RBAC zijn onlangs hernoemd. Foundry User, Foundry Owner, Foundry Account Owner en Foundry Project Manager zijn eerder benoemd Azure AI-gebruiker, Azure AI-eigenaar Azure AI-accounteigenaar en Azure AI Project Manager. Het kan zijn dat u op sommige plekken nog steeds de vorige namen ziet terwijl de naamswijziging wordt doorgevoerd. De rol-id's en basismachtigingen worden niet gewijzigd door de naamswijziging.
Direct aan de slag met modellen
Met onmiddellijke toegang is de workflow eenvoudig: gebruik in uw code de naam van een ondersteund instant-model. Er is geen implementatie nodig. Dezelfde API, SDK en client die u al gebruikt voor implementaties, werken met modellen voor directe toegang. Geen tweede SDK, geen afzonderlijke client, geen configuratiewijzigingen.
De enige wijziging van op implementatie gebaseerde code is de model parameter. Vervang in de onderstaande "gpt-5-mini" code (een geïmplementeerd model) door de naam van elk model voor directe toegang, zoals chat-gpt-latest.
from azure.identity import DefaultAzureCredential
from azure.ai.projects import AIProjectClient
# Format: "https://resource_name.ai.azure.com/api/projects/project_name"
PROJECT_ENDPOINT = "your_project_endpoint"
# Create project and openai clients to call Foundry API
project = AIProjectClient(
endpoint=PROJECT_ENDPOINT,
credential=DefaultAzureCredential(),
)
openai = project.get_openai_client()
# Run a responses API call
response = openai.responses.create(
model="gpt-5-mini",
input="What is the size of France in square miles?",
)
print(f"Response output: {response.output_text}")
Waarom directe toegang belangrijk is
-
Schakel tussen modellen door één tekenreeks te wijzigen : gebruik een willekeurige naam van een direct model in de
model=regel, zonder implementaties te maken of te verwijderen. - Dezelfde API en SDK : dezelfde aanroepen werken voor zowel directe toegang als implementaties.
- Werkt met uw ontwikkelhulpprogramma's : directe toegang kan worden geïntegreerd met Foundry CLI, VS Code en CI/CD-pijplijnen op dezelfde manier als bij implementaties.
Implementaties gaan niet weg. Ze blijven de juiste keuze wanneer u gereserveerde doorvoer, aangepaste inhoudsfilters, gegevenslocatie of geavanceerde bedrijfsconfiguraties nodig hebt. Directe toegang vereenvoudigt de eerste stappen, zodat deployments iets zijn waar u naartoe groeit, en geen drempel die u eerst over moet voordat u een model kunt gebruiken.
Ondersteunde modellen
Nieuwe modellen bieden standaard ondersteuning voor directe toegang wanneer ze worden vrijgegeven. Ondersteuning voor aanvullende modellen wordt overwogen op basis van de vraag van de klant.
Alle modellen weergeven die directe toegang ondersteunen:
- Open een project in VS - west 3 in de nieuwe Foundry-ervaring,
- Selecteer Ontdekken in de navigatie rechtsboven en vervolgens Modellen in het linkerdeelvenster.
- Selecteer Direct onder Ontwikkelingsopties in de modelcatalogus om de beschikbare modellen voor directe toegang weer te geven.
U kunt ook programmatisch modellen voor directe toegang opsommen:
SUBSCRIPTION_ID="<your-subscription-id>"
LOCATION="westus3"
az rest --method get \
--url "https://management.azure.com/subscriptions/$SUBSCRIPTION_ID/providers/Microsoft.CognitiveServices/locations/$LOCATION/models?api-version=2025-06-01" \
--output json \
| jq -r '(.value // .models // .)[]
| select((.model.capabilities.instant // "false" | tostring | ascii_downcase) == "true")
| .model.name' \
| sort -u
Opmerking
Tijdens de preview zijn modellen voor directe toegang alleen beschikbaar in projecten in VS - west 3 .
Sommige modellen voor directe toegang worden mogelijk weergegeven in de lijst, zelfs als uw abonnement geen quotum voor deze modellen heeft. Zie Quota en limieten voor Foundry Models voor meer informatie.
Wanneer gebruikt u directe toegang versus implementaties
| Scenario | Aanbevolen aanpak |
|---|---|
| Aan de slag, prototypen of experimenten | Directe toegang |
| Het nieuwste model direct na de release gebruiken | Directe toegang |
| Gereserveerde capaciteit of voorspelbare doorvoer nodig | Deployment |
| Ingerichte doorvoercapaciteit vereisen (PTU) | Deployment |
| Gegevenslocatie in een specifieke regio nodig | Deployment |
| Aangepast beleid voor inhoudsfilters per model | Deployment |
| Aangepaste beveiligingsrails per model | Deployment |
| Eindpuntspecifieke configuratie (bijvoorbeeld versievergrendelingen per eindpunt) | Deployment |
| Fijnmazige quotapartitionering tussen teams | Deployment |
| Nauwkeurig afgestemde modellen | Deployment |
Directe toegang en implementaties kunnen naast elkaar bestaan in hetzelfde project. U kunt beginnen met een model voor directe toegang en later een implementatie maken naarmate uw vereisten zich ontwikkelen.
Modelversies
Instant Access maakt standaard gebruik van de nieuwste versie van een model. Als u een specifieke versie wilt vastmaken, voegt u de versiedatum toe aan de modelnaam als een afbreekstreepje:
Wat u doorgeeft als model |
Gedrag |
|---|---|
model-name |
Routes naar de nieuwste versie |
model-name-2025-04-01 |
Routes naar die specifieke versie |
Versievastzetting is optioneel. Als voor uw toepassing stabiliteit is vereist, neemt u het versieachtervoegsel op. Anders krijgt u altijd automatisch de nieuwste versie.
Hoe quotum wordt verbruikt
Directe toegang maakt gebruik van een globale quotumgroep per model die is toegewezen aan uw abonnement. Dit quotum is gescheiden van het regionale quotum dat wordt gebruikt door standaardimplementaties.
- U kunt geen globaal quotum toewijzen of partitioneren. Het wordt automatisch gedeeld voor al het gebruik van direct modellen in uw abonnement.
- Global Standard-implementaties reserveren een deel van uw globale quotum. Modellen voor directe toegang maken gebruik van de capaciteit die overblijft.
- Andere implementatietypen (regionale standaard, ingericht) maken gebruik van afzonderlijke regionale quota en hebben geen invloed op uw directe modelcapaciteit.
- Als aanvragen voor direct model worden beperkt, kunt u een quotumverhoging aanvragen of een implementatie maken met gereserveerde capaciteit.
Zie Quota beheren en verhogen voor meer informatie over de interactie tussen globale en regionale quota.
Beheeropties voor ondernemingen
| Vermogen | Hoe werkt het? |
|---|---|
| Specifieke modellen of aanbieders blokkeren | Azure Policy definities gelden voor directe toegang op dezelfde manier als voor implementaties |
| Vastmaken aan een modelversie | Voeg het versieachtervoegsel toe aan de modelnaam (zie Modelversies) |
| Directe toegang volledig uitschakelen | Beheerders kunnen directe toegang op abonnementsniveau uitschakelen via Azure Policy |
Als u directe toegang van een account wilt verwijderen, configureert u de instellingen via Bicep of ARM REST.
Werk uw account bij met:
PATCH https://management.azure.com/subscriptions/{sub}/resourceGroups/{rg}/providers/Microsoft.CognitiveServices/accounts/{account}?api-version=2026-01-15-preview
Authorization: Bearer {arm_token}
Content-Type: application/json
Gebruik deze aanvraagbody om de directe modeltoegang effectief uit te schakelen:
{
"properties": {
"instant": {
"raiPolicyName": "Microsoft.DefaultV2",
"modelAllowList": []
}
}
}
Important
Alle modellen voor directe toegang maken gebruik van standaardbeveiligingen en inhoudsfilters . U kunt echter geen aangepaste kaders of verantwoordelijke AI-beleidsregels (RAI) per model configureren voor directe toegang. U kunt een standaard RAI-beleid instellen op accountniveau via de API, maar dat beleid is uniform van toepassing op alle modellen voor directe toegang. Als u verschillende beleidsregels voor inhoudsfiltering voor afzonderlijke modellen nodig hebt, gebruikt u een implementatie.
Conflicten tussen implementatienamen
Nieuwe implementaties kunnen geen naam gebruiken die overeenkomt met een bestaande modelnaam. Als u een bestaande implementatie hebt waarvan de naam conflicteert met een modelnaam, heeft de implementatie voorrang en is directe modeltoegang voor die modelnaam niet beschikbaar in dat project.
Beperkingen tijdens preview
- Alleen beschikbaar in VS - west 3 .
- Gefinetunede modellen worden niet ondersteund. Als u een nauwkeurig afgestemd model wilt gebruiken, maakt u een implementatie.
- Kaders, aangepaste RAI-beleidsregels en inhoudsfilters kunnen niet worden geconfigureerd voor directe toegang.
- Alleen de modellen die worden vermeld in ondersteunde modellen komen in aanmerking.