LLM Bereitstellung API Version

Question

LLM Bereitstellung API Version

Tim Weber 0

Wenn ich über die AI Foundry ein Modell bereitstelle, werden diese in einer bestimmten API Version bereitgestellt. Das ist bei vielen Modellen unterschiedlich, aber viele kommen dann in 2024-05-01-preview

Ich brauche aber eine neuere API Version in der Produktentwicklung. Viele OpenAI Modelle kommen mit modernerer API Version. Ich möchte aber nicht nur diese nutzen.

Wie kann ich die API Version bei Bereitstellungen von zB mistral Modellen, Phi4, Deepseek oder Grok ändern?#

Bathini Harshitha 85 Zuverlässigkeitspunkte Externe Microsoft-Mitarbeiter Moderator

2025-06-09T06:15:18.69+00:00

Hallo Tim Weber

Die API-Version für Modelle, die über Azure AI Foundry bereitgestellt werden, wird automatisch zugewiesen basierend auf dem Modell und seinem Integrationstermin. Für Modelle wie Mistral, Phi, DeepSeek oder Grok können Sie die api-version im Endpunkt nicht manuell überschreiben.

Um also eine neuere API-Version mit diesen Modellen für erweiterte Funktionen wie Function Calling oder JSON-Modus zu verwenden, müssen Sie entweder eine aktualisierte Version über den Azure Support anfordern oder OpenAI-gehostete Modelle wie GPT-4-turbo verwenden, die diese Funktionen bereits unterstützen. Link

Bitte kommentieren Sie zurück, lassen Sie uns wissen, wenn Sie Fragen haben. Ich wäre dankbar, wenn Sie weiterhelfen könnten.

Ich übersetze den Kommentar aus dem Englischen ins Deutsche, also entschuldigen Sie bitte, wenn ich Probleme mit der Grammatik habe.

1 Antwort

Ihre Antwort

Bathini Harshitha 85 Zuverlässigkeitspunkte Externe Microsoft-Mitarbeiter Moderator

2025-06-09T06:15:18.69+00:00

Hallo Tim Weber

Die API-Version für Modelle, die über Azure AI Foundry bereitgestellt werden, wird automatisch zugewiesen basierend auf dem Modell und seinem Integrationstermin. Für Modelle wie Mistral, Phi, DeepSeek oder Grok können Sie die api-version im Endpunkt nicht manuell überschreiben.

Um also eine neuere API-Version mit diesen Modellen für erweiterte Funktionen wie Function Calling oder JSON-Modus zu verwenden, müssen Sie entweder eine aktualisierte Version über den Azure Support anfordern oder OpenAI-gehostete Modelle wie GPT-4-turbo verwenden, die diese Funktionen bereits unterstützen. Link

Bitte kommentieren Sie zurück, lassen Sie uns wissen, wenn Sie Fragen haben. Ich wäre dankbar, wenn Sie weiterhelfen könnten.

Ich übersetze den Kommentar aus dem Englischen ins Deutsche, also entschuldigen Sie bitte, wenn ich Probleme mit der Grammatik habe.

Answer 1

Hallo Tim Weber,

Beim Bereitstellen von Modellen über Azure AI Foundry wird die api-version automatisch von Microsoft zugewiesen, abhängig vom Integrationsstand und der Kompatibilität des Modells. Für Open-Modelle wie Mistral, Phi-4, DeepSeek oder Grok ist die aktuell unterstützte API-Version häufig auf ältere Versionen wie 2024-05-01-preview .

Sie können keine neuere api-version manuell überschreiben oder erzwingen, weder während der Bereitstellung noch über den Code, wenn das Modell diese Version nicht ausdrücklich unterstützt.

Einige Modelle wie phi-4 beginnen nun, neuere API-Versionen wie 2025-04-01-preview zu unterstützen, aber diese Verfügbarkeit hängt von der spezifischen Bereitstellungsplattform ab.

Ich konnte phi-4, das über Azure OpenAI Foundry (Global Standard) bereitgestellt wurde, erfolgreich mit der API-Version 2025-04-01-preview über den REST-Endpunkt verwenden:

POST https://<your-endpoint>/openai/deployments/<model>/chat/completions?api-version=2025-04-01-preview

Ich hatte einen Workaround in meiner Umgebung, indem ich 'Phi-4' bereitgestellt habe:

import requests
api_key = "<Your API Key>"
endpoint = "<Your endpoint>"
deployment_id = "<Your deployment id>"
api_version = "2025-04-01-preview"
url = f"{endpoint}/openai/deployments/{deployment_id}/chat/completions?api-version={api_version}"
headers = {
    "Content-Type": "application/json",
    "api-key": api_key
}
body = {
    "messages": [
        {"role": "system", "content": "You are a helpful assistant."},
        {"role": "user", "content": "What are some good places to visit in Paris?"}
    ],
    "temperature": 0.7,
    "max_tokens": 512
}
response = requests.post(url, headers=headers, json=body)
if response.status_code == 200:
    print("Response:")
    print(response.json()["choices"][0]["message"]["content"])
else:
    print("Error:", response.status_code)
    print(response.text)

Ausgabe:

Referenz:

Azure AI Foundry-Modelle, die für die Standardbereitstellung verfügbar sind

Azure OpenAI in Azure AI Foundry-Modellen

Lassen Sie uns wissen, wenn Sie Fragen haben. Ich wäre dankbar, wenn Sie weiterhelfen könnten.

Wenn Sie die bereitgestellten Informationen hilfreich finden, vergessen Sie nicht, "die Antworten zu akzeptieren" und "Ja" auszuwählen. Dies ist auch für andere Mitglieder der Community von Vorteil.

Ich übersetze die Antworten aus dem Englischen ins Deutsche, also entschuldigen Sie bitte, wenn ich Probleme mit der Grammatik habe.

Freigeben über

LLM Bereitstellung API Version

1 Antwort

Ihre Antwort