Freigeben über

LLM Bereitstellung API Version

Tim Weber 0 Zuverlässigkeitspunkte
2025-06-06T13:15:40.41+00:00

Wenn ich über die AI Foundry ein Modell bereitstelle, werden diese in einer bestimmten API Version bereitgestellt. Das ist bei vielen Modellen unterschiedlich, aber viele kommen dann in 2024-05-01-preview

Ich brauche aber eine neuere API Version in der Produktentwicklung. Viele OpenAI Modelle kommen mit modernerer API Version. Ich möchte aber nicht nur diese nutzen.

Wie kann ich die API Version bei Bereitstellungen von zB mistral Modellen, Phi4, Deepseek oder Grok ändern?#

Community Center | Wird nicht überwacht

1 Antwort

Sortieren nach: Am hilfreichsten
  1. Bathini Harshitha 85 Zuverlässigkeitspunkte Externe Microsoft-Mitarbeiter Moderator
    2025-06-10T05:40:56.7466667+00:00

    Hallo Tim Weber,

    Beim Bereitstellen von Modellen über Azure AI Foundry wird die api-version automatisch von Microsoft zugewiesen, abhängig vom Integrationsstand und der Kompatibilität des Modells. Für Open-Modelle wie Mistral, Phi-4, DeepSeek oder Grok ist die aktuell unterstützte API-Version häufig auf ältere Versionen wie 2024-05-01-preview .

    Sie können keine neuere api-version manuell überschreiben oder erzwingen, weder während der Bereitstellung noch über den Code, wenn das Modell diese Version nicht ausdrücklich unterstützt.

    Einige Modelle wie phi-4 beginnen nun, neuere API-Versionen wie 2025-04-01-preview zu unterstützen, aber diese Verfügbarkeit hängt von der spezifischen Bereitstellungsplattform ab.

    Ich konnte phi-4, das über Azure OpenAI Foundry (Global Standard) bereitgestellt wurde, erfolgreich mit der API-Version 2025-04-01-preview über den REST-Endpunkt verwenden:

    POST https://<your-endpoint>/openai/deployments/<model>/chat/completions?api-version=2025-04-01-preview
    

    Ich hatte einen Workaround in meiner Umgebung, indem ich 'Phi-4' bereitgestellt habe:

    import requests
    api_key = "<Your API Key>"
    endpoint = "<Your endpoint>"
    deployment_id = "<Your deployment id>"
    api_version = "2025-04-01-preview"
    url = f"{endpoint}/openai/deployments/{deployment_id}/chat/completions?api-version={api_version}"
    headers = {
        "Content-Type": "application/json",
        "api-key": api_key
    }
    body = {
        "messages": [
            {"role": "system", "content": "You are a helpful assistant."},
            {"role": "user", "content": "What are some good places to visit in Paris?"}
        ],
        "temperature": 0.7,
        "max_tokens": 512
    }
    response = requests.post(url, headers=headers, json=body)
    if response.status_code == 200:
        print("Response:")
        print(response.json()["choices"][0]["message"]["content"])
    else:
        print("Error:", response.status_code)
        print(response.text)
    

    Ausgabe:

    Image

    Referenz:

    Azure AI Foundry-Modelle, die für die Standardbereitstellung verfügbar sind

    Azure OpenAI in Azure AI Foundry-Modellen


    Lassen Sie uns wissen, wenn Sie Fragen haben. Ich wäre dankbar, wenn Sie weiterhelfen könnten.

    Wenn Sie die bereitgestellten Informationen hilfreich finden, vergessen Sie nicht, "die Antworten zu akzeptieren" und "Ja" auszuwählen. Dies ist auch für andere Mitglieder der Community von Vorteil.

    Ich übersetze die Antworten aus dem Englischen ins Deutsche, also entschuldigen Sie bitte, wenn ich Probleme mit der Grammatik habe.

    War diese Antwort hilfreich?

    0 Kommentare Keine Kommentare

Ihre Antwort

Antworten können von Fragestellenden als „Angenommen“ und von Moderierenden als „Empfohlen“ gekennzeichnet werden, wodurch Benutzende wissen, dass diese Antwort das Problem des Fragestellenden gelöst hat.