Azure Häufig gestellte Fragen zu OpenAI

Daten und Datenschutz

Verwenden Sie meine Unternehmensdaten, um eines der Modelle zu trainieren?

Azure OpenAI verwendet keine Kundendaten, um Modelle neu zu trainieren. Weitere Informationen finden Sie im Azure OpenAI-Leitfaden zu Daten, Datenschutz und Sicherheit.

Allgemein

Unterstützt Azure OpenAI benutzerdefinierte API-Header? Wir fügen zusätzliche benutzerdefinierte Header an unsere API-Anforderungen an und sehen HTTP 431-Fehlerfehler.

Unsere aktuellen APIs ermöglichen bis zu 10 benutzerdefinierte Header, die über die Pipeline übergeben und zurückgegeben werden. Wir haben festgestellt, dass einige Kunden diese Headeranzahl jetzt überschreiten, was zu HTTP 431-Fehlern führt. Für diesen Fehler gibt es keine Lösung, außer um die Kopfzeilenlautstärke zu reduzieren. In zukünftigen API-Versionen werden keine benutzerdefinierten Header mehr übergeben. Es wird empfohlen, dass Kunden nicht von benutzerdefinierten Headern in zukünftigen Systemarchitekturen abhängen.

Funktioniert Azure OpenAI mit der neuesten Python Bibliothek, die von OpenAI veröffentlicht wurde (version>=1.0)?

Azure OpenAI wird von der neuesten Version der OpenAI Python Library (version>=1.0) unterstützt. Es ist jedoch wichtig zu beachten, dass die Migration Ihrer Codebasis mit openai migrate nicht unterstützt wird und mit Code, der auf Azure OpenAI abzielt, nicht funktioniert.

Wie vergleichen sich die Funktionen von Azure OpenAI mit OpenAI?

Azure OpenAI bietet Kunden fortgeschrittene Sprach-KI mit den neuesten OpenAI-Modellen mit dem Sicherheits- und Unternehmensversprechen von Azure. Azure OpenAI entwickelt die APIs gemeinsam mit OpenAI weiter, um die Kompatibilität und einen reibungslosen Übergang von einer zur anderen sicherzustellen.

Mit Azure OpenAI erhalten Kunden die Sicherheitsfunktionen von Microsoft Azure, während sie dieselben Modelle wie OpenAI ausführen.

Unterstützt Azure OpenAI VNETs und private Endpunkte?

Ja, Azure OpenAI unterstützt VNETs und private Endpunkte. Weitere Informationen finden Sie in den Richtlinien für virtuelle Netzwerke.

Ich versuche, Einbettungen zu verwenden und erhielt die Fehlermeldung "InvalidRequestError: Zu viele Eingaben. Die maximale Anzahl von Eingaben beträgt 16." Wie kann ich dieses Problem beheben?

Dieser Fehler tritt in der Regel auf, wenn Sie versuchen, eine Reihe von Text zu senden, um in eine einzelne API-Anforderung als Array einzubetten. Derzeit unterstützt Azure OpenAI nur Arrays von Einbettungen mit mehreren Eingaben für das text-embedding-ada-002-Modell (Version 2). Diese Modellversion unterstützt ein Array, das aus bis zu 16 Eingaben pro API-Anforderung besteht. Das Array kann bis zu 8.191 Token lang sein, wenn das Text-Embedding-ada-002 (Version 2)-Modell verwendet wird.

Wenn ich frage, welches Modell ausgeführt wird, teilt es mir mit, dass es eine andere Version ausführt. Warum geschieht dies?

Azure-OpenAI-Modelle, die nicht korrekt identifizieren können, welches Modell ausgeführt wird, sind das erwartete Verhalten.

Warum geschieht dies?

Das Modell führt als Reaktion auf Ihre Frage die nächste Tokenvorhersage aus. Es gibt keine systemeigene Möglichkeit, abzufragen, welche Modellversion derzeit ausgeführt wird. Um das Modell hinter einer Bereitstellung zu bestätigen, wechseln Sie zu Microsoft Foundry>Deployments oder Models + endpoints und überprüfen Sie die Spalte mit dem Modellnamen.

Fragen wie "Welches Modell laufen Sie?" oder "Was ist das neueste Modell von OpenAI?" hängen vollständig von den Schulungsdaten des Modells ab. Neue Modelle werden in der Regel nach dem Trainingsabbruch veröffentlicht, sodass das Modell keine genauen Informationen zu sich selbst oder anderen Modellen hat, die seit diesem Abbruch veröffentlicht wurden. Sehen Sie sich die Modellseite an, um die Wissensgrenzen der einzelnen Modelle zu erhalten.

Wenn Sie möchten, dass das Modell genau antwortet, geben Sie die Informationen über prompt Engineering, Retrieval Augmented Generation (RAG) oder Feinabstimmung an.

Wie kann ich das Modell in einer bestimmten Sprache beantworten?

Stellen Sie sicher, dass Ihre Eingabeaufforderung klar und spezifisch für die Sprachanforderung ist. Wenn das Problem weiterhin besteht, sollten Sie einen weiteren Kontext hinzufügen oder die Aufforderung neu erstellen, um die Sprachanweisungen zu verstärken.

Beispielaufforderungen:

  • "Bitte antworten Sie auf Englisch und nur auf Englisch."
  • "Beantworten Sie die folgende Frage in Englisch: Wie ist das Wetter in Fresno?"

Ich fragte das Modell, wann seine Wissensgrenze ist, und es gab mir eine andere Antwort als die auf der Seite des Azure OpenAI Modells. Warum geschieht dies?

Dies ist ein erwartetes Verhalten. Die Modelle können keine Fragen zu sich selbst beantworten. Wenn Sie wissen möchten, wann der Wissensgrenzwert für die Trainingsdaten des Modells erreicht ist, sehen Sie auf der Seite Modelle nach.

Ich habe dem Modell eine Frage zu etwas gestellt, das kürzlich vor der Wissensgrenze passiert ist, und es gab die falsche Antwort. Warum geschieht dies?

Dies ist ein erwartetes Verhalten. Es gibt keine Garantie dafür, dass jedes letzte Ereignis Teil der Schulungsdaten des Modells war, und auch wenn sich Informationen in Schulungsdaten befanden, besteht immer die Möglichkeit, nicht geerdete Antworten zu erhalten. Verwenden Sie Retrieval Augmented Generation (RAG) — zum Beispiel über Foundry Agents grounding —, um Modellantworten auf aktuellen Daten zu basieren.

Die Häufigkeit, mit der ein bestimmtes Informationsstück in den Schulungsdaten angezeigt wurde, wirkt sich auch auf die Reaktion des Modells aus.

Während Sie ein Modell anhand von Fragen testen können, um den Stichtag seiner Trainingsdaten abzuschätzen, ist die Seite „Modelle“ die maßgebliche Quelle.

Wo kann ich auf Preisinformationen für Ältere Modelle zugreifen, die für neue Bereitstellungen nicht mehr verfügbar sind?

Veraltete Preisinformationen sind über eine downloadfähige PDF-Datei verfügbar. Weitere Modelle finden Sie auf der offiziellen Preisseite.

Programmgesteuertes Nachschlagen der Preise

Wenn Sie auf der Preisseite kein bestimmtes Modell oder eine SKU finden können, können Sie die REST-API für Azure Einzelhandelspreise abfragen. Es ist öffentlich, erfordert keine Authentifizierung und gibt die Preise pro Region pro SKU für alle Azure OpenAI-Meter zurück.

Wichtige Konzepte:

  • productName – filtern Sie nach Azure OpenAI (die meisten Modelle) oder nach Azure OpenAI GPT5 (GPT-5-Familie).
  • skuName — codiert das Modell, die Richtung (Eingabe/Ausgabe) und den Bereitstellungstyp. Beispiele: gpt 4.1 Inp Data Zone, gpt 4o 0513 Input global, gpt 4o 1120 output.
  • armRegionName – die Azure-Region. Meter ohne global oder Data Zone im SKU-Namen sind regional und werden pro Region bepreist.
  • Die Preise variieren je nach Bereitstellungstyp: Globale (niedrigste) → Datenzone (ca. 10% Premium) → Regional (10-25% Premium gegenüber global, variierend nach Region).

Python Beispiel : Suchen Sie die Eingabepreise für ein Modell in allen Regionen und Bereitstellungstypen:

import requests

BASE_URL = "https://prices.azure.com/api/retail/prices"

def get_model_pricing(model_filter: str, product_name: str = "Azure OpenAI") -> list[dict]:
    """Fetch all consumption pricing for a given model from the Azure Retail Prices API."""
    items = []
    odata = (
        f"productName eq '{product_name}' "
        f"and priceType eq 'Consumption' "
        f"and contains(skuName, '{model_filter}')"
    )
    params = {"$filter": odata, "api-version": "2023-01-01-preview"}
    url = BASE_URL
    while url:
        resp = requests.get(url, params=params, timeout=30)
        resp.raise_for_status()
        data = resp.json()
        items.extend(data.get("Items", []))
        url = data.get("NextPageLink")
        params = {}  # NextPageLink already includes query params
    return items

# Example: compare gpt-4o 2024-11-20 input pricing across deployment types
items = get_model_pricing("gpt 4o 1120")

input_items = [
    i for i in items
    if i["retailPrice"] > 0
    and "inp" in i["skuName"].lower()
    and not any(x in i["skuName"].lower() for x in ["batch", "prov", "ft "])
]

for item in sorted(input_items, key=lambda x: x["retailPrice"]):
    sku = item["skuName"]
    tier = (
        "Global" if "global" in sku.lower()
        else "Data Zone" if "data zone" in sku.lower()
        else "Regional"
    )
    print(
        f"${item['retailPrice']:.4f} / {item['unitOfMeasure']:<12}  "
        f"{tier:<10}  {item['armRegionName']:<20}  SKU: {sku}"
    )

Beispielausgabe (abgekürzt):

$0.0025 / 1K Tokens    Global      eastus2          SKU: gpt 4o 1120 Inp global
$0.0025 / 1K Tokens    Regional    australiaeast    SKU: gpt 4o 1120 Inp
$0.0028 / 1K Tokens    Data Zone   eastus2          SKU: gpt 4o 1120 Inp Data Zone
$0.0028 / 1K Tokens    Regional    eastus           SKU: gpt 4o 1120 Inp
$0.0030 / 1K Tokens    Regional    swedencentral    SKU: gpt 4o 1120 Inp

Wenn Sie die Preise für alle Modelle gleichzeitig vergleichen möchten, lassen Sie den filter contains(skuName, ...) aus, und verwenden Sie productName eq 'Azure OpenAI'. Verwenden Sie für GPT-5-Familienmodelle productName eq 'Azure OpenAI GPT5'.

Wie behebe ich InternalServerError - 500 – Fehler beim Erstellen der Vervollständigung, weil das Modell ungültige Unicode-Ausgabe generiert hat?

Sie können das Auftreten dieser Fehler minimieren, indem Sie die Temperatur Ihrer Eingabeaufforderungen auf weniger als 1 reduzieren und sicherstellen, dass Sie einen Client mit Wiederholungslogik verwenden. Die erneute Ausführung der Anforderung führt häufig zu einer erfolgreichen Antwort.

Wie behebe ich den Serverfehler (500): Unerwartetes spezielles Token

Dies ist ein bekanntes Problem. Sie können das Auftreten dieser Fehler minimieren, indem Sie die Temperatur Ihrer Eingabeaufforderungen auf weniger als 1 reduzieren und sicherstellen, dass Sie einen Client mit Wiederholungslogik verwenden. Die erneute Ausführung der Anforderung führt häufig zu einer erfolgreichen Antwort.

Wenn das Verringern der Temperatur auf weniger als 1 die Häufigkeit dieses Fehlers nicht reduziert, besteht ein alternativer Workaround darin, die Anwesenheits- und Häufigkeitsstrafen sowie die Logit-Biases auf ihre Standardwerte festzulegen. In einigen Fällen kann es hilfreich sein, auf einen nicht standardmäßigen, niedrigeren Wert festzulegen top_p, um das Modell zu fördern, um Samplingtoken mit niedrigeren Wahrscheinlichkeitstoken zu vermeiden.

Es wurden Gebühren im Zusammenhang mit API-Aufrufen festgestellt, die mit dem Statuscode 400 nicht abgeschlossen wurden. Warum verursachen fehlgeschlagene API-Anfragen Kosten?

Wenn der Dienst die Verarbeitung durchführt, werden Sie belastet, auch wenn der Statuscode nicht erfolgreich ist (nicht 200). Häufige Beispiele hierfür sind ein HTTP-400-Fehler aufgrund eines Inhaltsfilters oder ein HTTP-408-Fehler aufgrund eines Zeitlimits. Gebühren treten auch auf, wenn ein status 200 mit einem finish_reason von content_filter empfangen wird. In diesem Fall wies der Prompt keine Probleme auf, aber bei der vom Modell generierten Antwort wurde festgestellt, dass sie gegen die Regeln der Inhaltsfilterung verstößt, weshalb die Antwort gefiltert wurde. Wenn der Dienst keine Verarbeitung durchführt, werden Sie nicht belastet. Beispielsweise ein 401-Fehler aufgrund der Authentifizierung oder eines 429-Fehlers aufgrund einer Überschreitung des Zinsgrenzwerts.

Unterstützen alle Azure OpenAI-Modelle "max_completion_tokens" mit der Chatabschluss-API?

Nein, alle Azure OpenAI-Modelle unterstützen max_completion_tokens nicht. Dieser Parameter wird bei älteren Modellen wie gpt-4 (Turbo-2024-04-09) nicht unterstützt.

Zugriff auf Azure OpenAI Service

Mein Gastkonto erhielt Zugriff auf eine Azure OpenAI-Ressource, aber ich kann über das [Microsoft Foundry-Portal](https://ai.azure.com/?cid=learnDocs). nicht auf diese Ressource zugreifen. Wie kann ich den Zugriff aktivieren?

Dies ist das erwartete Verhalten, wenn die Standardanmeldung für die Microsoft Foundry verwendet wird.

So greifen Sie von einem Gastkonto aus auf Microsoft Foundry zu, dem der Zugriff auf eine Azure OpenAI-Ressource gewährt wurde:

  1. Öffnen Sie eine private Browsersitzung, und navigieren Sie dann zu https://ai.azure.com.
  2. Anstatt stattdessen die Anmeldeinformationen für Ihr Gastkonto sofort einzugeben, wählen Sie Sign-in options
  3. Wählen Sie jetzt " Bei einer Organisation anmelden" aus.
  4. Geben Sie den Domänennamen der Organisation ein, der Ihrem Gastkonto Zugriff auf die Azure OpenAI-Ressource gewährt hat.
  5. Melden Sie sich jetzt mit Ihren Gastkontoanmeldeinformationen an.

Sie sollten jetzt über das Microsoft Foundry-Portal auf die Ressource zugreifen können.

Alternativ können Sie im Azure-Portal über den Übersichtsbereich der Azure OpenAI-Ressource Zur Microsoft Foundry wechseln auswählen, um sich automatisch mit dem entsprechenden Organisationskontext anzumelden.

Erfahren Sie mehr und wo Sie Fragen stellen können

Wo kann ich über die neuesten Updates für Azure OpenAI lesen?

Monatliche Updates finden Sie auf unserer neuen Seite.

Wo erhalte ich Schulungen, um mit dem Lernen zu beginnen und meine Fähigkeiten rund um Azure OpenAI aufzubauen?

Wo kann ich Fragen posten und Antworten auf andere häufig gestellte Fragen anzeigen?

  • Wir empfehlen, Fragen auf Microsoft Q&A zu veröffentlichen.
  • Alternativ können Sie Fragen auf Stack Overflow posten.

Wo finde ich Azure OpenAI-Kundensupport?

Sie erfahren mehr über alle Supportoptionen für Azure OpenAI im Support- und Hilfeoptionenhandbuch.

Modelle und Feintuning

Welche Modelle sind verfügbar?

Weitere Informationen finden Sie im Azure OpenAI Modellverfügbarkeitshandbuch.

Wo finde ich heraus, in welcher Region ein Modell verfügbar ist?

Weitere Informationen zur Verfügbarkeit der Region finden Sie im Azure OpenAI modellverfügbarkeitshandbuch.

Was sind die SLAs (Service Level Agreements) in Azure OpenAI?

Wir bieten ein Verfügbarkeits-SLA für alle Ressourcen und ein Latenz-SLA für Provisioned-Managed-Bereitstellungen an. Weitere Informationen zum SLA für Azure OpenAI Service finden Sie auf der Seite Service Level Agreements (SLA) für Onlinedienste.

Wie aktiviere ich die Optimierung? In [Microsoft Foundry portal](https://ai.azure.com/?cid=learnDocs).) ist das Erstellen eines benutzerdefinierten Modells ausgegraut.

Um auf Fine-Tuning zugreifen zu können, muss Ihnen die Rolle „Foundry User“ zugewiesen sein. Selbst für Personen mit den hohen Berechtigungen der Rolle „Dienstadministrator“ muss dieses Konto explizit festgelegt werden, um auf die Optimierung zugreifen zu können. Weitere Informationen finden Sie in den Richtlinien zur rollenbasierten Zugriffssteuerung.

Was ist der Unterschied zwischen einem Basismodell und einem fein abgestimmten Modell?

Ein Basismodell ist ein Modell, das für einen bestimmten Anwendungsfall nicht angepasst oder optimiert wurde. Bei optimierten Modellen handelt es sich um angepasste Versionen von Basismodellen, bei denen die Gewichtungen eines Modells anhand einer eindeutigen Reihe von Äußerungen trainiert werden. Mit fein abgestimmten Modellen können Sie bessere Ergebnisse für eine breitere Anzahl von Aufgaben erzielen, ohne detaillierte Beispiele für das kontextbezogene Lernen im Rahmen ihrer Abschlussaufforderung bereitzustellen. Weitere Informationen finden Sie in unserem Feinabstimmungshandbuch.

Was ist die maximale Anzahl fein abgestimmter Modelle, die ich erstellen kann?

100

Warum wurde meine fein abgestimmte Modellbereitstellung gelöscht?

Wenn ein angepasstes (fein abgestimmtes) Modell für mehr als 15 Tage bereitgestellt wird, während der keine Fertigstellungen oder Chat-Abschlussanrufe getätigt werden, wird die Bereitstellung automatisch gelöscht (und es entstehen keine weiteren Hostinggebühren für diese Bereitstellung). Das zugrunde liegende angepasste Modell bleibt verfügbar und kann jederzeit erneut bereitgestellt werden. Weitere Informationen finden Sie im Artikel " Anleitungen".

Wie kann ich ein Modell mit der REST-API bereitstellen?

Es gibt derzeit zwei verschiedene REST-APIs, die die Modellbereitstellung zulassen. Verwenden Sie für die neuesten Funktionen zur Modellbereitstellung, wie die Möglichkeit, bei der Bereitstellung eine Modellversion für Modelle wie text-embedding-ada-002 Version 2 anzugeben, den API-Aufruf Deployments - Create Or Update REST.

Kann ich das Kontingent verwenden, um die maximale Tokengrenze eines Modells zu erhöhen?

Nein, Kontingenttoken–Per-Minute (TPM)-Zuordnung ist nicht mit dem maximalen Eingabetokengrenzwert eines Modells verknüpft. Die Grenzwerte für Modelleingabetoken sind in der Modelltabelle definiert und wirken sich nicht auf Änderungen aus, die an TPM vorgenommen wurden.

Assistenten

Wie lautet der Status der Azure OpenAI-Assistenten-API?

Die Azure OpenAI-Assistenten-API wird eingestellt. Erstellen Sie neue Agents im Foundry Agent Service, dem unterstützten Nachfolger, der eine größere Auswahl an Modellen, Tools und Grounding-Quellen unterstützt. Anleitungen zur Migration finden Sie unter Migrieren zum neuen Foundry Agent Service.

Web-App

Wie kann ich meine veröffentlichte Web-App anpassen?

Sie können Ihre veröffentlichte Web-App im Azure Portal anpassen. Der Quellcode für die veröffentlichte Web-App ist unter GitHub verfügbar, wo Sie Informationen zum Ändern des App-Frontends sowie Anweisungen zum Erstellen und Bereitstellen der App finden können.

Wird meine Web-App überschrieben, wenn ich die App erneut vom [Microsoft Foundry-Portal](https://ai.azure.com/?cid=learnDocs)?) bereitstelle?

Der App-Code wird beim Aktualisieren der App nicht überschrieben. Die App wird aktualisiert, um die Azure OpenAI-Ressource, Azure KI-Suche Index und Modelleinstellungen zu verwenden, die im Microsoft Foundry Portal ausgewählt sind, ohne dass sich die Darstellung oder Funktionalität ändert.

Fundierung auf Ihren Daten

Wie lasse ich ein Modell auf meinen eigenen Daten basieren?

Verwenden Sie den Dienst Foundry Agents mit einem Azure KI-Suche Index oder einer anderen unterstützten Wissensquelle. Der Foundry Agents-Dienst ist der unterstützte Nachfolger der Funktion „Azure OpenAI für Ihre Daten“ und unterstützt ein breiteres Spektrum an Modellen, Tools und Groundingquellen. Eine vollständige Schritt-für-Schritt-Anleitung finden Sie unter Grounding with Azure KI-Suche.

Verpflichtung zum Urheberrecht des Kunden

Wie erhalte ich eine Abdeckung im Rahmen der Verpflichtung zum Urheberrecht des Kunden?

Die Verpflichtungserklärung zum Urheberrechtsschutz des Kunden ist eine Bestimmung, die in den Microsoft-Produktbedingungen ab dem 1. Dezember 2023 enthalten ist und die Verpflichtung von Microsoft beschreibt, Kunden gegen bestimmte Ansprüche Dritter auf geistiges Eigentum im Zusammenhang mit Ausgabematerialien zu verteidigen. Wenn der Gegenstand des Anspruchs Ausgabeinhalte sind, die aus dem Azure OpenAI (oder einem anderen abgedeckten Produkt, das es Kunden ermöglicht, die Sicherheitssysteme zu konfigurieren) generiert wurden, muss der Kunde alle in der Azure OpenAI-Dokumentation beschriebenen Maßnahmen implementiert haben, die für das Angebot erforderlich sind, das die Ausgabeinhalte geliefert hat. Die erforderlichen Entschärfungen werden hier dokumentiert und fortlaufend aktualisiert. Für neue Dienste, Features, Modelle oder Anwendungsfälle werden neue CCC-Anforderungen veröffentlicht und sind ab oder nach der Einführung eines solchen Diensts, Features, Modells oder Anwendungsfalls wirksam. Andernfalls haben Kunden sechs Monate ab dem Zeitpunkt der Veröffentlichung, um neue Entschärfungen zu implementieren, um die Abdeckung unter dem CCC aufrechtzuerhalten. Wenn ein Kunde einen Anspruch angibt, ist der Kunde verpflichtet, die Einhaltung der relevanten Anforderungen nachzuweisen. Diese Gegenmaßnahmen sind für abgedeckte Produkte erforderlich, mit denen Kunden die Sicherheitssysteme konfigurieren können, einschließlich Azure OpenAI Service. Sie wirken sich nicht auf die Abdeckung für Kunden aus, die andere abgedeckte Produkte verwenden.