Importieren einer Sprachmodell-API

GILT FÜR: Alle API Management-Ebenen

Sie können OpenAI-kompatible Sprachmodellendpunkte als APIs in Ihre API-Verwaltungsinstanz importieren. Sie können auch Sprachmodelle importieren, die nicht mit OpenAI als Passthrough-APIs kompatibel sind, die Anforderungen direkt an die Back-End-Endpunkte weiterleiten. Sie könnten beispielsweise ein LLM verwalten, das Sie selbst hosten oder das bei einem anderen Inferenzanbieter als den Azure AI-Diensten gehostet wird. Verwenden Sie KI-Gatewayrichtlinien und andere Funktionen in der API-Verwaltung, um die Integration zu vereinfachen, die Observierbarkeit zu verbessern und die Kontrolle über die Modellendpunkte zu verbessern.

Weitere Informationen zum Verwalten von KI-APIs in der API-Verwaltung:

Funktionen des KI-Gateways in Azure API Management

API-Typen des Sprachmodells

Die API-Verwaltung unterstützt zwei Arten von Sprachmodell-APIs für dieses Szenario. Wählen Sie die Option aus, die für ihre Modellbereitstellung geeignet ist. Die Option bestimmt, wie Clients die API aufrufen und wie die API-Verwaltungsinstanz Anforderungen an den KI-Dienst weiterleitet.

OpenAI-kompatible – Sprachmodellendpunkte, die mit der OpenAI-API kompatibel sind. Beispiele sind bestimmte Modelle, die von Inference-Anbietern wie Hugging Face Text Generation Inference (TGI) und Google Gemini-API verfügbar gemacht werden.

Für eine openAI-kompatible LLM konfiguriert die API-Verwaltung einen Endpunkt für Chatabschlusse.
Passthrough – Andere Sprachmodellendpunkte, die nicht mit der OpenAI-API kompatibel sind. Beispiele sind Modelle, die in Amazon Bedrock oder anderen Anbietern bereitgestellt werden.

Die API-Verwaltung konfiguriert Wildcardvorgänge für allgemeine HTTP-Verben. Clients können Pfade an die Wildcardvorgänge anfügen, und DIE API-Verwaltung übergibt Anforderungen an das Back-End.

Voraussetzungen

Eine bestehende API Management-Instanz. Erstellen Sie bitte eine, falls noch nicht geschehen.
Eine selbst gehostete oder nicht von Azure bereitgestellte Sprachmodellbereitstellung mit einem API-Endpunkt.

Importieren der Sprachmodell-API mithilfe des Portals

Wenn Sie die LLM-API im Portal importieren, konfiguriert die API-Verwaltung automatisch Folgendes:

Eine Backend-Ressource und eine Set-Backend-Dienst-Richtlinie, die API-Anforderungen an den LLM-Endpunkt leitet.
(optional) Zugriff auf das LLM-Back-End mithilfe eines von Ihnen bereitgestellten Zugriffsschlüssels. Der Schlüssel ist in der API-Verwaltung als geheime Named Value geschützt.
(optional) Richtlinien, mit denen Sie die API überwachen und verwalten können.

So importieren Sie eine Sprachmodell-API in die API-Verwaltung:

Navigieren Sie im Azure-Portal zu Ihrer API Management-Instanz.
Wählen Sie im linken Menü unter APIs die Option APIs>+ API hinzufügen aus.
Wählen Sie unter "Neue API definieren" die Sprachmodell-API aus.
Auf der Registerkarte "API konfigurieren ":
1. Geben Sie einen Anzeigenamen und optional eine Beschreibung für die API ein.
2. Geben Sie die URL zum LLM-API-Endpunkt ein.
3. Wählen Sie optional ein oder mehrere Produkte aus, die der API zugeordnet werden sollen.
4. Fügen Sie im Pfad einen Pfad an, den Ihre API-Verwaltungsinstanz für den Zugriff auf die LLM-API-Endpunkte verwendet.
5. Wählen Sie im Typ entweder openAI-API erstellen oder eine Passthrough-API erstellen. Weitere Informationen finden Sie unter Sprachmodell-API-Typen .
6. Geben Sie im Access-Schlüssel den Autorisierungsheadernamen und den API-Schlüssel ein, der für den Zugriff auf die LLM-API verwendet wird, falls erforderlich.
7. Wählen Sie Weiteraus.
Geben Sie optional auf der Registerkarte " Tokennutzung verwalten " Einstellungen ein, oder akzeptieren Sie Standardeinstellungen, die die folgenden Richtlinien definieren, um die API zu überwachen und zu verwalten:
- Tokennutzung verwalten
- Nachverfolgen der Tokenverwendung
Geben Sie auf der Registerkarte " Semantisches Zwischenspeichern anwenden " optional Einstellungen ein, oder akzeptieren Sie Standardeinstellungen, die die Richtlinien definieren, um die Leistung zu optimieren und die Latenz für die API zu verringern:
- Aktivieren der semantischen Zwischenspeicherung von Antworten
Geben Sie in der KI-Inhaltssicherheit optional Einstellungen ein oder akzeptieren Sie Standardeinstellungen, um den Azure AI Content Safety-Dienst so zu konfigurieren, dass Eingabeaufforderungen mit unsicherem Inhalt blockiert werden:
- Erzwingen von Inhaltssicherheitsprüfungen für LLM-Anforderungen
Wählen Sie Überprüfen aus.
Wählen Sie nach der Überprüfung Ihrer Einstellungen Erstellen aus.

Die API-Verwaltung erstellt die API und konfiguriert Vorgänge für die LLM-Endpunkte. Standardmäßig erfordert die API ein API-Verwaltungsabonnement.

Testen der LLM-API

Um sicherzustellen, dass Ihre LLM-API erwartungsgemäß funktioniert, testen Sie sie in der API-Verwaltungstestkonsole.

Wählen Sie die API aus, die Sie im vorherigen Schritt erstellt haben.
Wählen Sie die Registerkarte Testen aus.
Wählen Sie einen Vorgang aus, der mit der Modellbereitstellung kompatibel ist. Auf der Seite werden Felder für Parameter und Header angezeigt.
Geben Sie bei Bedarf Parameter und Header ein. Je nach Vorgang müssen Sie möglicherweise einen Anforderungstext konfigurieren oder aktualisieren.

Hinweis

In der Testkonsole füllt API Management automatisch einen Ocp-Apim-Subscription-Key-Header auf und konfiguriert den Abonnementschlüssel des integrierten All-Access-Abonnements. Dieser Schlüssel ermöglicht den Zugriff auf jede API in der API Management-Instanz. Optional können Sie den Ocp-Apim-Subscription-Key-Header anzeigen, indem Sie das Augensymbol neben der HTTP-Anforderung auswählen.
Wählen Sie "Senden" aus.

Wenn der Test erfolgreich ist, antwortet das Back-End mit einem erfolgreichen HTTP-Antwortcode und einigen Daten. Angefügt an die Antwort sind Tokennutzungsdaten, die Ihnen beim Überwachen und Verwalten des Sprachmodelltokenverbrauchs helfen.

Funktionen des KI-Gateways in Azure API Management

Feedback

War diese Seite hilfreich?

Last updated on 2025-07-28