Bereitstellen von Modellen als serverlose API-Endpunkte
In diesem Artikel erfahren Sie, wie Sie ein Modell aus dem Modellkatalog als serverlose API mit nutzungsbasierter Bezahlung auf tokenbasierter Abrechnung bereitstellen.
Bestimmte Modelle im Modellkatalog können als serverlose API mit nutzungsbasierter Bezahlung bereitgestellt werden. Diese Art von Bereitstellung bietet eine Möglichkeit, Modelle als API zu nutzen, ohne sie in Ihrem Abonnement zu hosten, während die Unternehmenssicherheit und Compliance beibehalten werden, die Organisationen benötigen. Für diese Bereitstellungsoption ist kein Kontingent aus Ihrem Abonnement erforderlich.
In diesem Artikel wird eine LLaMA-Modellbereitstellung (Meta) zur Veranschaulichung verwendet. Sie können jedoch dieselben Schritte ausführen, mit denen sie die anderen Modelle im Modellkatalog bereitstellen, die als serverlose API bereitgestellt werden können.
Voraussetzungen
Ein Azure-Abonnement mit einer gültigen Zahlungsmethode. Kostenlose Versionen oder Testversionen von Azure-Abonnements funktionieren nicht. Wenn Sie noch kein Azure-Abonnement haben, erstellen Sie zunächst ein kostenpflichtiges Azure-Konto.
Die rollenbasierte Zugriffssteuerung in Azure (Azure RBAC) wird verwendet, um Zugriff auf Vorgänge in Azure Machine Learning zu gewähren. Um die Schritte in diesem Artikel auszuführen, muss Ihrem Benutzerkonto die Azure KI-Entwicklerrolle in der Ressourcengruppe zugewiesen sein. Weitere Informationen zu Berechtigungen finden Sie unter Rollenbasierte Zugriffssteuerung in Azure Machine Learning.
Für die Arbeit mit Azure Machine Learning müssen Sie die folgende Software installieren:
Sie können einen beliebigen kompatiblen Webbrowser verwenden, um in Azure Machine Learning zu navigieren.
Finden Ihres Modells und Ihrer Modell-ID im Modellkatalog
Melden Sie sich bei Azure Machine Learning Studio an.
Stellen Sie für Modelle aus dem Azure Marketplace sicher, dass Ihr Konto über die Rollenberechtigungen für Azure KI-Entwickler für die Ressourcengruppe verfügt oder dass Sie die erforderlichen Berechtigungen zum Abonnieren von Modellangeboten erfüllen.
Modelle, die nicht von Microsoft angeboten werden (z. B. Llama- und Mistral-Modelle), werden über den Azure Marketplace abgerechnet. Für solche Modelle muss Ihr Arbeitsbereich das jeweilige Modellangebot abonnieren. Für Modelle, die von Microsoft angeboten werden (z. B. Phi-3-Modelle), gilt diese Anforderung nicht, da die Abrechnung anders erfolgt. Einzelheiten zur Abrechnung für die serverlose Bereitstellung von Modellen im Modellkatalog finden Sie unter Abrechnung für serverlose APIs.
Wechseln Sie zu Ihrem Arbeitsbereich. Um das Angebot zur Bereitstellung von serverlosen API-Modellen nutzen zu können, muss Ihr Arbeitsbereich zu einer der Regionen gehören, die für die serverlose Bereitstellung für das jeweilige Modell, das Sie bereitstellen möchten, unterstützt werden.
Wählen Sie den Modellkatalog auf der linken Randleiste aus, und suchen Sie die Modellkarte des Modells, das Sie bereitstellen möchten. In diesem Artikel wählen Sie ein Meta-Llama-3-8B-Instruct-Modell aus.
- Wenn Sie das Modell mit Azure CLI, Python SDK oder ARM bereitstellen, kopieren Sie die Modell-ID.
Wichtig
Schließen Sie die Version beim Kopieren der Modell-ID nicht ein. Serverlose API-Endpunkte stellen immer die neueste verfügbare Version des Modells bereit. Kopieren Sie z. B. für die Modell-ID
azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3
azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct
.
Im nächsten Abschnitt erfahren Sie, wie Ihr Arbeitsbereich ein Modellangebot abonnieren kann. Wenn Sie ein Microsoft-Modell bereitstellen, können Sie diesen Abschnitt überspringen und zu Bereitstellen des Modells für einen serverlosen API-Endpunkt gehen.
Abonnieren Ihres Arbeitsbereichs zum Modellangebot
Serverlose API-Endpunkte können sowohl Microsoft- als auch Nicht-Microsoft-Modelle bereitstellen. Für Microsoft-Modelle (wie z. B. Phi-3-Modelle) müssen Sie kein Azure Marketplace-Abonnement erstellen und Sie können sie direkt an serverlosen API-Endpunkten bereitstellen, um ihre Vorhersagen zu nutzen. Für Nicht-Microsoft-Modelle müssen Sie zunächst das Abonnement erstellen. Wenn Sie das Modell zum ersten Mal im Arbeitsbereich bereitstellen, müssen Sie Ihren Arbeitsbereich für das jeweilige Modellangebot aus dem Azure Marketplace abonnieren. Jeder Arbeitsbereich hat sein eigenes Abonnement für das jeweilige Azure Marketplace-Angebot des Modells, mit dem Sie die Ausgaben kontrollieren und überwachen können.
Hinweis
Modelle, die über den Azure Marketplace angeboten werden, stehen für die Bereitstellung für serverlose API-Endpunkte in bestimmten Regionen zur Verfügung. Überprüfen Sie die Verfügbarkeit von Regionen für Modelle in serverlosen API-Endpunkten, um zu überprüfen, welche Modelle und Regionen verfügbar sind. Wenn sie nicht aufgeführt ist, können Sie in einem Arbeitsbereich in einer unterstützten Region bereitstellen und dann serverlose API-Endpunkte aus einem anderen Arbeitsbereich nutzen.
Erstellen Sie das Marketplace-Abonnement des Modells. Wenn Sie ein Abonnement erstellen, akzeptieren Sie die Bedingungen, die dem Modellangebot zugeordnet sind. Denken Sie daran, dass Sie diesen Schritt für die von Microsoft angebotenen Modelle (wie Phi-3) nicht durchführen müssen.
Wählen Sie auf der Seite Details des Modells Bereitstellen aus. Ein Fenster mit Bereitstellungsoptionen wird geöffnet, in dem Sie zwischen einer Bereitstellung als serverlose API und einer mithilfe von verwalteten Computeressourcen wählen können.
Hinweis
Bei Modellen, die nur als serverlose API bereitgestellt werden können, wird der Assistent für die Bereitstellung als serverlose API sofort geöffnet, wenn Sie auf der Detailseite des Modells Bereitstellen auswählen.
Wählen Sie Serverlose API mit Azure KI Inhaltssicherheit (Preview) aus, um den Assistent für die Bereitstellung als serverlose API zu öffnen.
Aktivieren Sie das Kontrollkästchen, um die Microsoft-Einkaufsrichtlinie zu bestätigen.
Wenn die Notiz angezeigt wird Sie verfügen bereits über ein Azure Marketplace-Abonnement für diesen Arbeitsbereich, müssen Sie das Abonnement nicht erstellen, da Sie bereits über ein Abonnement verfügen. Sie können mit der Bereitstellung des Modells auf einem serverlosen API-Endpunkt fortfahren.
Wählen Sie im Bereitstellungsassistenten den Link zu Azure Marketplace-Nutzungsbedingungen aus, um mehr über die Nutzungsbedingungen zu erfahren. Sie können auch die Registerkarte Preise und Begriffe auswählen, um mehr über die Preise für das ausgewählte Modell zu erfahren.
Wählen Sie im Bereitstellungs-Assistenten den Link zu Azure Marketplace-Nutzungsbedingungen aus, um mehr über die Nutzungsbedingungen zu erfahren. Sie können auch die Registerkarte Marketplace – Angebotsdetails auswählen, um mehr über die Preise für das ausgewählte Modell zu erfahren.
Wählen Sie Abonnieren und bereitstellen aus.
Sobald Sie den Arbeitsbereich für das jeweilige Azure Marketplace-Angebot abonniert haben, müssen nachfolgende Bereitstellungen des gleichen Angebots im gleichen Arbeitsbereich nicht mehr abonniert werden.
An jedem Punkt können Sie das Modell sehen, für das Ihr Arbeitsbereich derzeit abonniert ist:
Navigieren Sie zu der Ressourcengruppe, zu der der Arbeitsbereich gehört.
Wählen Sie im Typfilter SaaSaus.
Sie sehen alle Angebote, für die Sie derzeit Abonnnements haben.
Wählen Sie eine beliebige Ressource aus, um die Details anzuzeigen.
Bereitstellen des Modells auf einem serverlosen API-Endpunkt
Nachdem Sie das Abonnement für ein Nicht-Microsoft-Modell erstellt haben, können Sie das zugeordnete Modell auf einem serverlosen API-Endpunkt bereitstellen. Für Microsoft-Modelle (z. B. Phi-3-Modelle) müssen Sie kein Abonnement erstellen.
Der serverlose API-Endpunkt bietet eine Möglichkeit, Modelle als API zu nutzen, ohne sie in Ihrem Abonnement zu hosten, während die Unternehmenssicherheits- und Complianceorganisationen benötigt werden. Für diese Bereitstellungsoption ist kein Kontingent aus Ihrem Abonnement erforderlich.
In diesem Abschnitt erstellen Sie einen Endpunkt mit dem Namen meta-llama3-8b-qwerty.
Erstellen des serverlosen Endpunkts
Um ein Microsoft-Modell bereitzustellen, für das kein Modellangebot abonniert werden muss, wählen Sie Bereitstellen und dann Serverlose API mit Azure KI Inhaltssicherheit (Preview), um den Bereitstellungsassistenten zu öffnen.
Alternativ können Sie für ein Nicht-Microsoft-Modell, für das ein Modellabonnement erforderlich ist, wenn Ihr Arbeitsbereich gerade das Modellangebot im vorherigen Abschnitt abonniert hat, trotzdem Bereitstellen wählen. Wählen Sie alternativ die Option Mit der Bereitstellung fortfahren (wenn Ihr Bereitstellungsassistent den Hinweis Sie haben bereits ein Azure Marketplace-Abonnement für diesen Arbeitsbereich angezeigt hat).
Geben Sie der Bereitstellung einen Namen. Dieser Name wird Teil der Bereitstellungs-API-URL. Diese URL muss in jeder Azure-Region eindeutig sein.
Tipp
Die Option Inhaltsfilter (Vorschau) ist standardmäßig aktiviert. Behalten Sie die Standardeinstellung bei, damit der Dienst schädliche Inhalte wie Hass, Selbstverletzung, sexuelle Inhalte und Gewalt erkennt. Weitere Informationen zur Inhaltsfilterung (Vorschau) finden Sie unter Inhaltssicherheit für Modelle, die über serverlose APIs bereitgestellt werden.
Klicken Sie auf Bereitstellen. Warten Sie, bis die Bereitstellung fertig ist und Sie auf die Seite Bereitstellungen weitergeleitet werden.
An jedem Punkt können Sie die Endpunkte sehen, die in Ihrem Arbeitsbereich bereitgestellt werden:
Wechseln Sie zu Ihrem Arbeitsbereich.
Wählen Sie Endpunkte.
Wählen Sie die Registerkarte Serverlose Endpunkte aus, um die serverlosen API-Endpunkte anzuzeigen.
Der erstellte Endpunkt verwendet die Schlüsselauthentifizierung für die Autorisierung. Führen Sie die folgenden Schritte aus, um die Schlüssel abzurufen, die einem bestimmten Endpunkt zugeordnet sind.
- Um zur Seite der Bereitstellung zurückzukehren, wählen Sie den Namen des Endpunkts aus der Liste der serverlosen Endpunkte aus.
- Beachten Sie den Ziel-URI und den Schlüssel des Endpunkts. Verwenden Sie sie, um die Bereitstellung aufzurufen und Vorhersagen zu generieren.
Hinweis
Wenn Sie das Azure-Portal verwenden, werden serverlose API-Endpunkte in der Ressourcengruppe nicht standardmäßig angezeigt. Verwenden Sie die Option Ausgeblendete Typen anzeigen, um sie in der Ressourcengruppe anzuzeigen.
An diesem Punkt kann Ihr Endpunkt verwendet werden.
Wenn Sie diese Bereitstellung aus einem anderen Arbeitsbereich nutzen müssen oder Prompt flow zum Erstellen intelligenter Anwendungen verwenden möchten, müssen Sie eine Verbindung mit der serverlosen API-Bereitstellung erstellen. Informationen zum Konfigurieren eines vorhandenen serverlosen API-Endpunkts in einem neuen Arbeitsbereich oder Hub finden Sie unter Verwenden bereitgestellter serverloser API-Endpunkte aus einem anderen Arbeitsbereich oder aus Prompt Flow.
Tipp
Wenn Sie Prompt flow im selben Arbeitsbereich verwenden, in dem die Bereitstellung bereitgestellt wurde, müssen Sie die Verbindung trotzdem erstellen.
Verwenden des serverlosen API-Endpunkts
Modelle, die in Azure Machine Learning und Azure KI Studio in serverlosen API-Endpunkten bereitgestellt werden, unterstützen die Azure AI Model Inference API, die einen gemeinsamen Satz von Funktionen für grundlegende Modelle bereitstellt und von Entwicklern verwendet werden kann, um Vorhersagen aus einem vielfältigen Satz von Modellen einheitlich und auf konsequente Art und Weise zu nutzen.
Erfahren Sie mehr über die Funktionen dieser API und wie Sie sie beim Erstellen von Anwendungen nutzen können.
Löschen von Endpunkten und Abonnements
Sie können Modellabonnements und Endpunkte löschen. Wenn Sie ein Modellabonnement löschen, werden alle zugehörigen Endpunkte zu Fehlerhaft und "unbrauchbar".
So löschen Sie einen serverlosen API-Endpunkt:
Navigieren Sie zu Azure Machine Learning Studio.
Wählen Sie Endpunkte aus der linken Randleiste aus.
Wählen Sie die Registerkarte Serverlose Endpunkte aus, um die serverlosen API-Endpunkte anzuzeigen.
Wählen Sie den zu löschenden Endpunkt aus.
Klicken Sie auf Löschen.
So löschen Sie das zugeordnete Modellabonnement:
Navigieren Sie zu der Ressourcengruppe, zu der der Arbeitsbereich gehört.
Wählen Sie im Typfilter SaaSaus.
Wählen Sie das Abonnement aus, das Sie löschen möchten.
Klicken Sie auf Löschen.
Überlegungen zu Kosten und Kontingenten für Modelle, die als serverlose API-Endpunkte bereitgestellt werden
Das Kontingent wird pro Bereitstellung verwaltet. Jede Bereitstellung hat eine Rate von 200.000 Token pro Minute und 1.000 API-Anforderungen pro Minute. Derzeit wird jedoch eine Bereitstellung pro Modell und Arbeitsbereich beschränkt. Wenden Sie sich an den Microsoft Azure-Support, wenn die aktuellen Ratenbegrenzungen für Ihre Szenarien nicht ausreichen.
Kosten für Microsoft-Modelle
Die Preisinformationen finden Sie auf der Registerkarte Preise und Nutzungsbedingungen des Bereitstellungs-Assistenten, wenn Sie Microsoft-Modelle (z. B. Phi-3-Modelle) als serverlose API-Endpunkte bereitstellen.
Kosten für Nicht-Microsoft-Modelle
Nicht-Microsoft-Modelle, die als serverlose API-Endpunkt bereitgestellt werden, werden über den Azure Marketplace angeboten und in Azure KI Studio zur Verwendung integriert. Die Azure Marketplace-Preise werden bei der Bereitstellung oder bei der Optimierung dieser Modelle angezeigt.
Jedes Mal, wenn ein Arbeitsbereich ein bestimmtes Angebot aus dem Azure Marketplace abonniert, wird eine neue Ressource erstellt, um die mit der Nutzung verbundenen Kosten nachzuverfolgen. Die gleiche Ressource wird zum Nachverfolgen der Kosten im Zusammenhang mit Rückschluss und Optimierung verwendet. Es stehen jedoch mehrere Verbrauchseinheiten zur Verfügung, um die einzelnen Szenarien unabhängig voneinander nachzuverfolgen.
Weitere Informationen zum Nachverfolgen von Kosten finden Sie unter Überwachen der Kosten für Modelle, die über den Azure Marketplace angeboten werden.
Zum Abonnieren von Modellangeboten erforderliche Berechtigungen
Die rollenbasierte Zugriffssteuerung in Azure (Azure RBAC) wird verwendet, um Zugriff auf Vorgänge in Azure Machine Learning zu gewähren. Um die Schritte in diesem Artikel auszuführen, muss Ihrem Benutzerkonto die Rolle Besitzer, Mitwirkender oderAzure KI Entwickler für das Azure-Abonnement zugewiesen werden. Alternativ kann Ihrem Konto eine benutzerdefinierte Rolle zugewiesen werden, die über die folgenden Berechtigungen verfügt:
Für das Azure-Abonnement: Zum Abonnieren des Arbeitsbereichs für das Azure Marketplace-Angebot, einmal für jeden Arbeitsbereich pro Angebot:
Microsoft.MarketplaceOrdering/agreements/offers/plans/read
Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
Microsoft.SaaS/register/action
Für die Ressourcengruppe: Zum Erstellen und Verwenden der SaaS-Ressource:
Microsoft.SaaS/resources/read
Microsoft.SaaS/resources/write
Für den Arbeitsbereich: Zum Bereitstellen von Endpunkten (die Azure Machine Learning-Rolle „Wissenschaftliche Fachkraft für Daten“ enthält diese Berechtigungen bereits):
Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*
Weitere Informationen zu Berechtigungen finden Sie unter Verwalten des Zugriffs auf einen Azure Machine Learning-Arbeitsbereich.