Freigeben über


Bereitstellen von Modellen als serverlose APIs

Wichtig

Einige der in diesem Artikel beschriebenen Features sind möglicherweise nur in der Vorschau verfügbar. Diese Vorschauversion wird ohne Vereinbarung zum Servicelevel bereitgestellt und sollte nicht für Produktionsworkloads verwendet werden. Manche Features werden möglicherweise nicht unterstützt oder sind nur eingeschränkt verwendbar. Weitere Informationen finden Sie unter Zusätzliche Nutzungsbestimmungen für Microsoft Azure-Vorschauen.

In diesem Artikel erfahren Sie, wie Sie ein Modell aus dem Modellkatalog als serverlose API mit nutzungsbasierter Bezahlung auf tokenbasierter Abrechnung bereitstellen.

Bestimmte Modelle im Modellkatalog können als serverlose API mit nutzungsbasierter Bezahlung bereitgestellt werden. Diese Art von Bereitstellung bietet eine Möglichkeit, Modelle als API zu nutzen, ohne sie in Ihrem Abonnement zu hosten, während die Unternehmenssicherheit und Compliance beibehalten werden, die Organisationen benötigen. Für diese Bereitstellungsoption ist kein Kontingent aus Ihrem Abonnement erforderlich.

Voraussetzungen

  • Ein Azure-Abonnement mit einer gültigen Zahlungsmethode. Kostenlose Versionen oder Testversionen von Azure-Abonnements funktionieren nicht. Wenn Sie noch kein Azure-Abonnement haben, erstellen Sie zunächst ein kostenpflichtiges Azure-Konto.

  • Ein Azure KI Studio-Hub.

  • Ein Azure KI Studio-Projekt.

  • Die rollenbasierten Zugriffssteuerungen in Azure (Azure RBAC) werden verwendet, um Zugriff auf Vorgänge in Azure KI Studio zuzuweisen. Um die Schritte in diesem Artikel auszuführen, muss Ihrem Benutzerkonto die Azure KI-Entwicklerrolle in der Ressourcengruppe zugewiesen sein. Weitere Informationen zu Berechtigungen finden Sie unter Rollenbasierte Zugriffssteuerung in Azure KI Studio.

  • Für die Arbeit mit Azure KI Studio müssen Sie die folgende Software installieren:

    Sie können einen beliebigen kompatiblen Webbrowser verwenden, um in Azure KI Studiozu navigieren.

Abonnieren Ihres Projekts zum Modellangebot

Für Modelle, die über den Azure Marketplace angeboten werden, können Sie sie für serverlose API-Endpunkte bereitstellen, um ihre Vorhersagen zu nutzen. Wenn Sie das Modell zum ersten Mal im Projekt bereitstellen, müssen Sie Ihr Projekt für das jeweilige Modellangebot aus dem Azure Marketplace abonnieren. Jedes Projekt hat sein eigenes Abonnement für das jeweilige Azure Marketplace-Angebot des Modells, mit dem Sie die Ausgaben kontrollieren und überwachen können.

Hinweis

Modelle, die über den Azure Marketplace angeboten werden, stehen für die Bereitstellung für serverlose API-Endpunkte in bestimmten Regionen zur Verfügung. Überprüfen Sie die Verfügbarkeit von Modellen und Regionen in serverlosen API-Bereitstellungen, um zu überprüfen, welche Modelle und Regionen verfügbar sind. Wenn sie nicht aufgeführt ist, können Sie in einem Arbeitsbereich in einer unterstützten Region bereitstellen und dann serverlose API-Endpunkte aus einem anderen Arbeitsbereich nutzen.

  1. Melden Sie sich beim Azure KI Studio an.

  2. Stellen Sie sicher, dass Ihr Konto über die Rollenberechtigungen für Azure KI-Entwickler für die Ressourcengruppe verfügt oder dass Sie die erforderlichen Berechtigungen zum Abonnieren von Modellangeboten erfüllen.

  3. Wählen Sie den Modellkatalog auf der linken Randleiste aus, und suchen Sie die Modellkarte des Modells, das Sie bereitstellen möchten. In diesem Artikel wählen Sie ein Meta-Llama-3-8B-Instruct-Modell aus.

    1. Wenn Sie das Modell mit Azure CLI, Python oder ARM bereitstellen, kopieren Sie die Modell-ID.

      Wichtig

      Schließen Sie die Version beim Kopieren der Modell-ID nicht ein. Serverlose API-Endpunkte stellen immer die neueste verfügbare Version des Modells bereit. Kopieren Sie z. B. für die Modell-ID azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3 azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct.

    Screenshot der Detailseite eines Modells.

  4. Erstellen Sie das Marketplace-Abonnement des Modells. Wenn Sie ein Abonnement erstellen, akzeptieren Sie die Bedingungen, die dem Modellangebot zugeordnet sind.

    1. Wählen Sie auf der Seite Details des Modells Bereitstellen und dann Serverlose API aus, um den Bereitstellungs-Assistenten zu öffnen.

    2. Wählen Sie das Projekt, in dem Sie Ihre Modelle bereitstellen möchten. Beachten Sie, dass nicht alle Regionen unterstützt werden.

      Screenshot, der zeigt, wie Sie ein Modell mit der Option „serverlose API“ bereitstellen.

    3. Wenn die Notiz angezeigt wird Sie verfügen bereits über ein Azure Marketplace-Abonnement für dieses Projekt, müssen Sie das Abonnement nicht erstellen, da Sie bereits über ein Abonnement verfügen. Sie können mit der Bereitstellung des Modells auf einem serverlosen API-Endpunkt fortfahren.

    4. Wählen Sie im Bereitstellungsassistenten den Link zu Azure Marketplace-Nutzungsbedingungen aus, um mehr über die Nutzungsbedingungen zu erfahren. Sie können auch die Registerkarte Preise und Nutzungsbedingungen auswählen, um mehr über die Preise für das ausgewählte Modell zu erfahren.

    5. Wählen Sie Abonnieren und bereitstellen aus.

  5. Sobald Sie den Arbeitsbereich für das jeweilige Azure Marketplace-Angebot registriert haben, müssen nachfolgende Bereitstellungen desselben Angebots im selben Projekt nicht mehr abonniert werden.

  6. An jedem Punkt können Sie das Modell sehen, für das Ihr Projekt derzeit abonniert ist:

    1. Öffnen Sie das Azure-Portal.

    2. Navigieren Sie zu der Ressourcengruppe, zu der das Projekt gehört.

    3. Wählen Sie im Typfilter SaaSaus.

    4. Sie sehen alle Angebote, für die Sie derzeit Abonnnements haben.

    5. Wählen Sie eine beliebige Ressource aus, um die Details anzuzeigen.

Bereitstellen des Modells auf einem serverlosen API-Endpunkt

Nachdem Sie das Abonnement eines Modells erstellt haben, können Sie das zugeordnete Modell auf einem serverlosen API-Endpunkt bereitstellen. Der serverlose API-Endpunkt bietet eine Möglichkeit, Modelle als API zu nutzen, ohne sie in Ihrem Abonnement zu hosten, während die Unternehmenssicherheits- und Complianceorganisationen benötigt werden. Für diese Bereitstellungsoption ist kein Kontingent aus Ihrem Abonnement erforderlich.

In diesem Artikel erstellen Sie einen Endpunkt mit dem Namen meta-llama3-8b-qwerty.

  1. Erstellen des serverlosen Endpunkts

    1. Wählen Sie im vorherigen Assistenten Bereitstellen aus (wenn Sie gerade das Projekt für das Modellangebot im vorherigen Abschnitt abonniert haben), oder wählen Sie Bereitstellen fortsetzen aus (wenn Ihr Bereitstellungs-Assistent die Notiz hatte: Sie verfügen bereits über ein Azure Marketplace-Abonnement für dieses Projekt).

      Screenshot zeigt ein Projekt, das bereits für das Angebot abonniert ist.

    2. Geben Sie der Bereitstellung einen Namen. Dieser Name wird Teil der Bereitstellungs-API-URL. Diese URL muss in jeder Azure-Region eindeutig sein.

      Ein Screenshot zeigt, wie der Name der Bereitstellung angegeben wird, die Sie erstellen möchten.

    3. Klicken Sie auf Bereitstellen. Warten Sie, bis die Bereitstellung fertig ist und Sie auf die Seite Bereitstellungen weitergeleitet werden.

  2. An jedem Punkt können Sie die Endpunkte sehen, die in Ihrem Projekt bereitgestellt werden:

    1. Gehen Sie zu Ihrem Projekt.

    2. Wählen Sie den Abschnitt Bereitstellung aus.

    3. Serverlose API-Endpunkte werden angezeigt.

  3. Der erstellte Endpunkt verwendet die Schlüsselauthentifizierung für die Autorisierung. Führen Sie die folgenden Schritte aus, um die Schlüssel abzurufen, die einem bestimmten Endpunkt zugeordnet sind.

    Sie können zur Seite „Bereitstellungen“ zurückkehren, die Bereitstellung auswählen und die Ziel-URI des Endpunkts und den Schlüssel notieren. Verwenden Sie sie, um die Bereitstellung aufzurufen und Vorhersagen zu generieren.

    Hinweis

    Wenn Sie das Azure-Portal verwenden, werden serverlose API-Endpunkte in der Ressourcengruppe nicht standardmäßig angezeigt. Verwenden Sie die Option Ausgeblendete Typen anzeigen, um sie in der Ressourcengruppe anzuzeigen.

  4. An diesem Punkt kann Ihr Endpunkt verwendet werden.

  5. Wenn Sie diese Bereitstellung aus einem anderen Projekt oder Hub nutzen müssen oder Prompt flow zum Erstellen intelligenter Anwendungen verwenden möchten, müssen Sie eine Verbindung mit der serverlosen API-Bereitstellung erstellen. Informationen zum Konfigurieren eines vorhandenen serverlosen API-Endpunkts in einem neuen Projekt oder Hub finden Sie unter Verwenden bereitgestellter serverloser API-Endpunkte aus einem anderen Projekt oder aus Prompt flow.

    Tipp

    Wenn Sie Prompt flow im selben Projekt oder Hub verwenden, in dem die Bereitstellung bereitgestellt wurde, müssen Sie die Verbindung trotzdem erstellen.

Verwenden des serverlosen API-Endpunkts

Modelle, die in Azure Machine Learning und Azure KI Studio in serverlosen API-Endpunkten bereitgestellt werden, unterstützen die Azure AI Model Inference API, die einen gemeinsamen Satz von Funktionen für grundlegende Modelle bereitstellt und von Entwicklern verwendet werden kann, um Vorhersagen aus einem vielfältigen Satz von Modellen einheitlich und auf konsequente Art und Weise zu nutzen.

Erfahren Sie mehr über die Funktionen dieser API und wie Sie sie beim Erstellen von Anwendungen nutzen können.

Löschen von Endpunkten und Abonnements

Sie können Modellabonnements und Endpunkte löschen. Wenn Sie ein Modellabonnement löschen, werden alle zugehörigen Endpunkte zu Fehlerhaft und „unbrauchbar“.

So löschen Sie einen serverlosen API-Endpunkt:

  1. Navigieren Sie zu Azure KI Studio.

  2. Gehen Sie zu Komponenten>Bereitstellungen.

  3. Wählen Sie die Bereitstellung aus, die Sie löschen möchten.

  4. Klicken Sie auf Löschen.

So löschen Sie das zugeordnete Modellabonnement:

  1. Navigieren Sie zum Azure-Portal.

  2. Navigieren Sie zu der Ressourcengruppe, zu der das Projekt gehört.

  3. Wählen Sie im Typfilter SaaSaus.

  4. Wählen Sie das Abonnement aus, das Sie löschen möchten.

  5. Klicken Sie auf Löschen.

Überlegungen zu Kosten und Kontingenten für Modelle, die als serverlose API-Endpunkte bereitgestellt werden

Modelle, die als serverlose API-Endpunkt bereitgestellt werden, werden über den Azure Marketplace angeboten und in Azure KI Studio zur Verwendung integriert. Die Azure Marketplace-Preise werden bei der Bereitstellung oder bei der Optimierung der Modelle angezeigt.

Jedes Mal, wenn ein Projekt ein bestimmtes Angebot aus dem Azure Marketplace abonniert, wird eine neue Ressource erstellt, um die mit der Nutzung verbundenen Kosten nachzuverfolgen. Die gleiche Ressource wird zum Nachverfolgen der Kosten im Zusammenhang mit Rückschluss und Optimierung verwendet. Es stehen jedoch mehrere Verbrauchseinheiten zur Verfügung, um die einzelnen Szenarien unabhängig voneinander nachzuverfolgen.

Weitere Informationen zum Nachverfolgen von Kosten finden Sie unter Überwachen der Kosten für Modelle, die über den Azure Marketplace angeboten werden.

Screenshot unterschiedlicher Ressourcen, die verschiedenen Modellangeboten und den zugehörigen Zählern entsprechen.

Das Kontingent wird pro Bereitstellung verwaltet. Jede Bereitstellung hat eine Rate von 200.000 Token pro Minute und 1.000 API-Anforderungen pro Minute. Derzeit wird jedoch eine Bereitstellung pro Modell und Projekt beschränkt. Wenden Sie sich an den Microsoft Azure-Support, wenn die aktuellen Ratenbegrenzungen für Ihre Szenarien nicht ausreichen.

Zum Abonnieren von Modellangeboten erforderliche Berechtigungen

Die rollenbasierten Zugriffssteuerungen in Azure (Azure RBAC) werden verwendet, um Zugriff auf Vorgänge in Azure KI Studio zuzuweisen. Um die Schritte in diesem Artikel auszuführen, muss Ihrem Benutzerkonto die Rolle Besitzer, Mitwirkender oderAzure KI Entwickler für das Azure-Abonnement zugewiesen werden. Alternativ kann Ihrem Konto eine benutzerdefinierte Rolle zugewiesen werden, die über die folgenden Berechtigungen verfügt:

  • Für das Azure-Abonnement: Zum Abonnieren des Arbeitsbereichs für das Azure Marketplace-Angebot, einmal für jeden Arbeitsbereich pro Angebot:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • Für die Ressourcengruppe: Zum Erstellen und Verwenden der SaaS-Ressource:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • Für den Arbeitsbereich: Zum Bereitstellen von Endpunkten (die Azure Machine Learning-Rolle „Wissenschaftliche Fachkraft für Daten“ enthält diese Berechtigungen bereits):

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*

Weitere Informationen zu Berechtigungen finden Sie unter Rollenbasierte Zugriffssteuerung in Azure KI Studio.

Nächster Schritt