Dela via


Distribuera modeller som serverlösa API:er

Viktigt!

Vissa av de funktioner som beskrivs i den här artikeln kanske bara är tillgängliga i förhandsversionen. Den här förhandsversionen tillhandahålls utan ett serviceavtal och vi rekommenderar det inte för produktionsarbetsbelastningar. Vissa funktioner kanske inte stöds eller kan vara begränsade. Mer information finns i Kompletterande villkor för användning av Microsoft Azure-förhandsversioner.

I den här artikeln får du lära dig hur du distribuerar en modell från modellkatalogen som ett serverlöst API med betala per användning-tokenbaserad fakturering.

Vissa modeller i modellkatalogen kan distribueras som ett serverlöst API med betala per användning-fakturering. Den här typen av distribution ger ett sätt att använda modeller som ett API utan att vara värd för dem i din prenumeration, samtidigt som den företagssäkerhet och efterlevnad som organisationer behöver bevaras. Det här distributionsalternativet kräver inte kvot från din prenumeration.

Förutsättningar

  • En Azure-prenumeration med en giltig betalningsmetod. Kostnadsfria azure-prenumerationer eller utvärderingsprenumerationer fungerar inte. Om du inte har en Azure-prenumeration skapar du ett betalt Azure-konto för att börja.

  • En Azure AI Studio-hubb.

  • Ett Azure AI Studio-projekt.

  • Rollbaserade åtkomstkontroller i Azure (Azure RBAC) används för att bevilja åtkomst till åtgärder i Azure AI Studio. Om du vill utföra stegen i den här artikeln måste ditt användarkonto tilldelas rollen Azure AI Developer i resursgruppen. Mer information om behörigheter finns i Rollbaserad åtkomstkontroll i Azure AI Studio.

  • Du måste installera följande programvara för att arbeta med Azure AI Studio:

    Du kan använda valfri kompatibel webbläsare för att navigera i Azure AI Studio.

Prenumerera ditt projekt på modellerbjudandet

För modeller som erbjuds via Azure Marketplace kan du distribuera dem till serverlösa API-slutpunkter för att använda deras förutsägelser. Om det är första gången du distribuerar modellen i projektet måste du prenumerera på ditt projekt för det specifika modellerbjudandet från Azure Marketplace. Varje projekt har en egen prenumeration på det specifika Azure Marketplace-erbjudandet för modellen, vilket gör att du kan styra och övervaka utgifter.

Kommentar

Modeller som erbjuds via Azure Marketplace är tillgängliga för distribution till serverlösa API-slutpunkter i specifika regioner. Kontrollera modell- och regionstillgängligheten för serverlösa API-distributioner för att kontrollera vilka modeller och regioner som är tillgängliga. Om den du behöver inte visas kan du distribuera till en arbetsyta i en region som stöds och sedan använda serverlösa API-slutpunkter från en annan arbetsyta.

  1. Logga in på Azure AI Studio.

  2. Se till att ditt konto har rollbehörigheter för Azure AI Developer i resursgruppen eller att du uppfyller de behörigheter som krävs för att prenumerera på modellerbjudanden.

  3. Välj Modellkatalog i det vänstra sidofältet och leta reda på modellkortet för den modell som du vill distribuera. I den här artikeln väljer du en Meta-Llama-3-8B-Instruct-modell .

    1. Om du distribuerar modellen med Hjälp av Azure CLI, Python eller ARM kopierar du modell-ID:t.

      Viktigt!

      Inkludera inte versionen när du kopierar modell-ID :t. Serverlösa API-slutpunkter distribuerar alltid modellens senaste tillgängliga version. För modell-ID azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3:t kopierar du azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instructtill exempel .

    En skärmbild som visar en modells informationssida.

  4. Skapa modellens Marketplace-prenumeration. När du skapar en prenumeration godkänner du de villkor som är associerade med modellerbjudandet.

    1. På modellens informationssida väljer du Distribuera och sedan Serverlöst API för att öppna distributionsguiden.

    2. Välj det projekt där du vill distribuera dina modeller. Observera att inte alla regioner stöds.

      En skärmbild som visar hur du distribuerar en modell med alternativet serverlöst API.

    3. Om du ser anteckningen Du har redan en Azure Marketplace-prenumeration för det här projektet behöver du inte skapa prenumerationen eftersom du redan har en. Du kan fortsätta att distribuera modellen till en serverlös API-slutpunkt.

    4. I distributionsguiden väljer du länken till Azure Marketplace-villkor för att lära dig mer om användningsvillkoren. Du kan också välja fliken Priser och villkor för att lära dig mer om priser för den valda modellen.

    5. Välj Prenumerera och Distribuera.

  5. När du har registrerat projektet för det specifika Azure Marketplace-erbjudandet behöver efterföljande distributioner av samma erbjudande i samma projekt inte prenumerera igen.

  6. När som helst kan du se de modellerbjudanden som ditt projekt för närvarande prenumererar på:

    1. Gå till Azure-portalen.

    2. Gå till den resursgrupp där projektet tillhör.

    3. I filtret Typ väljer du SaaS.

    4. Du ser alla erbjudanden som du prenumererar på.

    5. Välj valfri resurs för att se informationen.

Distribuera modellen till en serverlös API-slutpunkt

När du har skapat en modellprenumeration kan du distribuera den associerade modellen till en serverlös API-slutpunkt. Den serverlösa API-slutpunkten är ett sätt att använda modeller som ett API utan att vara värd för dem i din prenumeration, samtidigt som företagets säkerhets- och efterlevnadsorganisationer behöver det. Det här distributionsalternativet kräver inte kvot från din prenumeration.

I den här artikeln skapar du en slutpunkt med namnet meta-llama3-8b-qwerty.

  1. Skapa den serverlösa slutpunkten

    1. I föregående guide väljer du Distribuera (om du just prenumererar projektet på modellerbjudandet i föregående avsnitt) eller väljer Fortsätt att distribuera (om distributionsguiden hade anteckningen Du har redan en Azure Marketplace-prenumeration för det här projektet).

      En skärmbild som visar ett projekt som redan prenumererar på erbjudandet.

    2. Ge distributionen ett namn. Det här namnet blir en del av URL:en för distributions-API:et. Den här URL:en måste vara unik i varje Azure-region.

      En skärmbild som visar hur du anger namnet på den distribution som du vill skapa.

    3. Välj distribuera. Vänta tills distributionen är klar och du omdirigeras till sidan Distributioner.

  2. När som helst kan du se slutpunkterna som distribueras till projektet:

    1. Gå till ditt projekt.

    2. Välj avsnittet Distributioner

    3. Serverlösa API-slutpunkter visas.

  3. Den skapade slutpunkten använder nyckelautentisering för auktorisering. Använd följande steg för att hämta de nycklar som är associerade med en viss slutpunkt.

    Du kan gå tillbaka till sidan Distributioner, välja distributionen och notera slutpunktens mål-URI och nyckel. Använd dem för att anropa distributionen och generera förutsägelser.

    Kommentar

    När du använder Azure-portalen visas inte serverlösa API-slutpunkter som standard i resursgruppen. Använd alternativet Visa dolda typer för att visa dem i resursgruppen.

  4. Nu är slutpunkten redo att användas.

  5. Om du behöver använda den här distributionen från ett annat projekt eller en annan hubb, eller om du planerar att använda promptflöde för att skapa intelligenta program, måste du skapa en anslutning till den serverlösa API-distributionen. Information om hur du konfigurerar en befintlig serverlös API-slutpunkt för ett nytt projekt eller en ny hubb finns i Använda distribuerade serverlösa API-slutpunkter från ett annat projekt eller från promptflödet.

    Dricks

    Om du använder promptflöde i samma projekt eller hubb där distributionen distribuerades måste du fortfarande skapa anslutningen.

Använda den serverlösa API-slutpunkten

Modeller som distribueras i Azure Machine Learning och Azure AI Studio i serverlösa API-slutpunkter stöder Azure AI Model Inference API som exponerar en gemensam uppsättning funktioner för grundläggande modeller och som kan användas av utvecklare för att använda förutsägelser från en mängd olika modeller på ett enhetligt och konsekvent sätt.

Läs mer om funktionerna i det här API:et och hur du kan utnyttja det när du skapar program.

Ta bort slutpunkter och prenumerationer

Du kan ta bort modellprenumerationer och slutpunkter. Om du tar bort en modellprenumeration blir alla associerade slutpunkter inte felfria och oanvändbara.

Så här tar du bort en serverlös API-slutpunkt:

  1. Gå till Azure AI Studio.

  2. Gå till Distributioner av komponenter>.

  3. Öppna den distribution som du vill ta bort.

  4. Välj Ta bort.

Så här tar du bort den associerade modellprenumerationen:

  1. Gå till Azure Portal

  2. Gå till den resursgrupp där projektet tillhör.

  3. I filtret Typ väljer du SaaS.

  4. Välj den prenumeration du vill ta bort.

  5. Välj Ta bort.

Kostnads- och kvotöverväganden för modeller som distribueras som serverlösa API-slutpunkter

Modeller som distribueras som serverlösa API-slutpunkter erbjuds via Azure Marketplace och integreras med Azure AI Studio för användning. Du hittar prissättningen för Azure Marketplace när du distribuerar eller finjusterar modellerna.

Varje gång ett projekt prenumererar på ett visst erbjudande från Azure Marketplace skapas en ny resurs för att spåra de kostnader som är kopplade till förbrukningen. Samma resurs används för att spåra kostnader som är kopplade till slutsatsdragning och finjustering. Flera mätare är dock tillgängliga för att spåra varje scenario oberoende av varandra.

Mer information om hur du spårar kostnader finns i Övervaka kostnader för modeller som erbjuds via Azure Marketplace.

En skärmbild som visar olika resurser som motsvarar olika modellerbjudanden och deras associerade mätare.

Kvoten hanteras per distribution. Varje distribution har en hastighetsgräns på 200 000 token per minut och 1 000 API-begäranden per minut. Vi begränsar dock för närvarande en distribution per modell per projekt. Kontakta Microsoft Azure Support om de aktuella hastighetsgränserna inte räcker för dina scenarier.

Behörigheter som krävs för att prenumerera på modellerbjudanden

Rollbaserade åtkomstkontroller i Azure (Azure RBAC) används för att bevilja åtkomst till åtgärder i Azure AI Studio. Om du vill utföra stegen i den här artikeln måste ditt användarkonto tilldelas rollen Ägare, Deltagare eller Azure AI Developer för Azure-prenumerationen. Alternativt kan ditt konto tilldelas en anpassad roll som har följande behörigheter:

  • I Azure-prenumerationen – för att prenumerera på arbetsytan till Azure Marketplace-erbjudandet, en gång för varje arbetsyta, per erbjudande:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • I resursgruppen – för att skapa och använda SaaS-resursen:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • På arbetsytan – för att distribuera slutpunkter (dataexpertrollen i Azure Machine Learning innehåller redan dessa behörigheter):

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*

Mer information om behörigheter finns i Rollbaserad åtkomstkontroll i Azure AI Studio.

Gå vidare