Udostępnij za pośrednictwem


Wdrażanie modeli jako punktów końcowych bezserwerowego interfejsu API

Z tego artykułu dowiesz się, jak wdrożyć model z katalogu modeli jako bezserwerowy interfejs API z rozliczeniami opartymi na tokenach płatności zgodnie z rzeczywistym użyciem.

Niektóre modele w katalogu modeli można wdrożyć jako bezserwerowy interfejs API z rozliczeniami płatności zgodnie z rzeczywistym użyciem. Tego rodzaju wdrożenie umożliwia korzystanie z modeli jako interfejsu API bez hostowania ich w ramach subskrypcji, przy jednoczesnym zachowaniu bezpieczeństwa i zgodności przedsiębiorstwa, których potrzebują organizacje. Ta opcja wdrożenia nie wymaga limitu przydziału z subskrypcji.

W tym artykule użyto wdrożenia modelu Meta Llama na potrzeby ilustracji. Można jednak użyć tych samych kroków, aby wdrożyć dowolne modele w wykazie modeli, które są dostępne dla wdrożenia bezserwerowego interfejsu API.

Wymagania wstępne

  • Subskrypcja platformy Azure z prawidłową formą płatności. Subskrypcje platformy Azure w wersji bezpłatnej lub próbnej nie będą działać. Jeśli nie masz subskrypcji platformy Azure, utwórz płatne konto platformy Azure, aby rozpocząć.

  • Obszar roboczy usługi Azure Machine Learning.

  • Kontrola dostępu na podstawie ról platformy Azure (Azure RBAC): jest używana do udzielania dostępu do operacji w usłudze Azure Machine Learning. Aby wykonać kroki opisane w tym artykule, konto użytkownika musi mieć przypisaną rolę dewelopera usługi Azure AI w grupie zasobów. Aby uzyskać więcej informacji na temat uprawnień, zobacz Kontrola dostępu oparta na rolach w usłudze Azure Machine Learning.

  • Aby pracować z usługą Azure Machine Learning, musisz zainstalować następujące oprogramowanie:

    Aby nawigować po usłudze Azure Machine Learning, możesz użyć dowolnej zgodnej przeglądarki internetowej.

Znajdowanie modelu i identyfikatora modelu w wykazie modeli

  1. Zaloguj się do usługi Azure Machine Learning Studio

  2. W przypadku modeli oferowanych za pośrednictwem witryny Azure Marketplace upewnij się, że Twoje konto ma uprawnienia roli dewelopera sztucznej inteligencji platformy Azure w grupie zasobów lub że spełniasz uprawnienia wymagane do subskrybowania ofert modelu.

    Modele oferowane przez dostawców innych niż Microsoft (na przykład modele Llama i Mistral) są rozliczane za pośrednictwem witryny Azure Marketplace. W przypadku takich modeli musisz zasubskrybować obszar roboczy do określonej oferty modelu. Modele oferowane przez firmę Microsoft (na przykład modele Phi-3) nie mają tego wymagania, ponieważ rozliczenia są wykonywane inaczej. Aby uzyskać szczegółowe informacje o rozliczeniach dotyczących bezserwerowego wdrażania modeli w katalogu modeli, zobacz Rozliczenia dla bezserwerowych interfejsów API.

  3. Przejdź do swojego obszaru roboczego. Aby korzystać z oferty wdrażania modelu bezserwerowego interfejsu API, obszar roboczy musi należeć do jednego z regionów obsługiwanych w przypadku wdrożenia bezserwerowego dla określonego modelu, który chcesz wdrożyć.

  4. Wybierz pozycję Katalog modeli na lewym pasku bocznym i znajdź kartę modelu, którą chcesz wdrożyć. W tym artykule wybierzesz model Meta-Llama-3-8B-Instruct .

    1. Jeśli wdrażasz model przy użyciu interfejsu wiersza polecenia platformy Azure, zestawu SDK języka Python lub usługi ARM, skopiuj identyfikator modelu.

    Ważne

    Nie dołączaj wersji podczas kopiowania identyfikatora modelu. Punkty końcowe bezserwerowego interfejsu API zawsze wdrażają najnowszą dostępną wersję modelu. Na przykład dla identyfikatora azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3modelu skopiuj azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instructwartość .

    Zrzut ekranu przedstawiający stronę szczegółów modelu.

W następnej sekcji opisano kroki subskrybowania obszaru roboczego do oferty modelu. Możesz pominąć tę sekcję i przejść do sekcji Wdrażanie modelu w punkcie końcowym bezserwerowego interfejsu API, jeśli wdrażasz model firmy Microsoft.

Subskrybowanie obszaru roboczego do oferty modelu

Punkty końcowe bezserwerowego interfejsu API mogą wdrażać modele oferowane zarówno przez firmę Microsoft, jak i spoza firmy Microsoft. W przypadku modeli firmy Microsoft (takich jak modele Phi-3) nie trzeba tworzyć subskrypcji witryny Azure Marketplace i wdrażać je w punktach końcowych bezserwerowego interfejsu API bezpośrednio w celu korzystania z przewidywań. W przypadku modeli innych niż Microsoft należy najpierw utworzyć subskrypcję. Jeśli po raz pierwszy wdrażasz model w obszarze roboczym, musisz zasubskrybować obszar roboczy dla konkretnej oferty modelu z witryny Azure Marketplace. Każdy obszar roboczy ma własną subskrypcję dla konkretnej oferty usługi Azure Marketplace modelu, która umożliwia kontrolowanie i monitorowanie wydatków.

Uwaga

Modele oferowane za pośrednictwem witryny Azure Marketplace są dostępne do wdrożenia w punktach końcowych bezserwerowego interfejsu API w określonych regionach. Sprawdź dostępność regionów dla modeli w punktach końcowych bezserwerowego interfejsu API, aby sprawdzić, które modele i regiony są dostępne. Jeśli ta, której potrzebujesz, nie ma na liście, możesz wdrożyć w obszarze roboczym w obsługiwanym regionie, a następnie korzystać z punktów końcowych bezserwerowego interfejsu API z innego obszaru roboczego.

  1. Utwórz subskrypcję platformy handlowej modelu. Podczas tworzenia subskrypcji akceptujesz warunki i postanowienia skojarzone z ofertą modelu. Pamiętaj, że nie musisz wykonywać tego kroku dla modeli oferowanych przez firmę Microsoft (takich jak Phi-3).

    1. Na stronie Szczegóły modelu wybierz pozycję Wdróż. Zostanie otwarte okno Opcje wdrażania, dzięki czemu możesz wybrać między wdrożeniem bezserwerowego interfejsu API i wdrożeniem przy użyciu zarządzanego środowiska obliczeniowego.

      Uwaga

      W przypadku modeli, które można wdrożyć tylko za pośrednictwem bezserwerowego wdrażania interfejsu API, kreator wdrażania bezserwerowego interfejsu API zostanie otwarty bezpośrednio po wybraniu pozycji Wdróż na stronie szczegółów modelu.

    2. Wybierz pozycję Bezserwerowy interfejs API z usługą Azure AI Content Safety (wersja zapoznawcza), aby otworzyć kreatora wdrażania bezserwerowego interfejsu API.

    3. Zaznacz pole wyboru, aby potwierdzić zasady zakupu firmy Microsoft.

      Zrzut ekranu przedstawiający sposób wdrażania modelu przy użyciu opcji bezserwerowego interfejsu API.

    4. Jeśli widzisz notatkę Masz już subskrypcję witryny Azure Marketplace dla tego obszaru roboczego, nie musisz tworzyć subskrypcji, ponieważ masz już subskrypcję. Możesz przejść do sekcji Wdrażanie modelu w punkcie końcowym bezserwerowego interfejsu API.

    5. W kreatorze wdrażania wybierz link do warunków użytkowania witryny Azure Marketplace, aby dowiedzieć się więcej o warunkach użytkowania. Możesz również wybrać kartę Cennik i terminy , aby dowiedzieć się więcej o cenach dla wybranego modelu.

    6. W kreatorze wdrażania wybierz link do warunków użytkowania witryny Azure Marketplace, aby dowiedzieć się więcej o warunkach użytkowania. Możesz również wybrać kartę Szczegóły oferty w witrynie Marketplace, aby dowiedzieć się więcej o cenach dla wybranego modelu.

    7. Wybierz pozycję Subskrybuj i Wdróż.

  2. Po zasubskrybowaniu obszaru roboczego dla określonej oferty witryny Azure Marketplace kolejne wdrożenia tej samej oferty w tym samym obszarze roboczym nie wymagają ponownego subskrybowania.

  3. W dowolnym momencie możesz zobaczyć oferty modelu, do których aktualnie subskrybowany jest obszar roboczy:

    1. Przejdź do witryny Azure Portal.

    2. Przejdź do grupy zasobów, do której należy obszar roboczy.

    3. W filtrze Typ wybierz pozycję SaaS.

    4. Zobaczysz wszystkie oferty, do których obecnie subskrybujesz.

    5. Wybierz dowolny zasób, aby wyświetlić szczegóły.

Wdrażanie modelu w punkcie końcowym bezserwerowego interfejsu API

Po utworzeniu subskrypcji dla modelu innego niż Microsoft możesz wdrożyć skojarzony model w punkcie końcowym bezserwerowego interfejsu API. W przypadku modeli firmy Microsoft (takich jak modele Phi-3) nie trzeba tworzyć subskrypcji.

Punkt końcowy bezserwerowego interfejsu API umożliwia korzystanie z modeli jako interfejsu API bez hostowania ich w ramach subskrypcji, przy jednoczesnym zachowaniu potrzeb organizacji w zakresie zabezpieczeń i zgodności przedsiębiorstwa. Ta opcja wdrożenia nie wymaga limitu przydziału z subskrypcji.

W tej sekcji utworzysz punkt końcowy o nazwie meta-llama3-8b-qwerty.

  1. Tworzenie bezserwerowego punktu końcowego

    1. Aby wdrożyć model firmy Microsoft, który nie wymaga subskrybowania oferty modelu, wybierz pozycję Wdróż, a następnie wybierz pozycję Bezserwerowy interfejs API z bezpieczeństwem zawartości usługi Azure AI (wersja zapoznawcza), aby otworzyć kreatora wdrażania.

    2. Alternatywnie w przypadku modelu innego niż Microsoft, który wymaga subskrypcji modelu, jeśli właśnie zasubskrybujesz obszar roboczy do oferty modelu w poprzedniej sekcji, wybierz pozycję Wdróż. Alternatywnie wybierz pozycję Kontynuuj, aby wdrożyć (jeśli kreator wdrażania miał notatkę Masz już subskrypcję witryny Azure Marketplace dla tego obszaru roboczego).

      Zrzut ekranu przedstawiający obszar roboczy, który jest już subskrybowany do oferty.

    3. Nadaj wdrożeniu nazwę. Ta nazwa staje się częścią adresu URL interfejsu API wdrażania. Ten adres URL musi być unikatowy w każdym regionie świadczenia usługi Azure.

      Zrzut ekranu przedstawiający sposób określania nazwy wdrożenia, które chcesz utworzyć.

      Napiwek

      Opcja Filtr zawartości (wersja zapoznawcza) jest domyślnie włączona. Pozostaw ustawienie domyślne dla usługi, aby wykrywać szkodliwe treści, takie jak nienawiść, samookaleczenia, treści seksualne i brutalne. Aby uzyskać więcej informacji na temat filtrowania zawartości, zobacz Bezpieczeństwo zawartości dla modeli wdrożonych za pośrednictwem bezserwerowych interfejsów API.

    4. Wybierz Wdróż. Poczekaj, aż wdrożenie będzie gotowe, a nastąpi przekierowanie do strony Wdrożenia.

  2. W dowolnym momencie możesz zobaczyć punkty końcowe wdrożone w obszarze roboczym:

    1. Przejdź do swojego obszaru roboczego.

    2. Wybierz Punkty końcowe.

    3. Wybierz kartę Bezserwerowe punkty końcowe, aby wyświetlić bezserwerowe punkty końcowe interfejsu API.

  3. Utworzony punkt końcowy używa uwierzytelniania klucza do autoryzacji. Wykonaj poniższe kroki, aby uzyskać klucze skojarzone z danym punktem końcowym.

    1. Aby powrócić do strony wdrożenia, wybierz nazwę punktu końcowego z listy punktów końcowych bezserwerowych.
    2. Zanotuj docelowy identyfikator URI i klucz punktu końcowego. Użyj ich do wywoływania wdrożenia i generowania przewidywań.

    Uwaga

    W przypadku korzystania z witryny Azure Portal punkty końcowe interfejsu API bezserwerowego nie są domyślnie wyświetlane w grupie zasobów. Użyj opcji Pokaż ukryte typy, aby wyświetlić je w grupie zasobów.

  4. Na tym etapie punkt końcowy jest gotowy do użycia.

  5. Jeśli musisz korzystać z tego wdrożenia z innego obszaru roboczego lub planujesz użyć przepływu monitów do tworzenia inteligentnych aplikacji, musisz utworzyć połączenie z wdrożeniem bezserwerowego interfejsu API. Aby dowiedzieć się, jak skonfigurować istniejący punkt końcowy bezserwerowego interfejsu API w nowym obszarze roboczym lub centrum, zobacz Korzystanie z wdrożonych punktów końcowych bezserwerowego interfejsu API z innego obszaru roboczego lub przepływu monitu.

    Napiwek

    Jeśli używasz przepływu monitów w tym samym obszarze roboczym, w którym wdrożono wdrożenie, nadal musisz utworzyć połączenie.

Korzystanie z punktu końcowego bezserwerowego interfejsu API

Modele wdrożone w usłudze Azure Machine Learning i usłudze Azure AI Studio w punktach końcowych bezserwerowego interfejsu API interfejsu API wnioskowania modelu sztucznej inteligencji obsługują interfejs API wnioskowania usługi Azure AI, który uwidacznia wspólny zestaw funkcji dla podstawowych modeli i może być używany przez deweloperów do korzystania z przewidywań z różnych zestawów modeli w jednolity i spójny sposób.

Dowiedz się więcej o możliwościach tego interfejsu API i sposobach korzystania z niego podczas tworzenia aplikacji.

Usuwanie punktów końcowych i subskrypcji

Możesz usunąć subskrypcje modelu i punkty końcowe. Usunięcie subskrypcji modelu sprawia, że skojarzony punkt końcowy staje się w złej kondycji i bezużyteczny.

Aby usunąć punkt końcowy bezserwerowego interfejsu API:

  1. Przejdź do usługi Azure Machine Learning Studio.

  2. Wybierz pozycję Punkty końcowe na lewym pasku bocznym.

  3. Wybierz kartę Bezserwerowe punkty końcowe, aby wyświetlić bezserwerowe punkty końcowe interfejsu API.

  4. Otwórz punkt końcowy, który chcesz usunąć.

  5. Wybierz Usuń.

Aby usunąć skojarzona subskrypcja modelu:

  1. Przejdź do witryny Azure Portal.

  2. Przejdź do grupy zasobów, do której należy obszar roboczy.

  3. W filtrze Typ wybierz pozycję SaaS.

  4. Wybierz subskrypcję, którą chcesz usunąć.

  5. Wybierz Usuń.

Zagadnienia dotyczące kosztów i limitów przydziału dla modeli wdrożonych jako punkty końcowe bezserwerowego interfejsu API

Limit przydziału jest zarządzany na wdrożenie. Każde wdrożenie ma limit szybkości wynoszący 200 000 tokenów na minutę i 1000 żądań interfejsu API na minutę. Obecnie jednak ograniczamy jedno wdrożenie na model na obszar roboczy. Skontaktuj się z pomocą techniczną platformy Microsoft Azure, jeśli bieżące limity szybkości nie są wystarczające dla Twoich scenariuszy.

Koszt modeli firmy Microsoft

Informacje o cenach można znaleźć na karcie Cennik i terminy kreatora wdrażania podczas wdrażania modeli firmy Microsoft (takich jak modele Phi-3) jako punktów końcowych bezserwerowego interfejsu API.

Koszt dla modeli innych niż Microsoft

Modele inne niż firmy Microsoft wdrożone jako punkty końcowe bezserwerowego interfejsu API są oferowane za pośrednictwem witryny Azure Marketplace i zintegrowane z usługą Azure AI Studio do użycia. Cennik witryny Azure Marketplace można znaleźć podczas wdrażania lub dostrajania tych modeli.

Za każdym razem, gdy obszar roboczy subskrybuje daną ofertę z witryny Azure Marketplace, tworzony jest nowy zasób w celu śledzenia kosztów związanych z jego zużyciem. Ten sam zasób służy do śledzenia kosztów skojarzonych z wnioskowaniem i dostrajania; jednak w ramach śledzenia każdego scenariusza można niezależnie śledzić wiele mierników.

Aby uzyskać więcej informacji na temat śledzenia kosztów, zobacz Monitorowanie kosztów modeli oferowanych w witrynie Azure Marketplace.

Zrzut ekranu przedstawiający różne zasoby odpowiadające różnym ofertom modelu i skojarzonym miernikom.

Uprawnienia wymagane do subskrybowania ofert modeli

Kontrola dostępu na podstawie ról platformy Azure (Azure RBAC): jest używana do udzielania dostępu do operacji w usłudze Azure Machine Learning. Aby wykonać kroki opisane w tym artykule, konto użytkownika musi mieć przypisaną rolę Właściciela, Współautora lub Dewelopera sztucznej inteligencji platformy Azure dla subskrypcji platformy Azure. Możesz też przypisać rolę niestandardową, która ma następujące uprawnienia:

  • W subskrypcji platformy Azure — do subskrypcji obszaru roboczego oferty witryny Azure Marketplace, raz dla każdego obszaru roboczego, na ofertę:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • W grupie zasobów — do tworzenia zasobu SaaS i jego użycia:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • W obszarze roboczym — do wdrażania punktów końcowych (rola badacza danych usługi Azure Machine Learning zawiera już te uprawnienia):

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*

Aby uzyskać więcej informacji na temat uprawnień, zobacz Zarządzanie dostępem do obszaru roboczego usługi Azure Machine Learning.