Sdílet prostřednictvím


Nasazení modelů jako koncových bodů bezserverového rozhraní API

V tomto článku se dozvíte, jak nasadit model z katalogu modelů jako bezserverové rozhraní API s fakturací na základě tokenů s průběžnými platbami.

Některé modely v katalogu modelů je možné nasadit jako bezserverové rozhraní API s průběžnými platbami. Tento druh nasazení poskytuje způsob, jak využívat modely jako rozhraní API bez jejich hostování ve vašem předplatném a současně udržovat podnikové zabezpečení a dodržování předpisů, které organizace potřebují. Tato možnost nasazení nevyžaduje kvótu z vašeho předplatného.

Požadavky

  • Předplatné Azure s platným způsobem platby. Bezplatná nebo zkušební předplatná Azure nebudou fungovat. Pokud nemáte předplatné Azure, vytvořte si placený účet Azure, abyste mohli začít.

  • Pracovní prostor Azure Machine Learning.

  • Řízení přístupu na základě role v Azure (Azure RBAC) slouží k udělení přístupu k operacím ve službě Azure Machine Learning. Pokud chcete provést kroky v tomto článku, musí být vašemu uživatelskému účtu přiřazena role Vývojář Azure AI ve skupině prostředků. Další informace o oprávněních najdete v tématu Řízení přístupu na základě role ve službě Azure Machine Learning.

  • Abyste mohli pracovat se službou Azure Machine Learning, musíte nainstalovat následující software:

    K navigaci ve službě Azure Machine Learning můžete použít libovolný kompatibilní webový prohlížeč.

Vyhledání modelu a ID modelu v katalogu modelů

  1. Přihlášení k studio Azure Machine Learning

  2. U modelů nabízených prostřednictvím Azure Marketplace se ujistěte, že váš účet má oprávnění role Azure AI Developer ve skupině prostředků nebo že splňujete oprávnění potřebná k přihlášení k odběru nabídek modelů.

    Modely, které nabízejí poskytovatelé jiných společností než Microsoft (například modely Llama a Mistral), se účtují prostřednictvím Azure Marketplace. U takových modelů je potřeba přihlásit se k odběru pracovního prostoru konkrétní nabídky modelu. Modely, které nabízí Microsoft (například modely Phi-3), nemají tento požadavek, protože fakturace se provádí jinak. Podrobnosti o fakturaci bezserverového nasazení modelů v katalogu modelů najdete v tématu Fakturace bezserverových rozhraní API.

  3. Přejděte do svého pracovního prostoru. Pokud chcete použít nabídku nasazení bezserverového modelu rozhraní API, musí váš pracovní prostor patřit do jedné z oblastí podporovaných pro bezserverové nasazení pro konkrétní model, který chcete nasadit.

  4. Na levém bočním panelu vyberte Katalog modelů a najděte kartu modelu, který chcete nasadit. V tomto článku vyberete model Meta-Llama-3-8B-Instruct .

    1. Pokud model nasazujete pomocí Azure CLI, Python SDK nebo ARM, zkopírujte ID modelu.

    Důležité

    Při kopírování ID modelu nezahrnujte verzi. Koncové body bezserverového rozhraní API vždy nasazují nejnovější dostupnou verzi modelu. Například pro ID azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct/versions/3modelu , kopírovat azureml://registries/azureml-meta/models/Meta-Llama-3-8B-Instruct.

    Snímek obrazovky zobrazující stránku podrobností modelu

Následující část popisuje postup přihlášení pracovního prostoru k odběru nabídky modelu. Pokud nasazujete model Microsoftu, můžete tuto část přeskočit a přejít na nasazení modelu do koncového bodu bezserverového rozhraní API.

Přihlášení pracovního prostoru k odběru nabídky modelů

U modelů jiných společností než Microsoft nabízených prostřednictvím Azure Marketplace je můžete nasadit do bezserverových koncových bodů rozhraní API a využívat jejich predikce. Pokud model nasazujete v pracovním prostoru poprvé, musíte se přihlásit k odběru svého pracovního prostoru pro konkrétní nabídku modelu z Azure Marketplace. Každý pracovní prostor má vlastní předplatné konkrétní nabídky modelu na Azure Marketplace, která umožňuje řídit a monitorovat útraty.

Poznámka:

Modely nabízené prostřednictvím Azure Marketplace jsou k dispozici pro nasazení do koncových bodů bezserverového rozhraní API v konkrétních oblastech. Zkontrolujte dostupnost modelů v koncových bodech bezserverového rozhraní API a ověřte, které modely a oblasti jsou k dispozici. Pokud tu, kterou potřebujete, není uvedený, můžete ho nasadit do pracovního prostoru v podporované oblasti a pak využívat koncové body bezserverového rozhraní API z jiného pracovního prostoru.

  1. Vytvořte předplatné marketplace modelu. Při vytváření předplatného přijímáte podmínky a ujednání přidružené k nabídce modelu.

    1. Na stránce Podrobnosti modelu vyberte Nasadit a pak vyberte bezserverové rozhraní API s Azure AI Content Safety (Preview) a otevřete průvodce nasazením.

    2. Zaškrtnutím políčka potvrďte zásady nákupu Microsoftu.

      Snímek obrazovky znázorňující, jak nasadit model s možností bezserverového rozhraní API

    3. Pokud se zobrazí poznámka , že pro tento pracovní prostor už máte předplatné Azure Marketplace, nemusíte předplatné vytvářet, protože už ho máte. Můžete pokračovat nasazením modelu do koncového bodu bezserverového rozhraní API.

    4. V průvodci nasazením vyberte odkaz na podmínky Azure Marketplace, kde najdete další informace o podmínkách použití. Můžete také vybrat kartu Ceny a podmínky , kde se dozvíte o cenách vybraného modelu.

    5. V průvodci nasazením vyberte odkaz na podmínky Azure Marketplace, kde najdete další informace o podmínkách použití. Můžete také vybrat kartu Podrobnosti nabídky Marketplace, kde se dozvíte o cenách vybraného modelu.

    6. Vyberte Přihlášení k odběru a nasazení.

  2. Po přihlášení k odběru pracovního prostoru pro konkrétní nabídku Azure Marketplace nevyžadují následná nasazení stejné nabídky ve stejném pracovním prostoru opětovné přihlášení k odběru.

  3. V libovolném okamžiku můžete zobrazit nabídky modelu, ke kterým se váš pracovní prostor aktuálně přihlašuje:

    1. Přejděte na web Azure Portal.

    2. Přejděte do skupiny prostředků, do které pracovní prostor patří.

    3. Ve filtru Typ vyberte SaaS.

    4. Zobrazí se všechny nabídky, ke kterým jste aktuálně přihlášení k odběru.

    5. Výběrem libovolného prostředku zobrazíte podrobnosti.

Nasazení modelu do koncového bodu bezserverového rozhraní API

Po vytvoření předplatného pro model jiného než Microsoftu můžete přidružený model nasadit do koncového bodu bezserverového rozhraní API. Pro modely Microsoftu (například modely Phi-3) nemusíte vytvářet předplatné.

Koncový bod bezserverového rozhraní API poskytuje způsob, jak využívat modely jako rozhraní API bez jejich hostování ve vašem předplatném a současně zajistit, aby organizace v podnikovém prostředí potřebovaly zabezpečení a dodržování předpisů. Tato možnost nasazení nevyžaduje kvótu z vašeho předplatného.

V této části vytvoříte koncový bod s názvem meta-llama3-8b-qwerty.

  1. Vytvoření bezserverového koncového bodu

    1. Pokud chcete nasadit model Microsoftu, který nevyžaduje přihlášení k odběru nabídky modelu, vyberte Nasadit a pak výběrem bezserverového rozhraní API s Azure AI Content Safety (Preview) otevřete průvodce nasazením.

    2. Pokud jste pracovní prostor právě přihlásili k odběru nabídky modelu v předchozí části, můžete pro model, který vyžaduje jiný model než Microsoft, vybrat možnost Nasadit. Případně vyberte Pokračovat k nasazení (pokud měl průvodce nasazením poznámku , že pro tento pracovní prostor už máte předplatné Azure Marketplace).

      Snímek obrazovky znázorňující pracovní prostor, který je už předplacený k nabídce

    3. Pojmenujte nasazení. Tento název se stane součástí adresy URL rozhraní API nasazení. Tato adresa URL musí být v každé oblasti Azure jedinečná.

      Snímek obrazovky znázorňující, jak zadat název nasazení, které chcete vytvořit

    4. Vyberte Nasadit. Počkejte, až bude nasazení připravené a budete přesměrováni na stránku Nasazení.

  2. V libovolném okamžiku uvidíte koncové body nasazené do vašeho pracovního prostoru:

    1. Přejděte do svého pracovního prostoru.

    2. Vyberte Koncové body.

    3. Výběrem karty Bezserverové koncové body zobrazte koncové body bezserverového rozhraní API.

  3. Vytvořený koncový bod používá pro autorizaci ověřování pomocí klíče. Pomocí následujícího postupu získejte klíče přidružené k danému koncovému bodu.

    1. Pokud se chcete vrátit na stránku nasazení, vyberte název koncového bodu ze seznamu bezserverových koncových bodů.
    2. Poznamenejte si cílový identifikátor URI a klíč koncového bodu. Použijte je k volání nasazení a generování předpovědí.

    Poznámka:

    Při použití webu Azure Portal se ve skupině prostředků ve výchozím nastavení nezobrazují koncové body bezserverového rozhraní API. Pomocí možnosti Zobrazit skryté typy je můžete zobrazit ve skupině prostředků.

  4. V tuto chvíli je váš koncový bod připravený k použití.

  5. Pokud potřebujete toto nasazení využívat z jiného pracovního prostoru nebo plánujete použít tok výzvy k vytváření inteligentních aplikací, musíte vytvořit připojení k nasazení bezserverového rozhraní API. Informace o konfiguraci existujícího koncového bodu bezserverového rozhraní API v novém pracovním prostoru nebo centru najdete v tématu Využití nasazených koncových bodů bezserverového rozhraní API z jiného pracovního prostoru nebo z toku výzvy.

    Tip

    Pokud používáte tok výzvy ve stejném pracovním prostoru, ve kterém bylo nasazení nasazeno, musíte připojení vytvořit.

Použití koncového bodu bezserverového rozhraní API

Modely nasazené ve službě Azure Machine Learning a Azure AI Studio v koncových bodech bezserverového rozhraní API podporují rozhraní API pro odvozování modelů Azure AI, které zpřístupňuje společnou sadu funkcí pro základní modely a které můžou vývojáři používat k využívání predikcí z různorodé sady modelů jednotným a konzistentním způsobem.

Přečtěte si další informace o možnostech tohoto rozhraní API a o tom, jak ho můžete použít při vytváření aplikací.

Odstranění koncových bodů a předplatných

Můžete odstranit předplatná a koncové body modelu. Odstraněním předplatného modelu se z jakéhokoli přidruženého koncového bodu stane , že není v pořádku a nepoužitelný.

Odstranění koncového bodu bezserverového rozhraní API:

  1. Přejděte na studio Azure Machine Learning.

  2. Na levém bočním panelu vyberte koncové body .

  3. Výběrem karty Bezserverové koncové body zobrazte koncové body bezserverového rozhraní API.

  4. Otevřete koncový bod, který chcete odstranit.

  5. Vyberte Odstranit.

Odstranění přidruženého předplatného modelu:

  1. Přejděte na web Azure Portal.

  2. Přejděte do skupiny prostředků, do které pracovní prostor patří.

  3. Ve filtru Typ vyberte SaaS.

  4. Vyberte předplatné, které chcete odstranit.

  5. Vyberte Odstranit.

Důležité informace o nákladech a kvótách pro modely nasazené jako koncové body bezserverového rozhraní API

Kvóta se spravuje podle nasazení. Každé nasazení má limit rychlosti 200 000 tokenů za minutu a 1 000 požadavků rozhraní API za minutu. V současné době ale omezujeme jedno nasazení na model na jeden pracovní prostor. Pokud aktuální limity sazeb pro vaše scénáře nestačí, obraťte se na podporu Microsoft Azure.

Náklady na modely Microsoftu

Informace o cenách najdete na kartě Ceny a podmínky průvodce nasazením při nasazování modelů Microsoftu (například modelů Phi-3) jako koncových bodů bezserverového rozhraní API.

Náklady na modely jiné společnosti než Microsoft

Modely jiných společností než Microsoft nasazené jako koncové body bezserverového rozhraní API jsou nabízeny prostřednictvím Azure Marketplace a integrované s Azure AI Studio pro použití. Ceny za Azure Marketplace najdete při nasazování nebo vyladění těchto modelů.

Pokaždé, když se pracovní prostor přihlásí k odběru dané nabídky z Azure Marketplace, vytvoří se nový prostředek, který bude sledovat náklady spojené s jeho spotřebou. Ke sledování nákladů spojených s odvozováním a dolaďováním se používá stejný zdroj, nicméně ke sledování každého scénáře je k dispozici více měřidel nezávisle.

Další informace o sledování nákladů naleznete v části Sledování nákladů na modely nabízené prostřednictvím služby Azure Marketplace.

Snímek obrazovky znázorňující různé prostředky odpovídající různým nabídkám modelu a jejich přidruženým měřičům

Oprávnění potřebná k přihlášení k odběru nabídek modelů

Řízení přístupu na základě role v Azure (Azure RBAC) slouží k udělení přístupu k operacím ve službě Azure Machine Learning. Pokud chcete provést kroky v tomto článku, musíte mít uživatelský účet přiřazenou roli Vlastník, Přispěvatel nebo Vývojář Azure AI pro předplatné Azure. Případně můžete svému účtu přiřadit vlastní roli, která má následující oprávnění:

  • V předplatném Azure – pokud chcete přihlásit pracovní prostor k odběru nabídky Azure Marketplace, jednou pro každý pracovní prostor pro každou nabídku:

    • Microsoft.MarketplaceOrdering/agreements/offers/plans/read
    • Microsoft.MarketplaceOrdering/agreements/offers/plans/sign/action
    • Microsoft.MarketplaceOrdering/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.Marketplace/offerTypes/publishers/offers/plans/agreements/read
    • Microsoft.SaaS/register/action
  • Ve skupině prostředků – vytvoření a použití prostředku SaaS:

    • Microsoft.SaaS/resources/read
    • Microsoft.SaaS/resources/write
  • V pracovním prostoru – nasazení koncových bodů (role datového vědce Azure Machine Learning už tato oprávnění obsahuje):

    • Microsoft.MachineLearningServices/workspaces/marketplaceModelSubscriptions/*
    • Microsoft.MachineLearningServices/workspaces/serverlessEndpoints/*

Další informace o oprávněních najdete v tématu Správa přístupu k pracovnímu prostoru Azure Machine Learning.