Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tento článek ukazuje, jak povolit službu Model Serving ve vašem pracovním prostoru a přepnout modely na prostředí služby Služby modelů Bez serveru založené na prostředí pro obsluhu bezserverových modelů.
Důležité
Od 22. srpna 2025 už zákazníci nebudou moct vytvářet nové koncové body obsluhy pomocí prostředí pro poskytování starších modelů MLflow. 15. září 2025 bude starší verze prostředí ukončena a všechny stávající koncové body, které tuto službu používají, už není možné používat.
Požadavky
- Registrovaný model v registru modelů MLflow.
- Oprávnění k registrovaným modelům, jak je popsáno v průvodci řízením přístupu.
- Povolte výpočetní prostředky bez serveru ve vašem pracovním prostoru.
Významné změny
- Ve službě Model Serving se formát požadavku na koncový bod a odpověď z koncového bodu mírně liší od služby starší verze modelu MLflow. Podrobnosti o novém formátovacím protokolu najdete v bodování koncového bodu modelu.
- V části Obsluha modelu adresa URL koncového
serving-endpointsbodu obsahujemodelmísto . - Poskytování modelů zahrnuje plnou podporu správy prostředků pomocí pracovních postupů rozhraní API.
- Obsluha modelů je připravená pro produkční prostředí a je zajištěná smlouvou SLA pro Azure Databricks.
Identifikace koncových bodů obsluhy, které používají službu starší verze modelu MLflow
Identifikace koncových bodů obsluhy modelu, které používají starší verze obsluhy modelů MLflow:
- Přejděte do uživatelského rozhraní Modelů ve vašem pracovním prostoru.
- Vyberte filtr registru modelu pracovního prostoru .
- Vyberte filtr Povolené pouze pro použití ve starší verzi.
Migrace starší verze modelu MLflow obsluhované modely na obsluhu modelů
Můžete vytvořit koncový bod obsluhy modelů a pružně přecházet model obsluhující pracovní postupy bez zakázání služby starších modelů MLflow.
Následující kroky ukazují, jak toho dosáhnout pomocí uživatelského rozhraní. Pro každý model, na kterém máte povolenou službu starší verze modelu MLflow:
- Zaregistrujte model do katalogu Unity.
- Na bočním panelu pracovního prostoru strojového učení přejděte na obsluhu koncových bodů.
- Postupujte podle pracovního postupu popsaného v tématu Vytvoření vlastních modelů, který obsluhuje koncové body při vytváření obslužného koncového bodu s vaším modelem.
- Převést aplikaci tak, aby používala novou adresu URL poskytnutou koncovým bodem obsluhy k dotazování modelu spolu s novým formátem bodování.
- Po přechodu modelů můžete přejít na boční panel pracovního prostoru strojového učení na bočním panelu.
- Vyberte model, pro který chcete zakázat poskytování starší verze modelu MLflow.
- Na kartě Obsluha vyberte Zastavit.
- Zobrazí se zpráva, která se zobrazí k potvrzení. Vyberte Přestat obsluhovat.
Migrace nasazených verzí modelu do obsluhy modelů
V předchozích verzích funkce obsluhy modelu se koncový bod obsluhy vytvořil na základě fáze registrované verze modelu: Staging nebo Production. Pokud chcete migrovat obsluhované modely z daného prostředí, můžete toto chování replikovat v novém prostředí pro obsluhu modelů.
Tato část ukazuje, jak vytvořit samostatný model obsluhující koncové body pro Staging verze modelu a Production verze modelu. Následující kroky ukazují, jak toho dosáhnout pomocí rozhraní API pro obsluhu koncových bodů pro každý z vašich obsluhovaných modelů.
V příkladu má registrovaný název modelA modelu verzi 1 ve fázi Production modelu a verzi 2 ve fázi Stagingmodelu .
Vytvořte dva koncové body pro zaregistrovaný model, jeden pro verze modelu a druhý pro
StagingProductionverze modelu.Pro
Stagingverze modelu:POST /api/2.0/serving-endpoints { "name":"modelA-Staging" "config": { "served_entities": [ { "entity_name":"model-A", "entity_version":"2", // Staging Model Version "workload_size":"Small", "scale_to_zero_enabled":true }, ], }, }Pro
Productionverze modelu:POST /api/2.0/serving-endpoints { "name":"modelA-Production" "config": { "served_entities": [ { "entity_name":"model-A", "entity_version":"1", // Production Model Version "workload_size":"Small", "scale_to_zero_enabled":true }, ], }, }Ověřte stav koncových bodů.
Přípravný koncový bod:
GET /api/2.0/serving-endpoints/modelA-StagingPro produkční koncový bod:
GET /api/2.0/serving-endpoints/modelA-ProductionJakmile jsou koncové body připravené, zadejte dotaz na koncový bod pomocí:
Přípravný koncový bod:
POST /serving-endpoints/modelA-Staging/invocationsPro produkční koncový bod:
POST /serving-endpoints/modelA-Production/invocationsAktualizujte koncový bod na základě přechodů verzí modelu.
Ve scénáři, ve kterém je vytvořen nový model verze 3, může model verze 2 přejít na
Production, zatímco model verze 3 může přejít naStaginga model verze 1 přejde naArchived. Tyto změny se dají promítnout do samostatných modelů obsluhujících koncové body následujícím způsobem:V případě koncového bodu
Stagingaktualizujte koncový bod tak, aby používal novou verzi modelu vStaging.PUT /api/2.0/serving-endpoints/modelA-Staging/config { "served_entities": [ { "entity_name":"model-A", "entity_version":"3", // New Staging model version "workload_size":"Small", "scale_to_zero_enabled":true }, ], }V případě koncového bodu
Productionaktualizujte koncový bod tak, aby používal novou verzi modelu vProduction.PUT /api/2.0/serving-endpoints/modelA-Production/config { "served_entities": [ { "entity_name":"model-A", "entity_version":"2", // New Production model version "workload_size":"Small", "scale_to_zero_enabled":true }, ], }