Distribuzioni rapide per i modelli che servono gli endpoint

Questo articolo descrive come usare distribuzioni rapide nei modelli che servono gli endpoint. Le distribuzioni rapide diminuiscono notevolmente i tempi di distribuzione e mantengono l'ambiente di gestione del modello uguale all'ambiente di training del modello.

Annotazioni

Le distribuzioni Rapide sono state precedentemente chiamate distribuzioni ottimizzate senza server.

Cosa sono le distribuzioni rapide?

Le distribuzioni Express sfruttano la creazione di pacchetti e la preparazione degli artefatti del modello negli ambienti notebook serverless durante la registrazione del modello, consentendo una distribuzione più rapida degli endpoint e ambienti coerenti tra addestramento e serving.

Ciò differisce dalle distribuzioni non rapide, in cui gli artefatti e gli ambienti del modello vengono inseriti in contenitori in fase di distribuzione. In questi casi, l'ambiente di gestione potrebbe non corrispondere a quello usato durante il training del modello.

Requirements

Gli endpoint di distribuzione Rapida hanno gli stessi requisiti dell'endpoint di gestione del modello (vedere Requisiti). In aggiunta:

Il modello deve essere un modello personalizzato (non FMAPI)
Il modello deve essere registrato e loggato in un notebook serverless usando la versione 3 o 4
Il modello deve essere tracciato e registrato con mlflow>=3.1
Il modello deve essere registrato in UC e servito con CPU
La dimensione massima dell'ambiente del modello è 1 GB

Uso di distribuzioni rapide

Quando si registra e si registra un modello, usare un notebook serverless con client 3 o 4 e mlflow>=3.1.

Per modificare la versione client dell'ambiente serverless, vedere Configurare l'ambiente serverless.

Quindi, quando si registra un modello, impostare il env_pack parametro con i valori desiderati.

import mlflow
from mlflow.utils.env_pack import EnvPackConfig

mlflow.register_model(
    model_info.model_uri,
    model_name,
    env_pack=EnvPackConfig(name="databricks_model_serving")
)

L'aggiunta del parametro env_pack consentirà alla funzione di impacchettare e preparare gli artefatti del modello e l'ambiente notebook serverless durante la registrazione del modello per renderlo pronto all'uso durante la distribuzione. Questo può richiedere tempo aggiuntivo rispetto alla registrazione del modello senza env_pack.

EnvPackConfig ha un parametro install_dependencies (True per impostazione predefinita) che determina se le dipendenze del modello sono installate nell'ambiente corrente per verificare che l'ambiente sia valido. Se si vuole ignorare questo passaggio, impostare il valore su False.

Annotazioni

Gli endpoint nelle aree di lavoro senza accesso a Internet o endpoint con dipendenze da librerie personalizzate potrebbero non riuscire se install_dependencies è impostato su True. In questi casi, impostare install_dependencies su False.

È anche possibile sostituire EnvPackConfig(...) con "databricks_model_serving" come abbreviato. che equivale a EnvPackConfig(name="databricks_model_serving", install_dependencies = True).

Al termine della registrazione del modello, è possibile distribuire il modello nella gestione del modello. Notare che il tempo di distribuzione è ridotto e i registri degli eventi non indicano più la compilazione del contenitore.

Commenti e suggerimenti

Questa pagina è stata utile?

Last updated on 2026-06-01