Principy a vytváření dávkových koncových bodů
Pokud chcete získat model pro generování dávkových předpovědí, můžete ho nasadit do dávkového koncového bodu.
Naučíte se používat dávkové koncové body pro asynchronní dávkové vyhodnocování.
Dávkové předpovědi
Pokud chcete získat dávkové předpovědi, můžete model nasadit do koncového bodu. Koncový bod je koncový bod HTTPS, který můžete použít pro aktivaci dávkového vyhodnocení. Výhodou takového koncového bodu je, že můžete aktivovat dávkovou úlohu bodování z jiné služby, jako je Azure Synapse Analytics nebo Azure Databricks. Dávkový koncový bod umožňuje integraci dávkového zpracování s existujícím kanálem pro příjem a transformaci dat.
Při každém vyvolání koncového bodu se úloha dávkového vyhodnocování odešle do pracovního prostoru Azure Machine Learning. Úloha obvykle používá výpočetní klastr k vyhodnocení různých vstupů. Výsledky se dají uložit do úložiště dat připojeného k pracovnímu prostoru Azure Machine Learning.
Vytvoření dávkového koncového bodu
Pokud chcete model nasadit do dávkového koncového bodu, musíte nejprve vytvořit koncový bod dávky.
K vytvoření dávkového koncového bodu použijete třídu BatchEndpoint. Názvy koncových bodů služby Batch musí být jedinečné v rámci oblasti Azure.
K vytvoření koncového bodu použijte následující příkaz:
# create a batch endpoint
endpoint = BatchEndpoint(
name="endpoint-example",
description="A batch endpoint",
)
ml_client.batch_endpoints.begin_create_or_update(endpoint)
Spropitné
Prozkoumejte referenční dokumentaci k vytvoření dávkového koncového bodu pomocí sady Python SDK v2.
Nasadit model na dávkový koncový bod
Do dávkového koncového bodu můžete nasadit více modelů. Pokaždé, když zavoláte koncový bod dávky, který spustí dávkovou úlohu bodování, použije se výchozí nasazení, pokud neuvedete jinak.
Použití výpočetních clusterů pro dávkové nasazení
Ideální výpočetní prostředí, které se má použít pro dávkové nasazení, je výpočetní cluster Azure Machine Learning. Pokud chcete, aby úloha dávkového bodování zpracovávala nová data v paralelních dávkách, musíte zřídit výpočetní cluster s více než jednou maximální instancí.
K vytvoření výpočetního clusteru můžete použít třídu AMLCompute.
from azure.ai.ml.entities import AmlCompute
cpu_cluster = AmlCompute(
name="aml-cluster",
type="amlcompute",
size="STANDARD_DS11_V2",
min_instances=0,
max_instances=4,
idle_time_before_scale_down=120,
tier="Dedicated",
)
cpu_cluster = ml_client.compute.begin_create_or_update(cpu_cluster)