Sdílet prostřednictvím


Shromažďování dat z modelů v produkčním prostředí

PLATÍ PRO:Rozšíření Azure CLI ml v2 (aktuální)Python SDK azure-ai-ml v2 (aktuální)

V tomto článku se dozvíte o shromažďování dat z modelů nasazených do online koncových bodů služby Azure Machine Learning.

Kolektor dat Služby Azure Machine Learning poskytuje protokolování vstupních a výstupních dat z modelů nasazených do spravovaných online koncových bodů nebo online koncových bodů Kubernetes. Azure Machine Learning ukládá protokolovaná data odvozování do úložiště objektů blob v Azure. Tato data se pak dají bezproblémově použít k monitorování, ladění nebo auditování modelů, což poskytuje pozorovatelnost výkonu nasazených modelů.

Kolektor dat poskytuje:

  • Protokolování dat odvozování do centrálního umístění (Azure Blob Storage)
  • Podpora spravovaných online koncových bodů a online koncových bodů Kubernetes
  • Definice na úrovni nasazení umožňující maximální změny konfigurace
  • Podpora datové části i vlastního protokolování

Režimy protokolování

Kolektor dat poskytuje dva režimy protokolování: protokolování datové části a vlastní protokolování. Protokolování datové části umožňuje shromažďovat data datové části požadavku HTTP a odpovědi z nasazených modelů. Díky vlastnímu protokolování poskytuje Azure Machine Learning sadu Python SDK pro protokolování datových rámců pandas přímo ze skriptu bodování. Pomocí vlastního protokolování sady Python SDK můžete kromě dat před, během a po všech transformacích dat (nebo předzpracování) protokolovat také vstupní a výstupní data modelu.

Konfigurace kolektoru dat

Kolektor dat je možné nakonfigurovat na úrovni nasazení a konfigurace se zadává v době nasazení. Můžete nakonfigurovat cíl úložiště objektů blob v Azure, který bude přijímat shromážděná data. Můžete také nakonfigurovat vzorkovací frekvenci (od 0 do 100 %) dat, která se mají shromažďovat.

Omezení

Kolektor dat má následující omezení:

  • Kolektor dat podporuje protokolování jenom pro koncové body služby Azure Machine Learning (spravované nebo Kubernetes) online (nebo v reálném čase).
  • Sada Python SDK kolektoru dat podporuje protokolování tabulkových dat pouze prostřednictvím datových rámců pandas.