Monitorowanie wydajności modeli wdrożonych w środowisku produkcyjnym

DOTYCZY: Rozszerzenie interfejsu wiersza polecenia platformy Azure w wersji 2 (current)Zestaw PYTHON SDK azure-ai-ml v2 (bieżąca)

W usłudze Azure Machine Learning można używać monitorowania modeli do ciągłego śledzenia wydajności modeli uczenia maszynowego w środowisku produkcyjnym. Monitorowanie modelu zapewnia szeroki zakres sygnałów obserwacyjnych. Ostrzega również o potencjalnych problemach. Podczas monitorowania sygnałów i metryk wydajności modeli w środowisku produkcyjnym można ocenić krytyczne ryzyko związane z modelami. Możesz również zidentyfikować martwe punkty, które mogą niekorzystnie wpłynąć na Twoją firmę.

W tym artykule przedstawiono sposób wykonywania następujących zadań:

Konfigurowanie wbudowanego i zaawansowanego monitorowania modeli wdrożonych w punktach końcowych online Azure Machine Learning
Monitorowanie metryk wydajności modeli w środowisku produkcyjnym
Monitorowanie modeli wdrożonych poza usługą Azure Machine Learning lub wdrożonych w punktach końcowych usługi Azure Machine Learning wsadowych
Konfigurowanie niestandardowych sygnałów i metryk do użycia w monitorowaniu modelu
Interpretowanie wyników monitorowania
Integrowanie monitorowania modelu usługi Azure Machine Learning z usługą Azure Event Grid

Wymagania wstępne

Interfejs wiersza polecenia platformy Azure i ml rozszerzenie interfejsu wiersza polecenia platformy Azure, zainstalowane i skonfigurowane. Aby uzyskać więcej informacji, zobacz Instalowanie i konfigurowanie interfejsu wiersza polecenia (wersja 2).
Powłoka Bash lub zgodna powłoka, taka jak powłoka w systemie Linux lub Podsystem Windows dla systemu Linux. Przykłady Azure CLI w tym artykule przyjmują, że używasz tego typu powłoki.
Obszar roboczy usługi Azure Machine Learning. Aby uzyskać instrukcje dotyczące tworzenia obszaru roboczego, zobacz Konfigurowanie.

Obszar roboczy usługi Azure Machine Learning. Aby uzyskać instrukcje dotyczące tworzenia obszaru roboczego, zobacz Tworzenie obszaru roboczego.
Zestaw SDK usługi Azure Machine Learning dla języka Python w wersji 2. Aby zainstalować zestaw SDK, użyj następującego polecenia:
```
pip install azure-ai-ml azure-identity
```
Aby zaktualizować istniejącą instalację zestawu SDK do najnowszej wersji, użyj następującego polecenia:
```
pip install --upgrade azure-ai-ml azure-identity
```
Aby uzyskać więcej informacji, zobacz Azure Machine Learning Package client library for Python.

Konto użytkownika, które ma co najmniej jedną z następujących ról kontroli dostępu na podstawie ról (RBAC) platformy Azure:
- Rola właściciela obszaru roboczego usługi Azure Machine Learning
- Rola Współautor dla obszaru roboczego usługi Azure Machine Learning
- Rola niestandardowa, która ma Microsoft.MachineLearningServices/workspaces/onlineEndpoints/* uprawnienia
Aby uzyskać więcej informacji, zobacz Zarządzanie dostępem do obszarów roboczych usługi Azure Machine Learning.
Aby monitorować punkt końcowy online zarządzany przez usługę Azure Machine Learning lub punkt końcowy online platformy Kubernetes:
- Model wdrożony w punkcie końcowym online usługi Azure Machine Learning. Zarządzane punkty końcowe online i punkty końcowe online Kubernetes są wspierane. Aby uzyskać instrukcje dotyczące wdrażania modelu w punkcie końcowym online usługi Azure Machine Learning, zobacz Wdrażanie i ocenianie modelu uczenia maszynowego przy użyciu punktu końcowego online.
- Zbieranie danych dla Twojego wdrożenia modelu jest włączone. Zbieranie danych można włączyć podczas kroku wdrażania dla punktów końcowych online usługi Azure Machine Learning. Aby uzyskać więcej informacji, zobacz Zbieranie danych produkcyjnych z modeli wdrożonych na potrzeby wnioskowania w czasie rzeczywistym.
Aby monitorować model wdrożony w punkcie końcowym wsadowym usługi Azure Machine Learning lub wdrożony poza usługą Azure Machine Learning:
- Sposób zbierania danych produkcyjnych i rejestrowania ich jako zasobu danych usługi Azure Machine Learning
- Metoda ciągłego aktualizowania zarejestrowanego zasobu danych na potrzeby monitorowania modelu
- (Zalecane) Rejestracja modelu w obszarze roboczym usługi Azure Machine Learning na potrzeby śledzenia pochodzenia

Konfigurowanie bezserwerowej puli obliczeniowej platformy Spark

Zaplanowano uruchamianie zadań monitorowania modelu w bezserwerowych pulach obliczeniowych platformy Spark. Obsługiwane są następujące typy wystąpień usługi Azure Virtual Machines:

Standard_E4s_v3
Standard_E8s_v3
Standard_E16s_v3
Standard_E32s_v3
Standardowa_E64s_v3

Aby określić typ wystąpienia maszyny wirtualnej podczas wykonywania procedur opisanych w tym artykule, wykonaj następujące czynności:

Podczas tworzenia monitora przy użyciu interfejsu wiersza polecenia platformy Azure należy użyć pliku konfiguracji YAML. W tym pliku ustaw create_monitor.compute.instance_type wartość na typ, którego chcesz użyć.

Konfigurowanie gotowego do użycia monitorowania modelu

Rozważmy scenariusz, w którym wdrażasz model w środowisku produkcyjnym w punkcie końcowym online usługi Azure Machine Learning i włączasz zbieranie danych w czasie wdrażania. W takim przypadku usługa Azure Machine Learning zbiera dane wnioskowania produkcyjnego i automatycznie przechowuje je w usłudze Azure Blob Storage. Monitorowanie modelu usługi Azure Machine Learning umożliwia ciągłe monitorowanie tych danych wnioskowania produkcyjnego.

Możesz użyć interfejsu wiersza polecenia platformy Azure, zestawu SDK języka Python lub programu Studio na potrzeby gotowej konfiguracji monitorowania modelu. Konfiguracja monitorowania modelu gotowego do użycia zapewnia następujące możliwości monitorowania:

Usługa Azure Machine Learning automatycznie wykrywa zasób danych wnioskowania produkcyjnego skojarzony z wdrożeniem online usługi Azure Machine Learning i używa zasobu danych do monitorowania modelu.
Zasób danych referencyjnych porównania jest ustawiany jako ostatni, poprzedni zasób danych wnioskowania produkcyjnego.
Konfiguracja monitorowania automatycznie obejmuje i śledzi następujące wbudowane sygnały monitorowania: dryf danych, dryf przewidywania i jakość danych. Dla każdego sygnału monitorowania usługa Azure Machine Learning używa:
- Najnowszy zasób danych dotyczący wnioskowania z wcześniejszej produkcji jako zasób danych referencyjnych do porównań.
- Inteligentne wartości domyślne metryk i progów.
Zadanie monitorowania jest skonfigurowane do uruchamiania zgodnie z regularnym harmonogramem. To zadanie przechwytuje sygnały monitorujące i ocenia każdy rezultat metryki względem odpowiedniego progu. Domyślnie po przekroczeniu dowolnego progu usługa Azure Machine Learning wysyła wiadomość e-mail z alertem do użytkownika, który skonfigurował monitor.

Aby skonfigurować wbudowane monitorowanie modelu, wykonaj następujące kroki.

W interfejsie wiersza polecenia platformy Azure używa się az ml schedule do zaplanowania zadania monitorującego.

Utwórz definicję monitorowania w pliku YAML. Aby zobaczyć przykładową definicję gotową do użycia, zapoznaj się z następującym kodem YAML, który jest również dostępny w repozytorium azureml-examples.

Przed użyciem tej definicji dostosuj wartości, aby dopasować je do środowiska. Dla endpoint_deployment_id użyj wartości w formacie azureml:<endpoint-name>:<deployment-name>.

# out-of-box-monitoring.yaml
$schema:  http://azureml/sdk-2-0/Schedule.json
name: credit_default_model_monitoring
display_name: Credit default model monitoring
description: Credit default model monitoring setup with minimal configurations

trigger:
  # perform model monitoring activity daily at 3:15am
  type: recurrence
  frequency: day #can be minute, hour, day, week, month
  interval: 1 # #every day
  schedule: 
    hours: 3 # at 3am
    minutes: 15 # at 15 mins after 3am

create_monitor:

  compute: # specify a spark compute for monitoring job
    instance_type: standard_e4s_v3
    runtime_version: "3.4"

  monitoring_target: 
    ml_task: classification # model task type: [classification, regression, question_answering]
    endpoint_deployment_id: azureml:credit-default:main # azureml endpoint deployment id

  alert_notification: # emails to get alerts
    emails:
      - abc@example.com
      - def@example.com

Uruchom następujące polecenie, aby utworzyć model:

az ml schedule create -f ./out-of-box-monitoring.yaml

Użyj kodu podobnego do poniższego przykładu. Zastąp następujące symbole zastępcze odpowiednimi wartościami:

Zastępczy element	Opis	Przykład
<identyfikator subskrypcji>	Identyfikator subskrypcji	aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e
<nazwa grupy zasobów>	Nazwa grupy zasobów zawierającej obszar roboczy	moja-grupa-zasobów
<nazwa obszaru roboczego>	Nazwa obszaru roboczego	mój obszar roboczy
<nazwa punktu końcowego>	Nazwa punktu końcowego do monitorowania	credit-default
<nazwa wdrożenia>	Nazwa wdrożenia, które ma być monitorowane	główny
<adres-e-mail-1> i <adres-e-mail-2>	Adresy e-mail do użycia na potrzeby powiadomień	`abc@example.com`
<jednostka częstotliwości>	Jednostka częstotliwości monitorowania	dzień
<przedział>	Interwał między zadaniami wyrażony w jednostce częstotliwości	1
<godzina rozpoczęcia>	Godzina rozpoczęcia monitorowania na zegarze 24-godzinnym	3
<minuty rozpoczęcia>	Minuty po określonej godzinie rozpoczęcia monitorowania	15

from azure.identity import DefaultAzureCredential
from azure.ai.ml import MLClient
from azure.ai.ml.entities import (
    AlertNotification,
    MonitoringTarget,
    MonitorDefinition,
    MonitorSchedule,
    RecurrencePattern,
    RecurrenceTrigger,
    ServerlessSparkCompute
)

# Get a handle to the workspace.
ml_client = MLClient(
    DefaultAzureCredential(),
    subscription_id="<subscription-ID>",
    resource_group_name="<resource-group-name>",
    workspace_name="<workspace-name>",
)

# Create the compute instance.
spark_compute = ServerlessSparkCompute(
    instance_type="standard_e4s_v3",
    runtime_version="3.3"
)

# Specify your online endpoint deployment.
monitoring_target = MonitoringTarget(
    ml_task="classification",
    endpoint_deployment_id="azureml:<endpoint-name>:<deployment-name>"
)

# Create an alert notification object.
alert_notification = AlertNotification(
    emails=['<email-address-1>', '<email-address-2>']
)

# Create the monitor definition.
monitor_definition = MonitorDefinition(
    compute=spark_compute,
    monitoring_target=monitoring_target,
    alert_notification=alert_notification
)

# Specify the schedule frequency.
recurrence_trigger = RecurrenceTrigger(
    frequency="<frequency-unit>",
    interval=<interval>,
    schedule=RecurrencePattern(hours=<start-hour>, minutes=<start-minutes>)
)

# Create the monitoring schedule.
model_monitor = MonitorSchedule(
    name="credit_default_monitor_basic",
    trigger=recurrence_trigger,
    create_monitor=monitor_definition
)

# Schedule the monitoring job.
poller = ml_client.schedules.begin_create_or_update(model_monitor)
created_monitor = poller.result()

Konfigurowanie zaawansowanego monitorowania modelu

Usługa Azure Machine Learning oferuje wiele możliwości ciągłego monitorowania modeli. Aby uzyskać kompleksową listę tych funkcji, zobacz Możliwości monitorowania modeli. W wielu przypadkach należy skonfigurować monitorowanie modelu, które obsługuje zaawansowane zadania monitorowania. Poniższa sekcja zawiera kilka przykładów zaawansowanego monitorowania:

Korzystanie z wielu sygnałów monitorowania dla szerokiego widoku
Użycie historycznych danych trenowania modelu lub danych walidacji jako zasobu danych referencyjnych porównania
Monitorowanie N najważniejszych funkcji i poszczególnych funkcji

Konfigurowanie ważności funkcji

Ważność funkcji reprezentuje względne znaczenie każdej funkcji wejściowej do danych wyjściowych modelu. Na przykład temperatura może być ważniejsza dla prognozy modelu niż wysokość. Po włączeniu istotności cech możesz zapewnić widoczność cech, które nie powinny powodować dryfowania lub problemów z jakością danych w produkcji.

Aby włączyć ważność cechy z dowolnymi sygnałami, takimi jak między innymi dryf danych lub jakość danych, należy podać następujące elementy:

Twój zasób danych szkoleniowych jako reference_data zasób danych.
Właściwość reference_data.data_column_names.target_column , która jest nazwą kolumny wyjściowej modelu lub kolumny przewidywania.

Po włączeniu ważności cechy zobaczysz ważność cechy dla każdej cechy, którą monitorujesz w usłudze Azure Machine Learning Studio.

Alerty można włączać lub wyłączać dla każdego sygnału, ustawiając alert_enabled właściwość podczas korzystania z zestawu SDK języka Python lub interfejsu wiersza polecenia platformy Azure.

Do skonfigurowania zaawansowanego monitorowania modelu można użyć interfejsu wiersza polecenia platformy Azure, zestawu SDK języka Python lub programu Studio.

Utwórz definicję monitorowania w pliku YAML. Aby zapoznać się z przykładową definicją zaawansowaną, zobacz następujący kod YAML, który jest również dostępny w repozytorium azureml-examples.

Przed użyciem tej definicji dostosuj następujące ustawienia i inne, aby spełniały potrzeby środowiska:

Dla endpoint_deployment_id użyj wartości w formacie azureml:<endpoint-name>:<deployment-name>.
W odniesieniu do path sekcji danych wejściowych referencyjnych, należy użyć wartości w formacie azureml:<reference-data-asset-name>:<version>.
W przypadku target_columnelementu użyj nazwy kolumny wyjściowej zawierającej wartości przewidywane przez model, na przykład DEFAULT_NEXT_MONTH.
W przypadku features, wymień funkcje, takie jak SEX, EDUCATION i AGE, które mają być używane w zaawansowanym sygnale jakości danych.
W obszarze emailswyświetl listę adresów e-mail, których chcesz użyć w przypadku powiadomień.

# advanced-model-monitoring.yaml
$schema:  http://azureml/sdk-2-0/Schedule.json
name: fraud_detection_model_monitoring
display_name: Fraud detection model monitoring
description: Fraud detection model monitoring with advanced configurations

trigger:
  # perform model monitoring activity daily at 3:15am
  type: recurrence
  frequency: day #can be minute, hour, day, week, month
  interval: 1 # #every day
  schedule: 
    hours: 3 # at 3am
    minutes: 15 # at 15 mins after 3am

create_monitor:

  compute: 
    instance_type: standard_e4s_v3
    runtime_version: "3.4"

  monitoring_target:
    ml_task: classification
    endpoint_deployment_id: azureml:credit-default:main
  
  monitoring_signals:
    advanced_data_drift: # monitoring signal name, any user defined name works
      type: data_drift
      # reference_dataset is optional. By default referece_dataset is the production inference data associated with Azure Machine Learning online endpoint
      reference_data:
        input_data:
          path: azureml:credit-reference:1 # use training data as comparison reference dataset
          type: mltable
        data_context: training
        data_column_names:
          target_column: DEFAULT_NEXT_MONTH
      features: 
        top_n_feature_importance: 10 # monitor drift for top 10 features
      alert_enabled: true
      metric_thresholds:
        numerical:
          jensen_shannon_distance: 0.01
        categorical:
          pearsons_chi_squared_test: 0.02
    advanced_data_quality:
      type: data_quality
      # reference_dataset is optional. By default reference_dataset is the production inference data associated with Azure Machine Learning online endpoint
      reference_data:
        input_data:
          path: azureml:credit-reference:1
          type: mltable
        data_context: training
      features: # monitor data quality for 3 individual features only
        - SEX
        - EDUCATION
      alert_enabled: true
      metric_thresholds:
        numerical:
          null_value_rate: 0.05
        categorical:
          out_of_bounds_rate: 0.03

    feature_attribution_drift_signal:
      type: feature_attribution_drift
      # production_data: is not required input here
      # Please ensure Azure Machine Learning online endpoint is enabled to collected both model_inputs and model_outputs data
      # Azure Machine Learning model monitoring will automatically join both model_inputs and model_outputs data and used it for computation
      reference_data:
        input_data:
          path: azureml:credit-reference:1
          type: mltable
        data_context: training
        data_column_names:
          target_column: DEFAULT_NEXT_MONTH
      alert_enabled: true
      metric_thresholds:
        normalized_discounted_cumulative_gain: 0.9
  
  alert_notification:
    emails:
      - abc@example.com
      - def@example.com

Uruchom następujące polecenie, aby utworzyć model:

az ml schedule create -f ./advanced-model-monitoring.yaml

Aby skonfigurować zaawansowane monitorowanie modelu, użyj kodu podobnego do poniższego przykładu. Zastąp następujące symbole zastępcze odpowiednimi wartościami:

Zastępczy element	Opis	Przykład
<identyfikator subskrypcji>	Identyfikator subskrypcji	aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e
<nazwa grupy zasobów>	Nazwa grupy zasobów zawierającej obszar roboczy	moja-grupa-zasobów
<nazwa obszaru roboczego>	Nazwa obszaru roboczego	mój obszar roboczy
<nazwa punktu końcowego>	Nazwa punktu końcowego do monitorowania	credit-default
<nazwa wdrożenia>	Nazwa wdrożenia, które ma być monitorowane	główny
<nazwa zasobu danych produkcyjnych>	Nazwa zasobu danych zawierającego dane produkcyjne	model_wejścia-główne_kredytu-domyślne
<nazwa-zasobu-danych-referencyjnych>	Nazwa zasobu danych zawierającego dane referencyjne	credit-default-reference
<kolumna docelowa>	Nazwa kolumny wyjściowej zawierającej wartości przewidywane przez model	NASTĘPNY_MIESIĄC_DOMYŚLNIE
<feature-1>, <feature-2> i <feature-3>	Funkcje, które mają być używane w zaawansowanym sygnałie jakości danych	WIEK
<adres-e-mail-1> i <adres-e-mail-2>	Adresy e-mail do użycia na potrzeby powiadomień	`abc@example.com`
<jednostka częstotliwości>	Jednostka częstotliwości monitorowania	dzień
<przedział>	Interwał między zadaniami wyrażony w jednostce częstotliwości	1
<godzina rozpoczęcia>	Godzina rozpoczęcia monitorowania na zegarze 24-godzinnym	3
<minuty rozpoczęcia>	Minuty po określonej godzinie rozpoczęcia monitorowania	15

from azure.identity import DefaultAzureCredential
from azure.ai.ml import Input, MLClient
from azure.ai.ml.constants import (
    MonitorDatasetContext,
)
from azure.ai.ml.entities import (
    AlertNotification,
    BaselineDataRange,
    DataDriftSignal,
    DataQualitySignal,
    PredictionDriftSignal,
    DataDriftMetricThreshold,
    DataQualityMetricThreshold,
    FeatureAttributionDriftMetricThreshold,
    FeatureAttributionDriftSignal,
    PredictionDriftMetricThreshold,
    NumericalDriftMetrics,
    CategoricalDriftMetrics,
    DataQualityMetricsNumerical,
    DataQualityMetricsCategorical,
    MonitorFeatureFilter,
    MonitoringTarget,
    MonitorDefinition,
    MonitorSchedule,
    RecurrencePattern,
    RecurrenceTrigger,
    ServerlessSparkCompute,
    ReferenceData,
    ProductionData
)

# Get a handle to the workspace.
ml_client = MLClient(
    DefaultAzureCredential(),
    subscription_id="<subscription-ID>",
    resource_group_name="<resource-group-name>",
    workspace_name="<workspace-name>",
)

# Create a compute instance.
spark_compute = ServerlessSparkCompute(
    instance_type="standard_e4s_v3",
    runtime_version="3.3"
)

# Specify the online deployment if you have one.
monitoring_target = MonitoringTarget(
    ml_task="classification",
    endpoint_deployment_id="azureml:<endpoint-name>:<deployment-name>"
)

# Specify a look-back window size and offset to use. Omit this line to use the default values, which are listed in the documentation.
data_window = BaselineDataRange(lookback_window_size="P1D", lookback_window_offset="P0D")

# Set up the production data.
production_data = ProductionData(
    input_data=Input(
        type="uri_folder",
        path="azureml:<production-data-asset-name>:1"
    ),
    data_window=data_window,
    data_context=MonitorDatasetContext.MODEL_INPUTS,
)

# Set up the training data to use as a reference data asset.
reference_data_training = ReferenceData(
    input_data=Input(
        type="mltable",
        path="azureml:<reference-data-asset-name>:1"
    ),
    data_column_names={
        "target_column":"<target-column>"
    },
    data_context=MonitorDatasetContext.TRAINING,
)

# Create an advanced data drift signal.
features = MonitorFeatureFilter(top_n_feature_importance=10)

metric_thresholds = DataDriftMetricThreshold(
    numerical=NumericalDriftMetrics(
        jensen_shannon_distance=0.01
    ),
    categorical=CategoricalDriftMetrics(
        pearsons_chi_squared_test=0.02
    )
)

advanced_data_drift = DataDriftSignal(
    reference_data=reference_data_training,
    features=features,
    metric_thresholds=metric_thresholds,
    alert_enabled=True
)

# Create an advanced prediction drift signal.
metric_thresholds = PredictionDriftMetricThreshold(
    categorical=CategoricalDriftMetrics(
        jensen_shannon_distance=0.01
    )
)

advanced_prediction_drift = PredictionDriftSignal(
    reference_data=reference_data_training,
    metric_thresholds=metric_thresholds,
    alert_enabled=True
)

# Create an advanced data quality signal.
features = ['<feature-1>', '<feature-2>', '<feature-3>']

metric_thresholds = DataQualityMetricThreshold(
    numerical=DataQualityMetricsNumerical(
        null_value_rate=0.01
    ),
    categorical=DataQualityMetricsCategorical(
        out_of_bounds_rate=0.02
    )
)

advanced_data_quality = DataQualitySignal(
    reference_data=reference_data_training,
    features=features,
    metric_thresholds=metric_thresholds,
    alert_enabled=True
)

# Create a feature attribution drift signal.
metric_thresholds = FeatureAttributionDriftMetricThreshold(normalized_discounted_cumulative_gain=0.9)

feature_attribution_drift = FeatureAttributionDriftSignal(
    reference_data=reference_data_training,
    metric_thresholds=metric_thresholds,
    alert_enabled=True
)

# Put all monitoring signals in a dictionary.
monitoring_signals = {
    'data_drift_advanced':advanced_data_drift,
    'data_quality_advanced':advanced_data_quality,
    'feature_attribution_drift':feature_attribution_drift,
}

# Create an alert notification object.
alert_notification = AlertNotification(
    emails=['<email-address-1>', '<email-address-2>']
)

# Create the monitor definition.
monitor_definition = MonitorDefinition(
    compute=spark_compute,
    monitoring_target=monitoring_target,
    monitoring_signals=monitoring_signals,
    alert_notification=alert_notification
)

# Specify the schedule frequency.
recurrence_trigger = RecurrenceTrigger(
    frequency="<frequency-unit>",
    interval=<interval>,
    schedule=RecurrencePattern(hours=<start-hour>, minutes=<start-minutes>)
)

# Create the monitoring schedule.
model_monitor = MonitorSchedule(
    name="credit_default_monitor_advanced",
    trigger=recurrence_trigger,
    create_monitor=monitor_definition
)

# Schedule the monitoring job.
poller = ml_client.schedules.begin_create_or_update(model_monitor)
created_monitor = poller.result()

Konfigurowanie monitorowania wydajności modelu

W przypadku korzystania z monitorowania modelu usługi Azure Machine Learning można śledzić wydajność modeli w środowisku produkcyjnym, obliczając ich metryki wydajności. Obecnie obsługiwane są następujące metryki wydajności modelu:

W przypadku modeli klasyfikacji:
- Dokładność
- Dokładność
- Odwołaj
W przypadku modeli regresji:
- Średni błąd bezwzględny (MAE)
- Błąd średniokwadratowy (MSE)
- Błąd średniokwadratowy (RMSE)

Wymagania wstępne dotyczące monitorowania wydajności modelu

Dane wyjściowe dla modelu produkcyjnego (przewidywania modelu) z unikatowym identyfikatorem dla każdego wiersza. Jeśli używasz modułu zbierającego dane Azure Machine Learning do zbierania danych produkcyjnych, dla każdego żądania wnioskowania zostanie Ci podany identyfikator korelacji. Moduł zbierający dane oferuje również możliwość rejestrowania własnego unikatowego identyfikatora z aplikacji.

Uwaga

W przypadku monitorowania wydajności modelu usługi Azure Machine Learning zalecamy, aby użyć kolektora danych Azure Machine Learning do rejestrowania unikatowego identyfikatora we własnej kolumnie.
Dane referencyjne (wartości rzeczywiste) z unikatowym identyfikatorem dla każdego wiersza. Unikatowy identyfikator danego wiersza powinien być zgodny z unikatowym identyfikatorem danych wyjściowych modelu dla tego konkretnego żądania wnioskowania. Ten unikatowy identyfikator służy do łączenia danych rzeczywistych z danymi wyjściowymi modelu.

Jeżeli nie masz danych rzeczywistych, nie możesz przeprowadzać monitorowania efektywności modelu. Rzeczywiste dane są napotykane na poziomie aplikacji, więc Twoim obowiązkiem jest ich zbieranie, gdy będą dostępne. Należy również zachować zasób danych w usłudze Azure Machine Learning, który zawiera te podstawowe dane prawdy.
(Opcjonalnie) Wstępnie złączony zasób danych tabelarycznych z wynikami modelu i danymi rzeczywistymi już połączonymi razem.

Wymagania dotyczące monitorowania wydajności modelu podczas korzystania z modułu zbierającego dane

Usługa Azure Machine Learning generuje identyfikator korelacji dla Użytkownika, gdy spełniasz następujące kryteria:

Używasz kolektora danych Azure Machine Learning do zbierania danych dotyczących produkcji i wnioskowania.
Nie podajesz własnego unikatowego identyfikatora dla każdego wiersza jako oddzielnej kolumny.

Wygenerowany identyfikator korelacji jest uwzględniony w rejestrowanym obiekcie JSON. Moduł zbierający dane grupuje jednak wiersze wysyłane w krótkim odstępie czasu. W tym samym obiekcie JSON znajdują się wiersze wsadowe. W każdym obiekcie wszystkie wiersze mają ten sam identyfikator korelacji.

Aby rozróżnić wiersze w obiekcie JSON, monitorowanie wydajności modelu usługi Azure Machine Learning używa indeksowania w celu określenia kolejności wierszy w obiekcie. Jeśli na przykład partia zawiera trzy wiersze, a identyfikator korelacji to test, pierwszy wiersz ma identyfikator test_0, drugi wiersz ma identyfikator test_1, a trzeci wiersz ma identyfikator test_2. Aby dopasować unikatowe identyfikatory danych podstawowych do identyfikatorów zebranych danych wyjściowych modelu produkcyjnego wnioskowania, należy odpowiednio zastosować indeks do każdego identyfikatora korelacji. Jeśli zarejestrowany obiekt JSON ma tylko jeden wiersz, użyj correlationid_0 jako wartości correlationid.

Aby uniknąć używania tego indeksowania, zalecamy zarejestrowanie unikalnego identyfikatora w oddzielnej kolumnie. Umieść tę kolumnę w ramce danych pandas, zapisywanej przez moduł zbierania danych usługi Azure Machine Learning. W konfiguracji monitorowania modelu można następnie określić nazwę tej kolumny, aby połączyć dane wyjściowe modelu z danymi rzeczywistymi. Tak długo, jak identyfikatory wierszy w obu zasobach danych są takie same, monitorowanie modelu Azure Machine Learning może przeprowadzać monitorowanie wydajności modeli.

Przykładowy przepływ pracy monitorowania wydajności modelu

Aby zrozumieć pojęcia związane z monitorowaniem wydajności modelu, rozważ poniższy przykładowy przepływ pracy. Dotyczy scenariusza, w którym wdrażasz model w celu przewidywania, czy transakcje kart kredytowych są fałszywe:

Skonfiguruj wdrożenie tak, aby używało modułu zbierającego dane w celu zbierania danych wnioskowania produkcyjnego modelu (danych wejściowych i wyjściowych). Zapisz dane wyjściowe w kolumnie o nazwie is_fraud.
Dla każdego wiersza zebranych danych wnioskowania zarejestruj unikatowy identyfikator. Unikatowy identyfikator może pochodzić z aplikacji lub użyć correlationid wartości, którą usługa Azure Machine Learning unikatowo generuje dla każdego zarejestrowanego obiektu JSON.
Gdy dostępne są dane rzeczywiste, is_fraud zarejestruj i zamapuj każdy wiersz na ten sam unikatowy identyfikator, który jest logowany dla odpowiedniego wiersza w danych wyjściowych modelu.
Zarejestruj zasób danych w usłudze Azure Machine Learning i użyj go do zbierania oraz zarządzania danymi prawdziwymi is_fraud.
Utwórz sygnał monitorowania wydajności modelu, który wykorzystuje unikatowe kolumny identyfikatorów do łączenia wyników inferencji modelu z rzeczywistymi danymi prawdziwymi.
Oblicz metryki wydajności modelu.

Po spełnieniu wymagań wstępnych dotyczących monitorowania wydajności modelu wykonaj następujące kroki, aby skonfigurować monitorowanie modelu:

Utwórz definicję monitorowania w pliku YAML. Poniższa przykładowa specyfikacja definiuje monitorowanie modelu przy użyciu danych wnioskowania produkcyjnego. Przed użyciem tej definicji dostosuj następujące ustawienia i inne, aby spełniały potrzeby środowiska:

Dla endpoint_deployment_id użyj wartości w formacie azureml:<endpoint-name>:<deployment-name>.
Dla każdej path wartości w sekcji danych wejściowych użyj wartości w formacie azureml:<data-asset-name>:<version>.
prediction Dla wartości użyj nazwy kolumny wyjściowej zawierającej wartości przewidywane przez model.
actual Dla wartości użyj nazwy kolumny podstawy prawdy zawierającej rzeczywiste wartości, które próbuje przewidzieć model.
Dla wartości correlation_id użyj nazw kolumn, które są wykorzystywane do łączenia danych wyjściowych z danymi rzeczywistymi.
W obszarze emailswyświetl listę adresów e-mail, których chcesz użyć w przypadku powiadomień.

# model-performance-monitoring.yaml
$schema:  http://azureml/sdk-2-0/Schedule.json
name: model_performance_monitoring
display_name: Credit card fraud model performance
description: Credit card fraud model performance

trigger:
  type: recurrence
  frequency: day
  interval: 7 
  schedule: 
    hours: 10
    minutes: 15

create_monitor:
  compute: 
    instance_type: standard_e8s_v3
    runtime_version: "3.3"
  monitoring_target:
    ml_task: classification
    endpoint_deployment_id: azureml:loan-approval-endpoint:loan-approval-deployment

  monitoring_signals:
    fraud_detection_model_performance: 
      type: model_performance 
      production_data:
        input_data:
          path: azureml:credit-default-main-model_outputs:1
          type: mltable
        data_column_names:
          prediction: is_fraud
          correlation_id: correlation_id
      reference_data:
        input_data:
          path: azureml:my_model_ground_truth_data:1
          type: mltable
        data_column_names:
          actual: is_fraud
          correlation_id: correlation_id
        data_context: ground_truth
      alert_enabled: true
      metric_thresholds: 
        tabular_classification:
          accuracy: 0.95
          precision: 0.8
  alert_notification: 
      emails: 
        - abc@example.com

Uruchom następujące polecenie, aby utworzyć model:

az ml schedule create -f ./model-performance-monitoring.yaml

Po spełnieniu wymagań wstępnych dotyczących monitorowania wydajności modelu użyj następującego kodu w języku Python, aby skonfigurować monitorowanie modelu. Najpierw zastąp następujące symbole zastępcze odpowiednimi wartościami:

Zastępczy element	Opis	Przykład
<identyfikator subskrypcji>	Identyfikator subskrypcji	aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e
<nazwa grupy zasobów>	Nazwa grupy zasobów zawierającej obszar roboczy	moja-grupa-zasobów
<nazwa obszaru roboczego>	Nazwa obszaru roboczego	mój obszar roboczy
<nazwa zasobu danych produkcyjnych>	Nazwa zasobu danych zawierającego dane produkcyjne	model_wejścia-główne_kredytu-domyślne
<kolumna-cel-produkcyjny>	Nazwa kolumny produkcyjnej zawierającej wartości przewidywane przez model	NASTĘPNY_MIESIĄC_DOMYŚLNIE
<kolumna sprzężenia produkcyjnego>	Nazwa kolumny produkcyjnej używana do łączenia danych produkcyjnych i danych referencyjnych	correlationid
<nazwa zasobu danych referencyjnych>	Nazwa zasobu danych zawierającego dane rzeczywiste	prawda podstawowa kredytu
<kolumna-cele-rzeczywiste>	Nazwa kolumny podstawowej prawdy, która zawiera rzeczywiste dane, które model próbuje przewidzieć	prawdziwe dane
<kolumna-połączenia-dane-rzeczywiste>	Nazwa podstawowej kolumny prawdy używanej do łączenia danych produkcyjnych i podstawowych danych prawdy	correlationid
<adres-e-mail-1> i <adres-e-mail-2>	Adresy e-mail do użycia na potrzeby powiadomień	`abc@example.com`
<jednostka częstotliwości>	Jednostka częstotliwości monitorowania	dzień
<przedział>	Interwał między zadaniami wyrażony w jednostce częstotliwości	1
<godzina rozpoczęcia>	Godzina rozpoczęcia monitorowania na zegarze 24-godzinnym	3
<minuty rozpoczęcia>	Minuty po określonej godzinie rozpoczęcia monitorowania	15

from azure.identity import DefaultAzureCredential
from azure.ai.ml import Input, MLClient
from azure.ai.ml.constants import (
    MonitorDatasetContext,
)
from azure.ai.ml.entities import (
    AlertNotification,
    BaselineDataRange,
    ModelPerformanceMetricThreshold,
    ModelPerformanceSignal,
    ModelPerformanceClassificationThresholds,
    MonitoringTarget,
    MonitorDefinition,
    MonitorSchedule,
    RecurrencePattern,
    RecurrenceTrigger,
    ServerlessSparkCompute,
    ReferenceData,
    ProductionData
)

# Get a handle to the workspace.
ml_client = MLClient(
    DefaultAzureCredential(),
    subscription_id="<subscription-ID>",
    resource_group_name="<resource-group-name>",
    workspace_name="<workspace-name>",
)

# Create a compute instance.
spark_compute = ServerlessSparkCompute(
    instance_type="standard_e4s_v3",
    runtime_version="3.3"
)

# Specify the type of the model task.
monitoring_target = MonitoringTarget(
    ml_task="classification",
)

# Specify production data that the model data collector generates. 
production_data = ProductionData(
    input_data=Input(
        type="uri_folder",
        path="azureml:<production-data-asset-name>:1"
    ),
    data_column_names={
        "target_column": "<production-target-column>",
        "join_column": "<production-join-column>"
    },
    data_window=BaselineDataRange(
        lookback_window_offset="P0D",
        lookback_window_size="P10D",
    )
)

# Specify the ground truth reference data.
reference_data_ground_truth = ReferenceData(
    input_data=Input(
        type="mltable",
        path="azureml:<ground-truth-data-asset-name>:1"
    ),
    data_column_names={
        "target_column": "<ground-truth-target-column>",
        "join_column": "<ground-truth-join-column>"
    },
    data_context=MonitorDatasetContext.GROUND_TRUTH_DATA,
)

# Create the model performance signal.
metric_thresholds = ModelPerformanceMetricThreshold(
    classification=ModelPerformanceClassificationThresholds(
        accuracy=0.50,
        precision=0.50,
        recall=0.50
    ),
)

model_performance = ModelPerformanceSignal(
    production_data=production_data,
    reference_data=reference_data_ground_truth,
    metric_thresholds=metric_thresholds,
    alert_enabled=True
)

# Put all monitoring signals in a dictionary.
monitoring_signals = {
    'model_performance':model_performance,
}

# Create an alert notification object.
alert_notification = AlertNotification(
    emails=['<email-address-1>', '<email-address-2>']
)

# Set up the monitor definition.
monitor_definition = MonitorDefinition(
    compute=spark_compute,
    monitoring_target=monitoring_target,
    monitoring_signals=monitoring_signals,
    alert_notification=alert_notification
)

# Specify the schedule frequency.
recurrence_trigger = RecurrenceTrigger(
    frequency="<frequency-unit>",
    interval=<interval>,
    schedule=RecurrencePattern(hours=<start-hour>, minutes=<start-minutes>)
)

# Create the monitoring schedule.
model_monitor = MonitorSchedule(
    name="credit_default_model_performance",
    trigger=recurrence_trigger,
    create_monitor=monitor_definition
)

# Schedule the monitoring job.
poller = ml_client.schedules.begin_create_or_update(model_monitor)
created_monitor = poller.result()

Aby skonfigurować monitorowanie wydajności modelu, wykonaj kroki opisane w poniższych sekcjach.

Konfigurowanie ustawień podstawowych

W usłudze Azure Machine Learning Studio przejdź do obszaru roboczego.
W obszarze Zarządzanie wybierz pozycję Monitorowanie, a następnie wybierz pozycję Dodaj.
Na stronie Ustawienia podstawowe wprowadź informacje zgodnie z opisem we wcześniejszej części Konfigurowanie wbudowanego monitorowania modelu.

Dodawanie zasobów danych

Na stronie Ustawienia podstawowe wybierz pozycję Dalej , aby otworzyć stronę Konfigurowanie zasobu danych w sekcji Ustawienia zaawansowane .
Wybierz Dodaj, a następnie dodaj zasób danych, który chcesz używać jako zasób danych podstawowych. Zasób danych referencyjnych musi mieć unikatową kolumnę identyfikatora. Ponadto wartości w kolumnie unikatowego identyfikatora w zasobie danych prawdy bazowej i w zasobie danych wyjściowych modelu muszą się zgadzać. Te zasoby danych można następnie połączyć przed wykonaniem obliczeń metryk.
Jeśli na liście dodanych zasobów danych danych wyjściowych modelu nie widzisz, wybierz pozycję Dodaj, a następnie dodaj go.

Dodawanie sygnału monitorowania wydajności

Na stronie Konfigurowanie zasobu danych wybierz pozycję Dalej. Otwiera się strona "Wybierz sygnały monitorowania". Jeśli używasz wdrożenia online usługi Azure Machine Learning, zostanie wyświetlona lista sygnałów monitorowania.
Usuń wszystkie sygnały monitorowania widoczne na stronie. Celem tej sekcji jest utworzenie sygnału monitorowania wydajności modelu.
Wybierz Dodaj.
W oknie Edytowanie sygnału wybierz pozycję Wydajność modelu (WERSJA ZAPOZNAWCZA), a następnie wykonaj następujące kroki, aby skonfigurować sygnał wydajności modelu:
1. W kroku 1:
  1. W przypadku zasobu danych produkcyjnych wybierz zasób danych wyjściowych modelu.
  2. Wybierz odpowiednią kolumnę docelową, na przykład DEFAULT_NEXT_MONTH.
  3. Wybierz rozmiar okna odnośnika i przesunięcie, którego chcesz użyć.
2. W kroku 2:
  1. W przypadku zasobu danych referencyjnych wybierz zasób danych odniesienia.
  2. Wybierz kolumnę docelową, na przykład ground_truth.
  3. Wybierz kolumnę, która ma być używana dla sprzężenia z zasobem danych wyjściowych modelu, na przykład correlationid. Oba zasoby danych powinny zawierać kolumnę i powinny zawierać unikatowy identyfikator dla każdego wiersza w zasobie danych.
3. W kroku 3 wybierz metryki wydajności, których chcesz użyć, i określ odpowiednie progi.
Wybierz Zapisz. Na stronie Wybieranie sygnałów monitorowania widoczny jest sygnał wydajności modelu.

Zakończ konfigurację

Na stronie Wybieranie sygnałów monitorowania wybierz pozycję Dalej.
Na stronie Powiadomienia włącz powiadomienia dla sygnału wydajności modelu, a następnie wybierz pozycję Dalej.
Na stronie Przeglądanie ustawień monitorowania przejrzyj ustawienia.
Wybierz pozycję Utwórz , aby utworzyć monitor wydajności modelu.

Konfigurowanie monitorowania modelu danych produkcyjnych

Można również monitorować modele, które wdrażasz do wsadowych punktów końcowych Azure Machine Learning lub które są wdrażane poza usługą Azure Machine Learning. Jeśli nie masz wdrożenia, ale masz dane produkcyjne, możesz użyć tych danych do ciągłego monitorowania modelu. Aby monitorować te modele, musisz mieć możliwość:

Zbieranie danych wnioskowania produkcyjnego z modeli wdrożonych w środowisku produkcyjnym.
Zarejestruj dane wnioskowania produkcyjnego jako zasób danych usługi Azure Machine Learning i zapewnij ciągłe aktualizacje danych.
Podaj niestandardowy składnik przetwarzania wstępnego danych i zarejestruj go jako składnik usługi Azure Machine Learning, jeśli nie używasz modułu zbierającego dane do zbierania danych. Bez tego niestandardowego składnika przetwarzania wstępnego danych system monitorowania modelu usługi Azure Machine Learning nie może przetworzyć danych w formie tabelarycznej, która obsługuje przedziały czasu.

Niestandardowy składnik przetwarzania wstępnego musi mieć następujące podpisy wejściowe i wyjściowe:

Dane wejściowe lub wyjściowe	Nazwa podpisu	Typ	Opis	Przykładowa wartość
dane wejściowe	`data_window_start`	Literału	Godzina rozpoczęcia okna danych w formacie ISO8601	2023-05-01T04:31:57.012Z
dane wejściowe	`data_window_end`	Literału	Godzina zakończenia okna danych w formacie ISO8601	2023-05-01T04:31:57.012Z
dane wejściowe	`input_data`	uri_folder	Zebrane dane wnioskowania produkcyjnego zarejestrowane jako zasób danych usługi Azure Machine Learning	azureml:myproduction_dane_inferencyjne:1
We/Wy	`preprocessed_data`	mltable	Zasób danych tabelarycznych pasujący do podzestawu schematu danych referencyjnych

Aby zapoznać się z przykładem niestandardowego składnika przetwarzania wstępnego danych, zobacz custom_preprocessing w repozytorium GitHub azuremml-examples.

Aby uzyskać instrukcje dotyczące rejestrowania składnika usługi Azure Machine Learning, zobacz Rejestrowanie składnika w obszarze roboczym.

Po zarejestrowaniu danych produkcyjnych i składnika przetwarzania wstępnego można skonfigurować monitorowanie modelu.

Utwórz plik YAML definicji monitorowania podobny do poniższego. Przed użyciem tej definicji dostosuj następujące ustawienia i inne, aby spełniały potrzeby środowiska:

Dla endpoint_deployment_id użyj wartości w formacie azureml:<endpoint-name>:<deployment-name>.
Dla pre_processing_component użyj wartości w formacie azureml:<component-name>:<component-version>. Określ dokładną wersję, taką jak 1.0.0, a nie 1.
Dla każdego pathelementu użyj wartości w formacie azureml:<data-asset-name>:<version>.
target_column Dla wartości użyj nazwy kolumny wyjściowej zawierającej wartości przewidywane przez model.
W obszarze emailswyświetl listę adresów e-mail, których chcesz użyć w przypadku powiadomień.

# model-monitoring-with-collected-data.yaml
$schema:  http://azureml/sdk-2-0/Schedule.json
name: fraud_detection_model_monitoring
display_name: Fraud detection model monitoring
description: Fraud detection model monitoring with your own production data

trigger:
  # perform model monitoring activity daily at 3:15am
  type: recurrence
  frequency: day #can be minute, hour, day, week, month
  interval: 1 # #every day
  schedule: 
    hours: 3 # at 3am
    minutes: 15 # at 15 mins after 3am

create_monitor:
  compute: 
    instance_type: standard_e4s_v3
    runtime_version: "3.4"
  monitoring_target:
    ml_task: classification
    endpoint_deployment_id: azureml:fraud-detection-endpoint:fraud-detection-deployment
  
  monitoring_signals:

    advanced_data_drift: # monitoring signal name, any user defined name works
      type: data_drift
      # define production dataset with your collected data
      production_data:
        input_data:
          path: azureml:my_production_inference_data_model_inputs:1  # your collected data is registered as Azure Machine Learning asset
          type: uri_folder
        data_context: model_inputs
        pre_processing_component: azureml:production_data_preprocessing:1.0.0
      reference_data:
        input_data:
          path: azureml:my_model_training_data:1 # use training data as comparison baseline
          type: mltable
        data_context: training
        data_column_names:
          target_column: is_fraud
      features: 
        top_n_feature_importance: 20 # monitor drift for top 20 features
      alert_enabled: true
      metric_thresholds:
        numerical:
          jensen_shannon_distance: 0.01
        categorical:
          pearsons_chi_squared_test: 0.02

    advanced_prediction_drift: # monitoring signal name, any user defined name works
      type: prediction_drift
      # define production dataset with your collected data
      production_data:
        input_data:
          path: azureml:my_production_inference_data_model_outputs:1  # your collected data is registered as Azure Machine Learning asset
          type: uri_folder
        data_context: model_outputs
        pre_processing_component: azureml:production_data_preprocessing:1.0.0
      reference_data:
        input_data:
          path: azureml:my_model_validation_data:1 # use training data as comparison reference dataset
          type: mltable
        data_context: validation
      alert_enabled: true
      metric_thresholds:
        categorical:
          pearsons_chi_squared_test: 0.02
  
  alert_notification:
    emails:
      - abc@example.com
      - def@example.com

Uruchom następujące polecenie, aby utworzyć model.

az ml schedule create -f ./model-monitoring-with-collected-data.yaml

Użyj skryptu podobnego do poniższego kodu w języku Python, aby skonfigurować monitorowanie modelu. Najpierw zastąp następujące symbole zastępcze odpowiednimi wartościami:

Zastępczy element	Opis	Przykład
<identyfikator subskrypcji\>	Identyfikator subskrypcji	aaaa0a0a-bb1b-cc2c-dd3d-eeeeee4e4e4e
<nazwa-grupy zasobów\>	Nazwa grupy zasobów zawierającej obszar roboczy	moja-grupa-zasobów
<nazwa obszaru roboczego\>	Nazwa obszaru roboczego	mój obszar roboczy
<nazwa-zasobu-danych-produkcyjnych\>	Nazwa zasobu danych zawierającego dane produkcyjne	moje_dane_produkcji_modelu
<preprocessing-component-name\>	Nazwa składnika przetwarzania wstępnego	przetwarzanie_wstępne_danych_produkcyjnych
<nazwa zasobu danych szkoleniowych\>	Nazwa zasobu danych treningowych, którego chcesz użyć jako zasobu danych referencyjnych	dane_treningowe_modelu
<adres-e-mail-1\> i <adres-e-mail-2\>	Adresy e-mail do użycia na potrzeby powiadomień	`abc@example.com`
<jednostka częstotliwości\>	Jednostka częstotliwości monitorowania	dzień
<przedział\>	Interwał między zadaniami wyrażony w jednostce częstotliwości	1
<godzina rozpoczęcia\>	Godzina rozpoczęcia monitorowania na zegarze 24-godzinnym	3
<start-minutes\>	Minuty po określonej godzinie rozpoczęcia monitorowania	15

from azure.identity import InteractiveBrowserCredential
from azure.ai.ml import Input, MLClient
from azure.ai.ml.constants import (
    MonitorFeatureType,
    MonitorMetricName,
    MonitorDatasetContext
)
from azure.ai.ml.entities import (
    AlertNotification,
    DataDriftSignal,
    DataQualitySignal,
    DataDriftMetricThreshold,
    DataQualityMetricThreshold,
    NumericalDriftMetrics,
    CategoricalDriftMetrics,
    DataQualityMetricsNumerical,
    DataQualityMetricsCategorical,
    MonitorFeatureFilter,
    MonitorInputData,
    MonitoringTarget,
    MonitorDefinition,
    MonitorSchedule,
    RecurrencePattern,
    RecurrenceTrigger,
    ServerlessSparkCompute,
    ReferenceData,
    ProductionData
)

# Get a handle to the workspace.
subscription_id = "<subscription-ID>"
resource_group = "<resource-group-name>"
workspace = "<workspace-name>"
ml_client = MLClient(
   InteractiveBrowserCredential(),
   subscription_id,
   resource_group,
   workspace
)

# Specify the compute instance.
spark_compute = ServerlessSparkCompute(
    instance_type="standard_e4s_v3",
    runtime_version="3.3"
)

# Specify the target data asset (the production data asset).
production_data = ProductionData(
    input_data=Input(
        type="uri_folder",
        path="azureml:<production-data-asset-name>:1"
    ),
    data_context=MonitorDatasetContext.MODEL_INPUTS,
    pre_processing_component="azureml:<preprocessing-component-name>:1.0.0"
)

# Specify the training data to use as a reference data asset.
reference_data_training = ReferenceData(
    input_data=Input(
        type="mltable",
        path="azureml:<training-data-asset-name>:1"
    ),
    data_context=MonitorDatasetContext.TRAINING
)

# Create an advanced data drift signal.
features = MonitorFeatureFilter(top_n_feature_importance=20)
metric_thresholds = DataDriftMetricThreshold(
    numerical=NumericalDriftMetrics(
        jensen_shannon_distance=0.01
    ),
    categorical=CategoricalDriftMetrics(
        pearsons_chi_squared_test=0.02
    )
)

advanced_data_drift = DataDriftSignal(
    production_data=production_data,
    reference_data=reference_data_training,
    features=features,
    metric_thresholds=metric_thresholds,
    alert_enabled=True
)

# Create an advanced data quality signal.
features = ['feature_A', 'feature_B', 'feature_C']
metric_thresholds = DataQualityMetricThreshold(
    numerical=DataQualityMetricsNumerical(
        null_value_rate=0.01
    ),
    categorical=DataQualityMetricsCategorical(
        out_of_bounds_rate=0.02
    )
)

advanced_data_quality = DataQualitySignal(
    production_data=production_data,
    reference_data=reference_data_training,
    features=features,
    metric_thresholds=metric_thresholds,
    alert_enabled=True
)

# Put all monitoring signals in a dictionary.
monitoring_signals = {
    'data_drift_advanced': advanced_data_drift,
    'data_quality_advanced': advanced_data_quality
}

# Create an alert notification object.
alert_notification = AlertNotification(
    emails=['<email-address-1>', '<email-address-2>']
)

# Set up the monitor definition.
monitor_definition = MonitorDefinition(
    compute=spark_compute,
    monitoring_signals=monitoring_signals,
    alert_notification=alert_notification
)

# Specify the schedule frequency.
recurrence_trigger = RecurrenceTrigger(
    frequency="<frequency-unit>",
    interval=<interval>,
    schedule=RecurrencePattern(hours=<start-hour>, minutes=<start-minutes>)
)

# Create the monitoring schedule.
model_monitor = MonitorSchedule(
    name="fraud_detection_model_monitoring_advanced",
    trigger=recurrence_trigger,
    create_monitor=monitor_definition
)

# Schedule the monitoring job.
poller = ml_client.schedules.begin_create_or_update(model_monitor)
created_monitor = poller.result()

Konfigurowanie monitorowania modelu przy użyciu niestandardowych sygnałów i metryk

W przypadku korzystania z monitorowania modelu usługi Azure Machine Learning można zdefiniować niestandardowy sygnał i zaimplementować dowolną wybraną metrykę do monitorowania modelu. Możesz zarejestrować niestandardowy sygnał jako składnik usługi Azure Machine Learning. Gdy zadanie monitorowania modelu jest uruchamiane zgodnie z określonym harmonogramem, oblicza metryki zdefiniowane w ramach sygnału niestandardowego, podobnie jak w przypadku dryfu danych, dryfu przewidywania i wstępnie zdefiniowanych sygnałów jakości danych.

Aby skonfigurować niestandardowy sygnał do użycia na potrzeby monitorowania modelu, należy najpierw zdefiniować sygnał niestandardowy i zarejestrować go jako składnik usługi Azure Machine Learning. Składnik usługi Azure Machine Learning musi mieć następujące podpisy wejściowe i wyjściowe.

Podpis wejściowy składnika

Ramka danych wejściowych składnika powinna zawierać następujące elementy:

Struktura zawierająca dane przetworzone przez mltable komponent przetwarzania wstępnego.
Dowolna liczba literałów, z których każda reprezentuje zaimplementowaną metryki w ramach niestandardowego składnika sygnału. Jeśli na przykład zaimplementujesz metrykę std_deviation, potrzebujesz danych wejściowych dla metryki std_deviation_threshold. Generalnie, powinno istnieć jedno dane wejściowe o nazwie <metric-name>_threshold na każdą metrykę.

Nazwa podpisu	Typ	Opis	Przykładowa wartość
`production_data`	mltable	Zasób danych tabelarycznych pasujący do podzestawu schematu danych referencyjnych
`std_deviation_threshold`	Literału	Odpowiedni próg dla zaimplementowanej metryki	2

Podpis wyjściowy składnika

Port wyjściowy składnika powinien mieć następujący podpis:

Nazwa podpisu	Typ	Opis
`signal_metrics`	mltable	Struktura mltable zawierająca obliczone metryki. Aby zapoznać się ze schematem tego podpisu, zobacz następną sekcję signal_metrics schematu.

schemat signal_metrics

Ramka danych wyjściowych składnika powinna zawierać cztery kolumny: group, , metric_namemetric_valuei threshold_value.

Nazwa podpisu	Typ	Opis	Przykładowa wartość
`group`	Literału	Grupowanie logiczne najwyższego poziomu, które należy zastosować do metryki niestandardowej	KWOTA TRANSAKCJI
`metric_name`	Literału	Nazwa metryki niestandardowej	odchylenie_standardowe
`metric_value`	numeryczny	Wartość metryki niestandardowej	44,896.082
`threshold_value`	numeryczny	Próg metryki niestandardowej	2

W poniższej tabeli przedstawiono przykładowe dane wyjściowe z niestandardowego składnika sygnału, który oblicza metrykę std_deviation :

grupa	metric_value	metric_name	wartość progowa
KWOTA TRANSAKCJI	44,896.082	odchylenie_standardowe	2
LOCALHOUR	3.983	odchylenie_standardowe	2
KWOTATRANSAKCJIUSD	54 004,902	odchylenie_standardowe	2
DIGITALITEMCOUNT	7.238	odchylenie_standardowe	2
Fizyczna Ilość Przedmiotów	5.509	odchylenie_standardowe	2

Aby zapoznać się z przykładem niestandardowej definicji składnika sygnału i kodu obliczeniowego metryki, zobacz custom_signal w repozytorium azureml-examples.

Aby uzyskać instrukcje dotyczące rejestrowania składnika usługi Azure Machine Learning, zobacz Rejestrowanie składnika w obszarze roboczym.

Po utworzeniu i zarejestrowaniu niestandardowego składnika sygnału w usłudze Azure Machine Learning wykonaj następujące kroki, aby skonfigurować monitorowanie modelu:

Utwórz definicję monitorowania w pliku YAML podobnym do poniższego. Przed użyciem tej definicji dostosuj następujące ustawienia i inne, aby spełniały potrzeby środowiska:

Dla component_id użyj wartości w formacie azureml:<custom-signal-name>:1.0.0.
W sekcji path danych wejściowych użyj wartości w formacie azureml:<production-data-asset-name>:<version>.
Dla elementu pre_processing_component:
- Jeśli używasz modułu zbierającego dane do zbierania danych, możesz pominąć pre_processing_component właściwość .
- Jeśli nie używasz modułu zbierającego dane i chcesz użyć składnika do wstępnego przetwarzania danych produkcyjnych, użyj wartości w formacie azureml:<custom-preprocessor-name>:<custom-preprocessor-version>.
W obszarze emailswyświetl listę adresów e-mail, których chcesz użyć w przypadku powiadomień.

# custom-monitoring.yaml
$schema:  http://azureml/sdk-2-0/Schedule.json
name: my-custom-signal
trigger:
  type: recurrence
  frequency: day # Possible frequency values include "minute," "hour," "day," "week," and "month."
  interval: 7 # Monitoring runs every day when you use the value 1.
create_monitor:
  compute:
    instance_type: "standard_e4s_v3"
    runtime_version: "3.3"
  monitoring_signals:
    customSignal:
      type: custom
      component_id: azureml:my_custom_signal:1.0.0
      input_data:
        production_data:
          input_data:
            type: uri_folder
            path: azureml:my_production_data:1
          data_context: test
          data_window:
            lookback_window_size: P30D
            lookback_window_offset: P7D
          pre_processing_component: azureml:custom_preprocessor:1.0.0
      metric_thresholds:
        - metric_name: std_deviation
          threshold: 2
  alert_notification:
    emails:
      - abc@example.com

Uruchom następujące polecenie, aby utworzyć model:
```
az ml schedule create -f ./custom-monitoring.yaml
```

Interpretowanie wyników monitorowania

Po skonfigurowaniu monitora modelu i zakończeniu pierwszego uruchomienia możesz wyświetlić wyniki w usłudze Azure Machine Learning Studio.

W studio w obszarze Zarządzanie wybierz pozycję Monitorowanie. Na stronie Monitorowanie wybierz nazwę monitora modelu, aby wyświetlić jego stronę przeglądu. Na tej stronie przedstawiono model monitorowania, punkt końcowy i wdrożenie. Zawiera on również szczegółowe informacje o skonfigurowanych sygnałach. Na poniższej ilustracji przedstawiono stronę przeglądu monitorowania zawierającą sygnały dotyczące dryfu danych i jakości danych.
Zapoznaj się z sekcją Powiadomienia na stronie przeglądu. W tej sekcji można zobaczyć funkcję dla każdego sygnału, który narusza skonfigurowany próg dla odpowiedniej metryki.
W sekcji Sygnały wybierz pozycję data_drift , aby wyświetlić szczegółowe informacje na temat sygnału dryfu danych. Na stronie szczegółów można zobaczyć wartość metryki dryfu danych dla każdej funkcji liczbowej i kategorii uwzględnionej przez konfigurację monitorowania. Jeśli monitor ma więcej niż jedną sesję, zobaczysz linię trendu dla każdej cechy.
Na stronie szczegółów wybierz nazwę pojedynczej funkcji. Zostanie otwarty szczegółowy widok przedstawiający dystrybucję produkcyjną w porównaniu z dystrybucją referencyjną. Możesz również użyć tego widoku do śledzenia dryfu w czasie dla funkcji.
Wróć do strony przeglądu monitorowania. W sekcji Sygnały wybierz pozycję data_quality , aby wyświetlić szczegółowe informacje o tym sygnałie. Na tej stronie można zobaczyć współczynniki wartości null, wartości poza granicami oraz współczynniki błędów typów danych dla każdej monitorowanej cechy.

Monitorowanie modelu jest procesem ciągłym. W przypadku korzystania z monitorowania modelu usługi Azure Machine Learning można skonfigurować wiele sygnałów monitorowania w celu uzyskania szerokiego wglądu w wydajność modeli w środowisku produkcyjnym.

Integrowanie monitorowania modelu usługi Azure Machine Learning z usługą Event Grid

Korzystając z Event Grid, można skonfigurować zdarzenia generowane przez monitorowanie modelu Azure Machine Learning, które uruchamiają aplikacje, procesy oraz przepływy pracy CI/CD. Można odbierać zdarzenia za pośrednictwem różnych programów obsługi zdarzeń, takich jak Azure Event Hubs, Azure Functions i Azure Logic Apps. Gdy monitory wykrywają dryf, można podjąć działania programowo, na przykład uruchamiając potok uczenia maszynowego, aby ponownie wytrenować model i wdrożyć go ponownie.

Aby zintegrować monitorowanie modelu usługi Azure Machine Learning z usługą Event Grid, wykonaj kroki opisane w poniższych sekcjach.

Tworzenie tematu systemowego

Jeśli nie masz tematu systemu usługi Event Grid do użycia do monitorowania, utwórz go. Aby uzyskać instrukcje, zobacz Tworzenie, wyświetlanie i zarządzanie tematami systemu usługi Event Grid w witrynie Azure Portal.

Tworzenie subskrypcji zdarzeń

W witrynie Azure Portal przejdź do obszaru roboczego usługi Azure Machine Learning.
Wybierz opcję Zdarzenia, a następnie wybierz opcję Subskrypcja zdarzeń.
Obok pozycji Nazwa wprowadź nazwę subskrypcji zdarzeń, taką jak MonitoringEvent.
W obszarze Typy zdarzeń wybierz tylko Zmieniono stan uruchomienia.

Ostrzeżenie

Wybierz tylko stan uruchomienia zmieniony dla typu zdarzenia. Nie wybieraj Wykryto dryf zestawu danych, który odnosi się do dryfu danych w wersji 1, a nie do monitorowania modelu Azure Machine Learning.
Wybierz kartę Filtry . W obszarze Filtry zaawansowane wybierz pozycję Dodaj nowy filtr, a następnie wprowadź następujące wartości:
- W obszarze Klucz wprowadź dane. RunTags.azureml_modelmonitor_threshold_breached.
- Pod Operatorem wybierz opcję Ciąg zawiera.
- W obszarze Wartość wprowadź nie powiodło się z powodu co najmniej jednej funkcji naruszającej progi metryk.
Gdy używasz tego filtru, zdarzenia są generowane, gdy stan uruchomienia dowolnego monitora w obszarze roboczym usługi Azure Machine Learning ulegnie zmianie. Stan uruchomienia może ulec zmianie z ukończonego na niepowodzeniem lub z niepowodzenia na ukończone.

Aby filtrować na poziomie monitorowania, wybierz ponownie pozycję Dodaj nowy filtr , a następnie wprowadź następujące wartości:
- W obszarze Klucz wprowadź dane. RunTags.azureml_modelmonitor_threshold_breached.
- Pod Operatorem wybierz opcję Ciąg zawiera.
- W obszarze Wartość wprowadź nazwę sygnału monitora, dla którego chcesz filtrować zdarzenia, takie jak credit_card_fraud_monitor_data_drift. Wprowadzona nazwa musi być zgodna z nazwą sygnału monitorowania. Każdy sygnał używany w filtrowaniu powinien mieć nazwę w formacie <monitor-name>_<signal-description> zawierającym nazwę monitora i opis sygnału.
Wybierz kartę Podstawowe . Skonfiguruj punkt końcowy, który ma służyć jako program obsługi zdarzeń, taki jak Event Hubs.
Wybierz pozycję Utwórz , aby utworzyć subskrypcję zdarzeń.

Wyświetl zdarzenia

Po przechwyceniu zdarzeń można je wyświetlić na stronie punktu końcowego programu obsługi zdarzeń:

Zdarzenia można również wyświetlić na karcie Metryki usługi Azure Monitor:

Sprzężenie zwrotne

Czy ta strona była pomocna?

Last updated on 2025-05-02

Udostępnij za pomocą

Konfigurowanie ustawień podstawowych

Dodawanie zasobów danych

Edytowanie ustawień dryfu danych

Dodawanie sygnału dryfu autorstwa funkcji

Zakończ konfigurację

Konfigurowanie ustawień podstawowych

Dodawanie zasobów danych

Dodawanie sygnału monitorowania wydajności

Zakończ konfigurację

Udostępnij za pomocą

Monitorowanie wydajności modeli wdrożonych w środowisku produkcyjnym

Wymagania wstępne

Konfigurowanie bezserwerowej puli obliczeniowej platformy Spark

Konfigurowanie gotowego do użycia monitorowania modelu

Konfigurowanie zaawansowanego monitorowania modelu

Konfigurowanie ważności funkcji

Konfigurowanie monitorowania wydajności modelu

Wymagania wstępne dotyczące monitorowania wydajności modelu

Wymagania dotyczące monitorowania wydajności modelu podczas korzystania z modułu zbierającego dane

Przykładowy przepływ pracy monitorowania wydajności modelu

Konfigurowanie monitorowania modelu danych produkcyjnych

Konfigurowanie monitorowania modelu przy użyciu niestandardowych sygnałów i metryk

Podpis wejściowy składnika

Podpis wyjściowy składnika

schemat signal_metrics

Interpretowanie wyników monitorowania

Integrowanie monitorowania modelu usługi Azure Machine Learning z usługą Event Grid

Tworzenie tematu systemowego

Tworzenie subskrypcji zdarzeń

Wyświetl zdarzenia

Powiązana zawartość

Sprzężenie zwrotne

Dodatkowe zasoby