Udostępnij za pośrednictwem


AutoMLStep Klasa

Tworzy krok potoku usługi Azure ML, który hermetyzuje przebieg zautomatyzowanego uczenia maszynowego.

Przykład użycia narzędzia AutoMLStep można znaleźć w notesie https://aka.ms/pl-automl.

Zainicjuj element AutoMLStep.

Dziedziczenie
AutoMLStep

Konstruktor

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Parametry

Nazwa Opis
name
Wymagane
str

Nazwa kroku.

automl_config
Wymagane

Obiekt AutoMLConfig, który definiuje konfigurację dla tego przebiegu rozwiązania AutoML.

inputs

Lista powiązań portów wejściowych.

Domyślna wartość: None
outputs

Lista powiązań portów wyjściowych.

Domyślna wartość: None
script_repl_params

Opcjonalne parametry do zastąpienia w skrycie, na przykład {'param1': 'value1', 'param2': 'value2'}.

Domyślna wartość: None
allow_reuse

Wskazuje, czy krok powinien ponownie używać poprzednich wyników po ponownym uruchomieniu z tymi samymi ustawieniami.

Ponowne użycie jest domyślnie włączone. Jeśli zawartość kroku (skrypty/zależności) oraz dane wejściowe i parametry pozostają niezmienione, dane wyjściowe z poprzedniego uruchomienia tego kroku są ponownie używane. Podczas ponownego wykonywania kroku zamiast przesyłania zadania do obliczeń wyniki z poprzedniego uruchomienia są natychmiast udostępniane wszelkim kolejnym krokom. Jeśli używasz zestawów danych usługi Azure Machine Learning jako danych wejściowych, ponowne użycie zależy od tego, czy definicja zestawu danych uległa zmianie, a nie przez to, czy dane bazowe uległy zmianie.

Domyślna wartość: True
version
str

Wersja do przypisania do kroku.

Domyślna wartość: None
hash_paths

PRZESTARZAŁE. Lista ścieżek do skrótu podczas sprawdzania zmian w zawartości kroku potoku.

Domyślnie wszystkie pliki w parametrze path w pliku AutoMLConfig są skrótami z wyjątkiem plików wymienionych w pliku .amlignore lub .gitignore w obszarze path. Jeśli nie wykryto żadnych zmian, potok ponownie używa zawartości kroku z poprzedniego przebiegu.

Domyślna wartość: None
enable_default_model_output

Wskazuje, czy najlepszy model zostanie dodany jako domyślne dane wyjściowe. Może to służyć do pobierania najlepszego modelu po zakończeniu AutoMLStepRun przebiegu przy użyciu klasy . Uwaga: jeśli domyślne dane wyjściowe modelu nie są wymagane, zaleca się ustawienie tego parametru na Falsewartość .

Domyślna wartość: True
enable_default_metrics_output

Wskazuje, czy wszystkie podrzędne metryki uruchamiania zostaną dodane jako domyślne dane wyjściowe. Może to służyć do pobierania podrzędnych metryk uruchamiania po zakończeniu AutoMLStepRun przebiegu przy użyciu klasy . Uwaga: jeśli domyślne dane wyjściowe metryk nie są wymagane, zaleca się ustawienie tego parametru na False.

Domyślna wartość: True
name
Wymagane
str

Nazwa kroku.

automl_config
Wymagane

AutoMLConfig definiujący konfigurację dla tego przebiegu rozwiązania AutoML.

inputs
Wymagane

Lista powiązań portów wejściowych.

outputs
Wymagane

Lista powiązań portów wyjściowych.

script_repl_params
Wymagane

Opcjonalne parametry do zastąpienia w skrycie, na przykład {'param1': 'value1', 'param2': 'value2'}.

script_repl_params
Wymagane

Opcjonalne parametry, które mają zostać zastąpione w skrycie.

allow_reuse
Wymagane

Wskazuje, czy krok powinien ponownie używać poprzednich wyników po ponownym uruchomieniu z tymi samymi ustawieniami.

Ponowne użycie jest domyślnie włączone. Jeśli zawartość kroku (skrypty/zależności) oraz dane wejściowe i parametry pozostają niezmienione, dane wyjściowe z poprzedniego uruchomienia tego kroku są ponownie używane. Podczas ponownego wykonywania kroku zamiast przesyłania zadania do obliczeń wyniki z poprzedniego uruchomienia są natychmiast udostępniane wszelkim kolejnym krokom. Jeśli używasz zestawów danych usługi Azure Machine Learning jako danych wejściowych, ponowne użycie zależy od tego, czy definicja zestawu danych uległa zmianie, a nie przez to, czy dane bazowe uległy zmianie.

version
Wymagane
str

Wersja do przypisania do kroku.

hash_paths
Wymagane

PRZESTARZAŁE. Lista ścieżek do skrótu podczas sprawdzania zmian w zawartości kroku potoku.

Domyślnie wszystkie pliki w parametrze path w pliku AutoMLConfig są skrótami z wyjątkiem plików wymienionych w pliku .amlignore lub .gitignore w obszarze path. Jeśli nie wykryto żadnych zmian, potok ponownie używa zawartości kroku z poprzedniego przebiegu.

enable_default_model_output
Wymagane

Wskazuje, czy najlepszy model zostanie dodany jako domyślne dane wyjściowe. Może to służyć do pobierania najlepszego modelu po zakończeniu AutoMLStepRun przebiegu przy użyciu klasy . Uwaga: jeśli domyślne dane wyjściowe modelu nie są wymagane, zaleca się ustawienie tego parametru na Falsewartość .

enable_default_metrics_output
Wymagane

Wskazuje, czy wszystkie podrzędne metryki uruchamiania zostaną dodane jako domyślne dane wyjściowe. Może to służyć do pobierania podrzędnych metryk uruchamiania po zakończeniu AutoMLStepRun przebiegu przy użyciu klasy . Uwaga: jeśli domyślne dane wyjściowe metryk nie są wymagane, zaleca się ustawienie tego parametru na False.

Uwagi

Klasa AutoMLStep umożliwia uruchamianie zautomatyzowanego przepływu pracy uczenia maszynowego w potoku usługi Azure Machine Learning. Potoki zapewniają korzyści, takie jak powtarzalność, nienadzorowane przebiegi, przechowywanie wersji i śledzenie oraz modułowość zautomatyzowanego przepływu pracy uczenia maszynowego. Aby uzyskać więcej informacji, zobacz Co to są potoki usługi Azure Machine Learning?.

Gdy zautomatyzowany przepływ pracy uczenia maszynowego znajduje się w potoku, możesz zaplanować uruchamianie potoku zgodnie z harmonogramem opartym na czasie lub zgodnie z harmonogramem opartym na zmianach. Harmonogramy oparte na czasie są przydatne w przypadku rutynowych zadań, takich jak monitorowanie dryfu danych, podczas gdy harmonogramy oparte na zmianach są przydatne w przypadku nieregularnych lub nieprzewidywalnych zmian, takich jak zmiany danych. Na przykład harmonogram może sondować magazyn obiektów blob, w którym są przekazywane dane, a następnie ponownie uruchomić potok, jeśli dane się zmienią, a następnie zarejestrować nową wersję modelu po zakończeniu przebiegu. Aby uzyskać więcej informacji, zobacz Planowanie potoków uczenia maszynowego i wyzwalanie uruchomienia potoku uczenia maszynowego z poziomu aplikacji logiki.

W poniższym przykładzie pokazano, jak utworzyć element AutoMLStep.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

Pełna próbka jest dostępna z witryny https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

W poniższym przykładzie pokazano, jak używać obiektu AutoMLStep w obiekcie Pipeline.


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

Pełna próbka jest dostępna z witryny https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

W powyższym przykładzie przedstawiono jeden krok w potoku. Jednak w przypadku korzystania z narzędzia AutoMLStep w rzeczywistym zautomatyzowanym przepływie pracy uczenia maszynowego będziesz mieć co najmniej jeden krok potoku, który wykonuje przygotowanie danych przed krokiem AutoMLStep, a drugi krok potoku po tym zarejestrowaniu modelu. Na przykład tego typu przepływu pracy zobacz notes https://aka.ms/automl-retrain-pipeline.

Aby zarządzać, sprawdzać stan i pobierać szczegóły przebiegu z przebiegu potoku AutoMLStepRun , użyj klasy .

Aby uzyskać więcej informacji na temat zautomatyzowanego uczenia maszynowego na platformie Azure, zobacz artykuł Co to jest zautomatyzowane uczenie maszynowe?. Aby uzyskać więcej informacji na temat konfigurowania eksperymentu zautomatyzowanego uczenia maszynowego bez użycia potoku, zobacz artykuł Konfigurowanie eksperymentu zautomatyzowanego uczenia maszynowego w języku Python.

Metody

create_node

Utwórz węzeł na podstawie tego kroku rozwiązania AutoML i dodaj go do danego grafu.

Ta metoda nie jest przeznaczona do użycia bezpośrednio. Po utworzeniu wystąpienia potoku w tym kroku usługa Azure ML automatycznie przekazuje parametry wymagane za pomocą tej metody, aby można było dodać krok do wykresu potoku reprezentującego przepływ pracy.

create_node

Utwórz węzeł na podstawie tego kroku rozwiązania AutoML i dodaj go do danego grafu.

Ta metoda nie jest przeznaczona do użycia bezpośrednio. Po utworzeniu wystąpienia potoku w tym kroku usługa Azure ML automatycznie przekazuje parametry wymagane za pomocą tej metody, aby można było dodać krok do wykresu potoku reprezentującego przepływ pracy.

create_node(graph, default_datastore, context)

Parametry

Nazwa Opis
graph
Wymagane

Obiekt grafu, do który ma zostać dodany węzeł.

default_datastore
Wymagane

Domyślny magazyn danych.

context
Wymagane
<xref:azureml.pipeline.core._GraphContext>

Kontekst grafu.

Zwraca

Typ Opis

Utworzony węzeł.

Atrybuty

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'