AutoMLStep Klasa

Odwołanie

Tworzy krok potoku usługi Azure ML, który hermetyzuje przebieg zautomatyzowanego uczenia maszynowego.

Przykład użycia narzędzia AutoMLStep można znaleźć w notesie https://aka.ms/pl-automl.

Zainicjuj element AutoMLStep.

Dziedziczenie: PipelineStep

AutoMLStep

Konstruktor

AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)

Parametry

Nazwa	Opis
name Wymagane	str Nazwa kroku.
automl_config Wymagane	AutoMLConfig Obiekt AutoMLConfig, który definiuje konfigurację dla tego przebiegu rozwiązania AutoML.
inputs	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] Lista powiązań portów wejściowych. Domyślna wartość: None
outputs	list[Union[PipelineData, OutputPortBinding]] Lista powiązań portów wyjściowych. Domyślna wartość: None
script_repl_params	dict Opcjonalne parametry do zastąpienia w skrycie, na przykład {'param1': 'value1', 'param2': 'value2'}. Domyślna wartość: None
allow_reuse	bool Wskazuje, czy krok powinien ponownie używać poprzednich wyników po ponownym uruchomieniu z tymi samymi ustawieniami. Ponowne użycie jest domyślnie włączone. Jeśli zawartość kroku (skrypty/zależności) oraz dane wejściowe i parametry pozostają niezmienione, dane wyjściowe z poprzedniego uruchomienia tego kroku są ponownie używane. Podczas ponownego wykonywania kroku zamiast przesyłania zadania do obliczeń wyniki z poprzedniego uruchomienia są natychmiast udostępniane wszelkim kolejnym krokom. Jeśli używasz zestawów danych usługi Azure Machine Learning jako danych wejściowych, ponowne użycie zależy od tego, czy definicja zestawu danych uległa zmianie, a nie przez to, czy dane bazowe uległy zmianie. Domyślna wartość: True
version	str Wersja do przypisania do kroku. Domyślna wartość: None
hash_paths	list PRZESTARZAŁE. Lista ścieżek do skrótu podczas sprawdzania zmian w zawartości kroku potoku. Domyślnie wszystkie pliki w parametrze `path` w pliku AutoMLConfig są skrótami z wyjątkiem plików wymienionych w pliku .amlignore lub .gitignore w obszarze `path`. Jeśli nie wykryto żadnych zmian, potok ponownie używa zawartości kroku z poprzedniego przebiegu. Domyślna wartość: None
enable_default_model_output	bool Wskazuje, czy najlepszy model zostanie dodany jako domyślne dane wyjściowe. Może to służyć do pobierania najlepszego modelu po zakończeniu AutoMLStepRun przebiegu przy użyciu klasy . Uwaga: jeśli domyślne dane wyjściowe modelu nie są wymagane, zaleca się ustawienie tego parametru na `False`wartość . Domyślna wartość: True
enable_default_metrics_output	bool Wskazuje, czy wszystkie podrzędne metryki uruchamiania zostaną dodane jako domyślne dane wyjściowe. Może to służyć do pobierania podrzędnych metryk uruchamiania po zakończeniu AutoMLStepRun przebiegu przy użyciu klasy . Uwaga: jeśli domyślne dane wyjściowe metryk nie są wymagane, zaleca się ustawienie tego parametru na `False`. Domyślna wartość: True
name Wymagane	str Nazwa kroku.
automl_config Wymagane	AutoMLConfig AutoMLConfig definiujący konfigurację dla tego przebiegu rozwiązania AutoML.
inputs Wymagane	list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]] Lista powiązań portów wejściowych.
outputs Wymagane	list[Union[PipelineData, OutputPortBinding]] Lista powiązań portów wyjściowych.
script_repl_params Wymagane	dict Opcjonalne parametry do zastąpienia w skrycie, na przykład {'param1': 'value1', 'param2': 'value2'}.
script_repl_params Wymagane	Opcjonalne parametry, które mają zostać zastąpione w skrycie.
allow_reuse Wymagane	bool Wskazuje, czy krok powinien ponownie używać poprzednich wyników po ponownym uruchomieniu z tymi samymi ustawieniami. Ponowne użycie jest domyślnie włączone. Jeśli zawartość kroku (skrypty/zależności) oraz dane wejściowe i parametry pozostają niezmienione, dane wyjściowe z poprzedniego uruchomienia tego kroku są ponownie używane. Podczas ponownego wykonywania kroku zamiast przesyłania zadania do obliczeń wyniki z poprzedniego uruchomienia są natychmiast udostępniane wszelkim kolejnym krokom. Jeśli używasz zestawów danych usługi Azure Machine Learning jako danych wejściowych, ponowne użycie zależy od tego, czy definicja zestawu danych uległa zmianie, a nie przez to, czy dane bazowe uległy zmianie.
version Wymagane	str Wersja do przypisania do kroku.
hash_paths Wymagane	list PRZESTARZAŁE. Lista ścieżek do skrótu podczas sprawdzania zmian w zawartości kroku potoku. Domyślnie wszystkie pliki w parametrze `path` w pliku AutoMLConfig są skrótami z wyjątkiem plików wymienionych w pliku .amlignore lub .gitignore w obszarze `path`. Jeśli nie wykryto żadnych zmian, potok ponownie używa zawartości kroku z poprzedniego przebiegu.
enable_default_model_output Wymagane	bool Wskazuje, czy najlepszy model zostanie dodany jako domyślne dane wyjściowe. Może to służyć do pobierania najlepszego modelu po zakończeniu AutoMLStepRun przebiegu przy użyciu klasy . Uwaga: jeśli domyślne dane wyjściowe modelu nie są wymagane, zaleca się ustawienie tego parametru na `False`wartość .
enable_default_metrics_output Wymagane	bool Wskazuje, czy wszystkie podrzędne metryki uruchamiania zostaną dodane jako domyślne dane wyjściowe. Może to służyć do pobierania podrzędnych metryk uruchamiania po zakończeniu AutoMLStepRun przebiegu przy użyciu klasy . Uwaga: jeśli domyślne dane wyjściowe metryk nie są wymagane, zaleca się ustawienie tego parametru na `False`.

Uwagi

Klasa AutoMLStep umożliwia uruchamianie zautomatyzowanego przepływu pracy uczenia maszynowego w potoku usługi Azure Machine Learning. Potoki zapewniają korzyści, takie jak powtarzalność, nienadzorowane przebiegi, przechowywanie wersji i śledzenie oraz modułowość zautomatyzowanego przepływu pracy uczenia maszynowego. Aby uzyskać więcej informacji, zobacz Co to są potoki usługi Azure Machine Learning?.

Gdy zautomatyzowany przepływ pracy uczenia maszynowego znajduje się w potoku, możesz zaplanować uruchamianie potoku zgodnie z harmonogramem opartym na czasie lub zgodnie z harmonogramem opartym na zmianach. Harmonogramy oparte na czasie są przydatne w przypadku rutynowych zadań, takich jak monitorowanie dryfu danych, podczas gdy harmonogramy oparte na zmianach są przydatne w przypadku nieregularnych lub nieprzewidywalnych zmian, takich jak zmiany danych. Na przykład harmonogram może sondować magazyn obiektów blob, w którym są przekazywane dane, a następnie ponownie uruchomić potok, jeśli dane się zmienią, a następnie zarejestrować nową wersję modelu po zakończeniu przebiegu. Aby uzyskać więcej informacji, zobacz Planowanie potoków uczenia maszynowego i wyzwalanie uruchomienia potoku uczenia maszynowego z poziomu aplikacji logiki.

W poniższym przykładzie pokazano, jak utworzyć element AutoMLStep.


   automl_step = AutoMLStep(
       name='automl_module',
       automl_config=automl_config,
       outputs=[metrics_data, model_data],
       allow_reuse=True)

Pełna próbka jest dostępna z witryny https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb

W poniższym przykładzie pokazano, jak używać obiektu AutoMLStep w obiekcie Pipeline.


   from azureml.pipeline.core import Pipeline
   pipeline = Pipeline(
       description="pipeline_with_automlstep",
       workspace=ws,
       steps=[automl_step])

W powyższym przykładzie przedstawiono jeden krok w potoku. Jednak w przypadku korzystania z narzędzia AutoMLStep w rzeczywistym zautomatyzowanym przepływie pracy uczenia maszynowego będziesz mieć co najmniej jeden krok potoku, który wykonuje przygotowanie danych przed krokiem AutoMLStep, a drugi krok potoku po tym zarejestrowaniu modelu. Na przykład tego typu przepływu pracy zobacz notes https://aka.ms/automl-retrain-pipeline.

Aby zarządzać, sprawdzać stan i pobierać szczegóły przebiegu z przebiegu potoku AutoMLStepRun , użyj klasy .

Aby uzyskać więcej informacji na temat zautomatyzowanego uczenia maszynowego na platformie Azure, zobacz artykuł Co to jest zautomatyzowane uczenie maszynowe?. Aby uzyskać więcej informacji na temat konfigurowania eksperymentu zautomatyzowanego uczenia maszynowego bez użycia potoku, zobacz artykuł Konfigurowanie eksperymentu zautomatyzowanego uczenia maszynowego w języku Python.

Metody

create_node

Utwórz węzeł na podstawie tego kroku rozwiązania AutoML i dodaj go do danego grafu.

Ta metoda nie jest przeznaczona do użycia bezpośrednio. Po utworzeniu wystąpienia potoku w tym kroku usługa Azure ML automatycznie przekazuje parametry wymagane za pomocą tej metody, aby można było dodać krok do wykresu potoku reprezentującego przepływ pracy.

create_node

Utwórz węzeł na podstawie tego kroku rozwiązania AutoML i dodaj go do danego grafu.

create_node(graph, default_datastore, context)

Parametry

Nazwa	Opis
graph Wymagane	Graph Obiekt grafu, do który ma zostać dodany węzeł.
default_datastore Wymagane	Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore] Domyślny magazyn danych.
context Wymagane	<xref:azureml.pipeline.core._GraphContext> Kontekst grafu.

Zwraca

Typ	Opis
Node	Utworzony węzeł.

Atrybuty

AUTOML_CONFIG_PARAM_NAME

AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'

DEFAULT_METRIC_PREFIX

DEFAULT_METRIC_PREFIX = 'default_metrics_'

DEFAULT_MODEL_PREFIX

DEFAULT_MODEL_PREFIX = 'default_model_'

Udostępnij za pośrednictwem

AutoMLStep Klasa

Konstruktor

Parametry

Uwagi

Metody

create_node

Parametry

Zwraca

Atrybuty

AUTOML_CONFIG_PARAM_NAME

DEFAULT_METRIC_PREFIX

DEFAULT_MODEL_PREFIX

Opinia

Dodatkowe zasoby