AutoMLStep Klasa
Tworzy krok potoku usługi Azure ML, który hermetyzuje zautomatyzowany przebieg uczenia maszynowego.
Przykład użycia narzędzia AutoMLStep można znaleźć w notesie https://aka.ms/pl-automl.
Zainicjuj element AutoMLStep.
- Dziedziczenie
-
AutoMLStep
Konstruktor
AutoMLStep(name, automl_config, inputs=None, outputs=None, script_repl_params=None, allow_reuse=True, version=None, hash_paths=None, enable_default_model_output=True, enable_default_metrics_output=True, **kwargs)
Parametry
- automl_config
- AutoMLConfig
Obiekt AutoMLConfig, który definiuje konfigurację dla tego przebiegu rozwiązania AutoML.
- inputs
- list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
Lista powiązań portów wejściowych.
- outputs
- list[Union[PipelineData, OutputPortBinding]]
Lista powiązań portów wyjściowych.
- script_repl_params
- dict
Opcjonalne parametry, które mają zostać zastąpione w skrycie, na przykład {'param1': 'value1', 'param2': 'value2'}.
- allow_reuse
- bool
Wskazuje, czy krok powinien ponownie używać poprzednich wyników po ponownym uruchomieniu z tymi samymi ustawieniami.
Ponowne użycie jest domyślnie włączone. Jeśli zawartość kroku (skrypty/zależności) oraz dane wejściowe i parametry pozostają niezmienione, dane wyjściowe z poprzedniego uruchomienia tego kroku są ponownie używane. Podczas ponownego wykonywania kroku zamiast przesyłania zadania do obliczeń wyniki z poprzedniego przebiegu są natychmiast udostępniane wszystkim kolejnym krokom. Jeśli używasz zestawów danych usługi Azure Machine Learning jako danych wejściowych, ponowne użycie zależy od tego, czy definicja zestawu danych uległa zmianie, a nie przez to, czy dane bazowe uległy zmianie.
- hash_paths
- list
PRZESTARZAŁE. Lista ścieżek do skrótu podczas sprawdzania zmian zawartości kroku potoku.
Domyślnie wszystkie pliki w parametrze path
w AutoMLConfig pliku są skrótami z wyjątkiem plików wymienionych w pliku .amlignore lub .gitignore w obszarze path
. Jeśli nie zostaną wykryte żadne zmiany, potok ponownie użyje zawartości kroku z poprzedniego uruchomienia.
- enable_default_model_output
- bool
Wskazuje, czy najlepszy model zostanie dodany jako domyślne dane wyjściowe. Może to służyć do pobierania najlepszego modelu po zakończeniu AutoMLStepRun przebiegu przy użyciu klasy .
Należy pamiętać, że jeśli domyślne dane wyjściowe modelu nie są wymagane, zaleca się ustawienie tego parametru na False
wartość .
- enable_default_metrics_output
- bool
Wskazuje, czy wszystkie metryki przebiegu podrzędnego zostaną dodane jako domyślne dane wyjściowe. Może to służyć do pobierania metryk przebiegu podrzędnego po zakończeniu AutoMLStepRun przebiegu przy użyciu klasy .
Należy pamiętać, że jeśli domyślne dane wyjściowe metryk nie są wymagane, zaleca się ustawienie tego parametru na False
wartość .
- automl_config
- AutoMLConfig
AutoMLConfig definiujący konfigurację dla tego przebiegu rozwiązania AutoML.
- inputs
- list[Union[InputPortBinding, DataReference, PortDataReference, PipelineData]]
Lista powiązań portów wejściowych.
- script_repl_params
- dict
Opcjonalne parametry, które mają zostać zastąpione w skrycie, na przykład {'param1': 'value1', 'param2': 'value2'}.
- script_repl_params
Opcjonalne parametry, które mają zostać zastąpione w skrycie.
- allow_reuse
- bool
Wskazuje, czy krok powinien ponownie używać poprzednich wyników po ponownym uruchomieniu z tymi samymi ustawieniami.
Ponowne użycie jest domyślnie włączone. Jeśli zawartość kroku (skrypty/zależności) oraz dane wejściowe i parametry pozostają niezmienione, dane wyjściowe z poprzedniego uruchomienia tego kroku są ponownie używane. Podczas ponownego wykonywania kroku zamiast przesyłania zadania do obliczeń wyniki z poprzedniego przebiegu są natychmiast udostępniane wszystkim kolejnym krokom. Jeśli używasz zestawów danych usługi Azure Machine Learning jako danych wejściowych, ponowne użycie zależy od tego, czy definicja zestawu danych uległa zmianie, a nie przez to, czy dane bazowe uległy zmianie.
- hash_paths
- list
PRZESTARZAŁE. Lista ścieżek do skrótu podczas sprawdzania zmian zawartości kroku potoku.
Domyślnie wszystkie pliki w parametrze path
w AutoMLConfig pliku są skrótami z wyjątkiem plików wymienionych w pliku .amlignore lub .gitignore w obszarze path
. Jeśli nie zostaną wykryte żadne zmiany, potok ponownie użyje zawartości kroku z poprzedniego uruchomienia.
- enable_default_model_output
- bool
Wskazuje, czy najlepszy model zostanie dodany jako domyślne dane wyjściowe. Może to służyć do pobierania najlepszego modelu po zakończeniu AutoMLStepRun przebiegu przy użyciu klasy .
Należy pamiętać, że jeśli domyślne dane wyjściowe modelu nie są wymagane, zaleca się ustawienie tego parametru na False
wartość .
- enable_default_metrics_output
- bool
Wskazuje, czy wszystkie metryki przebiegu podrzędnego zostaną dodane jako domyślne dane wyjściowe. Może to służyć do pobierania metryk przebiegu podrzędnego po zakończeniu AutoMLStepRun przebiegu przy użyciu klasy .
Należy pamiętać, że jeśli domyślne dane wyjściowe metryk nie są wymagane, zaleca się ustawienie tego parametru na False
wartość .
Uwagi
Za pomocą klasy AutoMLStep możesz uruchomić zautomatyzowany przepływ pracy uczenia maszynowego w potoku usługi Azure Machine Learning. Potoki zapewniają korzyści, takie jak powtarzalność, nienadzorowane przebiegi, przechowywanie wersji i śledzenie oraz modułowość zautomatyzowanego przepływu pracy uczenia maszynowego. Aby uzyskać więcej informacji, zobacz Co to są potoki usługi Azure Machine Learning?.
Gdy zautomatyzowany przepływ pracy uczenia maszynowego znajduje się w potoku, możesz zaplanować uruchamianie potoku zgodnie z harmonogramem na podstawie czasu lub zgodnie z harmonogramem opartym na zmianach. Harmonogramy oparte na czasie są przydatne w przypadku rutynowych zadań, takich jak monitorowanie dryfu danych, podczas gdy harmonogramy oparte na zmianach są przydatne w przypadku nieregularnych lub nieprzewidywalnych zmian, takich jak zmiany danych. Na przykład harmonogram może sondować magazyn obiektów blob, w którym są przekazywane dane, a następnie ponownie uruchomić potok, jeśli dane się zmienią, a następnie zarejestrować nową wersję modelu po zakończeniu przebiegu. Aby uzyskać więcej informacji, zobacz Planowanie potoków uczenia maszynowego i Wyzwalanie uruchomienia potoku uczenia maszynowego z poziomu aplikacji logiki.
W poniższym przykładzie pokazano, jak utworzyć element AutoMLStep.
automl_step = AutoMLStep(
name='automl_module',
automl_config=automl_config,
outputs=[metrics_data, model_data],
allow_reuse=True)
Pełna próbka jest dostępna w witrynie https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb
W poniższym przykładzie pokazano, jak używać obiektu AutoMLStep w obiekcie Pipeline.
from azureml.pipeline.core import Pipeline
pipeline = Pipeline(
description="pipeline_with_automlstep",
workspace=ws,
steps=[automl_step])
Pełna próbka jest dostępna w witrynie https://github.com/Azure/MachineLearningNotebooks/blob/master/how-to-use-azureml/machine-learning-pipelines/intro-to-pipelines/aml-pipelines-with-automated-machine-learning-step.ipynb
W powyższym przykładzie pokazano jeden krok w potoku. Jednak w przypadku korzystania z rozwiązania AutoMLStep w rzeczywistym zautomatyzowanym przepływie pracy uczenia maszynowego będziesz mieć co najmniej jeden krok potoku, który wykonuje przygotowywanie danych przed krokiem AutoMLStep, a drugi krok potoku po zarejestrowaniu modelu. Na przykład tego typu przepływu pracy zobacz notes https://aka.ms/automl-retrain-pipeline.
Aby zarządzać, sprawdzać stan i pobierać szczegóły przebiegu z uruchomienia potoku, użyj AutoMLStepRun klasy .
Aby uzyskać więcej informacji na temat zautomatyzowanego uczenia maszynowego na platformie Azure, zobacz artykuł Co to jest zautomatyzowane uczenie maszynowe?. Aby uzyskać więcej informacji na temat konfigurowania eksperymentu zautomatyzowanego uczenia maszynowego bez użycia potoku, zobacz artykuł Konfigurowanie eksperymentu zautomatyzowanego uczenia maszynowego w języku Python.
Metody
create_node |
Utwórz węzeł na podstawie tego kroku rozwiązania AutoML i dodaj go do danego grafu. Ta metoda nie jest przeznaczona do bezpośredniego użycia. Po utworzeniu wystąpienia potoku w tym kroku usługa Azure ML automatycznie przekazuje wymagane parametry za pośrednictwem tej metody, aby można było dodać krok do grafu potoku reprezentującego przepływ pracy. |
create_node
Utwórz węzeł na podstawie tego kroku rozwiązania AutoML i dodaj go do danego grafu.
Ta metoda nie jest przeznaczona do bezpośredniego użycia. Po utworzeniu wystąpienia potoku w tym kroku usługa Azure ML automatycznie przekazuje wymagane parametry za pośrednictwem tej metody, aby można było dodać krok do grafu potoku reprezentującego przepływ pracy.
create_node(graph, default_datastore, context)
Parametry
- default_datastore
- Union[AbstractAzureStorageDatastore, AzureDataLakeDatastore]
Domyślny magazyn danych.
- context
- <xref:azureml.pipeline.core._GraphContext>
Kontekst grafu.
Zwraca
Utworzony węzeł.
Typ zwracany
Atrybuty
AUTOML_CONFIG_PARAM_NAME
AUTOML_CONFIG_PARAM_NAME = 'AutoMLConfig'
DEFAULT_METRIC_PREFIX
DEFAULT_METRIC_PREFIX = 'default_metrics_'
DEFAULT_MODEL_PREFIX
DEFAULT_MODEL_PREFIX = 'default_model_'
Opinia
https://aka.ms/ContentUserFeedback.
Dostępne już wkrótce: W 2024 r. będziemy stopniowo wycofywać zgłoszenia z serwisu GitHub jako mechanizm przesyłania opinii na temat zawartości i zastępować go nowym systemem opinii. Aby uzyskać więcej informacji, sprawdź:Prześlij i wyświetl opinię dla