Udostępnij za pośrednictwem


automl Pakiet

Zawiera klasy zautomatyzowanego uczenia maszynowego dla zestawu SDKKv2 usługi Azure Machine Learning.

Główne obszary obejmują zarządzanie zadaniami rozwiązania AutoML.

Klasy

ClassificationJob

Konfiguracja zadania klasyfikacji automatycznego uczenia maszynowego.

Zainicjuj nowe zadanie klasyfikacji automatycznego uczenia maszynowego.

ColumnTransformer

Ustawienia przekształcania kolumn.

ForecastingJob

Konfiguracja zadania prognozowania automatycznego uczenia maszynowego.

Zainicjuj nowe zadanie prognozowania automatycznego uczenia maszynowego.

ForecastingSettings

Ustawienia prognozowania dla zadania rozwiązania AutoML.

ImageClassificationJob

Konfiguracja zadania klasyfikacji obrazów wieloklasowej zautomatyzowanego uczenia maszynowego.

Zainicjuj nowe zadanie klasyfikacji obrazów wieloklasowej zautomatyzowanego uczenia maszynowego.

ImageClassificationMultilabelJob

Konfiguracja zadania klasyfikacji obrazów z wieloma etykietami rozwiązania AutoML.

Zainicjuj nowe zadanie klasyfikacji obrazów z wieloma etykietami rozwiązania AutoML.

ImageClassificationSearchSpace

Wyszukaj miejsce na zadania klasyfikacji obrazów automatycznego uczenia maszynowego i klasyfikacji obrazów z wieloma etykietami.

ImageInstanceSegmentationJob

Konfiguracja zadania segmentacji wystąpienia obrazu automatycznego uczenia maszynowego.

Inicjowanie nowego zadania segmentacji wystąpienia obrazu rozwiązania AutoML.

ImageLimitSettings

Ogranicz ustawienia dla obrazów autoML w pionie.

ImageLimitSettings to klasa zawierająca następujące parametry: max_concurrent_trials, max_trials i timeout_minutes.

Jest to opcjonalna metoda konfiguracji umożliwiająca skonfigurowanie parametrów limitów, takich jak limity czasu itp.

Uwaga

Liczba współbieżnych przebiegów jest warunkowa dla zasobów dostępnych w określonym docelowym obiekcie obliczeniowym.

Upewnij się, że docelowy obiekt obliczeniowy ma dostępne zasoby dla żądanej współbieżności.

Porada

Dobrym rozwiązaniem jest dopasowanie liczby max_concurrent_trials liczby węzłów w klastrze.

Jeśli na przykład masz klaster z 4 węzłami, ustaw max_concurrent_trials na 4.

Przykładowe użycie

Konfiguracja elementu ImageLimitSettings


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

Inicjowanie obiektu ImageLimitSettings.

Konstruktor imageLimitSettings dla pionowych obrazów autoML.

ImageModelSettingsClassification

Ustawienia modelu dla zadań klasyfikacji obrazów rozwiązania AutoML.

ImageModelSettingsObjectDetection

Ustawienia modelu dla zadania wykrywania obiektów obrazów automatycznego uczenia maszynowego.

ImageObjectDetectionJob

Konfiguracja zadania wykrywania obiektów obrazów automatycznego uczenia maszynowego.

Zainicjuj nowe zadanie wykrywania obiektów obrazów automatycznego uczenia maszynowego.

ImageObjectDetectionSearchSpace

Wyszukaj miejsce na potrzeby zadań wykrywania obiektów obrazów automatycznego uczenia maszynowego i segmentacji wystąpień obrazów.

ImageSweepSettings

Ustawienia zamiatania dla wszystkich obrazów AutoML w pionie.

NlpFeaturizationSettings

Ustawienia cechowania dla wszystkich pionowych funkcji NLP automatycznego uczenia maszynowego.

NlpFixedParameters

Obiekt do przechowywania stałych parametrów dla zadań NLP.

NlpLimitSettings

Ogranicz ustawienia dla wszystkich pionowych funkcji nlp zautomatyzowanego uczenia maszynowego.

NlpSearchSpace

Wyszukaj miejsce na potrzeby zadań automatycznego równoważenia obciążenia sieciowego w usłudze AutoML.

NlpSweepSettings

Ustawienia zamiatania dla wszystkich zadań nlp rozwiązania AutoML.

RegressionJob

Konfiguracja zadania regresji automatycznego uczenia maszynowego.

Inicjowanie nowego zadania regresji automatycznego uczenia maszynowego.

SearchSpace

Klasa SearchSpace dla pionowych uczenia maszynowego.

StackEnsembleSettings

Ustawienie zaawansowane umożliwiające dostosowanie przebiegu StackEnsemble.

TabularFeaturizationSettings

Ustawienia cechowania dla zadania rozwiązania AutoML.

TabularLimitSettings

Ogranicz ustawienia tabeli AutoML w pionie.

TextClassificationJob

Konfiguracja zadania klasyfikacji tekstu zautomatyzowanego uczenia maszynowego.

Inicjuje nowe zadanie klasyfikacji tekstu zautomatyzowanego uczenia maszynowego.

TextClassificationMultilabelJob

Konfiguracja zadania wieloebelowego klasyfikacji tekstu automatycznego uczenia maszynowego.

Inicjuje nowe zadanie multilabeli klasyfikacji tekstu automatycznego uczenia maszynowego.

TextNerJob

Konfiguracja zadania NER tekstu zautomatyzowanego uczenia maszynowego.

Inicjuje nowe zadanie NER tekstu automatycznego uczenia maszynowego.

TrainingSettings

TrainingSettings, klasa dla usługi Azure Machine Learning.

TrainingSettings, klasa dla usługi Azure Machine Learning.

Wyliczenia

BlockedTransformers

Wyliczenie dla wszystkich modeli klasyfikacji obsługiwanych przez rozwiązanie AutoML.

ClassificationModels

Wyliczenie dla wszystkich modeli klasyfikacji obsługiwanych przez rozwiązanie AutoML.

ClassificationMultilabelPrimaryMetrics

Podstawowe metryki dla zadań wieloabelowych klasyfikacji.

ClassificationPrimaryMetrics

Podstawowe metryki dla zadań klasyfikacji.

FeaturizationMode

Tryb cechowania — określa tryb cechowania danych.

ForecastHorizonMode

Wyliczenie w celu określenia trybu wyboru horyzontu prognozy.

ForecastingModels

Wyliczenie dla wszystkich modeli prognozowania obsługiwanych przez rozwiązanie AutoML.

ForecastingPrimaryMetrics

Podstawowe metryki dla zadania prognozowania.

InstanceSegmentationPrimaryMetrics

Podstawowe metryki dla zadań usługi InstanceSegmentation.

LearningRateScheduler

Wyliczenie harmonogramu szybkości nauki.

LogTrainingMetrics

Zawiera klasy zautomatyzowanego uczenia maszynowego dla zestawu SDKKv2 usługi Azure Machine Learning.

Główne obszary obejmują zarządzanie zadaniami rozwiązania AutoML.

LogValidationLoss

Zawiera klasy zautomatyzowanego uczenia maszynowego dla zestawu SDKKv2 usługi Azure Machine Learning.

Główne obszary obejmują zarządzanie zadaniami rozwiązania AutoML.

NCrossValidationsMode

Określa, jak jest określana wartość N-Cross validations.

ObjectDetectionPrimaryMetrics

Podstawowe metryki dla zadania Image ObjectDetection.

RegressionModels

Wyliczenie dla wszystkich modeli regresji obsługiwanych przez rozwiązanie AutoML.

RegressionPrimaryMetrics

Podstawowe metryki dla zadania regresji.

SamplingAlgorithmType

Zawiera klasy zautomatyzowanego uczenia maszynowego dla zestawu SDKKv2 usługi Azure Machine Learning.

Główne obszary obejmują zarządzanie zadaniami rozwiązania AutoML.

ShortSeriesHandlingConfiguration

Parametr definiujący sposób obsługi krótkich szeregów czasowych przez rozwiązanie AutoML.

StochasticOptimizer

Optymalizator stochastyczny dla modeli obrazów.

TargetAggregationFunction

Docelowa funkcja agregacji.

TargetLagsMode

Tryby wyboru elementu docelowego są opóźniane.

TargetRollingWindowSizeMode

Docelowy tryb rozmiaru okien stopniowych.

UseStl

Skonfiguruj dekompozycję STL kolumny docelowej szeregów czasowych.

ValidationMetricType

Metoda obliczania metryki do użycia na potrzeby metryk walidacji w zadaniach obrazu.

Funkcje

classification

Funkcja do utworzenia zadania ClassificationJob.

Zadanie klasyfikacji służy do trenowania modelu, który najlepiej przewiduje klasę próbki danych. Różne modele są trenowane przy użyciu danych treningowych. Model z najlepszą wydajnością danych walidacji na podstawie podstawowej metryki jest wybierany jako ostateczny model.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parametry

training_data
Input

Dane szkoleniowe, które mają być używane w eksperymencie. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiety (opcjonalnie kolumnę przykładowych wag).

target_column_name
str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_dataparametrów validation_data i test_data

primary_metric

Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Dopuszczalne wartości: dokładność, AUC_weighted, norm_macro_recall, average_precision_score_weighted i precision_score_weighted Wartości domyślne dokładności

enable_model_explainability
bool

Czy włączyć wyjaśnienie najlepszego modelu automatycznego uczenia maszynowego na końcu wszystkich iteracji trenowania zautomatyzowanego uczenia maszynowego. Wartość domyślna to Brak. Aby uzyskać więcej informacji, zobacz Interpretowanie: wyjaśnienia modelu w zautomatyzowanym uczeniu maszynowym.

weight_column_name
str

Nazwa przykładowej kolumny wagi. Zautomatyzowane uczenie maszynowe obsługuje kolumnę ważoną jako dane wejściowe, co powoduje, że wiersze w danych mają być ważone w górę lub w dół. Jeśli dane wejściowe pochodzą z biblioteki pandas. Obiekt DataFrame, który nie ma nazw kolumn, można zamiast tego użyć indeksów kolumn wyrażonych jako liczby całkowite.

Ten parametr ma zastosowanie do training_data parametrów i validation_data

validation_data
Input

Dane weryfikacji, które mają być używane w eksperymencie. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiet (opcjonalnie kolumnę przykładowych wag).

Wartość domyślna to None

validation_data_size
float

Ułamek danych do przechowywania w celu weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 włącznie.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations lub validation_data_size wyodrębnić dane weryfikacji z określonych danych treningowych. W przypadku niestandardowego składania krzyżowego sprawdzania poprawności użyj polecenia cv_split_column_names.

Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.

Wartość domyślna to None

n_cross_validations
Union[str, int]

Ile weryfikacji krzyżowych należy wykonać, gdy nie określono danych weryfikacji użytkownika.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations lub validation_data_size wyodrębnić dane weryfikacji z określonych danych treningowych. W przypadku niestandardowego składania krzyżowego sprawdzania poprawności użyj polecenia cv_split_column_names.

Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.

Wartość domyślna to None

cv_split_column_names
List[str]

Lista nazw kolumn zawierających podział niestandardowej weryfikacji krzyżowej. Każda z kolumn podzielonych CV reprezentuje jeden podział CV, w którym każdy wiersz jest oznaczony jako 1 do trenowania lub 0 w celu weryfikacji.

Wartość domyślna to None

test_data
Input

Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie wersji zapoznawczej i może ulec zmianie w dowolnym momencie. Dane testowe, które mają być używane na potrzeby przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.

Jeśli ten parametr lub test_data_size parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu. Dane testowe powinny zawierać zarówno funkcje, jak i kolumnę etykiety. Jeśli test_data określono parametr , target_column_name należy określić parametr .

Wartość domyślna to None

test_data_size
float

Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie wersji zapoznawczej i może ulec zmianie w dowolnym momencie. Ułamek danych treningowych do przechowywania danych testowych dla przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.

Powinno to należeć do przedziału od 0,0 do 1,0 włącznie. Jeśli test_data_size zostanie określony w tym samym czasie co validation_data_sizeparametr , dane testowe zostaną podzielone przed training_data podzieleniem danych walidacji. Jeśli na przykład validation_data_size=0.1test_data_size=0.1 , a oryginalne dane szkoleniowe zawierają 1000 wierszy, dane testowe będą zawierać 100 wierszy, dane walidacji będą zawierać 90 wierszy, a dane szkoleniowe będą zawierać 810 wierszy.

W przypadku zadań opartych na regresji jest używane losowe próbkowanie. W przypadku zadań klasyfikacji używane jest próbkowanie warstwowe. Prognozowanie nie obsługuje obecnie określania zestawu danych testowych przy użyciu podziału trenowania/testu.

Jeśli ten parametr lub test_data parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu.

Wartość domyślna to None

Zwraca

Obiekt zadania, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.

Typ zwracany

forecasting

Funkcja umożliwiająca utworzenie zadania prognozowania.

Zadanie prognozowania służy do przewidywania wartości docelowych dla przyszłego okresu czasu na podstawie danych historycznych. Różne modele są trenowane przy użyciu danych treningowych. Model z najlepszą wydajnością danych walidacji na podstawie podstawowej metryki jest wybierany jako ostateczny model.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parametry

training_data
Input

Dane szkoleniowe, które mają być używane w eksperymencie. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiety (opcjonalnie kolumnę przykładowych wag).

target_column_name
str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_dataparametrów validation_data i test_data

primary_metric

Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Dopuszczalne wartości: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Wartości domyślne do normalized_root_mean_squared_error

enable_model_explainability
bool

Czy włączyć wyjaśnienie najlepszego modelu automatycznego uczenia maszynowego na końcu wszystkich iteracji trenowania zautomatyzowanego uczenia maszynowego. Wartość domyślna to Brak. Aby uzyskać więcej informacji, zobacz Interpretowanie: wyjaśnienia modelu w zautomatyzowanym uczeniu maszynowym.

weight_column_name
str

Nazwa przykładowej kolumny wagi. Zautomatyzowane uczenie maszynowe obsługuje kolumnę ważoną jako dane wejściowe, co powoduje, że wiersze w danych mają być ważone w górę lub w dół. Jeśli dane wejściowe pochodzą z biblioteki pandas. Obiekt DataFrame, który nie ma nazw kolumn, można zamiast tego użyć indeksów kolumn wyrażonych jako liczby całkowite.

Ten parametr ma zastosowanie do training_data parametrów i validation_data

validation_data
Input

Dane weryfikacji, które mają być używane w eksperymencie. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiet (opcjonalnie kolumnę przykładowych wag).

Wartość domyślna to None

validation_data_size
float

Ułamek danych do przechowywania w celu weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 włącznie.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations lub validation_data_size wyodrębnić dane weryfikacji z określonych danych treningowych. W przypadku niestandardowego składania krzyżowego sprawdzania poprawności użyj polecenia cv_split_column_names.

Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.

Wartość domyślna to None

n_cross_validations
Union[str, int]

Ile weryfikacji krzyżowych należy wykonać, gdy nie określono danych weryfikacji użytkownika.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations lub validation_data_size wyodrębnić dane weryfikacji z określonych danych treningowych. W przypadku niestandardowego składania krzyżowego sprawdzania poprawności użyj polecenia cv_split_column_names.

Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.

Wartość domyślna to None

cv_split_column_names
List[str]

Lista nazw kolumn zawierających podział niestandardowej weryfikacji krzyżowej. Każda z kolumn podzielonych CV reprezentuje jeden podział CV, w którym każdy wiersz jest oznaczony jako 1 do trenowania lub 0 w celu weryfikacji.

Wartość domyślna to None

test_data
Input

Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie wersji zapoznawczej i może ulec zmianie w dowolnym momencie. Dane testowe, które mają być używane na potrzeby przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.

Jeśli ten parametr lub test_data_size parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu. Dane testowe powinny zawierać zarówno funkcje, jak i kolumnę etykiety. Jeśli test_data określono parametr , target_column_name należy określić parametr .

Wartość domyślna to None

test_data_size
float

Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie wersji zapoznawczej i może ulec zmianie w dowolnym momencie. Ułamek danych treningowych do przechowywania danych testowych dla przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.

Powinno to należeć do przedziału od 0,0 do 1,0 włącznie. Jeśli test_data_size zostanie określony w tym samym czasie co validation_data_sizeparametr , dane testowe zostaną podzielone przed training_data podzieleniem danych walidacji. Jeśli na przykład validation_data_size=0.1test_data_size=0.1 , a oryginalne dane szkoleniowe zawierają 1000 wierszy, dane testowe będą zawierać 100 wierszy, dane walidacji będą zawierać 90 wierszy, a dane szkoleniowe będą zawierać 810 wierszy.

W przypadku zadań opartych na regresji jest używane losowe próbkowanie. W przypadku zadań klasyfikacji używane jest próbkowanie warstwowe. Prognozowanie nie obsługuje obecnie określania zestawu danych testowych przy użyciu podziału trenowania/testu.

Jeśli ten parametr lub test_data parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu.

Wartość domyślna to None

forecasting_settings
ForecastingSettings

Ustawienia zadania prognozowania

Zwraca

Obiekt zadania, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.

Typ zwracany

image_classification

Tworzy obiekt dla zadania klasyfikacji wieloklasowej obrazu autoML.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parametry

training_data
Input

Dane szkoleniowe, które mają być używane w eksperymencie.

target_column_name
str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_data parametrów i .validation_data

primary_metric

Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Dopuszczalne wartości: dokładność, AUC_weighted, norm_macro_recall, average_precision_score_weighted i precision_score_weighted Wartości domyślne dokładności.

validation_data
Input

Dane weryfikacji, które mają być używane w eksperymencie.

validation_data_size
float

Ułamek danych do przechowywania w celu weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 włącznie.

Określ, aby zapewnić dane weryfikacji. W validation_data przeciwnym razie ustaw opcję validation_data_size wyodrębniania danych weryfikacji z określonych danych treningowych.

Wartość domyślna to .2

kwargs
dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Obiekt zadania klasyfikacji obrazów, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.

Typ zwracany

image_classification_multilabel

Tworzy obiekt dla zadania klasyfikacji wielokrotnej klasyfikacji obrazów autoML.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parametry

training_data
Input

Dane szkoleniowe, które mają być używane w ramach eksperymentu.

target_column_name
str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_data parametrów i .validation_data

primary_metric

Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Dopuszczalne wartości: dokładność, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted i Wartości domyślne Iou do Iou.

validation_data
Input

Dane weryfikacji, które mają być używane w eksperymencie.

validation_data_size
float

Jaki ułamek danych do przeprowadzenia weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustaw validation_data_size , aby wyodrębnić dane weryfikacji z określonych danych treningowych.

Wartość domyślna to .2

kwargs
dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Obraz obiekt zadania klasyfikacji z wieloma etykietami, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.

Typ zwracany

image_instance_segmentation

Tworzy obiekt dla zadania segmentacji wystąpienia obrazu autoML.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parametry

training_data
Input

Dane szkoleniowe, które mają być używane w ramach eksperymentu.

target_column_name
str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_data parametrów i .validation_data

primary_metric

Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Dopuszczalne wartości: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

Dane weryfikacji, które mają być używane w eksperymencie.

validation_data_size
float

Jaki ułamek danych do przeprowadzenia weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustaw validation_data_size , aby wyodrębnić dane weryfikacji z określonych danych treningowych.

Wartość domyślna to .2

kwargs
dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Zadanie segmentacji wystąpienia obrazu

Typ zwracany

image_object_detection

Tworzy obiekt dla zadania wykrywania obiektów obrazów automl.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parametry

training_data
Input

Dane szkoleniowe, które mają być używane w ramach eksperymentu.

target_column_name
str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_data parametrów i .validation_data

primary_metric

Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Dopuszczalne wartości: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data
Input

Dane weryfikacji, które mają być używane w eksperymencie.

validation_data_size
float

Jaki ułamek danych do przeprowadzenia weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustaw validation_data_size , aby wyodrębnić dane weryfikacji z określonych danych treningowych.

Wartość domyślna to .2

kwargs
dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Obiekt zadania wykrywania obiektów obrazów, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.

Typ zwracany

regression

Funkcja umożliwiająca utworzenie zadania regresji.

Zadanie regresji służy do trenowania modelu w celu przewidywania ciągłych wartości zmiennej docelowej z zestawu danych. Różne modele są trenowane przy użyciu danych treningowych. Model z najlepszą wydajnością danych walidacji na podstawie podstawowej metryki jest wybierany jako ostateczny model.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parametry

training_data
Input

Dane szkoleniowe, które mają być używane w ramach eksperymentu. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiety (opcjonalnie przykładową kolumnę wag).

target_column_name
str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_dataparametrów validation_data , i test_data

primary_metric

Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Dopuszczalne wartości: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Domyślnie normalized_root_mean_squared_error

enable_model_explainability
bool

Czy włączyć wyjaśnienie najlepszego modelu automatycznego uczenia maszynowego na końcu wszystkich iteracji trenowania automatycznego uczenia maszynowego. Wartość domyślna to Brak. Aby uzyskać więcej informacji, zobacz Interpretowanie: wyjaśnienia modelu w zautomatyzowanym uczeniu maszynowym.

weight_column_name
str

Nazwa kolumny wagi próbki. Zautomatyzowane uczenie maszynowe obsługuje kolumnę ważoną jako dane wejściowe, co powoduje, że wiersze w danych mają być ważone w górę lub w dół. Jeśli dane wejściowe pochodzą z biblioteki pandas. Ramka danych, która nie ma nazw kolumn, można zamiast tego użyć indeksów kolumn wyrażonych jako liczby całkowite.

Ten parametr ma zastosowanie do training_data parametrów i validation_data

validation_data
Input

Dane weryfikacji, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę etykiety (opcjonalnie kolumnę przykładowych wag).

Wartości domyślne to None

validation_data_size
float

Jaki ułamek danych do przeprowadzenia weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations lub validation_data_size wyodrębnić dane weryfikacji z określonych danych treningowych. W przypadku niestandardowej krzyżowej weryfikacji należy użyć polecenia cv_split_column_names.

Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.

Wartości domyślne to None

n_cross_validations
Union[str, int]

Ile walidacji krzyżowych należy wykonać, gdy nie określono danych weryfikacji użytkownika.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations lub validation_data_size wyodrębnić dane weryfikacji z określonych danych treningowych. W przypadku niestandardowej krzyżowej weryfikacji należy użyć polecenia cv_split_column_names.

Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.

Wartości domyślne to None

cv_split_column_names
List[str]

Lista nazw kolumn zawierających podział niestandardowej weryfikacji krzyżowej. Każda kolumna podziału CV reprezentuje jeden podział cv, w którym każdy wiersz jest oznaczony jako 1 do trenowania lub 0 na potrzeby walidacji.

Wartości domyślne to None

test_data
Input

Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie podglądu i może ulec zmianie w dowolnym momencie. Dane testowe do użycia na potrzeby przebiegu testu, które zostaną automatycznie uruchomione po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.

Jeśli ten parametr lub test_data_size parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu. Dane testowe powinny zawierać zarówno funkcje, jak i kolumnę etykiety. Jeśli test_data zostanie określony, target_column_name należy określić parametr .

Wartości domyślne to None

test_data_size
float

Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie podglądu i może ulec zmianie w dowolnym momencie. Ułamek danych treningowych do przechowywania danych testowych na potrzeby przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.

Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego. Jeśli test_data_size zostanie określony w tym samym czasie co validation_data_size, dane testowe zostaną podzielone przed training_data podzieleniem danych walidacji. Jeśli na przykład dane testowe zawierają 1000 wierszy, validation_data_size=0.1test_data_size=0.1 dane testowe będą zawierać 100 wierszy, dane weryfikacji będą zawierać 90 wierszy, a dane szkoleniowe będą zawierać 810 wierszy.

W przypadku zadań opartych na regresji jest używane losowe próbkowanie. W przypadku zadań klasyfikacji używane jest próbkowanie warstwowe. Prognozowanie nie obsługuje obecnie określania zestawu danych testowego przy użyciu podziału trenowania/testu.

Jeśli ten parametr lub test_data parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu.

Wartości domyślne to None

Zwraca

Obiekt zadania, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.

Typ zwracany

text_classification

Funkcja do utworzenia obiektu TextClassificationJob.

Zadanie klasyfikacji tekstu służy do trenowania modelu, który może przewidywać klasę/kategorię danych tekstowych. Wejściowe dane szkoleniowe powinny zawierać kolumnę docelową, która klasyfikuje tekst do dokładnie jednej klasy.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parametry

training_data
Input

Dane szkoleniowe, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.

target_column_name
str

Nazwa kolumny docelowej.

validation_data
Input

Dane weryfikacji, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.

primary_metric
Union[str, ClassificationPrimaryMetrics]

Podstawowa metryka zadania. Dopuszczalne wartości: dokładność, AUC_weighted, precision_score_weighted

log_verbosity
str

Poziom szczegółowości dziennika.

kwargs
dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Obiekt TextClassificationJob.

Typ zwracany

text_classification_multilabel

Funkcja do utworzenia obiektu TextClassificationMultilabelJob.

Zadanie wieloabelowe klasyfikacji tekstu służy do trenowania modelu, który może przewidywać klasy/kategorie danych tekstowych. Wejściowe dane szkoleniowe powinny zawierać kolumnę docelową, która klasyfikuje tekst do klas(es). Aby uzyskać więcej informacji na temat formatu danych wieloznakowych, zobacz: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parametry

training_data
Input

Dane szkoleniowe, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.

target_column_name
str

Nazwa kolumny docelowej.

validation_data
Input

Dane weryfikacji, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.

primary_metric
str

Podstawowa metryka zadania. Dopuszczalne wartości: dokładność

log_verbosity
str

Poziom szczegółowości dziennika.

kwargs
dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Obiekt TextClassificationMultilabelJob.

Typ zwracany

text_ner

Funkcja do utworzenia zadania TextNerJob.

Zadanie rozpoznawania jednostek o nazwie tekst służy do trenowania modelu, który może przewidywać nazwane jednostki w tekście. Dane treningowe wejściowe powinny być plikiem tekstowym w formacie CoNLL. Aby uzyskać więcej informacji na temat formatu danych tekstowych NER, zobacz: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parametry

training_data
Input

Dane szkoleniowe, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.

validation_data
Input

Dane weryfikacji, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.

primary_metric
str

Podstawowa metryka zadania. Dopuszczalne wartości: dokładność

log_verbosity
str

Poziom szczegółowości dziennika.

kwargs
dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Obiekt TextNerJob.

Typ zwracany