automl Pakiet

Odwołanie

Zawiera klasy zautomatyzowanego uczenia maszynowego dla zestawu SDKKv2 usługi Azure Machine Learning.

Główne obszary obejmują zarządzanie zadaniami rozwiązania AutoML.

Klasy

ClassificationJob	Konfiguracja zadania klasyfikacji automatycznego uczenia maszynowego. Zainicjuj nowe zadanie klasyfikacji automatycznego uczenia maszynowego.
ColumnTransformer	Ustawienia przekształcania kolumn.
ForecastingJob	Konfiguracja zadania prognozowania automatycznego uczenia maszynowego. Zainicjuj nowe zadanie prognozowania automatycznego uczenia maszynowego.
ForecastingSettings	Ustawienia prognozowania dla zadania rozwiązania AutoML.
ImageClassificationJob	Konfiguracja zadania klasyfikacji obrazów wieloklasowej zautomatyzowanego uczenia maszynowego. Zainicjuj nowe zadanie klasyfikacji obrazów wieloklasowej zautomatyzowanego uczenia maszynowego.
ImageClassificationMultilabelJob	Konfiguracja zadania klasyfikacji obrazów z wieloma etykietami rozwiązania AutoML. Zainicjuj nowe zadanie klasyfikacji obrazów z wieloma etykietami rozwiązania AutoML.
ImageClassificationSearchSpace	Wyszukaj miejsce na zadania klasyfikacji obrazów automatycznego uczenia maszynowego i klasyfikacji obrazów z wieloma etykietami.
ImageInstanceSegmentationJob	Konfiguracja zadania segmentacji wystąpienia obrazu automatycznego uczenia maszynowego. Inicjowanie nowego zadania segmentacji wystąpienia obrazu rozwiązania AutoML.
ImageLimitSettings	Ogranicz ustawienia dla obrazów autoML w pionie. ImageLimitSettings to klasa zawierająca następujące parametry: max_concurrent_trials, max_trials i timeout_minutes. Jest to opcjonalna metoda konfiguracji umożliwiająca skonfigurowanie parametrów limitów, takich jak limity czasu itp. Uwaga Liczba współbieżnych przebiegów jest warunkowa dla zasobów dostępnych w określonym docelowym obiekcie obliczeniowym. Upewnij się, że docelowy obiekt obliczeniowy ma dostępne zasoby dla żądanej współbieżności. Porada Dobrym rozwiązaniem jest dopasowanie liczby max_concurrent_trials liczby węzłów w klastrze. Jeśli na przykład masz klaster z 4 węzłami, ustaw max_concurrent_trials na 4. Przykładowe użycie Konfiguracja elementu ImageLimitSettings from azure.ai.ml import automl # Create the AutoML job with the related factory-function. image_instance_segmentation_job = automl.image_instance_segmentation( compute=compute_name, experiment_name=exp_name, training_data=my_training_data_input, validation_data=my_validation_data_input, target_column_name="label", primary_metric="MeanAveragePrecision", tags={"my_custom_tag": "custom value"}, ) # Set the limits for the AutoML job. image_instance_segmentation_job.set_limits( max_trials=10, max_concurrent_trials=2, ) # Submit the AutoML job. image_instance_segmentation_job.submit() Inicjowanie obiektu ImageLimitSettings. Konstruktor imageLimitSettings dla pionowych obrazów autoML.
ImageModelSettingsClassification	Ustawienia modelu dla zadań klasyfikacji obrazów rozwiązania AutoML.
ImageModelSettingsObjectDetection	Ustawienia modelu dla zadania wykrywania obiektów obrazów automatycznego uczenia maszynowego.
ImageObjectDetectionJob	Konfiguracja zadania wykrywania obiektów obrazów automatycznego uczenia maszynowego. Zainicjuj nowe zadanie wykrywania obiektów obrazów automatycznego uczenia maszynowego.
ImageObjectDetectionSearchSpace	Wyszukaj miejsce na potrzeby zadań wykrywania obiektów obrazów automatycznego uczenia maszynowego i segmentacji wystąpień obrazów.
ImageSweepSettings	Ustawienia zamiatania dla wszystkich obrazów AutoML w pionie.
NlpFeaturizationSettings	Ustawienia cechowania dla wszystkich pionowych funkcji NLP automatycznego uczenia maszynowego.
NlpFixedParameters	Obiekt do przechowywania stałych parametrów dla zadań NLP.
NlpLimitSettings	Ogranicz ustawienia dla wszystkich pionowych funkcji nlp zautomatyzowanego uczenia maszynowego.
NlpSearchSpace	Wyszukaj miejsce na potrzeby zadań automatycznego równoważenia obciążenia sieciowego w usłudze AutoML.
NlpSweepSettings	Ustawienia zamiatania dla wszystkich zadań nlp rozwiązania AutoML.
RegressionJob	Konfiguracja zadania regresji automatycznego uczenia maszynowego. Inicjowanie nowego zadania regresji automatycznego uczenia maszynowego.
SearchSpace	Klasa SearchSpace dla pionowych uczenia maszynowego.
StackEnsembleSettings	Ustawienie zaawansowane umożliwiające dostosowanie przebiegu StackEnsemble.
TabularFeaturizationSettings	Ustawienia cechowania dla zadania rozwiązania AutoML.
TabularLimitSettings	Ogranicz ustawienia tabeli AutoML w pionie.
TextClassificationJob	Konfiguracja zadania klasyfikacji tekstu zautomatyzowanego uczenia maszynowego. Inicjuje nowe zadanie klasyfikacji tekstu zautomatyzowanego uczenia maszynowego.
TextClassificationMultilabelJob	Konfiguracja zadania wieloebelowego klasyfikacji tekstu automatycznego uczenia maszynowego. Inicjuje nowe zadanie multilabeli klasyfikacji tekstu automatycznego uczenia maszynowego.
TextNerJob	Konfiguracja zadania NER tekstu zautomatyzowanego uczenia maszynowego. Inicjuje nowe zadanie NER tekstu automatycznego uczenia maszynowego.
TrainingSettings	TrainingSettings, klasa dla usługi Azure Machine Learning. TrainingSettings, klasa dla usługi Azure Machine Learning.

Wyliczenia

BlockedTransformers	Wyliczenie dla wszystkich modeli klasyfikacji obsługiwanych przez rozwiązanie AutoML.
ClassificationModels	Wyliczenie dla wszystkich modeli klasyfikacji obsługiwanych przez rozwiązanie AutoML.
ClassificationMultilabelPrimaryMetrics	Podstawowe metryki dla zadań wieloabelowych klasyfikacji.
ClassificationPrimaryMetrics	Podstawowe metryki dla zadań klasyfikacji.
FeaturizationMode	Tryb cechowania — określa tryb cechowania danych.
ForecastHorizonMode	Wyliczenie w celu określenia trybu wyboru horyzontu prognozy.
ForecastingModels	Wyliczenie dla wszystkich modeli prognozowania obsługiwanych przez rozwiązanie AutoML.
ForecastingPrimaryMetrics	Podstawowe metryki dla zadania prognozowania.
InstanceSegmentationPrimaryMetrics	Podstawowe metryki dla zadań usługi InstanceSegmentation.
LearningRateScheduler	Wyliczenie harmonogramu szybkości nauki.
LogTrainingMetrics	Zawiera klasy zautomatyzowanego uczenia maszynowego dla zestawu SDKKv2 usługi Azure Machine Learning. Główne obszary obejmują zarządzanie zadaniami rozwiązania AutoML.
LogValidationLoss	Zawiera klasy zautomatyzowanego uczenia maszynowego dla zestawu SDKKv2 usługi Azure Machine Learning. Główne obszary obejmują zarządzanie zadaniami rozwiązania AutoML.
NCrossValidationsMode	Określa, jak jest określana wartość N-Cross validations.
ObjectDetectionPrimaryMetrics	Podstawowe metryki dla zadania Image ObjectDetection.
RegressionModels	Wyliczenie dla wszystkich modeli regresji obsługiwanych przez rozwiązanie AutoML.
RegressionPrimaryMetrics	Podstawowe metryki dla zadania regresji.
SamplingAlgorithmType	Zawiera klasy zautomatyzowanego uczenia maszynowego dla zestawu SDKKv2 usługi Azure Machine Learning. Główne obszary obejmują zarządzanie zadaniami rozwiązania AutoML.
ShortSeriesHandlingConfiguration	Parametr definiujący sposób obsługi krótkich szeregów czasowych przez rozwiązanie AutoML.
StochasticOptimizer	Optymalizator stochastyczny dla modeli obrazów.
TargetAggregationFunction	Docelowa funkcja agregacji.
TargetLagsMode	Tryby wyboru elementu docelowego są opóźniane.
TargetRollingWindowSizeMode	Docelowy tryb rozmiaru okien stopniowych.
UseStl	Skonfiguruj dekompozycję STL kolumny docelowej szeregów czasowych.
ValidationMetricType	Metoda obliczania metryki do użycia na potrzeby metryk walidacji w zadaniach obrazu.

Funkcje

classification

Funkcja do utworzenia zadania ClassificationJob.

Zadanie klasyfikacji służy do trenowania modelu, który najlepiej przewiduje klasę próbki danych. Różne modele są trenowane przy użyciu danych treningowych. Model z najlepszą wydajnością danych walidacji na podstawie podstawowej metryki jest wybierany jako ostateczny model.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parametry

training_data: Input

Dane szkoleniowe, które mają być używane w eksperymencie. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiety (opcjonalnie kolumnę przykładowych wag).

target_column_name: str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_dataparametrów validation_data i test_data

primary_metric

Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Dopuszczalne wartości: dokładność, AUC_weighted, norm_macro_recall, average_precision_score_weighted i precision_score_weighted Wartości domyślne dokładności

enable_model_explainability: bool

Czy włączyć wyjaśnienie najlepszego modelu automatycznego uczenia maszynowego na końcu wszystkich iteracji trenowania zautomatyzowanego uczenia maszynowego. Wartość domyślna to Brak. Aby uzyskać więcej informacji, zobacz Interpretowanie: wyjaśnienia modelu w zautomatyzowanym uczeniu maszynowym.

weight_column_name: str

Nazwa przykładowej kolumny wagi. Zautomatyzowane uczenie maszynowe obsługuje kolumnę ważoną jako dane wejściowe, co powoduje, że wiersze w danych mają być ważone w górę lub w dół. Jeśli dane wejściowe pochodzą z biblioteki pandas. Obiekt DataFrame, który nie ma nazw kolumn, można zamiast tego użyć indeksów kolumn wyrażonych jako liczby całkowite.

Ten parametr ma zastosowanie do training_data parametrów i validation_data

validation_data: Input

Dane weryfikacji, które mają być używane w eksperymencie. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiet (opcjonalnie kolumnę przykładowych wag).

Wartość domyślna to None

validation_data_size: float

Ułamek danych do przechowywania w celu weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 włącznie.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations lub validation_data_size wyodrębnić dane weryfikacji z określonych danych treningowych. W przypadku niestandardowego składania krzyżowego sprawdzania poprawności użyj polecenia cv_split_column_names.

Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.

Wartość domyślna to None

n_cross_validations: Union[str, int]

Ile weryfikacji krzyżowych należy wykonać, gdy nie określono danych weryfikacji użytkownika.

Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.

Wartość domyślna to None

cv_split_column_names: List[str]

Lista nazw kolumn zawierających podział niestandardowej weryfikacji krzyżowej. Każda z kolumn podzielonych CV reprezentuje jeden podział CV, w którym każdy wiersz jest oznaczony jako 1 do trenowania lub 0 w celu weryfikacji.

Wartość domyślna to None

test_data: Input

Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie wersji zapoznawczej i może ulec zmianie w dowolnym momencie. Dane testowe, które mają być używane na potrzeby przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.

Jeśli ten parametr lub test_data_size parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu. Dane testowe powinny zawierać zarówno funkcje, jak i kolumnę etykiety. Jeśli test_data określono parametr , target_column_name należy określić parametr .

Wartość domyślna to None

test_data_size: float

Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie wersji zapoznawczej i może ulec zmianie w dowolnym momencie. Ułamek danych treningowych do przechowywania danych testowych dla przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.

Powinno to należeć do przedziału od 0,0 do 1,0 włącznie. Jeśli test_data_size zostanie określony w tym samym czasie co validation_data_sizeparametr , dane testowe zostaną podzielone przed training_data podzieleniem danych walidacji. Jeśli na przykład validation_data_size=0.1test_data_size=0.1 , a oryginalne dane szkoleniowe zawierają 1000 wierszy, dane testowe będą zawierać 100 wierszy, dane walidacji będą zawierać 90 wierszy, a dane szkoleniowe będą zawierać 810 wierszy.

W przypadku zadań opartych na regresji jest używane losowe próbkowanie. W przypadku zadań klasyfikacji używane jest próbkowanie warstwowe. Prognozowanie nie obsługuje obecnie określania zestawu danych testowych przy użyciu podziału trenowania/testu.

Jeśli ten parametr lub test_data parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu.

Wartość domyślna to None

Zwraca

Obiekt zadania, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.

Typ zwracany

ClassificationJob

forecasting

Funkcja umożliwiająca utworzenie zadania prognozowania.

Zadanie prognozowania służy do przewidywania wartości docelowych dla przyszłego okresu czasu na podstawie danych historycznych. Różne modele są trenowane przy użyciu danych treningowych. Model z najlepszą wydajnością danych walidacji na podstawie podstawowej metryki jest wybierany jako ostateczny model.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parametry

training_data: Input

Dane szkoleniowe, które mają być używane w eksperymencie. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiety (opcjonalnie kolumnę przykładowych wag).

target_column_name: str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_dataparametrów validation_data i test_data

primary_metric

Dopuszczalne wartości: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Wartości domyślne do normalized_root_mean_squared_error

enable_model_explainability: bool

weight_column_name: str

Ten parametr ma zastosowanie do training_data parametrów i validation_data

validation_data: Input

Dane weryfikacji, które mają być używane w eksperymencie. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiet (opcjonalnie kolumnę przykładowych wag).

Wartość domyślna to None

validation_data_size: float

Ułamek danych do przechowywania w celu weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 włącznie.

Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.

Wartość domyślna to None

n_cross_validations: Union[str, int]

Ile weryfikacji krzyżowych należy wykonać, gdy nie określono danych weryfikacji użytkownika.

Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.

Wartość domyślna to None

cv_split_column_names: List[str]

Wartość domyślna to None

test_data: Input

Wartość domyślna to None

test_data_size: float

Jeśli ten parametr lub test_data parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu.

Wartość domyślna to None

forecasting_settings: ForecastingSettings

Ustawienia zadania prognozowania

Zwraca

Obiekt zadania, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.

Typ zwracany

ForecastingJob

image_classification

Tworzy obiekt dla zadania klasyfikacji wieloklasowej obrazu autoML.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parametry

training_data: Input

Dane szkoleniowe, które mają być używane w eksperymencie.

target_column_name: str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_data parametrów i .validation_data

primary_metric

Dopuszczalne wartości: dokładność, AUC_weighted, norm_macro_recall, average_precision_score_weighted i precision_score_weighted Wartości domyślne dokładności.

validation_data: Input

Dane weryfikacji, które mają być używane w eksperymencie.

validation_data_size: float

Ułamek danych do przechowywania w celu weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 włącznie.

Określ, aby zapewnić dane weryfikacji. W validation_data przeciwnym razie ustaw opcję validation_data_size wyodrębniania danych weryfikacji z określonych danych treningowych.

Wartość domyślna to .2

kwargs: dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Obiekt zadania klasyfikacji obrazów, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.

Typ zwracany

ImageClassificationJob

image_classification_multilabel

Tworzy obiekt dla zadania klasyfikacji wielokrotnej klasyfikacji obrazów autoML.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parametry

training_data: Input

Dane szkoleniowe, które mają być używane w ramach eksperymentu.

target_column_name: str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_data parametrów i .validation_data

primary_metric

Dopuszczalne wartości: dokładność, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted i Wartości domyślne Iou do Iou.

validation_data: Input

Dane weryfikacji, które mają być używane w eksperymencie.

validation_data_size: float

Jaki ułamek danych do przeprowadzenia weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustaw validation_data_size , aby wyodrębnić dane weryfikacji z określonych danych treningowych.

Wartość domyślna to .2

kwargs: dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Obraz obiekt zadania klasyfikacji z wieloma etykietami, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.

Typ zwracany

ImageClassificationMultilabelJob

image_instance_segmentation

Tworzy obiekt dla zadania segmentacji wystąpienia obrazu autoML.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parametry

training_data: Input

Dane szkoleniowe, które mają być używane w ramach eksperymentu.

target_column_name: str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_data parametrów i .validation_data

primary_metric

Dopuszczalne wartości: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data: Input

Dane weryfikacji, które mają być używane w eksperymencie.

validation_data_size: float

Jaki ułamek danych do przeprowadzenia weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustaw validation_data_size , aby wyodrębnić dane weryfikacji z określonych danych treningowych.

Wartość domyślna to .2

kwargs: dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Zadanie segmentacji wystąpienia obrazu

Typ zwracany

ImageInstanceSegmentationJob

image_object_detection

Tworzy obiekt dla zadania wykrywania obiektów obrazów automl.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parametry

training_data: Input

Dane szkoleniowe, które mają być używane w ramach eksperymentu.

target_column_name: str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_data parametrów i .validation_data

primary_metric

Dopuszczalne wartości: MeanAveragePrecision Defaults to MeanAveragePrecision.

validation_data: Input

Dane weryfikacji, które mają być używane w eksperymencie.

validation_data_size: float

Jaki ułamek danych do przeprowadzenia weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustaw validation_data_size , aby wyodrębnić dane weryfikacji z określonych danych treningowych.

Wartość domyślna to .2

kwargs: dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Obiekt zadania wykrywania obiektów obrazów, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.

Typ zwracany

ImageObjectDetectionJob

regression

Funkcja umożliwiająca utworzenie zadania regresji.

Zadanie regresji służy do trenowania modelu w celu przewidywania ciągłych wartości zmiennej docelowej z zestawu danych. Różne modele są trenowane przy użyciu danych treningowych. Model z najlepszą wydajnością danych walidacji na podstawie podstawowej metryki jest wybierany jako ostateczny model.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parametry

training_data: Input

Dane szkoleniowe, które mają być używane w ramach eksperymentu. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiety (opcjonalnie przykładową kolumnę wag).

target_column_name: str

Nazwa kolumny etykiety. Ten parametr ma zastosowanie do training_dataparametrów validation_data , i test_data

primary_metric

Dopuszczalne wartości: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Domyślnie normalized_root_mean_squared_error

enable_model_explainability: bool

Czy włączyć wyjaśnienie najlepszego modelu automatycznego uczenia maszynowego na końcu wszystkich iteracji trenowania automatycznego uczenia maszynowego. Wartość domyślna to Brak. Aby uzyskać więcej informacji, zobacz Interpretowanie: wyjaśnienia modelu w zautomatyzowanym uczeniu maszynowym.

weight_column_name: str

Nazwa kolumny wagi próbki. Zautomatyzowane uczenie maszynowe obsługuje kolumnę ważoną jako dane wejściowe, co powoduje, że wiersze w danych mają być ważone w górę lub w dół. Jeśli dane wejściowe pochodzą z biblioteki pandas. Ramka danych, która nie ma nazw kolumn, można zamiast tego użyć indeksów kolumn wyrażonych jako liczby całkowite.

Ten parametr ma zastosowanie do training_data parametrów i validation_data

validation_data: Input

Dane weryfikacji, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę etykiety (opcjonalnie kolumnę przykładowych wag).

Wartości domyślne to None

validation_data_size: float

Jaki ułamek danych do przeprowadzenia weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations lub validation_data_size wyodrębnić dane weryfikacji z określonych danych treningowych. W przypadku niestandardowej krzyżowej weryfikacji należy użyć polecenia cv_split_column_names.

Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.

Wartości domyślne to None

n_cross_validations: Union[str, int]

Ile walidacji krzyżowych należy wykonać, gdy nie określono danych weryfikacji użytkownika.

Określ validation_data , aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations lub validation_data_size wyodrębnić dane weryfikacji z określonych danych treningowych. W przypadku niestandardowej krzyżowej weryfikacji należy użyć polecenia cv_split_column_names.

Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.

Wartości domyślne to None

cv_split_column_names: List[str]

Lista nazw kolumn zawierających podział niestandardowej weryfikacji krzyżowej. Każda kolumna podziału CV reprezentuje jeden podział cv, w którym każdy wiersz jest oznaczony jako 1 do trenowania lub 0 na potrzeby walidacji.

Wartości domyślne to None

test_data: Input

Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie podglądu i może ulec zmianie w dowolnym momencie. Dane testowe do użycia na potrzeby przebiegu testu, które zostaną automatycznie uruchomione po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.

Jeśli ten parametr lub test_data_size parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu. Dane testowe powinny zawierać zarówno funkcje, jak i kolumnę etykiety. Jeśli test_data zostanie określony, target_column_name należy określić parametr .

Wartości domyślne to None

test_data_size: float

Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie podglądu i może ulec zmianie w dowolnym momencie. Ułamek danych treningowych do przechowywania danych testowych na potrzeby przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.

Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego. Jeśli test_data_size zostanie określony w tym samym czasie co validation_data_size, dane testowe zostaną podzielone przed training_data podzieleniem danych walidacji. Jeśli na przykład dane testowe zawierają 1000 wierszy, validation_data_size=0.1test_data_size=0.1 dane testowe będą zawierać 100 wierszy, dane weryfikacji będą zawierać 90 wierszy, a dane szkoleniowe będą zawierać 810 wierszy.

Jeśli ten parametr lub test_data parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu.

Wartości domyślne to None

Zwraca

Obiekt zadania, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.

Typ zwracany

RegressionJob

text_classification

Funkcja do utworzenia obiektu TextClassificationJob.

Zadanie klasyfikacji tekstu służy do trenowania modelu, który może przewidywać klasę/kategorię danych tekstowych. Wejściowe dane szkoleniowe powinny zawierać kolumnę docelową, która klasyfikuje tekst do dokładnie jednej klasy.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parametry

training_data: Input

Dane szkoleniowe, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.

target_column_name: str

Nazwa kolumny docelowej.

validation_data: Input

Dane weryfikacji, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.

primary_metric: Union[str, ClassificationPrimaryMetrics]

Podstawowa metryka zadania. Dopuszczalne wartości: dokładność, AUC_weighted, precision_score_weighted

log_verbosity: str

Poziom szczegółowości dziennika.

kwargs: dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Obiekt TextClassificationJob.

Typ zwracany

TextClassificationJob

text_classification_multilabel

Funkcja do utworzenia obiektu TextClassificationMultilabelJob.

Zadanie wieloabelowe klasyfikacji tekstu służy do trenowania modelu, który może przewidywać klasy/kategorie danych tekstowych. Wejściowe dane szkoleniowe powinny zawierać kolumnę docelową, która klasyfikuje tekst do klas(es). Aby uzyskać więcej informacji na temat formatu danych wieloznakowych, zobacz: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parametry

training_data: Input

Dane szkoleniowe, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.

target_column_name: str

Nazwa kolumny docelowej.

validation_data: Input

Dane weryfikacji, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.

primary_metric: str

Podstawowa metryka zadania. Dopuszczalne wartości: dokładność

log_verbosity: str

Poziom szczegółowości dziennika.

kwargs: dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Obiekt TextClassificationMultilabelJob.

Typ zwracany

TextClassificationMultilabelJob

text_ner

Funkcja do utworzenia zadania TextNerJob.

Zadanie rozpoznawania jednostek o nazwie tekst służy do trenowania modelu, który może przewidywać nazwane jednostki w tekście. Dane treningowe wejściowe powinny być plikiem tekstowym w formacie CoNLL. Aby uzyskać więcej informacji na temat formatu danych tekstowych NER, zobacz: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parametry

training_data: Input

Dane szkoleniowe, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.

validation_data: Input

Dane weryfikacji, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.

primary_metric: str

Podstawowa metryka zadania. Dopuszczalne wartości: dokładność

log_verbosity: str

Poziom szczegółowości dziennika.

kwargs: dict

Słownik dodatkowych parametrów konfiguracji.

Zwraca

Obiekt TextNerJob.

Typ zwracany

TextNerJob

Udostępnij za pośrednictwem

automl Pakiet

Klasy

Wyliczenia

Funkcje

classification

Parametry

Zwraca

Typ zwracany

forecasting

Parametry

Zwraca

Typ zwracany

image_classification

Parametry

Zwraca

Typ zwracany

image_classification_multilabel

Parametry

Zwraca

Typ zwracany

image_instance_segmentation

Parametry

Zwraca

Typ zwracany

image_object_detection

Parametry

Zwraca

Typ zwracany

regression

Parametry

Zwraca

Typ zwracany

text_classification

Parametry

Zwraca

Typ zwracany

text_classification_multilabel

Parametry

Zwraca

Typ zwracany

text_ner

Parametry

Zwraca

Typ zwracany

Opinia

Dodatkowe zasoby