automl Pakiet
Zawiera klasy zautomatyzowanego uczenia maszynowego dla zestawu SDKKv2 usługi Azure Machine Learning.
Główne obszary obejmują zarządzanie zadaniami rozwiązania AutoML.
Klasy
ClassificationJob |
Konfiguracja zadania klasyfikacji automatycznego uczenia maszynowego. Zainicjuj nowe zadanie klasyfikacji automatycznego uczenia maszynowego. |
ColumnTransformer |
Ustawienia przekształcania kolumn. |
ForecastingJob |
Konfiguracja zadania prognozowania automatycznego uczenia maszynowego. Zainicjuj nowe zadanie prognozowania automatycznego uczenia maszynowego. |
ForecastingSettings |
Ustawienia prognozowania dla zadania rozwiązania AutoML. |
ImageClassificationJob |
Konfiguracja zadania klasyfikacji obrazów wieloklasowej zautomatyzowanego uczenia maszynowego. Zainicjuj nowe zadanie klasyfikacji obrazów wieloklasowej zautomatyzowanego uczenia maszynowego. |
ImageClassificationMultilabelJob |
Konfiguracja zadania klasyfikacji obrazów z wieloma etykietami rozwiązania AutoML. Zainicjuj nowe zadanie klasyfikacji obrazów z wieloma etykietami rozwiązania AutoML. |
ImageClassificationSearchSpace |
Wyszukaj miejsce na zadania klasyfikacji obrazów automatycznego uczenia maszynowego i klasyfikacji obrazów z wieloma etykietami. |
ImageInstanceSegmentationJob |
Konfiguracja zadania segmentacji wystąpienia obrazu automatycznego uczenia maszynowego. Inicjowanie nowego zadania segmentacji wystąpienia obrazu rozwiązania AutoML. |
ImageLimitSettings |
Ogranicz ustawienia dla obrazów autoML w pionie. ImageLimitSettings to klasa zawierająca następujące parametry: max_concurrent_trials, max_trials i timeout_minutes. Jest to opcjonalna metoda konfiguracji umożliwiająca skonfigurowanie parametrów limitów, takich jak limity czasu itp. Uwaga Liczba współbieżnych przebiegów jest warunkowa dla zasobów dostępnych w określonym docelowym obiekcie obliczeniowym. Upewnij się, że docelowy obiekt obliczeniowy ma dostępne zasoby dla żądanej współbieżności. Porada Dobrym rozwiązaniem jest dopasowanie liczby max_concurrent_trials liczby węzłów w klastrze. Jeśli na przykład masz klaster z 4 węzłami, ustaw max_concurrent_trials na 4. Przykładowe użycie Konfiguracja elementu ImageLimitSettings
Inicjowanie obiektu ImageLimitSettings. Konstruktor imageLimitSettings dla pionowych obrazów autoML. |
ImageModelSettingsClassification |
Ustawienia modelu dla zadań klasyfikacji obrazów rozwiązania AutoML. |
ImageModelSettingsObjectDetection |
Ustawienia modelu dla zadania wykrywania obiektów obrazów automatycznego uczenia maszynowego. |
ImageObjectDetectionJob |
Konfiguracja zadania wykrywania obiektów obrazów automatycznego uczenia maszynowego. Zainicjuj nowe zadanie wykrywania obiektów obrazów automatycznego uczenia maszynowego. |
ImageObjectDetectionSearchSpace |
Wyszukaj miejsce na potrzeby zadań wykrywania obiektów obrazów automatycznego uczenia maszynowego i segmentacji wystąpień obrazów. |
ImageSweepSettings |
Ustawienia zamiatania dla wszystkich obrazów AutoML w pionie. |
NlpFeaturizationSettings |
Ustawienia cechowania dla wszystkich pionowych funkcji NLP automatycznego uczenia maszynowego. |
NlpFixedParameters |
Obiekt do przechowywania stałych parametrów dla zadań NLP. |
NlpLimitSettings |
Ogranicz ustawienia dla wszystkich pionowych funkcji nlp zautomatyzowanego uczenia maszynowego. |
NlpSearchSpace |
Wyszukaj miejsce na potrzeby zadań automatycznego równoważenia obciążenia sieciowego w usłudze AutoML. |
NlpSweepSettings |
Ustawienia zamiatania dla wszystkich zadań nlp rozwiązania AutoML. |
RegressionJob |
Konfiguracja zadania regresji automatycznego uczenia maszynowego. Inicjowanie nowego zadania regresji automatycznego uczenia maszynowego. |
SearchSpace |
Klasa SearchSpace dla pionowych uczenia maszynowego. |
StackEnsembleSettings |
Ustawienie zaawansowane umożliwiające dostosowanie przebiegu StackEnsemble. |
TabularFeaturizationSettings |
Ustawienia cechowania dla zadania rozwiązania AutoML. |
TabularLimitSettings |
Ogranicz ustawienia tabeli AutoML w pionie. |
TextClassificationJob |
Konfiguracja zadania klasyfikacji tekstu zautomatyzowanego uczenia maszynowego. Inicjuje nowe zadanie klasyfikacji tekstu zautomatyzowanego uczenia maszynowego. |
TextClassificationMultilabelJob |
Konfiguracja zadania wieloebelowego klasyfikacji tekstu automatycznego uczenia maszynowego. Inicjuje nowe zadanie multilabeli klasyfikacji tekstu automatycznego uczenia maszynowego. |
TextNerJob |
Konfiguracja zadania NER tekstu zautomatyzowanego uczenia maszynowego. Inicjuje nowe zadanie NER tekstu automatycznego uczenia maszynowego. |
TrainingSettings |
TrainingSettings, klasa dla usługi Azure Machine Learning. TrainingSettings, klasa dla usługi Azure Machine Learning. |
Wyliczenia
BlockedTransformers |
Wyliczenie dla wszystkich modeli klasyfikacji obsługiwanych przez rozwiązanie AutoML. |
ClassificationModels |
Wyliczenie dla wszystkich modeli klasyfikacji obsługiwanych przez rozwiązanie AutoML. |
ClassificationMultilabelPrimaryMetrics |
Podstawowe metryki dla zadań wieloabelowych klasyfikacji. |
ClassificationPrimaryMetrics |
Podstawowe metryki dla zadań klasyfikacji. |
FeaturizationMode |
Tryb cechowania — określa tryb cechowania danych. |
ForecastHorizonMode |
Wyliczenie w celu określenia trybu wyboru horyzontu prognozy. |
ForecastingModels |
Wyliczenie dla wszystkich modeli prognozowania obsługiwanych przez rozwiązanie AutoML. |
ForecastingPrimaryMetrics |
Podstawowe metryki dla zadania prognozowania. |
InstanceSegmentationPrimaryMetrics |
Podstawowe metryki dla zadań usługi InstanceSegmentation. |
LearningRateScheduler |
Wyliczenie harmonogramu szybkości nauki. |
LogTrainingMetrics |
Zawiera klasy zautomatyzowanego uczenia maszynowego dla zestawu SDKKv2 usługi Azure Machine Learning. Główne obszary obejmują zarządzanie zadaniami rozwiązania AutoML. |
LogValidationLoss |
Zawiera klasy zautomatyzowanego uczenia maszynowego dla zestawu SDKKv2 usługi Azure Machine Learning. Główne obszary obejmują zarządzanie zadaniami rozwiązania AutoML. |
NCrossValidationsMode |
Określa, jak jest określana wartość N-Cross validations. |
ObjectDetectionPrimaryMetrics |
Podstawowe metryki dla zadania Image ObjectDetection. |
RegressionModels |
Wyliczenie dla wszystkich modeli regresji obsługiwanych przez rozwiązanie AutoML. |
RegressionPrimaryMetrics |
Podstawowe metryki dla zadania regresji. |
SamplingAlgorithmType |
Zawiera klasy zautomatyzowanego uczenia maszynowego dla zestawu SDKKv2 usługi Azure Machine Learning. Główne obszary obejmują zarządzanie zadaniami rozwiązania AutoML. |
ShortSeriesHandlingConfiguration |
Parametr definiujący sposób obsługi krótkich szeregów czasowych przez rozwiązanie AutoML. |
StochasticOptimizer |
Optymalizator stochastyczny dla modeli obrazów. |
TargetAggregationFunction |
Docelowa funkcja agregacji. |
TargetLagsMode |
Tryby wyboru elementu docelowego są opóźniane. |
TargetRollingWindowSizeMode |
Docelowy tryb rozmiaru okien stopniowych. |
UseStl |
Skonfiguruj dekompozycję STL kolumny docelowej szeregów czasowych. |
ValidationMetricType |
Metoda obliczania metryki do użycia na potrzeby metryk walidacji w zadaniach obrazu. |
Funkcje
classification
Funkcja do utworzenia zadania ClassificationJob.
Zadanie klasyfikacji służy do trenowania modelu, który najlepiej przewiduje klasę próbki danych. Różne modele są trenowane przy użyciu danych treningowych. Model z najlepszą wydajnością danych walidacji na podstawie podstawowej metryki jest wybierany jako ostateczny model.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
Parametry
- training_data
- Input
Dane szkoleniowe, które mają być używane w eksperymencie. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiety (opcjonalnie kolumnę przykładowych wag).
- target_column_name
- str
Nazwa kolumny etykiety.
Ten parametr ma zastosowanie do training_data
parametrów validation_data
i test_data
- primary_metric
Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Dopuszczalne wartości: dokładność, AUC_weighted, norm_macro_recall, average_precision_score_weighted i precision_score_weighted Wartości domyślne dokładności
- enable_model_explainability
- bool
Czy włączyć wyjaśnienie najlepszego modelu automatycznego uczenia maszynowego na końcu wszystkich iteracji trenowania zautomatyzowanego uczenia maszynowego. Wartość domyślna to Brak. Aby uzyskać więcej informacji, zobacz Interpretowanie: wyjaśnienia modelu w zautomatyzowanym uczeniu maszynowym.
- weight_column_name
- str
Nazwa przykładowej kolumny wagi. Zautomatyzowane uczenie maszynowe obsługuje kolumnę ważoną jako dane wejściowe, co powoduje, że wiersze w danych mają być ważone w górę lub w dół. Jeśli dane wejściowe pochodzą z biblioteki pandas. Obiekt DataFrame, który nie ma nazw kolumn, można zamiast tego użyć indeksów kolumn wyrażonych jako liczby całkowite.
Ten parametr ma zastosowanie do training_data
parametrów i validation_data
- validation_data
- Input
Dane weryfikacji, które mają być używane w eksperymencie. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiet (opcjonalnie kolumnę przykładowych wag).
Wartość domyślna to None
- validation_data_size
- float
Ułamek danych do przechowywania w celu weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 włącznie.
Określ validation_data
, aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations
lub validation_data_size
wyodrębnić dane weryfikacji z określonych danych treningowych.
W przypadku niestandardowego składania krzyżowego sprawdzania poprawności użyj polecenia cv_split_column_names
.
Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.
Wartość domyślna to None
Ile weryfikacji krzyżowych należy wykonać, gdy nie określono danych weryfikacji użytkownika.
Określ validation_data
, aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations
lub validation_data_size
wyodrębnić dane weryfikacji z określonych danych treningowych.
W przypadku niestandardowego składania krzyżowego sprawdzania poprawności użyj polecenia cv_split_column_names
.
Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.
Wartość domyślna to None
Lista nazw kolumn zawierających podział niestandardowej weryfikacji krzyżowej. Każda z kolumn podzielonych CV reprezentuje jeden podział CV, w którym każdy wiersz jest oznaczony jako 1 do trenowania lub 0 w celu weryfikacji.
Wartość domyślna to None
- test_data
- Input
Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie wersji zapoznawczej i może ulec zmianie w dowolnym momencie. Dane testowe, które mają być używane na potrzeby przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.
Jeśli ten parametr lub test_data_size
parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu.
Dane testowe powinny zawierać zarówno funkcje, jak i kolumnę etykiety.
Jeśli test_data
określono parametr , target_column_name
należy określić parametr .
Wartość domyślna to None
- test_data_size
- float
Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie wersji zapoznawczej i może ulec zmianie w dowolnym momencie. Ułamek danych treningowych do przechowywania danych testowych dla przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.
Powinno to należeć do przedziału od 0,0 do 1,0 włącznie.
Jeśli test_data_size
zostanie określony w tym samym czasie co validation_data_size
parametr , dane testowe zostaną podzielone przed training_data
podzieleniem danych walidacji.
Jeśli na przykład validation_data_size=0.1
test_data_size=0.1
, a oryginalne dane szkoleniowe zawierają 1000 wierszy, dane testowe będą zawierać 100 wierszy, dane walidacji będą zawierać 90 wierszy, a dane szkoleniowe będą zawierać 810 wierszy.
W przypadku zadań opartych na regresji jest używane losowe próbkowanie. W przypadku zadań klasyfikacji używane jest próbkowanie warstwowe. Prognozowanie nie obsługuje obecnie określania zestawu danych testowych przy użyciu podziału trenowania/testu.
Jeśli ten parametr lub test_data
parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu.
Wartość domyślna to None
Zwraca
Obiekt zadania, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.
Typ zwracany
forecasting
Funkcja umożliwiająca utworzenie zadania prognozowania.
Zadanie prognozowania służy do przewidywania wartości docelowych dla przyszłego okresu czasu na podstawie danych historycznych. Różne modele są trenowane przy użyciu danych treningowych. Model z najlepszą wydajnością danych walidacji na podstawie podstawowej metryki jest wybierany jako ostateczny model.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
Parametry
- training_data
- Input
Dane szkoleniowe, które mają być używane w eksperymencie. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiety (opcjonalnie kolumnę przykładowych wag).
- target_column_name
- str
Nazwa kolumny etykiety.
Ten parametr ma zastosowanie do training_data
parametrów validation_data
i test_data
- primary_metric
Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Dopuszczalne wartości: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Wartości domyślne do normalized_root_mean_squared_error
- enable_model_explainability
- bool
Czy włączyć wyjaśnienie najlepszego modelu automatycznego uczenia maszynowego na końcu wszystkich iteracji trenowania zautomatyzowanego uczenia maszynowego. Wartość domyślna to Brak. Aby uzyskać więcej informacji, zobacz Interpretowanie: wyjaśnienia modelu w zautomatyzowanym uczeniu maszynowym.
- weight_column_name
- str
Nazwa przykładowej kolumny wagi. Zautomatyzowane uczenie maszynowe obsługuje kolumnę ważoną jako dane wejściowe, co powoduje, że wiersze w danych mają być ważone w górę lub w dół. Jeśli dane wejściowe pochodzą z biblioteki pandas. Obiekt DataFrame, który nie ma nazw kolumn, można zamiast tego użyć indeksów kolumn wyrażonych jako liczby całkowite.
Ten parametr ma zastosowanie do training_data
parametrów i validation_data
- validation_data
- Input
Dane weryfikacji, które mają być używane w eksperymencie. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiet (opcjonalnie kolumnę przykładowych wag).
Wartość domyślna to None
- validation_data_size
- float
Ułamek danych do przechowywania w celu weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 włącznie.
Określ validation_data
, aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations
lub validation_data_size
wyodrębnić dane weryfikacji z określonych danych treningowych.
W przypadku niestandardowego składania krzyżowego sprawdzania poprawności użyj polecenia cv_split_column_names
.
Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.
Wartość domyślna to None
Ile weryfikacji krzyżowych należy wykonać, gdy nie określono danych weryfikacji użytkownika.
Określ validation_data
, aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations
lub validation_data_size
wyodrębnić dane weryfikacji z określonych danych treningowych.
W przypadku niestandardowego składania krzyżowego sprawdzania poprawności użyj polecenia cv_split_column_names
.
Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.
Wartość domyślna to None
Lista nazw kolumn zawierających podział niestandardowej weryfikacji krzyżowej. Każda z kolumn podzielonych CV reprezentuje jeden podział CV, w którym każdy wiersz jest oznaczony jako 1 do trenowania lub 0 w celu weryfikacji.
Wartość domyślna to None
- test_data
- Input
Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie wersji zapoznawczej i może ulec zmianie w dowolnym momencie. Dane testowe, które mają być używane na potrzeby przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.
Jeśli ten parametr lub test_data_size
parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu.
Dane testowe powinny zawierać zarówno funkcje, jak i kolumnę etykiety.
Jeśli test_data
określono parametr , target_column_name
należy określić parametr .
Wartość domyślna to None
- test_data_size
- float
Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie wersji zapoznawczej i może ulec zmianie w dowolnym momencie. Ułamek danych treningowych do przechowywania danych testowych dla przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.
Powinno to należeć do przedziału od 0,0 do 1,0 włącznie.
Jeśli test_data_size
zostanie określony w tym samym czasie co validation_data_size
parametr , dane testowe zostaną podzielone przed training_data
podzieleniem danych walidacji.
Jeśli na przykład validation_data_size=0.1
test_data_size=0.1
, a oryginalne dane szkoleniowe zawierają 1000 wierszy, dane testowe będą zawierać 100 wierszy, dane walidacji będą zawierać 90 wierszy, a dane szkoleniowe będą zawierać 810 wierszy.
W przypadku zadań opartych na regresji jest używane losowe próbkowanie. W przypadku zadań klasyfikacji używane jest próbkowanie warstwowe. Prognozowanie nie obsługuje obecnie określania zestawu danych testowych przy użyciu podziału trenowania/testu.
Jeśli ten parametr lub test_data
parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu.
Wartość domyślna to None
- forecasting_settings
- ForecastingSettings
Ustawienia zadania prognozowania
Zwraca
Obiekt zadania, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.
Typ zwracany
image_classification
Tworzy obiekt dla zadania klasyfikacji wieloklasowej obrazu autoML.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
Parametry
- training_data
- Input
Dane szkoleniowe, które mają być używane w eksperymencie.
- target_column_name
- str
Nazwa kolumny etykiety.
Ten parametr ma zastosowanie do training_data
parametrów i .validation_data
- primary_metric
Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Dopuszczalne wartości: dokładność, AUC_weighted, norm_macro_recall, average_precision_score_weighted i precision_score_weighted Wartości domyślne dokładności.
- validation_data
- Input
Dane weryfikacji, które mają być używane w eksperymencie.
- validation_data_size
- float
Ułamek danych do przechowywania w celu weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 włącznie.
Określ, aby zapewnić dane weryfikacji. W validation_data
przeciwnym razie ustaw opcję validation_data_size
wyodrębniania danych weryfikacji z określonych danych treningowych.
Wartość domyślna to .2
- kwargs
- dict
Słownik dodatkowych parametrów konfiguracji.
Zwraca
Obiekt zadania klasyfikacji obrazów, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.
Typ zwracany
image_classification_multilabel
Tworzy obiekt dla zadania klasyfikacji wielokrotnej klasyfikacji obrazów autoML.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
Parametry
- training_data
- Input
Dane szkoleniowe, które mają być używane w ramach eksperymentu.
- target_column_name
- str
Nazwa kolumny etykiety.
Ten parametr ma zastosowanie do training_data
parametrów i .validation_data
- primary_metric
Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Dopuszczalne wartości: dokładność, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted i Wartości domyślne Iou do Iou.
- validation_data
- Input
Dane weryfikacji, które mają być używane w eksperymencie.
- validation_data_size
- float
Jaki ułamek danych do przeprowadzenia weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.
Określ validation_data
, aby zapewnić dane weryfikacji, w przeciwnym razie ustaw validation_data_size
, aby wyodrębnić dane weryfikacji z określonych danych treningowych.
Wartość domyślna to .2
- kwargs
- dict
Słownik dodatkowych parametrów konfiguracji.
Zwraca
Obraz obiekt zadania klasyfikacji z wieloma etykietami, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.
Typ zwracany
image_instance_segmentation
Tworzy obiekt dla zadania segmentacji wystąpienia obrazu autoML.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
Parametry
- training_data
- Input
Dane szkoleniowe, które mają być używane w ramach eksperymentu.
- target_column_name
- str
Nazwa kolumny etykiety.
Ten parametr ma zastosowanie do training_data
parametrów i .validation_data
- primary_metric
Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Dopuszczalne wartości: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
Dane weryfikacji, które mają być używane w eksperymencie.
- validation_data_size
- float
Jaki ułamek danych do przeprowadzenia weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.
Określ validation_data
, aby zapewnić dane weryfikacji, w przeciwnym razie ustaw validation_data_size
, aby wyodrębnić dane weryfikacji z określonych danych treningowych.
Wartość domyślna to .2
- kwargs
- dict
Słownik dodatkowych parametrów konfiguracji.
Zwraca
Zadanie segmentacji wystąpienia obrazu
Typ zwracany
image_object_detection
Tworzy obiekt dla zadania wykrywania obiektów obrazów automl.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
Parametry
- training_data
- Input
Dane szkoleniowe, które mają być używane w ramach eksperymentu.
- target_column_name
- str
Nazwa kolumny etykiety.
Ten parametr ma zastosowanie do training_data
parametrów i .validation_data
- primary_metric
Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Dopuszczalne wartości: MeanAveragePrecision Defaults to MeanAveragePrecision.
- validation_data
- Input
Dane weryfikacji, które mają być używane w eksperymencie.
- validation_data_size
- float
Jaki ułamek danych do przeprowadzenia weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.
Określ validation_data
, aby zapewnić dane weryfikacji, w przeciwnym razie ustaw validation_data_size
, aby wyodrębnić dane weryfikacji z określonych danych treningowych.
Wartość domyślna to .2
- kwargs
- dict
Słownik dodatkowych parametrów konfiguracji.
Zwraca
Obiekt zadania wykrywania obiektów obrazów, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.
Typ zwracany
regression
Funkcja umożliwiająca utworzenie zadania regresji.
Zadanie regresji służy do trenowania modelu w celu przewidywania ciągłych wartości zmiennej docelowej z zestawu danych. Różne modele są trenowane przy użyciu danych treningowych. Model z najlepszą wydajnością danych walidacji na podstawie podstawowej metryki jest wybierany jako ostateczny model.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
Parametry
- training_data
- Input
Dane szkoleniowe, które mają być używane w ramach eksperymentu. Powinna ona zawierać zarówno funkcje trenowania, jak i kolumnę etykiety (opcjonalnie przykładową kolumnę wag).
- target_column_name
- str
Nazwa kolumny etykiety.
Ten parametr ma zastosowanie do training_data
parametrów validation_data
, i test_data
- primary_metric
Metryka zoptymalizowana pod kątem wyboru modelu przez zautomatyzowane uczenie maszynowe. Zautomatyzowane uczenie maszynowe zbiera więcej metryk niż może zoptymalizować. Aby uzyskać więcej informacji na temat sposobu obliczania metryk, zobacz https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Dopuszczalne wartości: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Domyślnie normalized_root_mean_squared_error
- enable_model_explainability
- bool
Czy włączyć wyjaśnienie najlepszego modelu automatycznego uczenia maszynowego na końcu wszystkich iteracji trenowania automatycznego uczenia maszynowego. Wartość domyślna to Brak. Aby uzyskać więcej informacji, zobacz Interpretowanie: wyjaśnienia modelu w zautomatyzowanym uczeniu maszynowym.
- weight_column_name
- str
Nazwa kolumny wagi próbki. Zautomatyzowane uczenie maszynowe obsługuje kolumnę ważoną jako dane wejściowe, co powoduje, że wiersze w danych mają być ważone w górę lub w dół. Jeśli dane wejściowe pochodzą z biblioteki pandas. Ramka danych, która nie ma nazw kolumn, można zamiast tego użyć indeksów kolumn wyrażonych jako liczby całkowite.
Ten parametr ma zastosowanie do training_data
parametrów i validation_data
- validation_data
- Input
Dane weryfikacji, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę etykiety (opcjonalnie kolumnę przykładowych wag).
Wartości domyślne to None
- validation_data_size
- float
Jaki ułamek danych do przeprowadzenia weryfikacji, gdy nie określono danych weryfikacji użytkownika. Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.
Określ validation_data
, aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations
lub validation_data_size
wyodrębnić dane weryfikacji z określonych danych treningowych.
W przypadku niestandardowej krzyżowej weryfikacji należy użyć polecenia cv_split_column_names
.
Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.
Wartości domyślne to None
Ile walidacji krzyżowych należy wykonać, gdy nie określono danych weryfikacji użytkownika.
Określ validation_data
, aby zapewnić dane weryfikacji, w przeciwnym razie ustawić n_cross_validations
lub validation_data_size
wyodrębnić dane weryfikacji z określonych danych treningowych.
W przypadku niestandardowej krzyżowej weryfikacji należy użyć polecenia cv_split_column_names
.
Aby uzyskać więcej informacji, zobacz Konfigurowanie podziałów danych i krzyżowe sprawdzanie poprawności w zautomatyzowanym uczeniu maszynowym.
Wartości domyślne to None
Lista nazw kolumn zawierających podział niestandardowej weryfikacji krzyżowej. Każda kolumna podziału CV reprezentuje jeden podział cv, w którym każdy wiersz jest oznaczony jako 1 do trenowania lub 0 na potrzeby walidacji.
Wartości domyślne to None
- test_data
- Input
Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie podglądu i może ulec zmianie w dowolnym momencie. Dane testowe do użycia na potrzeby przebiegu testu, które zostaną automatycznie uruchomione po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.
Jeśli ten parametr lub test_data_size
parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu.
Dane testowe powinny zawierać zarówno funkcje, jak i kolumnę etykiety.
Jeśli test_data
zostanie określony, target_column_name
należy określić parametr .
Wartości domyślne to None
- test_data_size
- float
Funkcja testu modelu przy użyciu zestawów danych testowych lub podziałów danych testowych jest funkcją w stanie podglądu i może ulec zmianie w dowolnym momencie. Ułamek danych treningowych do przechowywania danych testowych na potrzeby przebiegu testu, który zostanie automatycznie uruchomiony po zakończeniu trenowania modelu. Przebieg testu uzyska przewidywania przy użyciu najlepszego modelu i obliczy metryki, biorąc pod uwagę te przewidywania.
Powinno to należeć do przedziału od 0,0 do 1,0 inkluzywnego.
Jeśli test_data_size
zostanie określony w tym samym czasie co validation_data_size
, dane testowe zostaną podzielone przed training_data
podzieleniem danych walidacji.
Jeśli na przykład dane testowe zawierają 1000 wierszy, validation_data_size=0.1
test_data_size=0.1
dane testowe będą zawierać 100 wierszy, dane weryfikacji będą zawierać 90 wierszy, a dane szkoleniowe będą zawierać 810 wierszy.
W przypadku zadań opartych na regresji jest używane losowe próbkowanie. W przypadku zadań klasyfikacji używane jest próbkowanie warstwowe. Prognozowanie nie obsługuje obecnie określania zestawu danych testowego przy użyciu podziału trenowania/testu.
Jeśli ten parametr lub test_data
parametr nie zostaną określone, uruchomienie testu nie zostanie wykonane automatycznie po zakończeniu trenowania modelu.
Wartości domyślne to None
Zwraca
Obiekt zadania, który można przesłać do obliczeń usługi Azure ML na potrzeby wykonywania.
Typ zwracany
text_classification
Funkcja do utworzenia obiektu TextClassificationJob.
Zadanie klasyfikacji tekstu służy do trenowania modelu, który może przewidywać klasę/kategorię danych tekstowych. Wejściowe dane szkoleniowe powinny zawierać kolumnę docelową, która klasyfikuje tekst do dokładnie jednej klasy.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
Parametry
- training_data
- Input
Dane szkoleniowe, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.
- target_column_name
- str
Nazwa kolumny docelowej.
- validation_data
- Input
Dane weryfikacji, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
Podstawowa metryka zadania. Dopuszczalne wartości: dokładność, AUC_weighted, precision_score_weighted
- log_verbosity
- str
Poziom szczegółowości dziennika.
- kwargs
- dict
Słownik dodatkowych parametrów konfiguracji.
Zwraca
Obiekt TextClassificationJob.
Typ zwracany
text_classification_multilabel
Funkcja do utworzenia obiektu TextClassificationMultilabelJob.
Zadanie wieloabelowe klasyfikacji tekstu służy do trenowania modelu, który może przewidywać klasy/kategorie danych tekstowych. Wejściowe dane szkoleniowe powinny zawierać kolumnę docelową, która klasyfikuje tekst do klas(es). Aby uzyskać więcej informacji na temat formatu danych wieloznakowych, zobacz: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
Parametry
- training_data
- Input
Dane szkoleniowe, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.
- target_column_name
- str
Nazwa kolumny docelowej.
- validation_data
- Input
Dane weryfikacji, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.
- primary_metric
- str
Podstawowa metryka zadania. Dopuszczalne wartości: dokładność
- log_verbosity
- str
Poziom szczegółowości dziennika.
- kwargs
- dict
Słownik dodatkowych parametrów konfiguracji.
Zwraca
Obiekt TextClassificationMultilabelJob.
Typ zwracany
text_ner
Funkcja do utworzenia zadania TextNerJob.
Zadanie rozpoznawania jednostek o nazwie tekst służy do trenowania modelu, który może przewidywać nazwane jednostki w tekście. Dane treningowe wejściowe powinny być plikiem tekstowym w formacie CoNLL. Aby uzyskać więcej informacji na temat formatu danych tekstowych NER, zobacz: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
Parametry
- training_data
- Input
Dane szkoleniowe, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.
- validation_data
- Input
Dane weryfikacji, które mają być używane w eksperymencie. Powinna zawierać zarówno funkcje trenowania, jak i kolumnę docelową.
- primary_metric
- str
Podstawowa metryka zadania. Dopuszczalne wartości: dokładność
- log_verbosity
- str
Poziom szczegółowości dziennika.
- kwargs
- dict
Słownik dodatkowych parametrów konfiguracji.
Zwraca
Obiekt TextNerJob.
Typ zwracany
Azure SDK for Python