automl Balíček

Obsahuje automatizované třídy strojového učení pro Azure Machine Learning SDKv2.

Mezi hlavní oblasti patří správa úloh AutoML.

Třídy

ClassificationJob

Konfigurace pro úlohu klasifikace autoML.

Inicializuje novou úlohu klasifikace AutoML.

ColumnTransformer

Nastavení sloupcových transformátorů.

ForecastingJob

Konfigurace pro úlohu prognózování automatického strojového učení

Inicializuje novou úlohu prognózování autoML.

ForecastingSettings

Nastavení prognózy pro úlohu AutoML

ImageClassificationJob

Konfigurace pro úlohu Klasifikace obrázků s více třídami AutoML

Inicializuje novou úlohu Klasifikace obrázků s více třídami AutoML.

ImageClassificationMultilabelJob

Konfigurace pro úlohu Klasifikace obrázků s více popisky AutoML

Inicializujte novou úlohu Klasifikace obrázků autoML s více popisky.

ImageClassificationSearchSpace

Vyhledejte místo pro úlohy Klasifikace obrázků AutoML a Klasifikace obrázků s více popisky.

ImageInstanceSegmentationJob

Konfigurace pro úlohu segmentace instance image AutoML

Inicializuje novou úlohu segmentace instance image autoML.

ImageLimitSettings

Omezení nastavení pro vertikály obrázků AutoML

ImageLimitSettings je třída, která obsahuje následující parametry: max_concurrent_trials, max_trials a timeout_minutes.

Jedná se o volitelnou metodu konfigurace pro konfiguraci parametrů limitů, jako jsou vypršení časových limitů atd.

Poznámka

Počet souběžných spuštění se hradí u prostředků dostupných v zadaném cílovém výpočetním objektu.

Ujistěte se, že cíl výpočetních prostředků má dostupné prostředky pro požadovanou souběžnost.

Tip

Je vhodné porovnat max_concurrent_trials počet s počtem uzlů v clusteru.

Pokud máte například cluster se 4 uzly, nastavte max_concurrent_trials na 4.

Příklad použití

Konfigurace ImageLimitSettings


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

Inicializujte objekt ImageLimitSettings.

Konstruktor pro ImageLimitSettings pro AutoML Image Verticals.

ImageModelSettingsClassification

Nastavení modelu pro úlohy klasifikace obrázků autoML

ImageModelSettingsObjectDetection

Nastavení modelu pro úlohu Rozpoznávání objektů obrázku AutoML

ImageObjectDetectionJob

Konfigurace pro úlohu detekce objektů image autoML

Inicializuje novou úlohu rozpoznávání objektů obrázku autoML.

ImageObjectDetectionSearchSpace

Vyhledejte místo pro úlohy Detekce objektů obrázků AutoML a Segmentace instancí obrázků.

ImageSweepSettings

Nastavení uklidit pro všechny svislé obrázky AutoML

NlpFeaturizationSettings

Nastavení funkce pro všechny vertikály NLP autoML.

NlpFixedParameters

Objekt do domu s pevnými parametry pro úlohy NLP.

NlpLimitSettings

Nastavení omezení pro všechny svislé funkce NLP automatického strojového učení

NlpSearchSpace

Vyhledejte místo pro úlohy automatického strojového učení NLP.

NlpSweepSettings

Nastavení úklidu pro všechny úlohy automatického strojového učení NLP.

RegressionJob

Konfigurace pro úlohu regrese AutoML.

Inicializace nové úlohy regrese AutoML

SearchSpace

SearchSpace – třída pro vertikály AutoML.

StackEnsembleSettings

Pokročilé nastavení pro přizpůsobení spuštění StackEnsemble

TabularFeaturizationSettings

Nastavení funkce pro úlohu AutoML.

TabularLimitSettings

Omezení nastavení pro vertikálu tabulky AutoML.

TextClassificationJob

Konfigurace pro úlohu klasifikace textu AutoML.

Inicializuje novou úlohu Klasifikace textu AutoML.

TextClassificationMultilabelJob

Konfigurace pro úlohu více popisku klasifikace textu AutoML

Inicializuje novou úlohu Klasifikace textu AutoML s více popisky.

TextNerJob

Konfigurace pro úlohu AutoML Text NER

Inicializuje novou úlohu AutoML Text NER.

TrainingSettings

Třída TrainingSettings pro Azure Machine Learning.

Třída TrainingSettings pro Azure Machine Learning.

Výčty

BlockedTransformers

Výčet pro všechny klasifikační modely podporované v AutoML.

ClassificationModels

Výčet pro všechny klasifikační modely podporované v AutoML.

ClassificationMultilabelPrimaryMetrics

Primární metriky pro úlohy klasifikace s více popisky

ClassificationPrimaryMetrics

Primární metriky pro úlohy klasifikace

FeaturizationMode

Režim featurizace – určuje režim featurizace dat.

ForecastHorizonMode

Výčet pro určení režimu výběru horizontu prognózy.

ForecastingModels

Výčet pro všechny modely prognóz, které autoML podporuje.

ForecastingPrimaryMetrics

Primární metriky pro úlohu prognózování

InstanceSegmentationPrimaryMetrics

Primární metriky pro úlohy InstanceSegmentation

LearningRateScheduler

Výčet plánovače četnosti učení

LogTrainingMetrics

Obsahuje automatizované třídy strojového učení pro Azure Machine Learning SDKv2.

Mezi hlavní oblasti patří správa úloh AutoML.

LogValidationLoss

Obsahuje automatizované třídy strojového učení pro Azure Machine Learning SDKv2.

Mezi hlavní oblasti patří správa úloh AutoML.

NCrossValidationsMode

Určuje, jak se určuje hodnota N-Křížového ověření.

ObjectDetectionPrimaryMetrics

Primární metriky pro úlohu Image ObjectDetection

RegressionModels

Výčet pro všechny regresní modely podporované v AutoML

RegressionPrimaryMetrics

Primární metriky pro úlohu regrese

SamplingAlgorithmType

Obsahuje automatizované třídy strojového učení pro Azure Machine Learning SDKv2.

Mezi hlavní oblasti patří správa úloh AutoML.

ShortSeriesHandlingConfiguration

Parametr definující, jak má AutoML zpracovávat krátké časové řady.

StochasticOptimizer

Stochastic optimizer pro image modely.

TargetAggregationFunction

Cílová agregační funkce.

TargetLagsMode

Cíl zpožďuje režimy výběru.

TargetRollingWindowSizeMode

Cílový režim velikosti průběžných oken.

UseStl

Nakonfigurujte rozklad STL cílového sloupce časové řady.

ValidationMetricType

Metoda výpočtu metrik, která se má použít pro ověřovací metriky v úlohách obrázků.

Funkce

classification

Funkce pro vytvoření klasifikační úlohy.

Úloha klasifikace se používá k trénování modelu, který nejlépe predikuje třídu vzorku dat. Pomocí trénovacích dat se trénují různé modely. Jako konečný model se vybere model s nejlepším výkonem u ověřovacích dat na základě primární metriky.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parametry

training_data
Input

Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).

target_column_name
str

Název sloupce popisku Tento parametr se vztahuje na training_dataparametry atest_data. validation_data

primary_metric

Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o způsobu výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Přijatelné hodnoty: přesnost, AUC_weighted, norm_macro_recall, average_precision_score_weighted a precision_score_weighted Výchozí hodnoty přesnosti

enable_model_explainability
bool

Jestli chcete povolit vysvětlení nejlepšího modelu AutoML na konci všech iterací trénování autoML. Výchozí hodnota je Žádný. Další informace najdete v tématu Interpretovatelnost: vysvětlení modelů v automatizovaném strojovém učení.

weight_column_name
str

Název sloupce hmotnosti vzorku. Automatizované strojové učení podporuje jako vstup vážený sloupec, což způsobuje, že se řádky v datech váží nahoru nebo dolů. Pokud vstupní data pocházejí z knihovny pandas. Datový rámec, který nemá názvy sloupců, je možné místo toho použít indexy sloupců vyjádřené jako celá čísla.

Tento parametr se vztahuje na training_data parametry a validation_data .

validation_data
Input

Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).

Výchozí hodnota není žádná.

validation_data_size
float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu.

Zadejte validation_data , jestli chcete zadat ověřovací data, jinak nastavit n_cross_validations nebo validation_data_size extrahovat ověřovací data ze zadaných trénovacích dat. Pokud chcete použít vlastní křížové ověření, použijte cv_split_column_names.

Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.

Výchozí hodnota není žádná.

n_cross_validations
Union[str, int]

Kolik křížových ověření se má provést, když nejsou zadána data ověření uživatele.

Zadejte validation_data , jestli chcete zadat ověřovací data, jinak nastavit n_cross_validations nebo validation_data_size extrahovat ověřovací data ze zadaných trénovacích dat. Pokud chcete použít vlastní křížové ověření, použijte cv_split_column_names.

Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.

Výchozí hodnota není žádná.

cv_split_column_names
List[str]

Seznam názvů sloupců, které obsahují vlastní rozdělení křížového ověření Každý ze sloupců s rozdělením životopisu představuje jedno rozdělení CV, kde každý řádek je označený buď 1 pro trénování, nebo 0 pro ověření.

Výchozí hodnota není žádná.

test_data
Input

Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Testovací data, která se mají použít pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky dané predikcemi.

Pokud tento parametr nebo test_data_size parametr nejsou zadány, po dokončení trénování modelu se automaticky neprovede žádné testovací spuštění. Testovací data by měla obsahovat funkce i sloupec popisků. Pokud test_data je zadaný target_column_name parametr, musí být zadán parametr.

Výchozí hodnota není žádná.

test_data_size
float

Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Jaký zlomek trénovacích dat se má uchovávat pro testovací data pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky dané predikcemi.

Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu. Pokud test_data_size je zadána ve stejnou dobu jako validation_data_size, pak se testovací data před rozdělením ověřovacích dat rozdělí training_data . Pokud validation_data_size=0.1například a test_data_size=0.1 původní trénovací data mají 1000 řádků, testovací data budou mít 100 řádků, ověřovací data budou obsahovat 90 řádků a trénovací data budou mít 810 řádků.

Pro úlohy založené na regresi se používá náhodný vzorkování. Pro úlohy klasifikace se používá stratifikované vzorkování. Prognózování v současné době nepodporuje zadání testovací datové sady pomocí rozdělení trénování a testu.

Pokud tento parametr nebo test_data parametr nejsou zadány, po dokončení trénování modelu se automaticky neprovede žádné testovací spuštění.

Výchozí hodnota není žádná.

Návraty

Objekt úlohy, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.

Návratový typ

forecasting

Funkce pro vytvoření úlohy prognózování

Úloha prognózování se používá k predikci cílových hodnot pro budoucí časové období na základě historických dat. Pomocí trénovacích dat se trénují různé modely. Jako konečný model se vybere model s nejlepším výkonem u ověřovacích dat na základě primární metriky.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parametry

training_data
Input

Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).

target_column_name
str

Název sloupce popisku Tento parametr se vztahuje na training_dataparametry atest_data. validation_data

primary_metric

Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o způsobu výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Přijatelné hodnoty: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Výchozí hodnota normalized_root_mean_squared_error

enable_model_explainability
bool

Jestli chcete povolit vysvětlení nejlepšího modelu AutoML na konci všech iterací trénování autoML. Výchozí hodnota je Žádný. Další informace najdete v tématu Interpretovatelnost: vysvětlení modelů v automatizovaném strojovém učení.

weight_column_name
str

Název sloupce hmotnosti vzorku. Automatizované strojové učení podporuje jako vstup vážený sloupec, což způsobuje, že se řádky v datech váží nahoru nebo dolů. Pokud vstupní data pocházejí z knihovny pandas. Datový rámec, který nemá názvy sloupců, je možné místo toho použít indexy sloupců vyjádřené jako celá čísla.

Tento parametr se vztahuje na training_data parametry a validation_data .

validation_data
Input

Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).

Výchozí hodnota není žádná.

validation_data_size
float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu.

Zadejte validation_data , jestli chcete zadat ověřovací data, jinak nastavit n_cross_validations nebo validation_data_size extrahovat ověřovací data ze zadaných trénovacích dat. Pokud chcete použít vlastní křížové ověření, použijte cv_split_column_names.

Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.

Výchozí hodnota není žádná.

n_cross_validations
Union[str, int]

Kolik křížových ověření se má provést, když nejsou zadána data ověření uživatele.

Zadejte validation_data , jestli chcete zadat ověřovací data, jinak nastavit n_cross_validations nebo validation_data_size extrahovat ověřovací data ze zadaných trénovacích dat. Pokud chcete použít vlastní křížové ověření, použijte cv_split_column_names.

Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.

Výchozí hodnota není žádná.

cv_split_column_names
List[str]

Seznam názvů sloupců, které obsahují vlastní rozdělení křížového ověření Každý ze sloupců s rozdělením životopisu představuje jedno rozdělení CV, kde každý řádek je označený buď 1 pro trénování, nebo 0 pro ověření.

Výchozí hodnota není žádná.

test_data
Input

Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Testovací data, která se mají použít pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky dané predikcemi.

Pokud tento parametr nebo test_data_size parametr nejsou zadány, po dokončení trénování modelu se automaticky neprovede žádné testovací spuštění. Testovací data by měla obsahovat funkce i sloupec popisků. Pokud test_data je zadaný target_column_name parametr, musí být zadán parametr.

Výchozí hodnota není žádná.

test_data_size
float

Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Jaký zlomek trénovacích dat se má uchovávat pro testovací data pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky dané predikcemi.

Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu. Pokud test_data_size je zadána ve stejnou dobu jako validation_data_size, pak se testovací data před rozdělením ověřovacích dat rozdělí training_data . Pokud validation_data_size=0.1například a test_data_size=0.1 původní trénovací data mají 1000 řádků, testovací data budou mít 100 řádků, ověřovací data budou obsahovat 90 řádků a trénovací data budou mít 810 řádků.

Pro úlohy založené na regresi se používá náhodný vzorkování. Pro úlohy klasifikace se používá stratifikované vzorkování. Prognózování v současné době nepodporuje zadání testovací datové sady pomocí rozdělení trénování a testu.

Pokud tento parametr nebo test_data parametr nejsou zadány, po dokončení trénování modelu se automaticky neprovede žádné testovací spuštění.

Výchozí hodnota není žádná.

forecasting_settings
ForecastingSettings

Nastavení úlohy prognózování

Návraty

Objekt úlohy, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.

Návratový typ

image_classification

Vytvoří objekt pro úlohu klasifikace obrázků autoML s více třídami.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parametry

training_data
Input

Trénovací data, která se mají použít v rámci experimentu.

target_column_name
str

Název sloupce popisku Tento parametr platí pro training_data parametry a validation_data .

primary_metric

Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o způsobu výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Přijatelné hodnoty: přesnost, AUC_weighted, norm_macro_recall, average_precision_score_weighted a precision_score_weighted Výchozí hodnoty přesnosti.

validation_data
Input

Ověřovací data, která se mají použít v rámci experimentu.

validation_data_size
float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu.

Zadáním validation_data zadáte ověřovací data, jinak nastavíte validation_data_size extrahování ověřovacích dat ze zadaných trénovacích dat.

Výchozí hodnota je .2.

kwargs
dict

Slovník dalších parametrů konfigurace.

Návraty

Objekt úlohy klasifikace obrázků, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.

Návratový typ

image_classification_multilabel

Vytvoří objekt pro úlohu klasifikace obrázků s více popisky autoML.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parametry

training_data
Input

Trénovací data, která se mají použít v rámci experimentu.

target_column_name
str

Název sloupce popisku Tento parametr se vztahuje na training_data parametry a validation_data .

primary_metric

Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Přijatelné hodnoty: přesnost, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted a výchozí hodnota IOU je IOU.

validation_data
Input

Ověřovací data, která se mají použít v rámci experimentu.

validation_data_size
float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. To by mělo být mezi 0,0 a 1,0 bez začlenění.

Zadáním validation_data zadejte ověřovací data, jinak nastavíte validation_data_size extrahování ověřovacích dat ze zadaných trénovacích dat.

Výchozí hodnota je .2.

kwargs
dict

Slovník dalších parametrů konfigurace.

Návraty

Image objektu úlohy klasifikace s více popisky, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.

Návratový typ

image_instance_segmentation

Vytvoří objekt pro úlohu segmentace instance image automatizovaného strojového učení.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parametry

training_data
Input

Trénovací data, která se mají použít v rámci experimentu.

target_column_name
str

Název sloupce popisku Tento parametr se vztahuje na training_data parametry a validation_data .

primary_metric

Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Přijatelné hodnoty: MeanAveragePrecision Výchozí hodnota je MeanAveragePrecision.

validation_data
Input

Ověřovací data, která se mají použít v rámci experimentu.

validation_data_size
float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. To by mělo být mezi 0,0 a 1,0 bez začlenění.

Zadáním validation_data zadejte ověřovací data, jinak nastavíte validation_data_size extrahování ověřovacích dat ze zadaných trénovacích dat.

Výchozí hodnota je .2.

kwargs
dict

Slovník dalších parametrů konfigurace.

Návraty

Úloha segmentace instance image

Návratový typ

image_object_detection

Vytvoří objekt pro úlohu detekce objektu obrázku automatizovaného strojového učení.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parametry

training_data
Input

Trénovací data, která se mají použít v rámci experimentu.

target_column_name
str

Název sloupce popisku Tento parametr se vztahuje na training_data parametry a validation_data .

primary_metric

Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Přijatelné hodnoty: MeanAveragePrecision Výchozí hodnota je MeanAveragePrecision.

validation_data
Input

Ověřovací data, která se mají použít v rámci experimentu.

validation_data_size
float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. To by mělo být mezi 0,0 a 1,0 bez začlenění.

Zadáním validation_data zadejte ověřovací data, jinak nastavíte validation_data_size extrahování ověřovacích dat ze zadaných trénovacích dat.

Výchozí hodnota je .2.

kwargs
dict

Slovník dalších parametrů konfigurace.

Návraty

Objekt úlohy rozpoznávání objektu obrázku, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.

Návratový typ

regression

Funkce pro vytvoření regresní úlohy

Úloha regrese se používá k trénování modelu pro predikci průběžných hodnot cílové proměnné z datové sady. Pomocí trénovacích dat se trénují různé modely. Jako konečný model se vybere model s nejlepším výkonem u ověřovacích dat na základě primární metriky.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parametry

training_data
Input

Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).

target_column_name
str

Název sloupce popisku Tento parametr se vztahuje na training_dataparametry , validation_data a test_data .

primary_metric

Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Přijatelné hodnoty: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Výchozí hodnota je normalized_root_mean_squared_error.

enable_model_explainability
bool

Jestli chcete povolit vysvětlení nejlepšího modelu Automatizovaného strojového učení na konci všech iterací trénování automatizovaného strojového učení. Výchozí hodnota je Žádná. Další informace najdete v tématu Interpretovatelnost: vysvětlení modelů v automatizovaném strojovém učení.

weight_column_name
str

Název sloupce hmotnosti vzorku. Automatizované strojové učení podporuje vážený sloupec jako vstup, což způsobuje, že řádky v datech jsou vážené nahoru nebo dolů. Pokud vstupní data pocházejí z knihovny pandas. Datový rámec, který nemá názvy sloupců, je možné místo toho použít indexy sloupců vyjádřené jako celá čísla.

Tento parametr se vztahuje na training_data parametry a .validation_data

validation_data
Input

Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i sloupec popisku (volitelně sloupec s váhou vzorku).

Výchozí hodnota je Žádná.

validation_data_size
float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. To by mělo být mezi 0,0 a 1,0 bez začlenění.

Zadejte validation_data , chcete-li poskytnout ověřovací data, jinak nastavit n_cross_validations nebo validation_data_size extrahovat ověřovací data ze zadaných trénovacích dat. Pro vlastní křížové ověřování fold použijte cv_split_column_names.

Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.

Výchozí hodnota je Žádná.

n_cross_validations
Union[str, int]

Kolik křížových ověření se má provést, když nejsou zadána data ověření uživatele.

Zadejte validation_data , chcete-li poskytnout ověřovací data, jinak nastavit n_cross_validations nebo validation_data_size extrahovat ověřovací data ze zadaných trénovacích dat. Pro vlastní křížové ověřování fold použijte cv_split_column_names.

Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.

Výchozí hodnota je Žádná.

cv_split_column_names
List[str]

Seznam názvů sloupců, které obsahují vlastní rozdělení křížového ověření Každý sloupec s rozdělením CV představuje jedno rozdělení CV, kde každý řádek je označen 1 pro trénování nebo 0 pro ověření.

Výchozí hodnota je Žádná.

test_data
Input

Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Testovací data, která se mají použít pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky, které jsou s těmito predikcemi.

Pokud tento parametr nebo test_data_size parametr nezadáte, po dokončení trénování modelu se automaticky neprovedou žádné testovací běhy. Testovací data by měla obsahovat jak funkce, tak sloupec popisku. Pokud test_data je zadán target_column_name parametr , musí být zadán parametr .

Výchozí hodnota je Žádná.

test_data_size
float

Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Jaký zlomek trénovacích dat se má uchovávat pro testovací data pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky, které jsou s těmito predikcemi.

To by mělo být mezi 0,0 a 1,0 bez začlenění. Pokud test_data_size je zadána ve stejnou dobu jako validation_data_size, testovací data jsou před rozdělením ověřovacích dat rozdělena training_data od . Pokud validation_data_size=0.1například mají test_data_size=0.1 původní trénovací data 1000 řádků, testovací data budou mít 100 řádků, ověřovací data budou obsahovat 90 řádků a trénovací data 810 řádků.

Pro úlohy založené na regresi se používá náhodné vzorkování. Pro úlohy klasifikace se používá stratifikované vzorkování. Prognózování v současné době nepodporuje zadání testovací datové sady pomocí rozdělení trénování a testu.

Pokud tento parametr nebo test_data parametr nezadáte, po dokončení trénování modelu se automaticky neprovedou žádné testovací běhy.

Výchozí hodnota je Žádná.

Návraty

Objekt úlohy, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.

Návratový typ

text_classification

Funkce pro vytvoření TextClassificationJob.

Úloha klasifikace textu se používá k trénování modelu, který dokáže předpovědět třídu nebo kategorii textových dat. Vstupní trénovací data by měla obsahovat cílový sloupec, který klasifikuje text přesně do jedné třídy.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parametry

training_data
Input

Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.

target_column_name
str

Název cílového sloupce

validation_data
Input

Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.

primary_metric
Union[str, ClassificationPrimaryMetrics]

Primární metrika pro úkol. Přijatelné hodnoty: přesnost, AUC_weighted, precision_score_weighted

log_verbosity
str

Úroveň podrobností protokolu.

kwargs
dict

Slovník dalších parametrů konfigurace.

Návraty

Objekt TextClassificationJob.

Návratový typ

text_classification_multilabel

Funkce pro vytvoření TextClassificationMultilabelJob.

Úloha vícenásobného označení klasifikace textu slouží k trénování modelu, který dokáže předpovědět třídy nebo kategorie textových dat. Vstupní trénovací data by měla obsahovat cílový sloupec, který klasifikuje text do tříd. Další informace o formátu dat s více popisky najdete tady: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parametry

training_data
Input

Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.

target_column_name
str

Název cílového sloupce

validation_data
Input

Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.

primary_metric
str

Primární metrika pro úkol. Přijatelné hodnoty: přesnost

log_verbosity
str

Úroveň podrobností protokolu.

kwargs
dict

Slovník dalších parametrů konfigurace.

Návraty

Objekt TextClassificationMultilabelJob.

Návratový typ

text_ner

Funkce pro vytvoření úlohy TextNerJob.

Úloha rozpoznávání entit s názvem text slouží k trénování modelu, který dokáže předpovědět pojmenované entity v textu. Vstupní trénovací data by měla být textový soubor ve formátu CoNLL. Další informace o formátu textových dat NER najdete tady: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parametry

training_data
Input

Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.

validation_data
Input

Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.

primary_metric
str

Primární metrika pro úkol. Přijatelné hodnoty: přesnost

log_verbosity
str

Úroveň podrobností protokolu.

kwargs
dict

Slovník dalších parametrů konfigurace.

Návraty

Objekt TextNerJob.

Návratový typ