automl Balíček

Reference

Obsahuje automatizované třídy strojového učení pro Azure Machine Learning SDKv2.

Mezi hlavní oblasti patří správa úloh AutoML.

Třídy

ClassificationJob	Konfigurace pro úlohu klasifikace autoML. Inicializuje novou úlohu klasifikace AutoML.
ColumnTransformer	Nastavení sloupcových transformátorů.
ForecastingJob	Konfigurace pro úlohu prognózování automatického strojového učení Inicializuje novou úlohu prognózování autoML.
ForecastingSettings	Nastavení prognózy pro úlohu AutoML
ImageClassificationJob	Konfigurace pro úlohu Klasifikace obrázků s více třídami AutoML Inicializuje novou úlohu Klasifikace obrázků s více třídami AutoML.
ImageClassificationMultilabelJob	Konfigurace pro úlohu Klasifikace obrázků s více popisky AutoML Inicializujte novou úlohu Klasifikace obrázků autoML s více popisky.
ImageClassificationSearchSpace	Vyhledejte místo pro úlohy Klasifikace obrázků AutoML a Klasifikace obrázků s více popisky.
ImageInstanceSegmentationJob	Konfigurace pro úlohu segmentace instance image AutoML Inicializuje novou úlohu segmentace instance image autoML.
ImageLimitSettings	Omezení nastavení pro vertikály obrázků AutoML ImageLimitSettings je třída, která obsahuje následující parametry: max_concurrent_trials, max_trials a timeout_minutes. Jedná se o volitelnou metodu konfigurace pro konfiguraci parametrů limitů, jako jsou vypršení časových limitů atd. Poznámka Počet souběžných spuštění se hradí u prostředků dostupných v zadaném cílovém výpočetním objektu. Ujistěte se, že cíl výpočetních prostředků má dostupné prostředky pro požadovanou souběžnost. Tip Je vhodné porovnat max_concurrent_trials počet s počtem uzlů v clusteru. Pokud máte například cluster se 4 uzly, nastavte max_concurrent_trials na 4. Příklad použití Konfigurace ImageLimitSettings from azure.ai.ml import automl # Create the AutoML job with the related factory-function. image_instance_segmentation_job = automl.image_instance_segmentation( compute=compute_name, experiment_name=exp_name, training_data=my_training_data_input, validation_data=my_validation_data_input, target_column_name="label", primary_metric="MeanAveragePrecision", tags={"my_custom_tag": "custom value"}, ) # Set the limits for the AutoML job. image_instance_segmentation_job.set_limits( max_trials=10, max_concurrent_trials=2, ) # Submit the AutoML job. image_instance_segmentation_job.submit() Inicializujte objekt ImageLimitSettings. Konstruktor pro ImageLimitSettings pro AutoML Image Verticals.
ImageModelSettingsClassification	Nastavení modelu pro úlohy klasifikace obrázků autoML
ImageModelSettingsObjectDetection	Nastavení modelu pro úlohu Rozpoznávání objektů obrázku AutoML
ImageObjectDetectionJob	Konfigurace pro úlohu detekce objektů image autoML Inicializuje novou úlohu rozpoznávání objektů obrázku autoML.
ImageObjectDetectionSearchSpace	Vyhledejte místo pro úlohy Detekce objektů obrázků AutoML a Segmentace instancí obrázků.
ImageSweepSettings	Nastavení uklidit pro všechny svislé obrázky AutoML
NlpFeaturizationSettings	Nastavení funkce pro všechny vertikály NLP autoML.
NlpFixedParameters	Objekt do domu s pevnými parametry pro úlohy NLP.
NlpLimitSettings	Nastavení omezení pro všechny svislé funkce NLP automatického strojového učení
NlpSearchSpace	Vyhledejte místo pro úlohy automatického strojového učení NLP.
NlpSweepSettings	Nastavení úklidu pro všechny úlohy automatického strojového učení NLP.
RegressionJob	Konfigurace pro úlohu regrese AutoML. Inicializace nové úlohy regrese AutoML
SearchSpace	SearchSpace – třída pro vertikály AutoML.
StackEnsembleSettings	Pokročilé nastavení pro přizpůsobení spuštění StackEnsemble
TabularFeaturizationSettings	Nastavení funkce pro úlohu AutoML.
TabularLimitSettings	Omezení nastavení pro vertikálu tabulky AutoML.
TextClassificationJob	Konfigurace pro úlohu klasifikace textu AutoML. Inicializuje novou úlohu Klasifikace textu AutoML.
TextClassificationMultilabelJob	Konfigurace pro úlohu více popisku klasifikace textu AutoML Inicializuje novou úlohu Klasifikace textu AutoML s více popisky.
TextNerJob	Konfigurace pro úlohu AutoML Text NER Inicializuje novou úlohu AutoML Text NER.
TrainingSettings	Třída TrainingSettings pro Azure Machine Learning. Třída TrainingSettings pro Azure Machine Learning.

Výčty

BlockedTransformers	Výčet pro všechny klasifikační modely podporované v AutoML.
ClassificationModels	Výčet pro všechny klasifikační modely podporované v AutoML.
ClassificationMultilabelPrimaryMetrics	Primární metriky pro úlohy klasifikace s více popisky
ClassificationPrimaryMetrics	Primární metriky pro úlohy klasifikace
FeaturizationMode	Režim featurizace – určuje režim featurizace dat.
ForecastHorizonMode	Výčet pro určení režimu výběru horizontu prognózy.
ForecastingModels	Výčet pro všechny modely prognóz, které autoML podporuje.
ForecastingPrimaryMetrics	Primární metriky pro úlohu prognózování
InstanceSegmentationPrimaryMetrics	Primární metriky pro úlohy InstanceSegmentation
LearningRateScheduler	Výčet plánovače četnosti učení
LogTrainingMetrics	Obsahuje automatizované třídy strojového učení pro Azure Machine Learning SDKv2. Mezi hlavní oblasti patří správa úloh AutoML.
LogValidationLoss	Obsahuje automatizované třídy strojového učení pro Azure Machine Learning SDKv2. Mezi hlavní oblasti patří správa úloh AutoML.
NCrossValidationsMode	Určuje, jak se určuje hodnota N-Křížového ověření.
ObjectDetectionPrimaryMetrics	Primární metriky pro úlohu Image ObjectDetection
RegressionModels	Výčet pro všechny regresní modely podporované v AutoML
RegressionPrimaryMetrics	Primární metriky pro úlohu regrese
SamplingAlgorithmType	Obsahuje automatizované třídy strojového učení pro Azure Machine Learning SDKv2. Mezi hlavní oblasti patří správa úloh AutoML.
ShortSeriesHandlingConfiguration	Parametr definující, jak má AutoML zpracovávat krátké časové řady.
StochasticOptimizer	Stochastic optimizer pro image modely.
TargetAggregationFunction	Cílová agregační funkce.
TargetLagsMode	Cíl zpožďuje režimy výběru.
TargetRollingWindowSizeMode	Cílový režim velikosti průběžných oken.
UseStl	Nakonfigurujte rozklad STL cílového sloupce časové řady.
ValidationMetricType	Metoda výpočtu metrik, která se má použít pro ověřovací metriky v úlohách obrázků.

Funkce

classification

Funkce pro vytvoření klasifikační úlohy.

Úloha klasifikace se používá k trénování modelu, který nejlépe predikuje třídu vzorku dat. Pomocí trénovacích dat se trénují různé modely. Jako konečný model se vybere model s nejlepším výkonem u ověřovacích dat na základě primární metriky.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parametry

training_data: Input

Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).

target_column_name: str

Název sloupce popisku Tento parametr se vztahuje na training_dataparametry atest_data. validation_data

primary_metric

Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o způsobu výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Přijatelné hodnoty: přesnost, AUC_weighted, norm_macro_recall, average_precision_score_weighted a precision_score_weighted Výchozí hodnoty přesnosti

enable_model_explainability: bool

Jestli chcete povolit vysvětlení nejlepšího modelu AutoML na konci všech iterací trénování autoML. Výchozí hodnota je Žádný. Další informace najdete v tématu Interpretovatelnost: vysvětlení modelů v automatizovaném strojovém učení.

weight_column_name: str

Název sloupce hmotnosti vzorku. Automatizované strojové učení podporuje jako vstup vážený sloupec, což způsobuje, že se řádky v datech váží nahoru nebo dolů. Pokud vstupní data pocházejí z knihovny pandas. Datový rámec, který nemá názvy sloupců, je možné místo toho použít indexy sloupců vyjádřené jako celá čísla.

Tento parametr se vztahuje na training_data parametry a validation_data .

validation_data: Input

Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).

Výchozí hodnota není žádná.

validation_data_size: float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu.

Zadejte validation_data , jestli chcete zadat ověřovací data, jinak nastavit n_cross_validations nebo validation_data_size extrahovat ověřovací data ze zadaných trénovacích dat. Pokud chcete použít vlastní křížové ověření, použijte cv_split_column_names.

Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.

Výchozí hodnota není žádná.

n_cross_validations: Union[str, int]

Kolik křížových ověření se má provést, když nejsou zadána data ověření uživatele.

Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.

Výchozí hodnota není žádná.

cv_split_column_names: List[str]

Seznam názvů sloupců, které obsahují vlastní rozdělení křížového ověření Každý ze sloupců s rozdělením životopisu představuje jedno rozdělení CV, kde každý řádek je označený buď 1 pro trénování, nebo 0 pro ověření.

Výchozí hodnota není žádná.

test_data: Input

Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Testovací data, která se mají použít pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky dané predikcemi.

Pokud tento parametr nebo test_data_size parametr nejsou zadány, po dokončení trénování modelu se automaticky neprovede žádné testovací spuštění. Testovací data by měla obsahovat funkce i sloupec popisků. Pokud test_data je zadaný target_column_name parametr, musí být zadán parametr.

Výchozí hodnota není žádná.

test_data_size: float

Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Jaký zlomek trénovacích dat se má uchovávat pro testovací data pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky dané predikcemi.

Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu. Pokud test_data_size je zadána ve stejnou dobu jako validation_data_size, pak se testovací data před rozdělením ověřovacích dat rozdělí training_data . Pokud validation_data_size=0.1například a test_data_size=0.1 původní trénovací data mají 1000 řádků, testovací data budou mít 100 řádků, ověřovací data budou obsahovat 90 řádků a trénovací data budou mít 810 řádků.

Pro úlohy založené na regresi se používá náhodný vzorkování. Pro úlohy klasifikace se používá stratifikované vzorkování. Prognózování v současné době nepodporuje zadání testovací datové sady pomocí rozdělení trénování a testu.

Pokud tento parametr nebo test_data parametr nejsou zadány, po dokončení trénování modelu se automaticky neprovede žádné testovací spuštění.

Výchozí hodnota není žádná.

Návraty

Objekt úlohy, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.

Návratový typ

ClassificationJob

forecasting

Funkce pro vytvoření úlohy prognózování

Úloha prognózování se používá k predikci cílových hodnot pro budoucí časové období na základě historických dat. Pomocí trénovacích dat se trénují různé modely. Jako konečný model se vybere model s nejlepším výkonem u ověřovacích dat na základě primární metriky.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parametry

training_data: Input

Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).

target_column_name: str

Název sloupce popisku Tento parametr se vztahuje na training_dataparametry atest_data. validation_data

primary_metric

Přijatelné hodnoty: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Výchozí hodnota normalized_root_mean_squared_error

enable_model_explainability: bool

weight_column_name: str

Tento parametr se vztahuje na training_data parametry a validation_data .

validation_data: Input

Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).

Výchozí hodnota není žádná.

validation_data_size: float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu.

Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.

Výchozí hodnota není žádná.

n_cross_validations: Union[str, int]

Kolik křížových ověření se má provést, když nejsou zadána data ověření uživatele.

Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.

Výchozí hodnota není žádná.

cv_split_column_names: List[str]

Výchozí hodnota není žádná.

test_data: Input

Výchozí hodnota není žádná.

test_data_size: float

Pokud tento parametr nebo test_data parametr nejsou zadány, po dokončení trénování modelu se automaticky neprovede žádné testovací spuštění.

Výchozí hodnota není žádná.

forecasting_settings: ForecastingSettings

Nastavení úlohy prognózování

Návraty

Objekt úlohy, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.

Návratový typ

ForecastingJob

image_classification

Vytvoří objekt pro úlohu klasifikace obrázků autoML s více třídami.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parametry

training_data: Input

Trénovací data, která se mají použít v rámci experimentu.

target_column_name: str

Název sloupce popisku Tento parametr platí pro training_data parametry a validation_data .

primary_metric

Přijatelné hodnoty: přesnost, AUC_weighted, norm_macro_recall, average_precision_score_weighted a precision_score_weighted Výchozí hodnoty přesnosti.

validation_data: Input

Ověřovací data, která se mají použít v rámci experimentu.

validation_data_size: float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu.

Zadáním validation_data zadáte ověřovací data, jinak nastavíte validation_data_size extrahování ověřovacích dat ze zadaných trénovacích dat.

Výchozí hodnota je .2.

kwargs: dict

Slovník dalších parametrů konfigurace.

Návraty

Objekt úlohy klasifikace obrázků, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.

Návratový typ

ImageClassificationJob

image_classification_multilabel

Vytvoří objekt pro úlohu klasifikace obrázků s více popisky autoML.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parametry

training_data: Input

Trénovací data, která se mají použít v rámci experimentu.

target_column_name: str

Název sloupce popisku Tento parametr se vztahuje na training_data parametry a validation_data .

primary_metric

Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Přijatelné hodnoty: přesnost, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted a výchozí hodnota IOU je IOU.

validation_data: Input

Ověřovací data, která se mají použít v rámci experimentu.

validation_data_size: float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. To by mělo být mezi 0,0 a 1,0 bez začlenění.

Zadáním validation_data zadejte ověřovací data, jinak nastavíte validation_data_size extrahování ověřovacích dat ze zadaných trénovacích dat.

Výchozí hodnota je .2.

kwargs: dict

Slovník dalších parametrů konfigurace.

Návraty

Image objektu úlohy klasifikace s více popisky, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.

Návratový typ

ImageClassificationMultilabelJob

image_instance_segmentation

Vytvoří objekt pro úlohu segmentace instance image automatizovaného strojového učení.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parametry

training_data: Input

Trénovací data, která se mají použít v rámci experimentu.

target_column_name: str

Název sloupce popisku Tento parametr se vztahuje na training_data parametry a validation_data .

primary_metric

Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Přijatelné hodnoty: MeanAveragePrecision Výchozí hodnota je MeanAveragePrecision.

validation_data: Input

Ověřovací data, která se mají použít v rámci experimentu.

validation_data_size: float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. To by mělo být mezi 0,0 a 1,0 bez začlenění.

Zadáním validation_data zadejte ověřovací data, jinak nastavíte validation_data_size extrahování ověřovacích dat ze zadaných trénovacích dat.

Výchozí hodnota je .2.

kwargs: dict

Slovník dalších parametrů konfigurace.

Návraty

Úloha segmentace instance image

Návratový typ

ImageInstanceSegmentationJob

image_object_detection

Vytvoří objekt pro úlohu detekce objektu obrázku automatizovaného strojového učení.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parametry

training_data: Input

Trénovací data, která se mají použít v rámci experimentu.

target_column_name: str

Název sloupce popisku Tento parametr se vztahuje na training_data parametry a validation_data .

primary_metric

Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Přijatelné hodnoty: MeanAveragePrecision Výchozí hodnota je MeanAveragePrecision.

validation_data: Input

Ověřovací data, která se mají použít v rámci experimentu.

validation_data_size: float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. To by mělo být mezi 0,0 a 1,0 bez začlenění.

Zadáním validation_data zadejte ověřovací data, jinak nastavíte validation_data_size extrahování ověřovacích dat ze zadaných trénovacích dat.

Výchozí hodnota je .2.

kwargs: dict

Slovník dalších parametrů konfigurace.

Návraty

Objekt úlohy rozpoznávání objektu obrázku, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.

Návratový typ

ImageObjectDetectionJob

regression

Funkce pro vytvoření regresní úlohy

Úloha regrese se používá k trénování modelu pro predikci průběžných hodnot cílové proměnné z datové sady. Pomocí trénovacích dat se trénují různé modely. Jako konečný model se vybere model s nejlepším výkonem u ověřovacích dat na základě primární metriky.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parametry

training_data: Input

Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).

target_column_name: str

Název sloupce popisku Tento parametr se vztahuje na training_dataparametry , validation_data a test_data .

primary_metric

Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Přijatelné hodnoty: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Výchozí hodnota je normalized_root_mean_squared_error.

enable_model_explainability: bool

Jestli chcete povolit vysvětlení nejlepšího modelu Automatizovaného strojového učení na konci všech iterací trénování automatizovaného strojového učení. Výchozí hodnota je Žádná. Další informace najdete v tématu Interpretovatelnost: vysvětlení modelů v automatizovaném strojovém učení.

weight_column_name: str

Název sloupce hmotnosti vzorku. Automatizované strojové učení podporuje vážený sloupec jako vstup, což způsobuje, že řádky v datech jsou vážené nahoru nebo dolů. Pokud vstupní data pocházejí z knihovny pandas. Datový rámec, který nemá názvy sloupců, je možné místo toho použít indexy sloupců vyjádřené jako celá čísla.

Tento parametr se vztahuje na training_data parametry a .validation_data

validation_data: Input

Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i sloupec popisku (volitelně sloupec s váhou vzorku).

Výchozí hodnota je Žádná.

validation_data_size: float

Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. To by mělo být mezi 0,0 a 1,0 bez začlenění.

Zadejte validation_data , chcete-li poskytnout ověřovací data, jinak nastavit n_cross_validations nebo validation_data_size extrahovat ověřovací data ze zadaných trénovacích dat. Pro vlastní křížové ověřování fold použijte cv_split_column_names.

Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.

Výchozí hodnota je Žádná.

n_cross_validations: Union[str, int]

Kolik křížových ověření se má provést, když nejsou zadána data ověření uživatele.

Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.

Výchozí hodnota je Žádná.

cv_split_column_names: List[str]

Seznam názvů sloupců, které obsahují vlastní rozdělení křížového ověření Každý sloupec s rozdělením CV představuje jedno rozdělení CV, kde každý řádek je označen 1 pro trénování nebo 0 pro ověření.

Výchozí hodnota je Žádná.

test_data: Input

Pokud tento parametr nebo test_data_size parametr nezadáte, po dokončení trénování modelu se automaticky neprovedou žádné testovací běhy. Testovací data by měla obsahovat jak funkce, tak sloupec popisku. Pokud test_data je zadán target_column_name parametr , musí být zadán parametr .

Výchozí hodnota je Žádná.

test_data_size: float

To by mělo být mezi 0,0 a 1,0 bez začlenění. Pokud test_data_size je zadána ve stejnou dobu jako validation_data_size, testovací data jsou před rozdělením ověřovacích dat rozdělena training_data od . Pokud validation_data_size=0.1například mají test_data_size=0.1 původní trénovací data 1000 řádků, testovací data budou mít 100 řádků, ověřovací data budou obsahovat 90 řádků a trénovací data 810 řádků.

Pro úlohy založené na regresi se používá náhodné vzorkování. Pro úlohy klasifikace se používá stratifikované vzorkování. Prognózování v současné době nepodporuje zadání testovací datové sady pomocí rozdělení trénování a testu.

Pokud tento parametr nebo test_data parametr nezadáte, po dokončení trénování modelu se automaticky neprovedou žádné testovací běhy.

Výchozí hodnota je Žádná.

Návraty

Objekt úlohy, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.

Návratový typ

RegressionJob

text_classification

Funkce pro vytvoření TextClassificationJob.

Úloha klasifikace textu se používá k trénování modelu, který dokáže předpovědět třídu nebo kategorii textových dat. Vstupní trénovací data by měla obsahovat cílový sloupec, který klasifikuje text přesně do jedné třídy.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parametry

training_data: Input

Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.

target_column_name: str

Název cílového sloupce

validation_data: Input

Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.

primary_metric: Union[str, ClassificationPrimaryMetrics]

Primární metrika pro úkol. Přijatelné hodnoty: přesnost, AUC_weighted, precision_score_weighted

log_verbosity: str

Úroveň podrobností protokolu.

kwargs: dict

Slovník dalších parametrů konfigurace.

Návraty

Objekt TextClassificationJob.

Návratový typ

TextClassificationJob

text_classification_multilabel

Funkce pro vytvoření TextClassificationMultilabelJob.

Úloha vícenásobného označení klasifikace textu slouží k trénování modelu, který dokáže předpovědět třídy nebo kategorie textových dat. Vstupní trénovací data by měla obsahovat cílový sloupec, který klasifikuje text do tříd. Další informace o formátu dat s více popisky najdete tady: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parametry

training_data: Input

Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.

target_column_name: str

Název cílového sloupce

validation_data: Input

Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.

primary_metric: str

Primární metrika pro úkol. Přijatelné hodnoty: přesnost

log_verbosity: str

Úroveň podrobností protokolu.

kwargs: dict

Slovník dalších parametrů konfigurace.

Návraty

Objekt TextClassificationMultilabelJob.

Návratový typ

TextClassificationMultilabelJob

text_ner

Funkce pro vytvoření úlohy TextNerJob.

Úloha rozpoznávání entit s názvem text slouží k trénování modelu, který dokáže předpovědět pojmenované entity v textu. Vstupní trénovací data by měla být textový soubor ve formátu CoNLL. Další informace o formátu textových dat NER najdete tady: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parametry

training_data: Input

Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.

validation_data: Input

Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.

primary_metric: str

Primární metrika pro úkol. Přijatelné hodnoty: přesnost

log_verbosity: str

Úroveň podrobností protokolu.

kwargs: dict

Slovník dalších parametrů konfigurace.

Návraty

Objekt TextNerJob.

Návratový typ

TextNerJob

Sdílet prostřednictvím

automl Balíček

Třídy

Výčty

Funkce

classification

Parametry

Návraty

Návratový typ

forecasting

Parametry

Návraty

Návratový typ

image_classification

Parametry

Návraty

Návratový typ

image_classification_multilabel

Parametry

Návraty

Návratový typ

image_instance_segmentation

Parametry

Návraty

Návratový typ

image_object_detection

Parametry

Návraty

Návratový typ

regression

Parametry

Návraty

Návratový typ

text_classification

Parametry

Návraty

Návratový typ

text_classification_multilabel

Parametry

Návraty

Návratový typ

text_ner

Parametry

Návraty

Návratový typ

Váš názor

Další materiály