automl Balíček
Obsahuje automatizované třídy strojového učení pro Azure Machine Learning SDKv2.
Mezi hlavní oblasti patří správa úloh AutoML.
Třídy
ClassificationJob |
Konfigurace pro úlohu klasifikace autoML. Inicializuje novou úlohu klasifikace AutoML. |
ColumnTransformer |
Nastavení sloupcových transformátorů. |
ForecastingJob |
Konfigurace pro úlohu prognózování automatického strojového učení Inicializuje novou úlohu prognózování autoML. |
ForecastingSettings |
Nastavení prognózy pro úlohu AutoML |
ImageClassificationJob |
Konfigurace pro úlohu Klasifikace obrázků s více třídami AutoML Inicializuje novou úlohu Klasifikace obrázků s více třídami AutoML. |
ImageClassificationMultilabelJob |
Konfigurace pro úlohu Klasifikace obrázků s více popisky AutoML Inicializujte novou úlohu Klasifikace obrázků autoML s více popisky. |
ImageClassificationSearchSpace |
Vyhledejte místo pro úlohy Klasifikace obrázků AutoML a Klasifikace obrázků s více popisky. |
ImageInstanceSegmentationJob |
Konfigurace pro úlohu segmentace instance image AutoML Inicializuje novou úlohu segmentace instance image autoML. |
ImageLimitSettings |
Omezení nastavení pro vertikály obrázků AutoML ImageLimitSettings je třída, která obsahuje následující parametry: max_concurrent_trials, max_trials a timeout_minutes. Jedná se o volitelnou metodu konfigurace pro konfiguraci parametrů limitů, jako jsou vypršení časových limitů atd. Poznámka Počet souběžných spuštění se hradí u prostředků dostupných v zadaném cílovém výpočetním objektu. Ujistěte se, že cíl výpočetních prostředků má dostupné prostředky pro požadovanou souběžnost. Tip Je vhodné porovnat max_concurrent_trials počet s počtem uzlů v clusteru. Pokud máte například cluster se 4 uzly, nastavte max_concurrent_trials na 4. Příklad použití Konfigurace ImageLimitSettings
Inicializujte objekt ImageLimitSettings. Konstruktor pro ImageLimitSettings pro AutoML Image Verticals. |
ImageModelSettingsClassification |
Nastavení modelu pro úlohy klasifikace obrázků autoML |
ImageModelSettingsObjectDetection |
Nastavení modelu pro úlohu Rozpoznávání objektů obrázku AutoML |
ImageObjectDetectionJob |
Konfigurace pro úlohu detekce objektů image autoML Inicializuje novou úlohu rozpoznávání objektů obrázku autoML. |
ImageObjectDetectionSearchSpace |
Vyhledejte místo pro úlohy Detekce objektů obrázků AutoML a Segmentace instancí obrázků. |
ImageSweepSettings |
Nastavení uklidit pro všechny svislé obrázky AutoML |
NlpFeaturizationSettings |
Nastavení funkce pro všechny vertikály NLP autoML. |
NlpFixedParameters |
Objekt do domu s pevnými parametry pro úlohy NLP. |
NlpLimitSettings |
Nastavení omezení pro všechny svislé funkce NLP automatického strojového učení |
NlpSearchSpace |
Vyhledejte místo pro úlohy automatického strojového učení NLP. |
NlpSweepSettings |
Nastavení úklidu pro všechny úlohy automatického strojového učení NLP. |
RegressionJob |
Konfigurace pro úlohu regrese AutoML. Inicializace nové úlohy regrese AutoML |
SearchSpace |
SearchSpace – třída pro vertikály AutoML. |
StackEnsembleSettings |
Pokročilé nastavení pro přizpůsobení spuštění StackEnsemble |
TabularFeaturizationSettings |
Nastavení funkce pro úlohu AutoML. |
TabularLimitSettings |
Omezení nastavení pro vertikálu tabulky AutoML. |
TextClassificationJob |
Konfigurace pro úlohu klasifikace textu AutoML. Inicializuje novou úlohu Klasifikace textu AutoML. |
TextClassificationMultilabelJob |
Konfigurace pro úlohu více popisku klasifikace textu AutoML Inicializuje novou úlohu Klasifikace textu AutoML s více popisky. |
TextNerJob |
Konfigurace pro úlohu AutoML Text NER Inicializuje novou úlohu AutoML Text NER. |
TrainingSettings |
Třída TrainingSettings pro Azure Machine Learning. Třída TrainingSettings pro Azure Machine Learning. |
Výčty
BlockedTransformers |
Výčet pro všechny klasifikační modely podporované v AutoML. |
ClassificationModels |
Výčet pro všechny klasifikační modely podporované v AutoML. |
ClassificationMultilabelPrimaryMetrics |
Primární metriky pro úlohy klasifikace s více popisky |
ClassificationPrimaryMetrics |
Primární metriky pro úlohy klasifikace |
FeaturizationMode |
Režim featurizace – určuje režim featurizace dat. |
ForecastHorizonMode |
Výčet pro určení režimu výběru horizontu prognózy. |
ForecastingModels |
Výčet pro všechny modely prognóz, které autoML podporuje. |
ForecastingPrimaryMetrics |
Primární metriky pro úlohu prognózování |
InstanceSegmentationPrimaryMetrics |
Primární metriky pro úlohy InstanceSegmentation |
LearningRateScheduler |
Výčet plánovače četnosti učení |
LogTrainingMetrics |
Obsahuje automatizované třídy strojového učení pro Azure Machine Learning SDKv2. Mezi hlavní oblasti patří správa úloh AutoML. |
LogValidationLoss |
Obsahuje automatizované třídy strojového učení pro Azure Machine Learning SDKv2. Mezi hlavní oblasti patří správa úloh AutoML. |
NCrossValidationsMode |
Určuje, jak se určuje hodnota N-Křížového ověření. |
ObjectDetectionPrimaryMetrics |
Primární metriky pro úlohu Image ObjectDetection |
RegressionModels |
Výčet pro všechny regresní modely podporované v AutoML |
RegressionPrimaryMetrics |
Primární metriky pro úlohu regrese |
SamplingAlgorithmType |
Obsahuje automatizované třídy strojového učení pro Azure Machine Learning SDKv2. Mezi hlavní oblasti patří správa úloh AutoML. |
ShortSeriesHandlingConfiguration |
Parametr definující, jak má AutoML zpracovávat krátké časové řady. |
StochasticOptimizer |
Stochastic optimizer pro image modely. |
TargetAggregationFunction |
Cílová agregační funkce. |
TargetLagsMode |
Cíl zpožďuje režimy výběru. |
TargetRollingWindowSizeMode |
Cílový režim velikosti průběžných oken. |
UseStl |
Nakonfigurujte rozklad STL cílového sloupce časové řady. |
ValidationMetricType |
Metoda výpočtu metrik, která se má použít pro ověřovací metriky v úlohách obrázků. |
Funkce
classification
Funkce pro vytvoření klasifikační úlohy.
Úloha klasifikace se používá k trénování modelu, který nejlépe predikuje třídu vzorku dat. Pomocí trénovacích dat se trénují různé modely. Jako konečný model se vybere model s nejlepším výkonem u ověřovacích dat na základě primární metriky.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
Parametry
- training_data
- Input
Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).
- target_column_name
- str
Název sloupce popisku
Tento parametr se vztahuje na training_data
parametry atest_data
. validation_data
- primary_metric
Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o způsobu výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Přijatelné hodnoty: přesnost, AUC_weighted, norm_macro_recall, average_precision_score_weighted a precision_score_weighted Výchozí hodnoty přesnosti
- enable_model_explainability
- bool
Jestli chcete povolit vysvětlení nejlepšího modelu AutoML na konci všech iterací trénování autoML. Výchozí hodnota je Žádný. Další informace najdete v tématu Interpretovatelnost: vysvětlení modelů v automatizovaném strojovém učení.
- weight_column_name
- str
Název sloupce hmotnosti vzorku. Automatizované strojové učení podporuje jako vstup vážený sloupec, což způsobuje, že se řádky v datech váží nahoru nebo dolů. Pokud vstupní data pocházejí z knihovny pandas. Datový rámec, který nemá názvy sloupců, je možné místo toho použít indexy sloupců vyjádřené jako celá čísla.
Tento parametr se vztahuje na training_data
parametry a validation_data
.
- validation_data
- Input
Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).
Výchozí hodnota není žádná.
- validation_data_size
- float
Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu.
Zadejte validation_data
, jestli chcete zadat ověřovací data, jinak nastavit n_cross_validations
nebo validation_data_size
extrahovat ověřovací data ze zadaných trénovacích dat.
Pokud chcete použít vlastní křížové ověření, použijte cv_split_column_names
.
Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.
Výchozí hodnota není žádná.
Kolik křížových ověření se má provést, když nejsou zadána data ověření uživatele.
Zadejte validation_data
, jestli chcete zadat ověřovací data, jinak nastavit n_cross_validations
nebo validation_data_size
extrahovat ověřovací data ze zadaných trénovacích dat.
Pokud chcete použít vlastní křížové ověření, použijte cv_split_column_names
.
Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.
Výchozí hodnota není žádná.
Seznam názvů sloupců, které obsahují vlastní rozdělení křížového ověření Každý ze sloupců s rozdělením životopisu představuje jedno rozdělení CV, kde každý řádek je označený buď 1 pro trénování, nebo 0 pro ověření.
Výchozí hodnota není žádná.
- test_data
- Input
Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Testovací data, která se mají použít pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky dané predikcemi.
Pokud tento parametr nebo test_data_size
parametr nejsou zadány, po dokončení trénování modelu se automaticky neprovede žádné testovací spuštění.
Testovací data by měla obsahovat funkce i sloupec popisků.
Pokud test_data
je zadaný target_column_name
parametr, musí být zadán parametr.
Výchozí hodnota není žádná.
- test_data_size
- float
Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Jaký zlomek trénovacích dat se má uchovávat pro testovací data pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky dané predikcemi.
Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu.
Pokud test_data_size
je zadána ve stejnou dobu jako validation_data_size
, pak se testovací data před rozdělením ověřovacích dat rozdělí training_data
.
Pokud validation_data_size=0.1
například a test_data_size=0.1
původní trénovací data mají 1000 řádků, testovací data budou mít 100 řádků, ověřovací data budou obsahovat 90 řádků a trénovací data budou mít 810 řádků.
Pro úlohy založené na regresi se používá náhodný vzorkování. Pro úlohy klasifikace se používá stratifikované vzorkování. Prognózování v současné době nepodporuje zadání testovací datové sady pomocí rozdělení trénování a testu.
Pokud tento parametr nebo test_data
parametr nejsou zadány, po dokončení trénování modelu se automaticky neprovede žádné testovací spuštění.
Výchozí hodnota není žádná.
Návraty
Objekt úlohy, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.
Návratový typ
forecasting
Funkce pro vytvoření úlohy prognózování
Úloha prognózování se používá k predikci cílových hodnot pro budoucí časové období na základě historických dat. Pomocí trénovacích dat se trénují různé modely. Jako konečný model se vybere model s nejlepším výkonem u ověřovacích dat na základě primární metriky.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
Parametry
- training_data
- Input
Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).
- target_column_name
- str
Název sloupce popisku
Tento parametr se vztahuje na training_data
parametry atest_data
. validation_data
- primary_metric
Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o způsobu výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Přijatelné hodnoty: r2_score, normalized_mean_absolute_error normalized_root_mean_squared_error Výchozí hodnota normalized_root_mean_squared_error
- enable_model_explainability
- bool
Jestli chcete povolit vysvětlení nejlepšího modelu AutoML na konci všech iterací trénování autoML. Výchozí hodnota je Žádný. Další informace najdete v tématu Interpretovatelnost: vysvětlení modelů v automatizovaném strojovém učení.
- weight_column_name
- str
Název sloupce hmotnosti vzorku. Automatizované strojové učení podporuje jako vstup vážený sloupec, což způsobuje, že se řádky v datech váží nahoru nebo dolů. Pokud vstupní data pocházejí z knihovny pandas. Datový rámec, který nemá názvy sloupců, je možné místo toho použít indexy sloupců vyjádřené jako celá čísla.
Tento parametr se vztahuje na training_data
parametry a validation_data
.
- validation_data
- Input
Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).
Výchozí hodnota není žádná.
- validation_data_size
- float
Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu.
Zadejte validation_data
, jestli chcete zadat ověřovací data, jinak nastavit n_cross_validations
nebo validation_data_size
extrahovat ověřovací data ze zadaných trénovacích dat.
Pokud chcete použít vlastní křížové ověření, použijte cv_split_column_names
.
Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.
Výchozí hodnota není žádná.
Kolik křížových ověření se má provést, když nejsou zadána data ověření uživatele.
Zadejte validation_data
, jestli chcete zadat ověřovací data, jinak nastavit n_cross_validations
nebo validation_data_size
extrahovat ověřovací data ze zadaných trénovacích dat.
Pokud chcete použít vlastní křížové ověření, použijte cv_split_column_names
.
Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.
Výchozí hodnota není žádná.
Seznam názvů sloupců, které obsahují vlastní rozdělení křížového ověření Každý ze sloupců s rozdělením životopisu představuje jedno rozdělení CV, kde každý řádek je označený buď 1 pro trénování, nebo 0 pro ověření.
Výchozí hodnota není žádná.
- test_data
- Input
Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Testovací data, která se mají použít pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky dané predikcemi.
Pokud tento parametr nebo test_data_size
parametr nejsou zadány, po dokončení trénování modelu se automaticky neprovede žádné testovací spuštění.
Testovací data by měla obsahovat funkce i sloupec popisků.
Pokud test_data
je zadaný target_column_name
parametr, musí být zadán parametr.
Výchozí hodnota není žádná.
- test_data_size
- float
Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Jaký zlomek trénovacích dat se má uchovávat pro testovací data pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky dané predikcemi.
Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu.
Pokud test_data_size
je zadána ve stejnou dobu jako validation_data_size
, pak se testovací data před rozdělením ověřovacích dat rozdělí training_data
.
Pokud validation_data_size=0.1
například a test_data_size=0.1
původní trénovací data mají 1000 řádků, testovací data budou mít 100 řádků, ověřovací data budou obsahovat 90 řádků a trénovací data budou mít 810 řádků.
Pro úlohy založené na regresi se používá náhodný vzorkování. Pro úlohy klasifikace se používá stratifikované vzorkování. Prognózování v současné době nepodporuje zadání testovací datové sady pomocí rozdělení trénování a testu.
Pokud tento parametr nebo test_data
parametr nejsou zadány, po dokončení trénování modelu se automaticky neprovede žádné testovací spuštění.
Výchozí hodnota není žádná.
- forecasting_settings
- ForecastingSettings
Nastavení úlohy prognózování
Návraty
Objekt úlohy, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.
Návratový typ
image_classification
Vytvoří objekt pro úlohu klasifikace obrázků autoML s více třídami.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
Parametry
- training_data
- Input
Trénovací data, která se mají použít v rámci experimentu.
- target_column_name
- str
Název sloupce popisku
Tento parametr platí pro training_data
parametry a validation_data
.
- primary_metric
Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o způsobu výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Přijatelné hodnoty: přesnost, AUC_weighted, norm_macro_recall, average_precision_score_weighted a precision_score_weighted Výchozí hodnoty přesnosti.
- validation_data
- Input
Ověřovací data, která se mají použít v rámci experimentu.
- validation_data_size
- float
Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. Tato hodnota by měla být mezi 0,0 a 1,0 bez inkluzivního rozsahu.
Zadáním validation_data
zadáte ověřovací data, jinak nastavíte validation_data_size
extrahování ověřovacích dat ze zadaných trénovacích dat.
Výchozí hodnota je .2.
- kwargs
- dict
Slovník dalších parametrů konfigurace.
Návraty
Objekt úlohy klasifikace obrázků, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.
Návratový typ
image_classification_multilabel
Vytvoří objekt pro úlohu klasifikace obrázků s více popisky autoML.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
Parametry
- training_data
- Input
Trénovací data, která se mají použít v rámci experimentu.
- target_column_name
- str
Název sloupce popisku
Tento parametr se vztahuje na training_data
parametry a validation_data
.
- primary_metric
Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Přijatelné hodnoty: přesnost, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted a výchozí hodnota IOU je IOU.
- validation_data
- Input
Ověřovací data, která se mají použít v rámci experimentu.
- validation_data_size
- float
Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. To by mělo být mezi 0,0 a 1,0 bez začlenění.
Zadáním validation_data
zadejte ověřovací data, jinak nastavíte validation_data_size
extrahování ověřovacích dat ze zadaných trénovacích dat.
Výchozí hodnota je .2.
- kwargs
- dict
Slovník dalších parametrů konfigurace.
Návraty
Image objektu úlohy klasifikace s více popisky, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.
Návratový typ
image_instance_segmentation
Vytvoří objekt pro úlohu segmentace instance image automatizovaného strojového učení.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
Parametry
- training_data
- Input
Trénovací data, která se mají použít v rámci experimentu.
- target_column_name
- str
Název sloupce popisku
Tento parametr se vztahuje na training_data
parametry a validation_data
.
- primary_metric
Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Přijatelné hodnoty: MeanAveragePrecision Výchozí hodnota je MeanAveragePrecision.
- validation_data
- Input
Ověřovací data, která se mají použít v rámci experimentu.
- validation_data_size
- float
Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. To by mělo být mezi 0,0 a 1,0 bez začlenění.
Zadáním validation_data
zadejte ověřovací data, jinak nastavíte validation_data_size
extrahování ověřovacích dat ze zadaných trénovacích dat.
Výchozí hodnota je .2.
- kwargs
- dict
Slovník dalších parametrů konfigurace.
Návraty
Úloha segmentace instance image
Návratový typ
image_object_detection
Vytvoří objekt pro úlohu detekce objektu obrázku automatizovaného strojového učení.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
Parametry
- training_data
- Input
Trénovací data, která se mají použít v rámci experimentu.
- target_column_name
- str
Název sloupce popisku
Tento parametr se vztahuje na training_data
parametry a validation_data
.
- primary_metric
Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Přijatelné hodnoty: MeanAveragePrecision Výchozí hodnota je MeanAveragePrecision.
- validation_data
- Input
Ověřovací data, která se mají použít v rámci experimentu.
- validation_data_size
- float
Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. To by mělo být mezi 0,0 a 1,0 bez začlenění.
Zadáním validation_data
zadejte ověřovací data, jinak nastavíte validation_data_size
extrahování ověřovacích dat ze zadaných trénovacích dat.
Výchozí hodnota je .2.
- kwargs
- dict
Slovník dalších parametrů konfigurace.
Návraty
Objekt úlohy rozpoznávání objektu obrázku, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.
Návratový typ
regression
Funkce pro vytvoření regresní úlohy
Úloha regrese se používá k trénování modelu pro predikci průběžných hodnot cílové proměnné z datové sady. Pomocí trénovacích dat se trénují různé modely. Jako konečný model se vybere model s nejlepším výkonem u ověřovacích dat na základě primární metriky.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
Parametry
- training_data
- Input
Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat jak trénovací funkce, tak sloupec popisku (volitelně sloupec s váhou vzorku).
- target_column_name
- str
Název sloupce popisku
Tento parametr se vztahuje na training_data
parametry , validation_data
a test_data
.
- primary_metric
Metrika, kterou automatizované strojové učení optimalizuje pro výběr modelu. Automatizované strojové učení shromažďuje více metrik, než dokáže optimalizovat. Další informace o výpočtu metrik najdete v tématu https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Přijatelné hodnoty: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Výchozí hodnota je normalized_root_mean_squared_error.
- enable_model_explainability
- bool
Jestli chcete povolit vysvětlení nejlepšího modelu Automatizovaného strojového učení na konci všech iterací trénování automatizovaného strojového učení. Výchozí hodnota je Žádná. Další informace najdete v tématu Interpretovatelnost: vysvětlení modelů v automatizovaném strojovém učení.
- weight_column_name
- str
Název sloupce hmotnosti vzorku. Automatizované strojové učení podporuje vážený sloupec jako vstup, což způsobuje, že řádky v datech jsou vážené nahoru nebo dolů. Pokud vstupní data pocházejí z knihovny pandas. Datový rámec, který nemá názvy sloupců, je možné místo toho použít indexy sloupců vyjádřené jako celá čísla.
Tento parametr se vztahuje na training_data
parametry a .validation_data
- validation_data
- Input
Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i sloupec popisku (volitelně sloupec s váhou vzorku).
Výchozí hodnota je Žádná.
- validation_data_size
- float
Jaký zlomek dat se má uchovávat pro ověření, když nejsou zadána data ověření uživatele. To by mělo být mezi 0,0 a 1,0 bez začlenění.
Zadejte validation_data
, chcete-li poskytnout ověřovací data, jinak nastavit n_cross_validations
nebo validation_data_size
extrahovat ověřovací data ze zadaných trénovacích dat.
Pro vlastní křížové ověřování fold použijte cv_split_column_names
.
Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.
Výchozí hodnota je Žádná.
Kolik křížových ověření se má provést, když nejsou zadána data ověření uživatele.
Zadejte validation_data
, chcete-li poskytnout ověřovací data, jinak nastavit n_cross_validations
nebo validation_data_size
extrahovat ověřovací data ze zadaných trénovacích dat.
Pro vlastní křížové ověřování fold použijte cv_split_column_names
.
Další informace najdete v tématu Konfigurace rozdělení dat a křížového ověřování v automatizovaném strojovém učení.
Výchozí hodnota je Žádná.
Seznam názvů sloupců, které obsahují vlastní rozdělení křížového ověření Každý sloupec s rozdělením CV představuje jedno rozdělení CV, kde každý řádek je označen 1 pro trénování nebo 0 pro ověření.
Výchozí hodnota je Žádná.
- test_data
- Input
Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Testovací data, která se mají použít pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky, které jsou s těmito predikcemi.
Pokud tento parametr nebo test_data_size
parametr nezadáte, po dokončení trénování modelu se automaticky neprovedou žádné testovací běhy.
Testovací data by měla obsahovat jak funkce, tak sloupec popisku.
Pokud test_data
je zadán target_column_name
parametr , musí být zadán parametr .
Výchozí hodnota je Žádná.
- test_data_size
- float
Funkce Test modelu využívající testovací datové sady nebo rozdělení testovacích dat je funkce ve stavu Preview a může se kdykoli změnit. Jaký zlomek trénovacích dat se má uchovávat pro testovací data pro testovací běh, který se automaticky spustí po dokončení trénování modelu. Testovací běh získá předpovědi pomocí nejlepšího modelu a vypočítá metriky, které jsou s těmito predikcemi.
To by mělo být mezi 0,0 a 1,0 bez začlenění.
Pokud test_data_size
je zadána ve stejnou dobu jako validation_data_size
, testovací data jsou před rozdělením ověřovacích dat rozdělena training_data
od .
Pokud validation_data_size=0.1
například mají test_data_size=0.1
původní trénovací data 1000 řádků, testovací data budou mít 100 řádků, ověřovací data budou obsahovat 90 řádků a trénovací data 810 řádků.
Pro úlohy založené na regresi se používá náhodné vzorkování. Pro úlohy klasifikace se používá stratifikované vzorkování. Prognózování v současné době nepodporuje zadání testovací datové sady pomocí rozdělení trénování a testu.
Pokud tento parametr nebo test_data
parametr nezadáte, po dokončení trénování modelu se automaticky neprovedou žádné testovací běhy.
Výchozí hodnota je Žádná.
Návraty
Objekt úlohy, který je možné odeslat do výpočetního prostředí Azure ML ke spuštění.
Návratový typ
text_classification
Funkce pro vytvoření TextClassificationJob.
Úloha klasifikace textu se používá k trénování modelu, který dokáže předpovědět třídu nebo kategorii textových dat. Vstupní trénovací data by měla obsahovat cílový sloupec, který klasifikuje text přesně do jedné třídy.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
Parametry
- training_data
- Input
Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.
- target_column_name
- str
Název cílového sloupce
- validation_data
- Input
Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
Primární metrika pro úkol. Přijatelné hodnoty: přesnost, AUC_weighted, precision_score_weighted
- log_verbosity
- str
Úroveň podrobností protokolu.
- kwargs
- dict
Slovník dalších parametrů konfigurace.
Návraty
Objekt TextClassificationJob.
Návratový typ
text_classification_multilabel
Funkce pro vytvoření TextClassificationMultilabelJob.
Úloha vícenásobného označení klasifikace textu slouží k trénování modelu, který dokáže předpovědět třídy nebo kategorie textových dat. Vstupní trénovací data by měla obsahovat cílový sloupec, který klasifikuje text do tříd. Další informace o formátu dat s více popisky najdete tady: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
Parametry
- training_data
- Input
Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.
- target_column_name
- str
Název cílového sloupce
- validation_data
- Input
Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.
- primary_metric
- str
Primární metrika pro úkol. Přijatelné hodnoty: přesnost
- log_verbosity
- str
Úroveň podrobností protokolu.
- kwargs
- dict
Slovník dalších parametrů konfigurace.
Návraty
Objekt TextClassificationMultilabelJob.
Návratový typ
text_ner
Funkce pro vytvoření úlohy TextNerJob.
Úloha rozpoznávání entit s názvem text slouží k trénování modelu, který dokáže předpovědět pojmenované entity v textu. Vstupní trénovací data by měla být textový soubor ve formátu CoNLL. Další informace o formátu textových dat NER najdete tady: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
Parametry
- training_data
- Input
Trénovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.
- validation_data
- Input
Ověřovací data, která se mají použít v rámci experimentu. Měl by obsahovat trénovací funkce i cílový sloupec.
- primary_metric
- str
Primární metrika pro úkol. Přijatelné hodnoty: přesnost
- log_verbosity
- str
Úroveň podrobností protokolu.
- kwargs
- dict
Slovník dalších parametrů konfigurace.
Návraty
Objekt TextNerJob.
Návratový typ
Azure SDK for Python
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro