AutoMLBaseSettings Classe
Conservez et validez les paramètres pour une expérience AutoML.
Gérer les paramètres utilisés par les composants AutoML.
- Héritage
-
builtins.objectAutoMLBaseSettings
Constructeur
AutoMLBaseSettings(path: str | None = None, iterations: int = 1000, data_script: str | None = None, primary_metric: str | None = None, task_type: str | None = None, positive_label: Any | None = None, test_size: float | None = None, validation_size: float | None = None, n_cross_validations: int | str | None = None, y_min: float | None = None, y_max: float | None = None, num_classes: int | None = None, featurization: str | FeaturizationConfig = 'auto', max_cores_per_iteration: int = 1, max_concurrent_iterations: int = 1, iteration_timeout_minutes: int | None = None, mem_in_mb: int | None = None, enforce_time_on_windows: bool = True, experiment_timeout_minutes: int | None = None, experiment_exit_score: float | None = None, blocked_models: List[str] | None = None, blacklist_models: List[str] | None = None, allowed_models: List[str] | None = None, whitelist_models: List[str] | None = None, exclude_nan_labels: bool = True, verbosity: int = 20, debug_log: str | None = 'automl.log', debug_flag: Dict[str, Any] | None = None, enable_voting_ensemble: bool = True, enable_stack_ensemble: bool | None = None, ensemble_iterations: int | None = None, model_explainability: bool = True, enable_tf: bool = True, enable_subsampling: bool | None = None, subsample_seed: int | None = None, cost_mode: int = 0, is_timeseries: bool = False, enable_early_stopping: bool = True, early_stopping_n_iters: int = 10, enable_onnx_compatible_models: bool = False, enable_feature_sweeping: bool = False, enable_nimbusml: bool | None = None, enable_streaming: bool | None = None, force_streaming: bool | None = None, label_column_name: str | None = None, weight_column_name: str | None = None, cv_split_column_names: List[str] | None = None, enable_local_managed: bool = False, vm_type: str | None = None, track_child_runs: bool = True, n_best_runs: int = 1, show_deprecate_warnings: bool | None = True, forecasting_parameters: ForecastingParameters | None = None, allowed_private_models: List[str] | None = None, scenario: str | None = None, environment_label: str | None = None, save_mlflow: bool = False, test_include_predictions_only: bool = False, run_source: str | None = None, partition_column_names: List[str] | None = None, **kwargs: Any)
Paramètres
- path
Chemin d’accès complet au dossier du projet
- iterations
Nombre de pipelines différents à tester
- data_script
Chemin d’accès au script contenant get_data()
- primary_metric
Métrique que vous souhaitez optimiser.
- task_type
Champ décrivant s’il s’agit d’une expérience de classification ou de régression
- positive_label
Étiquette de classe positive avec laquelle calculer les métriques binaires.
- test_size
Quel pourcentage des données conserver pour le test
- validation_size
Quel pourcentage des données conserver pour validation
- n_cross_validations
Nombre de validations croisées à effectuer
- y_min
Valeur minimale de y pour une expérience de régression
- y_max
Valeur maximale de y pour une expérience de régression
- num_classes
Nombre de classes dans les données d’étiquette
- featurization
Indicateur indiquant si l’étape de caractérisation doit être effectuée automatiquement ou non, ou si la caractérisation personnalisée doit être utilisée.
- max_cores_per_iteration
Nombre maximal de threads à utiliser pour une itération donnée
- max_concurrent_iterations
Nombre maximal d’itérations qui seraient exécutées en parallèle. Ce nombre doit être inférieur au nombre de cœurs sur le calcul AzureML. Anciennement concurrent_iterations.
- iteration_timeout_minutes
Durée maximale en secondes pendant laquelle chaque itération se termine
- mem_in_mb
Utilisation maximale de la mémoire de chaque itération avant son arrêt
- enforce_time_on_windows
indicateur pour appliquer une limite de temps à l’entraînement du modèle à chaque itération sous windows.
- experiment_timeout_minutes
Durée maximale pendant laquelle toutes les itérations combinées peuvent prendre
- experiment_exit_score
Score cible de l’expérience. L’expérience se termine une fois ce score atteint.
- blocked_models
Liste des algorithmes à ignorer pour l’expérience AutoML
- blacklist_models
Déconseillé, utilisez blocked_models.
- allowed_models
Liste des noms de modèles à rechercher pour l’expérience AutoML.
- whitelist_models
Déconseillé, utilisez allowed_models.
- exclude_nan_labels
Indiquer s’il faut exclure des lignes avec des valeurs NaN dans l’étiquette
- verbosity
Niveau de détail pour le fichier journal AutoML
- debug_log
Chemin d’accès aux journaux AutoML
- enable_voting_ensemble
Indicateur permettant d’activer/désactiver une itération supplémentaire pour l’ensemble de vote.
- enable_stack_ensemble
Indicateur permettant d’activer/désactiver une itération supplémentaire pour l’ensemble de la pile.
- ensemble_iterations
Nombre de modèles à prendre en compte pour la génération d’ensemble
- model_explainability
Indiquez s’il faut expliquer le meilleur modèle AutoML à la fin des itérations d’entraînement.
- enable_tf
Indicateur pour activer/désactiver les algorithmes Tensorflow
- enable_subsampling
Indicateur permettant d’activer/désactiver le sous-échantillonnage.
- subsample_seed
random_state utilisé pour échantillonner les données.
- cost_mode
- int ou PipelineCost
Indicateur pour définir les modes de prédiction des coûts. COST_NONE signifie aucune prédiction de coût, COST_FILTER signifie prédiction de coût par itération.
- is_timeseries
- bool
Indiquez si AutoML doit traiter vos données en tant que données de série chronologique.
- enable_early_stopping
- bool
Indiquez si l’expérience doit s’arrêter tôt si le score ne s’améliore pas.
- early_stopping_n_iters
- int
Nombre d’itérations à exécuter en plus des pipelines de repère avant l’arrêt précoce.
- enable_onnx_compatible_models
Indicateur pour activer/désactiver l’application des modèles compatibles onnx.
- enable_feature_sweeping
Indicateur pour activer/désactiver le balayage des fonctionnalités.
- enable_nimbusml
Indicateur permettant d’activer/désactiver les transformateurs/apprenants NimbusML.
- enable_streaming
Indicateur pour activer/désactiver la diffusion en continu.
- force_streaming
Indicateur pour forcer le streaming à se lancer.
- label_column_name
Nom de la colonne d’étiquette.
- weight_column_name
Nom de la colonne correspondant aux pondérations de l’échantillon.
- cv_split_column_names
Liste des noms des colonnes contenant un fractionnement de validation croisée personnalisée.
- enable_local_managed
- bool
indiquer s’il faut autoriser les exécutions gérées locales
- track_child_runs
- bool
Indiquez s’il faut charger tous les détails de l’exécution enfant dans l’historique des exécutions. Si la valeur est false, seules les meilleures exécutions enfants et d’autres détails de résumé sont chargés.
- n_best_runs
- int
Nombre de meilleures exécutions à charger par partition pour une exécution de nombreux modèles. La valeur par défaut est de 1.
Nombre de périodes passées à décaler par rapport à la colonne cible. Ce paramètre est déprécié. Utilisez plutôt forecasting_parameters.
Pendant la prévision, ce paramètre correspond au nombre de lignes dont les valeurs cibles doivent être décalées en fonction de la fréquence des données. Ce paramètre est représenté sous la forme d’une liste ou d’un entier unique. Un décalage est nécessaire en l’absence de correspondance ou de corrélation par défaut des relations entre les variables indépendantes et la variable dépendante. Par exemple, quand vous essayez de prévoir la demande d’un produit, la demande mensuelle peut dépendre du prix de certaines matières premières trois mois auparavant. Dans ce cas, vous pouvez appliquer un décalage négatif de trois mois à la cible (la demande) afin que le modèle soit entraîné sur la relation appropriée.
- feature_lags
- str
Indicateur pour générer des retards pour les fonctionnalités numériques Ce paramètre est déconseillé. Utilisez plutôt forecasting_parameters.
- freq
- str
Fréquence du jeu de données de série chronologique. Ce paramètre est déprécié. Utilisez plutôt forecasting_parameters.
Pendant la prévision, ce paramètre représente la période à laquelle les événements sont supposés se produire, par exemple, tous les jours, toutes les semaines, tous les ans, etc. La fréquence doit être un alias de décalage pandas. Pour plus d’informations, consultez la documentation Pandas : https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#dateoffset-objects
- forecasting_parameters
- ForecastingParameters
Objet ForecastingParameters qui contient tous les paramètres spécifiques de prévision.
Liste des modèles privés à ajouter au allowed_list. Les modèles privés sont des modèles implémentés dans sdk/JOS, mais qui ne sont pas encore accessibles au public.
- show_deprecate_warnings
Basculez pour afficher les avertissements de paramètres déconseillés.
- scenario
Scénario client utilisé pour cette exécution, défini par AutoMLConfig.
Étiquette de l’environnement utilisé pour l’apprentissage. Remplace l’étiquette sélectionnée PAR JOS.
- save_mlflow
- bool
Indicateur indiquant s’il faut enregistrer la sortie à l’aide de MLFlow.
- test_include_predictions_only
- bool
Indicateur indiquant s’il faut inclure uniquement des prédictions dans la série de tests.
Chaîne utilisée pour définir une propriété RootAttribution différente de « automl ».
Noms de colonnes à utiliser pour de nombreuses partitions de modèles.
- kwargs
- debug_flag
- vm_type
Méthodes
as_serializable_dict | |
from_string_or_dict |
Convertissez une chaîne ou un dictionnaire contenant des paramètres en objet AutoMLBaseSettings. Si la valeur fournie est déjà un objet AutoMLBaseSettings, elle est simplement transmise. |
as_serializable_dict
as_serializable_dict() -> Dict[str, Any]
from_string_or_dict
Convertissez une chaîne ou un dictionnaire contenant des paramètres en objet AutoMLBaseSettings.
Si la valeur fournie est déjà un objet AutoMLBaseSettings, elle est simplement transmise.
static from_string_or_dict(val: Dict[str, Any] | str | AutoMLBaseSettings) -> AutoMLBaseSettings
Paramètres
- val
données d’entrée à convertir
Retours
objet AutoMLBaseSettings
Attributs
debug_log
MAXIMUM_DEFAULT_ENSEMBLE_SELECTION_ITERATIONS
MAXIMUM_DEFAULT_ENSEMBLE_SELECTION_ITERATIONS = 15
MAXIMUM_EXPERIMENT_TIMEOUT_MINUTES
MAXIMUM_EXPERIMENT_TIMEOUT_MINUTES = 525600
MAXIMUM_ITERATION_TIMEOUT_MINUTES
MAXIMUM_ITERATION_TIMEOUT_MINUTES = 43200
MAXIMUM_MEM_IN_MB
MAXIMUM_MEM_IN_MB = 1073741824
MAX_CORES_PER_ITERATION
MAX_CORES_PER_ITERATION = 16384
MAX_LAG_LENGTH
MAX_LAG_LENGTH = 2000
MAX_N_CROSS_VALIDATIONS
MAX_N_CROSS_VALIDATIONS = 1000
MINIMUM_REQUIRED_ITERATIONS_ENSEMBLE
MINIMUM_REQUIRED_ITERATIONS_ENSEMBLE = 2
MIN_EXPTIMEOUT_MINUTES
MIN_EXPTIMEOUT_MINUTES = 15
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour