PipelineOutputTabularDataset Classe
Représente les données de pipeline intermédiaires promues en jeu de données tabulaires Azure Machine Learning.
Une fois que les données intermédiaires ont été promues en jeu de données Azure Machine Learning, elles sont également consommées en tant que jeu de données plutôt qu’en tant que référence de données dans les étapes suivantes.
Créez des données intermédiaires qui seront promues en jeu de données Azure Machine Learning.
- Héritage
-
PipelineOutputTabularDataset
Constructeur
PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)
Paramètres
- pipeline_output_dataset
- PipelineOutputFileDataset
Jeu de données de fichier qui représente la sortie intermédiaire à transformer en jeu de données tabulaires.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Transformations supplémentaires appliquées sur le jeu de données de fichier.
- pipeline_output_dataset
- PipelineOutputFileDataset
Jeu de données de fichier qui représente la sortie intermédiaire à transformer en jeu de données tabulaires.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Transformations supplémentaires appliquées sur le jeu de données de fichier.
Méthodes
create_input_binding |
Permet de créer une liaison d’entrée. |
drop_columns |
Supprimez les colonnes spécifiées du jeu de données. |
keep_columns |
Conservez les colonnes spécifiées et supprimez toutes les autres du jeu de données. |
random_split |
Fractionne les enregistrements dans le jeu de données en deux parties de façon aléatoire et approximative selon le pourcentage spécifié. |
create_input_binding
Permet de créer une liaison d’entrée.
create_input_binding()
Retours
InputPortBinding avec ce PipelineData en tant que source.
Type de retour
drop_columns
Supprimez les colonnes spécifiées du jeu de données.
drop_columns(columns)
Paramètres
Retours
Retourne de nouvelles données intermédiaires avec uniquement les colonnes spécifiées supprimées.
Type de retour
keep_columns
Conservez les colonnes spécifiées et supprimez toutes les autres du jeu de données.
keep_columns(columns)
Paramètres
Retours
Retourne de nouvelles données intermédiaires avec uniquement les colonnes spécifiées conservées.
Type de retour
random_split
Fractionne les enregistrements dans le jeu de données en deux parties de façon aléatoire et approximative selon le pourcentage spécifié.
random_split(percentage, seed=None)
Paramètres
- percentage
- float
Pourcentage approximatif par lequel fractionner le jeu de données. Il doit s’agir d’un nombre compris entre 0,0 et 1,0.
- seed
- int
Valeur initiale facultative à utiliser pour le générateur aléatoire.
Retours
Retourne un tuple de nouveaux objets TabularDataset représentant les deux jeux de données après le fractionnement.
Type de retour
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour