PipelineOutputTabularDataset Klas
Vertegenwoordigen tussenliggende pijplijngegevens die zijn gepromoveerd naar een tabellaire Azure Machine Learning-gegevensset.
Zodra een tussenliggende gegevensset wordt gepromoveerd naar een Azure Machine Learning-gegevensset, worden deze in de volgende stappen ook gebruikt als een gegevensset in plaats van een DataReference.
Maak tussenliggende gegevens die worden gepromoveerd naar een Azure Machine Learning-gegevensset.
- Overname
-
PipelineOutputTabularDataset
Constructor
PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)
Parameters
- pipeline_output_dataset
- PipelineOutputFileDataset
De bestandsgegevensset die de tussenliggende uitvoer vertegenwoordigt die wordt omgezet in een tabellaire gegevensset.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Aanvullende transformaties die worden toegepast op de bestandsgegevensset.
- pipeline_output_dataset
- PipelineOutputFileDataset
De bestandsgegevensset die de tussenliggende uitvoer vertegenwoordigt die wordt omgezet in een tabellaire gegevensset.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Aanvullende transformaties die worden toegepast op de bestandsgegevensset.
Methoden
create_input_binding |
Een invoerbinding maken. |
drop_columns |
Verwijder de opgegeven kolommen uit de gegevensset. |
keep_columns |
Behoud de opgegeven kolommen en verwijdert alle andere kolommen uit de gegevensset. |
random_split |
Splits records in de gegevensset willekeurig in twee delen en ongeveer op basis van het opgegeven percentage. |
create_input_binding
Een invoerbinding maken.
create_input_binding()
Retouren
De InputPortBinding met deze PipelineData als bron.
Retourtype
drop_columns
Verwijder de opgegeven kolommen uit de gegevensset.
drop_columns(columns)
Parameters
De naam of een lijst met namen voor de kolommen die moeten worden verwijderd.
Retouren
Retourneert een nieuwe tussenliggende gegevens waarbij alleen de opgegeven kolommen zijn verwijderd.
Retourtype
keep_columns
Behoud de opgegeven kolommen en verwijdert alle andere kolommen uit de gegevensset.
keep_columns(columns)
Parameters
De naam of een lijst met namen voor de kolommen die moeten worden bewaard.
Retouren
Retourneert een nieuwe tussenliggende gegevens waarbij alleen de opgegeven kolommen worden bewaard.
Retourtype
random_split
Splits records in de gegevensset willekeurig in twee delen en ongeveer op basis van het opgegeven percentage.
random_split(percentage, seed=None)
Parameters
- percentage
- float
Het percentage bij benadering waarop de gegevensset moet worden gesplitst. Dit moet een getal tussen 0,0 en 1,0 zijn.
Retouren
Retourneert een tuple van nieuwe TabularDataset-objecten die de twee gegevenssets na de splitsing vertegenwoordigen.
Retourtype
Feedback
https://aka.ms/ContentUserFeedback.
Binnenkort beschikbaar: In de loop van 2024 zullen we GitHub-problemen geleidelijk uitfaseren als het feedbackmechanisme voor inhoud en deze vervangen door een nieuw feedbacksysteem. Zie voor meer informatie:Feedback verzenden en weergeven voor