PipelineOutputTabularDataset Klass
Representera mellanliggande pipelinedata som befordrats till en Azure Machine Learning-tabelldatauppsättning.
När mellanliggande data har befordrats till en Azure Machine Learning-datauppsättning, kommer den också att användas som en datauppsättning i stället för en DataReference i efterföljande steg.
Skapa mellanliggande data som ska höjas upp till en Azure Machine Learning-datauppsättning.
- Arv
-
PipelineOutputTabularDataset
Konstruktor
PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)
Parametrar
- pipeline_output_dataset
- PipelineOutputFileDataset
Fildatauppsättningen som representerar mellanliggande utdata som omvandlas till en tabellbaserad datauppsättning.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Ytterligare transformeringar som ska tillämpas ovanpå fildatauppsättningen.
- pipeline_output_dataset
- PipelineOutputFileDataset
Fildatauppsättningen som representerar mellanliggande utdata som omvandlas till en tabellbaserad datauppsättning.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Ytterligare transformeringar som ska tillämpas ovanpå fildatauppsättningen.
Metoder
create_input_binding |
Skapa en indatabindning. |
drop_columns |
Ta bort de angivna kolumnerna från datauppsättningen. |
keep_columns |
Behåll de angivna kolumnerna och ta bort alla andra från datauppsättningen. |
random_split |
Dela upp poster i datauppsättningen i två delar slumpmässigt och ungefär med den procentandel som anges. |
create_input_binding
Skapa en indatabindning.
create_input_binding()
Returer
InputPortBinding med denna PipelineData som källa.
Returtyp
drop_columns
Ta bort de angivna kolumnerna från datauppsättningen.
drop_columns(columns)
Parametrar
Returer
Returnerar nya mellanliggande data med endast de angivna kolumnerna borttagna.
Returtyp
keep_columns
Behåll de angivna kolumnerna och ta bort alla andra från datauppsättningen.
keep_columns(columns)
Parametrar
Returer
Returnerar nya mellanliggande data med endast de angivna kolumnerna behålls.
Returtyp
random_split
Dela upp poster i datauppsättningen i två delar slumpmässigt och ungefär med den procentandel som anges.
random_split(percentage, seed=None)
Parametrar
- percentage
- float
Den ungefärliga procentandelen som datauppsättningen ska delas med. Detta måste vara ett tal mellan 0,0 och 1,0.
Returer
Returnerar en tupplar med nya TabularDataset-objekt som representerar de två datauppsättningarna efter delningen.
Returtyp
Feedback
https://aka.ms/ContentUserFeedback.
Kommer snart: Under hela 2024 kommer vi att fasa ut GitHub-problem som feedbackmekanism för innehåll och ersätta det med ett nytt feedbacksystem. Mer information finns i:Skicka och visa feedback för