PipelineOutputTabularDataset Třída
Představují zprostředkující data kanálu povýšená na tabulkovou datovou sadu Služby Azure Machine Learning.
Jakmile se zprostředkující data povyšují na datovou sadu Azure Machine Learning, budou se v dalších krocích využívat také jako datová sada místo dataReference.
Vytvořte průběžná data, která budou povýšena na datovou sadu Azure Machine Learning.
- Dědičnost
-
PipelineOutputTabularDataset
Konstruktor
PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)
Parametry
- pipeline_output_dataset
- PipelineOutputFileDataset
Souborová datová sada, která představuje zprostředkující výstup, který bude transformován na tabulkovou datovou sadu.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Další transformace, které se použijí nad datovou sadou souboru.
- pipeline_output_dataset
- PipelineOutputFileDataset
Souborová datová sada, která představuje zprostředkující výstup, který bude transformován na tabulkovou datovou sadu.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Další transformace, které se použijí nad datovou sadou souboru.
Metody
create_input_binding |
Vytvořte vstupní vazbu. |
drop_columns |
Odstraňte zadané sloupce z datové sady. |
keep_columns |
Zachovejte zadané sloupce a vyhodí všechny ostatní z datové sady. |
random_split |
Rozdělte záznamy v datové sadě na dvě části náhodně a přibližně podle zadaného procenta. |
create_input_binding
Vytvořte vstupní vazbu.
create_input_binding()
Návraty
InputPortBinding s tímto PipelineData jako zdrojem.
Návratový typ
drop_columns
Odstraňte zadané sloupce z datové sady.
drop_columns(columns)
Parametry
Návraty
Vrátí nová průběžná data s vynechanými pouze zadanými sloupci.
Návratový typ
keep_columns
Zachovejte zadané sloupce a vyhodí všechny ostatní z datové sady.
keep_columns(columns)
Parametry
Návraty
Vrátí nová průběžná data se zachováním pouze zadaných sloupců.
Návratový typ
random_split
Rozdělte záznamy v datové sadě na dvě části náhodně a přibližně podle zadaného procenta.
random_split(percentage, seed=None)
Parametry
- percentage
- float
Přibližné procento, podle které se má datová sada rozdělit. Musí to být číslo mezi 0,0 a 1,0.
- seed
- int
Volitelná počáteční hodnota, která se použije pro generátor náhodných.
Návraty
Vrátí řazenou kolekci členů nových objektů TabularDataset, které představují dvě datové sady po rozdělení.
Návratový typ
Váš názor
https://aka.ms/ContentUserFeedback.
Připravujeme: V průběhu roku 2024 budeme postupně vyřazovat problémy z GitHub coby mechanismus zpětné vazby pro obsah a nahrazovat ho novým systémem zpětné vazby. Další informace naleznete v tématu:Odeslat a zobrazit názory pro