PipelineOutputTabularDataset Třída

Reference

Představují zprostředkující data kanálu povýšená na tabulkovou datovou sadu Služby Azure Machine Learning.

Jakmile se zprostředkující data povyšují na datovou sadu Azure Machine Learning, budou se v dalších krocích využívat také jako datová sada místo dataReference.

Vytvořte průběžná data, která budou povýšena na datovou sadu Azure Machine Learning.

Dědičnost: PipelineOutputAbstractDataset

PipelineOutputTabularDataset

Konstruktor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Parametry

pipeline_output_dataset: PipelineOutputFileDataset

Vyžadováno

Souborová datová sada, která představuje zprostředkující výstup, který bude transformován na tabulkovou datovou sadu.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Vyžadováno

Další transformace, které se použijí nad datovou sadou souboru.

pipeline_output_dataset: PipelineOutputFileDataset

Vyžadováno

Souborová datová sada, která představuje zprostředkující výstup, který bude transformován na tabulkovou datovou sadu.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Vyžadováno

Další transformace, které se použijí nad datovou sadou souboru.

Metody

create_input_binding	Vytvořte vstupní vazbu.
drop_columns	Odstraňte zadané sloupce z datové sady.
keep_columns	Zachovejte zadané sloupce a vyhodí všechny ostatní z datové sady.
random_split	Rozdělte záznamy v datové sadě na dvě části náhodně a přibližně podle zadaného procenta.

create_input_binding

Vytvořte vstupní vazbu.

create_input_binding()

Návraty

InputPortBinding s tímto PipelineData jako zdrojem.

Návratový typ

InputPortBinding

drop_columns

Odstraňte zadané sloupce z datové sady.

drop_columns(columns)

Parametry

columns: str nebo list[str]

Vyžadováno

Název nebo seznam názvů sloupců, které se mají odstranit.

Návraty

Vrátí nová průběžná data s vynechanými pouze zadanými sloupci.

Návratový typ

PipelineOutputTabularDataset

keep_columns

Zachovejte zadané sloupce a vyhodí všechny ostatní z datové sady.

keep_columns(columns)

Parametry

columns: str nebo list[str]

Vyžadováno

Název nebo seznam názvů sloupců, které se mají zachovat.

Návraty

Vrátí nová průběžná data se zachováním pouze zadaných sloupců.

Návratový typ

PipelineOutputTabularDataset

random_split

Rozdělte záznamy v datové sadě na dvě části náhodně a přibližně podle zadaného procenta.

random_split(percentage, seed=None)

Parametry

percentage: float

Vyžadováno

Přibližné procento, podle které se má datová sada rozdělit. Musí to být číslo mezi 0,0 a 1,0.

seed: int

výchozí hodnota: None

Volitelná počáteční hodnota, která se použije pro generátor náhodných.

Návraty

Vrátí řazenou kolekci členů nových objektů TabularDataset, které představují dvě datové sady po rozdělení.

Návratový typ

(TabularDataset, TabularDataset)

PipelineOutputTabularDataset Třída

Konstruktor

Parametry

Metody

create_input_binding

Návraty

Návratový typ

drop_columns

Parametry

Návraty

Návratový typ

keep_columns

Parametry

Návraty

Návratový typ

random_split

Parametry

Návraty

Návratový typ

Váš názor

Váš názor

Další materiály