PipelineOutputTabularDataset Třída

Představují zprostředkující data kanálu povýšená na tabulkovou datovou sadu Služby Azure Machine Learning.

Jakmile se zprostředkující data povyšují na datovou sadu Azure Machine Learning, budou se v dalších krocích využívat také jako datová sada místo dataReference.

Vytvořte průběžná data, která budou povýšena na datovou sadu Azure Machine Learning.

Dědičnost
PipelineOutputTabularDataset

Konstruktor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Parametry

pipeline_output_dataset
PipelineOutputFileDataset
Vyžadováno

Souborová datová sada, která představuje zprostředkující výstup, který bude transformován na tabulkovou datovou sadu.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Vyžadováno

Další transformace, které se použijí nad datovou sadou souboru.

pipeline_output_dataset
PipelineOutputFileDataset
Vyžadováno

Souborová datová sada, která představuje zprostředkující výstup, který bude transformován na tabulkovou datovou sadu.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Vyžadováno

Další transformace, které se použijí nad datovou sadou souboru.

Metody

create_input_binding

Vytvořte vstupní vazbu.

drop_columns

Odstraňte zadané sloupce z datové sady.

keep_columns

Zachovejte zadané sloupce a vyhodí všechny ostatní z datové sady.

random_split

Rozdělte záznamy v datové sadě na dvě části náhodně a přibližně podle zadaného procenta.

create_input_binding

Vytvořte vstupní vazbu.

create_input_binding()

Návraty

InputPortBinding s tímto PipelineData jako zdrojem.

Návratový typ

drop_columns

Odstraňte zadané sloupce z datové sady.

drop_columns(columns)

Parametry

columns
str nebo list[str]
Vyžadováno

Název nebo seznam názvů sloupců, které se mají odstranit.

Návraty

Vrátí nová průběžná data s vynechanými pouze zadanými sloupci.

Návratový typ

keep_columns

Zachovejte zadané sloupce a vyhodí všechny ostatní z datové sady.

keep_columns(columns)

Parametry

columns
str nebo list[str]
Vyžadováno

Název nebo seznam názvů sloupců, které se mají zachovat.

Návraty

Vrátí nová průběžná data se zachováním pouze zadaných sloupců.

Návratový typ

random_split

Rozdělte záznamy v datové sadě na dvě části náhodně a přibližně podle zadaného procenta.

random_split(percentage, seed=None)

Parametry

percentage
float
Vyžadováno

Přibližné procento, podle které se má datová sada rozdělit. Musí to být číslo mezi 0,0 a 1,0.

seed
int
výchozí hodnota: None

Volitelná počáteční hodnota, která se použije pro generátor náhodných.

Návraty

Vrátí řazenou kolekci členů nových objektů TabularDataset, které představují dvě datové sady po rozdělení.

Návratový typ