PipelineOutputTabularDataset Osztály

Referencia

Az Azure Machine Learning táblázatos adathalmazba előléptetett köztes folyamatadatokat jelöli.

Miután előléptet egy köztes adatot egy Azure Machine Learning-adatkészletbe, a rendszer adathalmazként is felhasználja azokat a következő lépésekben dataReference helyett.

Hozzon létre egy köztes adatot, amelyet előléptet egy Azure Machine Learning-adatkészletbe.

Öröklődés: PipelineOutputAbstractDataset

PipelineOutputTabularDataset

Konstruktor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Paraméterek

pipeline_output_dataset: PipelineOutputFileDataset

Kötelező

A köztes kimenetet képviselő fájladatkészlet, amely táblázatos adatkészletté lesz átalakítva.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Kötelező

További átalakítások, amelyek a fájladatkészletre lesznek alkalmazva.

pipeline_output_dataset: PipelineOutputFileDataset

Kötelező

A köztes kimenetet képviselő fájladatkészlet, amely táblázatos adatkészletté lesz átalakítva.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Kötelező

További átalakítások, amelyek a fájladatkészletre lesznek alkalmazva.

Metódusok

create_input_binding	Bemeneti kötés létrehozása.
drop_columns	A megadott oszlopok elvetése az adathalmazból.
keep_columns	Tartsa meg a megadott oszlopokat, és távolítsa el az összes többit az adathalmazból.
random_split	Az adathalmaz rekordjainak felosztása két részre véletlenszerűen és körülbelül a megadott százalékkal.

create_input_binding

Bemeneti kötés létrehozása.

create_input_binding()

Válaszok

Az InputPortBinding ezzel a PipelineData-val forrásként.

Visszatérési típus

InputPortBinding

drop_columns

A megadott oszlopok elvetése az adathalmazból.

drop_columns(columns)

Paraméterek

columns: str vagy list[str]

Kötelező

Az elvetni kívánt oszlopok neve vagy listája.

Válaszok

Egy új köztes adatot ad vissza, amely csak a megadott oszlopokat elveti.

Visszatérési típus

PipelineOutputTabularDataset

keep_columns

Tartsa meg a megadott oszlopokat, és távolítsa el az összes többit az adathalmazból.

keep_columns(columns)

Paraméterek

columns: str vagy list[str]

Kötelező

A megtartandó oszlopok neve vagy listája.

Válaszok

Egy új köztes adatot ad vissza, amely csak a megadott oszlopokat tartalmazza.

Visszatérési típus

PipelineOutputTabularDataset

random_split

Az adathalmaz rekordjainak felosztása két részre véletlenszerűen és körülbelül a megadott százalékkal.

random_split(percentage, seed=None)

Paraméterek

percentage: float

Kötelező

Az adathalmaz felosztásának hozzávetőleges százaléka. Ennek 0,0 és 1,0 közötti számnak kell lennie.

seed: int

alapértelmezett érték: None

A véletlenszerű generátorhoz nem kötelező vetőmagot használni.

Válaszok

A felosztás után a két adathalmazt képviselő új TabularDataset-objektumok rekordját adja vissza.

Visszatérési típus

(TabularDataset, TabularDataset)

Megosztás a következőn keresztül:

PipelineOutputTabularDataset Osztály

Konstruktor

Paraméterek

Metódusok

create_input_binding

Válaszok

Visszatérési típus

drop_columns

Paraméterek

Válaszok

Visszatérési típus

keep_columns

Paraméterek

Válaszok

Visszatérési típus

random_split

Paraméterek

Válaszok

Visszatérési típus

Visszajelzés

Visszajelzés

További források