Megosztás a következőn keresztül:


PipelineOutputTabularDataset Osztály

Az Azure Machine Learning táblázatos adathalmazba előléptetett köztes folyamatadatokat jelöli.

Miután előléptet egy köztes adatot egy Azure Machine Learning-adatkészletbe, a rendszer adathalmazként is felhasználja azokat a következő lépésekben dataReference helyett.

Hozzon létre egy köztes adatot, amelyet előléptet egy Azure Machine Learning-adatkészletbe.

Öröklődés
PipelineOutputTabularDataset

Konstruktor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Paraméterek

pipeline_output_dataset
PipelineOutputFileDataset
Kötelező

A köztes kimenetet képviselő fájladatkészlet, amely táblázatos adatkészletté lesz átalakítva.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Kötelező

További átalakítások, amelyek a fájladatkészletre lesznek alkalmazva.

pipeline_output_dataset
PipelineOutputFileDataset
Kötelező

A köztes kimenetet képviselő fájladatkészlet, amely táblázatos adatkészletté lesz átalakítva.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Kötelező

További átalakítások, amelyek a fájladatkészletre lesznek alkalmazva.

Metódusok

create_input_binding

Bemeneti kötés létrehozása.

drop_columns

A megadott oszlopok elvetése az adathalmazból.

keep_columns

Tartsa meg a megadott oszlopokat, és távolítsa el az összes többit az adathalmazból.

random_split

Az adathalmaz rekordjainak felosztása két részre véletlenszerűen és körülbelül a megadott százalékkal.

create_input_binding

Bemeneti kötés létrehozása.

create_input_binding()

Válaszok

Az InputPortBinding ezzel a PipelineData-val forrásként.

Visszatérési típus

drop_columns

A megadott oszlopok elvetése az adathalmazból.

drop_columns(columns)

Paraméterek

columns
str vagy list[str]
Kötelező

Az elvetni kívánt oszlopok neve vagy listája.

Válaszok

Egy új köztes adatot ad vissza, amely csak a megadott oszlopokat elveti.

Visszatérési típus

keep_columns

Tartsa meg a megadott oszlopokat, és távolítsa el az összes többit az adathalmazból.

keep_columns(columns)

Paraméterek

columns
str vagy list[str]
Kötelező

A megtartandó oszlopok neve vagy listája.

Válaszok

Egy új köztes adatot ad vissza, amely csak a megadott oszlopokat tartalmazza.

Visszatérési típus

random_split

Az adathalmaz rekordjainak felosztása két részre véletlenszerűen és körülbelül a megadott százalékkal.

random_split(percentage, seed=None)

Paraméterek

percentage
float
Kötelező

Az adathalmaz felosztásának hozzávetőleges százaléka. Ennek 0,0 és 1,0 közötti számnak kell lennie.

seed
int
alapértelmezett érték: None

A véletlenszerű generátorhoz nem kötelező vetőmagot használni.

Válaszok

A felosztás után a két adathalmazt képviselő új TabularDataset-objektumok rekordját adja vissza.

Visszatérési típus