Megosztás a következőn keresztül:


OutputTabularDatasetConfig Osztály

Egy futtatás kimenetének másolását és tabulátoradatkészletként való előléptetését mutatja be.

OutputTabularDatasetConfig inicializálása.

Öröklődés
OutputTabularDatasetConfig

Konstruktor

OutputTabularDatasetConfig(**kwargs)

Megjegyzések

Ne hívja meg közvetlenül ezt a konstruktort, hanem hozzon létre egy OutputFileDatasetConfig parancsot, majd hívja meg a megfelelő read_* metódusokat, hogy OutputTabularDatasetConfig-ra konvertálja.

Az OutputTabularDatasetConfig célhelyre másolásának módja megegyezik az OutputFileDatasetConfig értékével. A különbség köztük az, hogy a létrehozott adatkészlet egy táblázatos adatkészlet lesz, amely az összes megadott átalakítást tartalmazza.

Metódusok

as_input

Adja meg, hogyan használja fel a kimenetet bemenetként a következő folyamatlépésekben.

as_mount

Állítsa be a kimenet csatlakoztatási módját.

Csatlakoztatási mód esetén a kimeneti könyvtár egy FUSE-ra csatlakoztatott könyvtár lesz. A csatlakoztatott könyvtárba írt fájlok a fájl bezárásakor lesznek feltöltve.

as_upload

Állítsa be a kimenet feltöltési módját.

Feltöltési mód esetén a kimeneti könyvtárba írt fájlok a feladat végén lesznek feltöltve. Ha a feladat meghiúsul vagy megszakad, a kimeneti könyvtár nem lesz feltöltve.

drop_columns

A megadott oszlopok elvetése az adatkészletből.

keep_columns

Tartsa meg a megadott oszlopokat, és távolítsa el az összes többit az adatkészletből.

random_split

Az adathalmaz rekordjainak felosztása két részre véletlenszerűen és körülbelül a megadott százalékkal.

Az eredményként kapott kimeneti konfigurációk neve megváltozik, az elsőben _1 lesz hozzáfűzve a névhez, a második pedig _2 lesz hozzáfűzve a névhez. Ha névütközést okoz, vagy egyéni nevet szeretne megadni, állítsa be manuálisan a nevüket.

as_input

Adja meg, hogyan használja fel a kimenetet bemenetként a következő folyamatlépésekben.

as_input(name=None)

Paraméterek

Name Description
name
Kötelező
str

A futtatásra vonatkozó bemenet neve.

Válaszok

Típus Description

A DatasetConsumptionConfig bemeneti adatok kézbesítését leíró példány.

as_mount

Állítsa be a kimenet csatlakoztatási módját.

Csatlakoztatási mód esetén a kimeneti könyvtár egy FUSE-ra csatlakoztatott könyvtár lesz. A csatlakoztatott könyvtárba írt fájlok a fájl bezárásakor lesznek feltöltve.

as_mount()

Válaszok

Típus Description

Egy OutputTabularDatasetConfig csatlakoztatási móddal rendelkező példány.

as_upload

Állítsa be a kimenet feltöltési módját.

Feltöltési mód esetén a kimeneti könyvtárba írt fájlok a feladat végén lesznek feltöltve. Ha a feladat meghiúsul vagy megszakad, a kimeneti könyvtár nem lesz feltöltve.

as_upload(overwrite=False, source_globs=None)

Paraméterek

Name Description
overwrite
Kötelező

Felülírja-e a célhelyen már létező fájlokat.

source_globs
Kötelező

A feltöltődő fájlok szűréséhez használt Glob-minták.

Válaszok

Típus Description

Egy OutputTabularDatasetConfig feltöltésre beállított módú példány.

drop_columns

A megadott oszlopok elvetése az adatkészletből.

drop_columns(columns)

Paraméterek

Name Description
columns
Kötelező

Az elvetni kívánt oszlopok neve vagy listája.

Válaszok

Típus Description

Egy OutputTabularDatasetConfig példány, amellyel az oszlopokat el kell dobni.

keep_columns

Tartsa meg a megadott oszlopokat, és távolítsa el az összes többit az adatkészletből.

keep_columns(columns)

Paraméterek

Name Description
columns
Kötelező

A megtartandó oszlopok neve vagy listája.

Válaszok

Típus Description

Egy OutputTabularDatasetConfig példány, amelyben az oszlopokat meg kell tartani.

random_split

Az adathalmaz rekordjainak felosztása két részre véletlenszerűen és körülbelül a megadott százalékkal.

Az eredményként kapott kimeneti konfigurációk neve megváltozik, az elsőben _1 lesz hozzáfűzve a névhez, a második pedig _2 lesz hozzáfűzve a névhez. Ha névütközést okoz, vagy egyéni nevet szeretne megadni, állítsa be manuálisan a nevüket.

random_split(percentage, seed=None)

Paraméterek

Name Description
percentage
Kötelező

Az adathalmaz felosztásának hozzávetőleges százaléka. Ennek 0,0 és 1,0 közötti számnak kell lennie.

seed
Kötelező
int

A véletlenszerű generátorhoz nem kötelező vetőmagot használni.

Válaszok

Típus Description

Két OutputTabularDatasetConfig objektum rekordját adja vissza, amelyek a felosztás után a két adathalmazt képviselik.