Sdílet prostřednictvím


OutputTabularDatasetConfig Třída

Představuje, jak zkopírovat výstup spuštění a být povýšen jako tabulkovádataset.

Inicializace OutputTabularDatasetConfig.

Dědičnost
OutputTabularDatasetConfig

Konstruktor

OutputTabularDatasetConfig(**kwargs)

Poznámky

Tento konstruktor byste neměli volat přímo, ale místo toho byste měli vytvořit OutputFileDatasetConfig a poté volat odpovídající metody read_* převést na OutputTabularDatasetConfig.

Způsob, jakým bude výstup zkopírován do cíle pro OutputTabularDatasetConfig je stejný jako OutputFileDatasetConfig. Rozdíl mezi nimi spočívá v tom, že vytvořená datová sada bude tabulkovádataset obsahující všechny zadané transformace.

Metody

as_input

V dalších krocích kanálu určete, jak se má výstup využívat jako vstup.

as_mount

Nastavte režim výstupu na připojení.

Pro režim připojení bude výstupním adresářem připojený adresář FUSE. Soubory zapsané do připojeného adresáře se nahrají při zavření souboru.

as_upload

Nastavte režim výstupu, který se má nahrát.

V režimu nahrávání se soubory zapsané do výstupního adresáře nahrají na konci úlohy. Pokud úloha selže nebo se zruší, výstupní adresář se nenahraje.

drop_columns

Vypusťte zadané sloupce z datové sady.

keep_columns

Ponechte zadané sloupce a vyhodí všechny ostatní z datové sady.

random_split

Rozdělte záznamy v datové sadě na dvě části náhodně a přibližně podle zadaného procenta.

Výsledné výstupní konfigurace budou mít změněné názvy, první z nich bude mít k názvu _1 a druhá bude mít k názvu _2. Pokud to způsobí kolizi názvu nebo pokud chcete zadat vlastní název, nastavte jejich názvy ručně.

as_input

V dalších krocích kanálu určete, jak se má výstup využívat jako vstup.

as_input(name=None)

Parametry

Name Description
name
Vyžadováno
str

Název vstupu specifického pro spuštění.

Návraty

Typ Description

Instance DatasetConsumptionConfig popisující způsob doručení vstupních dat

as_mount

Nastavte režim výstupu na připojení.

Pro režim připojení bude výstupním adresářem připojený adresář FUSE. Soubory zapsané do připojeného adresáře se nahrají při zavření souboru.

as_mount()

Návraty

Typ Description

Instance OutputTabularDatasetConfig s režimem nastaveným na připojení.

as_upload

Nastavte režim výstupu, který se má nahrát.

V režimu nahrávání se soubory zapsané do výstupního adresáře nahrají na konci úlohy. Pokud úloha selže nebo se zruší, výstupní adresář se nenahraje.

as_upload(overwrite=False, source_globs=None)

Parametry

Name Description
overwrite
Vyžadováno

Zda se mají přepsat soubory, které již v cíli existují.

source_globs
Vyžadováno

Vzory globů používané k filtrování souborů, které se budou nahrávat.

Návraty

Typ Description

Instance OutputTabularDatasetConfig s režimem nastaveným na nahrání

drop_columns

Vypusťte zadané sloupce z datové sady.

drop_columns(columns)

Parametry

Name Description
columns
Vyžadováno

Název nebo seznam názvů sloupců, které se mají odstranit.

Návraty

Typ Description

Instance OutputTabularDatasetConfig , se kterou mají být sloupce zahoděné.

keep_columns

Ponechte zadané sloupce a vyhodí všechny ostatní z datové sady.

keep_columns(columns)

Parametry

Name Description
columns
Vyžadováno

Název nebo seznam názvů sloupců, které se mají zachovat.

Návraty

Typ Description

Instance OutputTabularDatasetConfig , se kterou se mají zachovat sloupce.

random_split

Rozdělte záznamy v datové sadě na dvě části náhodně a přibližně podle zadaného procenta.

Výsledné výstupní konfigurace budou mít změněné názvy, první z nich bude mít k názvu _1 a druhá bude mít k názvu _2. Pokud to způsobí kolizi názvu nebo pokud chcete zadat vlastní název, nastavte jejich názvy ručně.

random_split(percentage, seed=None)

Parametry

Name Description
percentage
Vyžadováno

Přibližné procento, podle které chcete datovou sadu rozdělit. Musí to být číslo od 0,0 do 1,0.

seed
Vyžadováno
int

Volitelné počáteční pole, které se má použít pro náhodný generátor.

Návraty

Typ Description

Vrátí kolekci členů dvou outputTabularDatasetConfig objektů představujících dvě datové sady po rozdělení.