OutputTabularDatasetConfig Klasa

Odwołanie

Przedstawia sposób kopiowania danych wyjściowych przebiegu i podwyższenia poziomu jako tabelarycznego zestawu danych.

Zainicjuj element OutputTabularDatasetConfig.

Dziedziczenie: OutputDatasetConfig

OutputTabularDatasetConfig

Konstruktor

OutputTabularDatasetConfig(**kwargs)

Uwagi

Nie należy wywoływać tego konstruktora bezpośrednio, ale zamiast tego należy utworzyć parametr OutputFileDatasetConfig, a następnie wywołać odpowiednie metody read_*, aby przekonwertować go na element OutputTabularDatasetConfig.

Sposób kopiowania danych wyjściowych do miejsca docelowego dla elementu OutputTabularDatasetConfig jest taki sam jak outputFileDatasetConfig. Różnica między nimi polega na tym, że utworzony zestaw danych będzie tabelarycznym zestawem danych zawierającym wszystkie określone przekształcenia.

Metody

as_input	Określ sposób korzystania z danych wyjściowych jako danych wejściowych w kolejnych krokach potoku.
as_mount	Ustaw tryb danych wyjściowych na instalację. W przypadku trybu instalacji katalog wyjściowy będzie katalogiem zainstalowanym w formacie FUSE. Pliki zapisane w zainstalowanym katalogu zostaną przekazane po zamknięciu pliku.
as_upload	Ustaw tryb przekazywania danych wyjściowych. W przypadku trybu przekazywania pliki zapisane w katalogu wyjściowym zostaną przekazane na końcu zadania. Jeśli zadanie zakończy się niepowodzeniem lub zostanie anulowane, katalog wyjściowy nie zostanie przekazany.
drop_columns	Upuść określone kolumny z zestawu danych.
keep_columns	Zachowaj określone kolumny i pomiń wszystkie inne z zestawu danych.
random_split	Podziel rekordy w zestawie danych na dwie części losowo i w przybliżeniu według określonej wartości procentowej. Wynikowe konfiguracje wyjściowe będą miały zmienione nazwy, pierwsza z nich będzie zawierać wartość _1 dołączona do nazwy, a druga będzie zawierać wartość _2 dołączona do nazwy. Jeśli spowoduje to kolizję nazw lub chcesz określić nazwę niestandardową, ręcznie ustaw ich nazwy.

as_input

Określ sposób korzystania z danych wyjściowych jako danych wejściowych w kolejnych krokach potoku.

as_input(name=None)

Parametry

Nazwa	Opis
name Wymagane	str Nazwa danych wejściowych specyficznych dla przebiegu.

Zwraca

Typ	Opis
DatasetConsumptionConfig	DatasetConsumptionConfig Wystąpienie opisujące sposób dostarczania danych wejściowych.

as_mount

Ustaw tryb danych wyjściowych na instalację.

W przypadku trybu instalacji katalog wyjściowy będzie katalogiem zainstalowanym w formacie FUSE. Pliki zapisane w zainstalowanym katalogu zostaną przekazane po zamknięciu pliku.

as_mount()

Zwraca

Typ	Opis
OutputTabularDatasetConfig	Wystąpienie OutputTabularDatasetConfig z trybem ustawionym na instalację.

as_upload

Ustaw tryb przekazywania danych wyjściowych.

W przypadku trybu przekazywania pliki zapisane w katalogu wyjściowym zostaną przekazane na końcu zadania. Jeśli zadanie zakończy się niepowodzeniem lub zostanie anulowane, katalog wyjściowy nie zostanie przekazany.

as_upload(overwrite=False, source_globs=None)

Parametry

Nazwa	Opis
overwrite Wymagane	bool Czy zastąpić pliki, które już istnieją w miejscu docelowym.
source_globs Wymagane	list[str] Wzorce globu używane do filtrowania plików, które zostaną przekazane.

Zwraca

Typ	Opis
OutputTabularDatasetConfig	Wystąpienie OutputTabularDatasetConfig z trybem ustawionym na przekazywanie.

drop_columns

Upuść określone kolumny z zestawu danych.

drop_columns(columns)

Parametry

Nazwa	Opis
columns Wymagane	Union[str, list[str]] Nazwa lub lista nazw kolumn do upuszczania.

Zwraca

Typ	Opis
PipelineOutputTabularDataset	OutputTabularDatasetConfig Wystąpienie, z którym kolumny mają być upuszczane.

keep_columns

Zachowaj określone kolumny i pomiń wszystkie inne z zestawu danych.

keep_columns(columns)

Parametry

Nazwa	Opis
columns Wymagane	Union[str, list[str]] Nazwa lub lista nazw kolumn do zachowania.

Zwraca

Typ	Opis
PipelineOutputTabularDataset	OutputTabularDatasetConfig Wystąpienie, z którym kolumny mają być zachowywane.

random_split

Podziel rekordy w zestawie danych na dwie części losowo i w przybliżeniu według określonej wartości procentowej.

Wynikowe konfiguracje wyjściowe będą miały zmienione nazwy, pierwsza z nich będzie zawierać wartość _1 dołączona do nazwy, a druga będzie zawierać wartość _2 dołączona do nazwy. Jeśli spowoduje to kolizję nazw lub chcesz określić nazwę niestandardową, ręcznie ustaw ich nazwy.

random_split(percentage, seed=None)

Parametry

Nazwa	Opis
percentage Wymagane	float Przybliżona wartość procentowa dzielenia zestawu danych według. Musi to być liczba z zakresu od 0.0 do 1.0.
seed Wymagane	int Opcjonalne nasion do użycia dla generatora losowego.

Zwraca

Typ	Opis
tuple(OutputTabularDatasetConfig, OutputTabularDatasetConfig)	Zwraca krotkę dwóch obiektów OutputTabularDatasetConfig reprezentujących dwa zestawy danych po podziale.

Udostępnij przez

OutputTabularDatasetConfig Klasa

Konstruktor

Uwagi

Metody

as_input

Parametry

Zwraca

as_mount

Zwraca

as_upload

Parametry

Zwraca

drop_columns

Parametry

Zwraca

keep_columns

Parametry

Zwraca

random_split

Parametry

Zwraca

Opinia

Opinia

Dodatkowe zasoby