PipelineOutputTabularDataset Класс

Представляет промежуточные данные конвейера, уровень которых повышен до табличного набора данных Машинного обучения Azure.

После того как уровень промежуточных данных будет повышен до набора данных Машинного обучение Azure, их можно будет использовать на последующих этапах.

Создайте промежуточные данные, которые будут повышены до набора данных Машинного обучения Azure.

Наследование
PipelineOutputTabularDataset

Конструктор

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Параметры

pipeline_output_dataset
PipelineOutputFileDataset
Обязательно

Файловый набор данных, представляющий промежуточные выходные данные, который будет преобразован в табличный набор данных.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Обязательно

Дополнительные преобразования, которые будут применены к файловому набору данных.

pipeline_output_dataset
PipelineOutputFileDataset
Обязательно

Файловый набор данных, представляющий промежуточные выходные данные, который будет преобразован в табличный набор данных.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Обязательно

Дополнительные преобразования, которые будут применены к файловому набору данных.

Методы

create_input_binding

Создание входной привязки.

drop_columns

Удаляет указанные столбцы из набора данных.

keep_columns

Сохраняет указанные столбцы и удаляет все остальные столбцы из набора данных.

random_split

Разделяет записи в наборе данных на две части случайным образом и приблизительно в указанном процентном соотношении.

create_input_binding

Создание входной привязки.

create_input_binding()

Возвращаемое значение

InputPortBinding с данными PipelineData в качестве источника.

Возвращаемый тип

drop_columns

Удаляет указанные столбцы из набора данных.

drop_columns(columns)

Параметры

columns
str или list[str]
Обязательно

Имя или список имен столбцов для удаления.

Возвращаемое значение

Возвращает новые промежуточные данные, из которых удаляются только указанные столбцы.

Возвращаемый тип

keep_columns

Сохраняет указанные столбцы и удаляет все остальные столбцы из набора данных.

keep_columns(columns)

Параметры

columns
str или list[str]
Обязательно

Имя или список имен столбцов для сохранения.

Возвращаемое значение

Возвращает новые промежуточные данные, содержащие только указанные столбцы.

Возвращаемый тип

random_split

Разделяет записи в наборе данных на две части случайным образом и приблизительно в указанном процентном соотношении.

random_split(percentage, seed=None)

Параметры

percentage
float
Обязательно

Приблизительное процентное соотношение для разделения набора данных. Это должно быть число от 0,0 до 1,0.

seed
int
значение по умолчанию: None

Необязательное начальное значение, используемое для генератора случайных чисел.

Возвращаемое значение

Возвращает кортеж новых объектов TabularDataset, представляющий два набора данных после разделения.

Возвращаемый тип