PipelineOutputTabularDataset Класс

Ссылка

Представляет промежуточные данные конвейера, уровень которых повышен до табличного набора данных Машинного обучения Azure.

После того как уровень промежуточных данных будет повышен до набора данных Машинного обучение Azure, их можно будет использовать на последующих этапах.

Создайте промежуточные данные, которые будут повышены до набора данных Машинного обучения Azure.

Наследование: PipelineOutputAbstractDataset

PipelineOutputTabularDataset

Конструктор

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Параметры

pipeline_output_dataset: PipelineOutputFileDataset

Обязательно

Файловый набор данных, представляющий промежуточные выходные данные, который будет преобразован в табличный набор данных.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Обязательно

Дополнительные преобразования, которые будут применены к файловому набору данных.

pipeline_output_dataset: PipelineOutputFileDataset

Обязательно

additional_transformations: <xref:azureml.dataprep.Dataflow>

Обязательно

Дополнительные преобразования, которые будут применены к файловому набору данных.

Методы

create_input_binding	Создание входной привязки.
drop_columns	Удаляет указанные столбцы из набора данных.
keep_columns	Сохраняет указанные столбцы и удаляет все остальные столбцы из набора данных.
random_split	Разделяет записи в наборе данных на две части случайным образом и приблизительно в указанном процентном соотношении.

create_input_binding

Создание входной привязки.

create_input_binding()

Возвращаемое значение

InputPortBinding с данными PipelineData в качестве источника.

Возвращаемый тип

InputPortBinding

drop_columns

Удаляет указанные столбцы из набора данных.

drop_columns(columns)

Параметры

columns: str или list[str]

Обязательно

Имя или список имен столбцов для удаления.

Возвращаемое значение

Возвращает новые промежуточные данные, из которых удаляются только указанные столбцы.

Возвращаемый тип

PipelineOutputTabularDataset

keep_columns

Сохраняет указанные столбцы и удаляет все остальные столбцы из набора данных.

keep_columns(columns)

Параметры

columns: str или list[str]

Обязательно

Имя или список имен столбцов для сохранения.

Возвращаемое значение

Возвращает новые промежуточные данные, содержащие только указанные столбцы.

Возвращаемый тип

PipelineOutputTabularDataset

random_split

Разделяет записи в наборе данных на две части случайным образом и приблизительно в указанном процентном соотношении.

random_split(percentage, seed=None)

Параметры

percentage: float

Обязательно

Приблизительное процентное соотношение для разделения набора данных. Это должно быть число от 0,0 до 1,0.

seed: int

значение по умолчанию: None

Необязательное начальное значение, используемое для генератора случайных чисел.

Возвращаемое значение

Возвращает кортеж новых объектов TabularDataset, представляющий два набора данных после разделения.

Возвращаемый тип

(TabularDataset, TabularDataset)

PipelineOutputTabularDataset Класс

Конструктор

Параметры

Методы

create_input_binding

Возвращаемое значение

Возвращаемый тип

drop_columns

Параметры

Возвращаемое значение

Возвращаемый тип

keep_columns

Параметры

Возвращаемое значение

Возвращаемый тип

random_split

Параметры

Возвращаемое значение

Возвращаемый тип

Обратная связь

Обратная связь

Дополнительные ресурсы