PipelineOutputTabularDataset Класс
Представляет промежуточные данные конвейера, уровень которых повышен до табличного набора данных Машинного обучения Azure.
После того как уровень промежуточных данных будет повышен до набора данных Машинного обучение Azure, их можно будет использовать на последующих этапах.
Создайте промежуточные данные, которые будут повышены до набора данных Машинного обучения Azure.
- Наследование
-
PipelineOutputTabularDataset
Конструктор
PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)
Параметры
- pipeline_output_dataset
- PipelineOutputFileDataset
Файловый набор данных, представляющий промежуточные выходные данные, который будет преобразован в табличный набор данных.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Дополнительные преобразования, которые будут применены к файловому набору данных.
- pipeline_output_dataset
- PipelineOutputFileDataset
Файловый набор данных, представляющий промежуточные выходные данные, который будет преобразован в табличный набор данных.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Дополнительные преобразования, которые будут применены к файловому набору данных.
Методы
create_input_binding |
Создание входной привязки. |
drop_columns |
Удаляет указанные столбцы из набора данных. |
keep_columns |
Сохраняет указанные столбцы и удаляет все остальные столбцы из набора данных. |
random_split |
Разделяет записи в наборе данных на две части случайным образом и приблизительно в указанном процентном соотношении. |
create_input_binding
Создание входной привязки.
create_input_binding()
Возвращаемое значение
InputPortBinding с данными PipelineData в качестве источника.
Возвращаемый тип
drop_columns
Удаляет указанные столбцы из набора данных.
drop_columns(columns)
Параметры
Возвращаемое значение
Возвращает новые промежуточные данные, из которых удаляются только указанные столбцы.
Возвращаемый тип
keep_columns
Сохраняет указанные столбцы и удаляет все остальные столбцы из набора данных.
keep_columns(columns)
Параметры
Возвращаемое значение
Возвращает новые промежуточные данные, содержащие только указанные столбцы.
Возвращаемый тип
random_split
Разделяет записи в наборе данных на две части случайным образом и приблизительно в указанном процентном соотношении.
random_split(percentage, seed=None)
Параметры
- percentage
- float
Приблизительное процентное соотношение для разделения набора данных. Это должно быть число от 0,0 до 1,0.
- seed
- int
Необязательное начальное значение, используемое для генератора случайных чисел.
Возвращаемое значение
Возвращает кортеж новых объектов TabularDataset, представляющий два набора данных после разделения.
Возвращаемый тип
Обратная связь
https://aka.ms/ContentUserFeedback.
Ожидается в ближайшее время: в течение 2024 года мы постепенно откажемся от GitHub Issues как механизма обратной связи для контента и заменим его новой системой обратной связи. Дополнительные сведения см. в разделеОтправить и просмотреть отзыв по