Compartir a través de


PipelineOutputTabularDataset Clase

Representa los datos de canalización intermedios promovidos a un conjunto de datos tabular de Azure Machine Learning.

Una vez que los datos intermedios se promueven a un conjunto de datos de Azure Machine Learning, también se consumirán como Dataset en lugar de como DataReference en pasos posteriores.

Cree datos intermedios que se promoverán a un conjunto de datos de Azure Machine Learning.

Herencia
PipelineOutputTabularDataset

Constructor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Parámetros

pipeline_output_dataset
PipelineOutputFileDataset
Requerido

Conjunto de datos de archivo que representa la salida intermedia que se transformará en un conjunto de datos tabulares.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Requerido

Transformaciones adicionales que se aplicarán sobre el conjunto de datos de archivo.

pipeline_output_dataset
PipelineOutputFileDataset
Requerido

Conjunto de datos de archivo que representa la salida intermedia que se transformará en un conjunto de datos tabulares.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Requerido

Transformaciones adicionales que se aplicarán sobre el conjunto de datos de archivo.

Métodos

create_input_binding

Cree un enlace de entrada.

drop_columns

Quita las columnas especificadas del conjunto de datos.

keep_columns

Conserva las columnas especificadas y elimina todas las demás del conjunto de datos.

random_split

Divide los registros del conjunto de datos en dos partes de manera aleatoria y aproximada según el porcentaje especificado.

create_input_binding

Cree un enlace de entrada.

create_input_binding()

Devoluciones

InputPortBinding con este objeto PipelineData como origen.

Tipo de valor devuelto

drop_columns

Quita las columnas especificadas del conjunto de datos.

drop_columns(columns)

Parámetros

columns
str o list[str]
Requerido

Nombre o lista de nombres de las columnas que se van a quitar.

Devoluciones

Devuelve un nuevo dato intermedio con solo las columnas especificadas eliminadas.

Tipo de valor devuelto

keep_columns

Conserva las columnas especificadas y elimina todas las demás del conjunto de datos.

keep_columns(columns)

Parámetros

columns
str o list[str]
Requerido

Nombre o lista de nombres de las columnas que se van a mantener.

Devoluciones

Devuelve un nuevo dato intermedio con solo las columnas especificadas conservadas.

Tipo de valor devuelto

random_split

Divide los registros del conjunto de datos en dos partes de manera aleatoria y aproximada según el porcentaje especificado.

random_split(percentage, seed=None)

Parámetros

percentage
float
Requerido

Porcentaje aproximado por el que se divide el conjunto de datos. Debe ser un número comprendido entre 0,0 y 1,0.

seed
int
valor predeterminado: None

Inicialización opcional que se usará para el generador aleatorio.

Devoluciones

Devuelve una tupla de objetos FileDataset nuevos que representa los dos conjuntos de datos después de la división.

Tipo de valor devuelto