PipelineOutputTabularDataset Clase

Referencia

Representa los datos de canalización intermedios promovidos a un conjunto de datos tabular de Azure Machine Learning.

Una vez que los datos intermedios se promueven a un conjunto de datos de Azure Machine Learning, también se consumirán como Dataset en lugar de como DataReference en pasos posteriores.

Cree datos intermedios que se promoverán a un conjunto de datos de Azure Machine Learning.

Herencia: PipelineOutputAbstractDataset

PipelineOutputTabularDataset

Constructor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Parámetros

pipeline_output_dataset: PipelineOutputFileDataset

Requerido

Conjunto de datos de archivo que representa la salida intermedia que se transformará en un conjunto de datos tabulares.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Requerido

Transformaciones adicionales que se aplicarán sobre el conjunto de datos de archivo.

pipeline_output_dataset: PipelineOutputFileDataset

Requerido

Conjunto de datos de archivo que representa la salida intermedia que se transformará en un conjunto de datos tabulares.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Requerido

Transformaciones adicionales que se aplicarán sobre el conjunto de datos de archivo.

Métodos

create_input_binding	Cree un enlace de entrada.
drop_columns	Quita las columnas especificadas del conjunto de datos.
keep_columns	Conserva las columnas especificadas y elimina todas las demás del conjunto de datos.
random_split	Divide los registros del conjunto de datos en dos partes de manera aleatoria y aproximada según el porcentaje especificado.

create_input_binding

Cree un enlace de entrada.

create_input_binding()

Devoluciones

InputPortBinding con este objeto PipelineData como origen.

Tipo de valor devuelto

InputPortBinding

drop_columns

Quita las columnas especificadas del conjunto de datos.

drop_columns(columns)

Parámetros

columns: str o list[str]

Requerido

Nombre o lista de nombres de las columnas que se van a quitar.

Devoluciones

Devuelve un nuevo dato intermedio con solo las columnas especificadas eliminadas.

Tipo de valor devuelto

PipelineOutputTabularDataset

keep_columns

Conserva las columnas especificadas y elimina todas las demás del conjunto de datos.

keep_columns(columns)

Parámetros

columns: str o list[str]

Requerido

Nombre o lista de nombres de las columnas que se van a mantener.

Devoluciones

Devuelve un nuevo dato intermedio con solo las columnas especificadas conservadas.

Tipo de valor devuelto

PipelineOutputTabularDataset

random_split

Divide los registros del conjunto de datos en dos partes de manera aleatoria y aproximada según el porcentaje especificado.

random_split(percentage, seed=None)

Parámetros

percentage: float

Requerido

Porcentaje aproximado por el que se divide el conjunto de datos. Debe ser un número comprendido entre 0,0 y 1,0.

seed: int

valor predeterminado: None

Inicialización opcional que se usará para el generador aleatorio.

Devoluciones

Devuelve una tupla de objetos FileDataset nuevos que representa los dos conjuntos de datos después de la división.

Tipo de valor devuelto

(TabularDataset, TabularDataset)

Compartir a través de

PipelineOutputTabularDataset Clase

Constructor

Parámetros

Métodos

create_input_binding

Devoluciones

Tipo de valor devuelto

drop_columns

Parámetros

Devoluciones

Tipo de valor devuelto

keep_columns

Parámetros

Devoluciones

Tipo de valor devuelto

random_split

Parámetros

Devoluciones

Tipo de valor devuelto

Comentarios

Comentarios

Recursos adicionales