PipelineOutputTabularDataset Clase
Representa los datos de canalización intermedios promovidos a un conjunto de datos tabular de Azure Machine Learning.
Una vez que los datos intermedios se promueven a un conjunto de datos de Azure Machine Learning, también se consumirán como Dataset en lugar de como DataReference en pasos posteriores.
Cree datos intermedios que se promoverán a un conjunto de datos de Azure Machine Learning.
- Herencia
-
PipelineOutputTabularDataset
Constructor
PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)
Parámetros
- pipeline_output_dataset
- PipelineOutputFileDataset
Conjunto de datos de archivo que representa la salida intermedia que se transformará en un conjunto de datos tabulares.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Transformaciones adicionales que se aplicarán sobre el conjunto de datos de archivo.
- pipeline_output_dataset
- PipelineOutputFileDataset
Conjunto de datos de archivo que representa la salida intermedia que se transformará en un conjunto de datos tabulares.
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
Transformaciones adicionales que se aplicarán sobre el conjunto de datos de archivo.
Métodos
create_input_binding |
Cree un enlace de entrada. |
drop_columns |
Quita las columnas especificadas del conjunto de datos. |
keep_columns |
Conserva las columnas especificadas y elimina todas las demás del conjunto de datos. |
random_split |
Divide los registros del conjunto de datos en dos partes de manera aleatoria y aproximada según el porcentaje especificado. |
create_input_binding
Cree un enlace de entrada.
create_input_binding()
Devoluciones
InputPortBinding con este objeto PipelineData como origen.
Tipo de valor devuelto
drop_columns
Quita las columnas especificadas del conjunto de datos.
drop_columns(columns)
Parámetros
Devoluciones
Devuelve un nuevo dato intermedio con solo las columnas especificadas eliminadas.
Tipo de valor devuelto
keep_columns
Conserva las columnas especificadas y elimina todas las demás del conjunto de datos.
keep_columns(columns)
Parámetros
Devoluciones
Devuelve un nuevo dato intermedio con solo las columnas especificadas conservadas.
Tipo de valor devuelto
random_split
Divide los registros del conjunto de datos en dos partes de manera aleatoria y aproximada según el porcentaje especificado.
random_split(percentage, seed=None)
Parámetros
- percentage
- float
Porcentaje aproximado por el que se divide el conjunto de datos. Debe ser un número comprendido entre 0,0 y 1,0.
- seed
- int
Inicialización opcional que se usará para el generador aleatorio.
Devoluciones
Devuelve una tupla de objetos FileDataset nuevos que representa los dos conjuntos de datos después de la división.
Tipo de valor devuelto
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de