PipelineOutputTabularDataset Klas

Vertegenwoordigen tussenliggende pijplijngegevens die zijn gepromoveerd naar een tabellaire Azure Machine Learning-gegevensset.

Zodra een tussenliggende gegevensset wordt gepromoveerd naar een Azure Machine Learning-gegevensset, worden deze in de volgende stappen ook gebruikt als een gegevensset in plaats van een DataReference.

Maak tussenliggende gegevens die worden gepromoveerd naar een Azure Machine Learning-gegevensset.

Overname
PipelineOutputTabularDataset

Constructor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Parameters

pipeline_output_dataset
PipelineOutputFileDataset
Vereist

De bestandsgegevensset die de tussenliggende uitvoer vertegenwoordigt die wordt omgezet in een tabellaire gegevensset.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Vereist

Aanvullende transformaties die worden toegepast op de bestandsgegevensset.

pipeline_output_dataset
PipelineOutputFileDataset
Vereist

De bestandsgegevensset die de tussenliggende uitvoer vertegenwoordigt die wordt omgezet in een tabellaire gegevensset.

additional_transformations
<xref:azureml.dataprep.Dataflow>
Vereist

Aanvullende transformaties die worden toegepast op de bestandsgegevensset.

Methoden

create_input_binding

Een invoerbinding maken.

drop_columns

Verwijder de opgegeven kolommen uit de gegevensset.

keep_columns

Behoud de opgegeven kolommen en verwijdert alle andere kolommen uit de gegevensset.

random_split

Splits records in de gegevensset willekeurig in twee delen en ongeveer op basis van het opgegeven percentage.

create_input_binding

Een invoerbinding maken.

create_input_binding()

Retouren

De InputPortBinding met deze PipelineData als bron.

Retourtype

drop_columns

Verwijder de opgegeven kolommen uit de gegevensset.

drop_columns(columns)

Parameters

columns
str of list[str]
Vereist

De naam of een lijst met namen voor de kolommen die moeten worden verwijderd.

Retouren

Retourneert een nieuwe tussenliggende gegevens waarbij alleen de opgegeven kolommen zijn verwijderd.

Retourtype

keep_columns

Behoud de opgegeven kolommen en verwijdert alle andere kolommen uit de gegevensset.

keep_columns(columns)

Parameters

columns
str of list[str]
Vereist

De naam of een lijst met namen voor de kolommen die moeten worden bewaard.

Retouren

Retourneert een nieuwe tussenliggende gegevens waarbij alleen de opgegeven kolommen worden bewaard.

Retourtype

random_split

Splits records in de gegevensset willekeurig in twee delen en ongeveer op basis van het opgegeven percentage.

random_split(percentage, seed=None)

Parameters

percentage
float
Vereist

Het percentage bij benadering waarop de gegevensset moet worden gesplitst. Dit moet een getal tussen 0,0 en 1,0 zijn.

seed
int
standaardwaarde: None

Optioneel seed voor gebruik voor de willekeurige generator.

Retouren

Retourneert een tuple van nieuwe TabularDataset-objecten die de twee gegevenssets na de splitsing vertegenwoordigen.

Retourtype