PipelineOutputTabularDataset Klas

Referentie

Vertegenwoordigen tussenliggende pijplijngegevens die zijn gepromoveerd naar een tabellaire Azure Machine Learning-gegevensset.

Zodra een tussenliggende gegevensset wordt gepromoveerd naar een Azure Machine Learning-gegevensset, worden deze in de volgende stappen ook gebruikt als een gegevensset in plaats van een DataReference.

Maak tussenliggende gegevens die worden gepromoveerd naar een Azure Machine Learning-gegevensset.

Overname: PipelineOutputAbstractDataset

PipelineOutputTabularDataset

Constructor

PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)

Parameters

pipeline_output_dataset: PipelineOutputFileDataset

Vereist

De bestandsgegevensset die de tussenliggende uitvoer vertegenwoordigt die wordt omgezet in een tabellaire gegevensset.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Vereist

Aanvullende transformaties die worden toegepast op de bestandsgegevensset.

pipeline_output_dataset: PipelineOutputFileDataset

Vereist

De bestandsgegevensset die de tussenliggende uitvoer vertegenwoordigt die wordt omgezet in een tabellaire gegevensset.

additional_transformations: <xref:azureml.dataprep.Dataflow>

Vereist

Aanvullende transformaties die worden toegepast op de bestandsgegevensset.

Methoden

create_input_binding	Een invoerbinding maken.
drop_columns	Verwijder de opgegeven kolommen uit de gegevensset.
keep_columns	Behoud de opgegeven kolommen en verwijdert alle andere kolommen uit de gegevensset.
random_split	Splits records in de gegevensset willekeurig in twee delen en ongeveer op basis van het opgegeven percentage.

create_input_binding

Een invoerbinding maken.

create_input_binding()

Retouren

De InputPortBinding met deze PipelineData als bron.

Retourtype

InputPortBinding

drop_columns

Verwijder de opgegeven kolommen uit de gegevensset.

drop_columns(columns)

Parameters

columns: str of list[str]

Vereist

De naam of een lijst met namen voor de kolommen die moeten worden verwijderd.

Retouren

Retourneert een nieuwe tussenliggende gegevens waarbij alleen de opgegeven kolommen zijn verwijderd.

Retourtype

PipelineOutputTabularDataset

keep_columns

Behoud de opgegeven kolommen en verwijdert alle andere kolommen uit de gegevensset.

keep_columns(columns)

Parameters

columns: str of list[str]

Vereist

De naam of een lijst met namen voor de kolommen die moeten worden bewaard.

Retouren

Retourneert een nieuwe tussenliggende gegevens waarbij alleen de opgegeven kolommen worden bewaard.

Retourtype

PipelineOutputTabularDataset

random_split

Splits records in de gegevensset willekeurig in twee delen en ongeveer op basis van het opgegeven percentage.

random_split(percentage, seed=None)

Parameters

percentage: float

Vereist

Het percentage bij benadering waarop de gegevensset moet worden gesplitst. Dit moet een getal tussen 0,0 en 1,0 zijn.

seed: int

standaardwaarde: None

Optioneel seed voor gebruik voor de willekeurige generator.

Retouren

Retourneert een tuple van nieuwe TabularDataset-objecten die de twee gegevenssets na de splitsing vertegenwoordigen.

Retourtype

(TabularDataset, TabularDataset)

PipelineOutputTabularDataset Klas

Constructor

Parameters

Methoden

create_input_binding

Retouren

Retourtype

drop_columns

Parameters

Retouren

Retourtype

keep_columns

Parameters

Retouren

Retourtype

random_split

Parameters

Retouren

Retourtype

Feedback

Feedback

Aanvullende resources