PipelineOutputTabularDataset 類別
代表升級為 Azure Machine Learning 表格式資料集的中繼管線資料。
一旦將中繼資料升級為 Azure Machine Learning 資料集,後續步驟也會取用為資料集,而不是 DataReference。
建立將升階為 Azure Machine Learning 資料集的中繼資料。
- 繼承
-
PipelineOutputTabularDataset
建構函式
PipelineOutputTabularDataset(pipeline_output_dataset, additional_transformations)
參數
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
必要
將在檔案資料集之上套用的其他轉換。
- additional_transformations
- <xref:azureml.dataprep.Dataflow>
必要
將在檔案資料集之上套用的其他轉換。
方法
create_input_binding |
建立輸入系結。 |
drop_columns |
從資料集卸載指定的資料行。 |
keep_columns |
保留指定的資料行,並從資料集卸載所有其他資料行。 |
random_split |
將資料集中的記錄隨機分割成兩個部分,大約依指定的百分比來分割。 |
create_input_binding
drop_columns
從資料集卸載指定的資料行。
drop_columns(columns)
參數
傳回
傳回只卸載指定資料行的新中繼資料。
傳回類型
keep_columns
保留指定的資料行,並從資料集卸載所有其他資料行。
keep_columns(columns)
參數
傳回
傳回只保留指定資料行的新中繼資料。
傳回類型
random_split
將資料集中的記錄隨機分割成兩個部分,大約依指定的百分比來分割。
random_split(percentage, seed=None)
參數
傳回
傳回新的 TabularDataset 物件的 Tuple,代表分割之後的兩個資料集。
傳回類型
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應