DatasetDefinition 類別
定義一系列步驟,指定如何讀取和轉換資料集中的資料。
注意
這個類別已被取代。 如需詳細資訊,請參閱 https://aka.ms/dataset-deprecation 。
在 Azure Machine Learning 工作區中註冊的資料集可以有多個定義,每個定義都是藉由呼叫 update_definition 來建立。 每個定義都有唯一識別碼。 目前的定義是最新建立的定義。
對於未註冊的資料集,只有一個定義存在。
資料集定義支援針對 <xref:azureml.dataprep.Dataflow> 類別列出的所有轉換:請參閱 http://aka.ms/azureml/howto/transformdata 。 若要深入瞭解資料集定義,請移至 https://aka.ms/azureml/howto/versiondata 。
初始化資料集定義物件。
- 繼承
-
azureml.dataprep.api.engineless_dataflow.EnginelessDataflowDatasetDefinition
建構函式
DatasetDefinition(workspace=None, dataset_id=None, version_id=None, dataflow=None, dataflow_json=None, notes=None, etag=None, created_time=None, modified_time=None, state=None, deprecated_by_dataset_id=None, deprecated_by_definition_version=None, data_path=None, dataset=None, file_type='Unknown')
參數
- dataflow_json
資料流程 json。
方法
archive |
封存資料集定義。 |
create_snapshot |
建立已註冊資料集的快照集。 |
deprecate |
使用新資料集的指標取代資料集。 |
reactivate |
重新啟用資料集定義。 適用于已淘汰或封存的資料集定義。 |
to_pandas_dataframe |
執行此資料集定義所定義的轉換管線,以建立 Pandas 資料框架。 |
to_spark_dataframe |
建立 Spark DataFrame,以執行此資料流程所定義的轉換管線。 |
archive
create_snapshot
建立已註冊資料集的快照集。
create_snapshot(snapshot_name, compute_target=None, create_data_snapshot=False, target_datastore=None)
參數
- target_datastore
- Union[AbstractAzureStorageDatastore, str]
要儲存快照集的目標資料存放區。 如果省略,則會在工作區的預設儲存體中建立快照集。
傳回
DatasetSnapshot 物件。
傳回類型
備註
快照集擷取基礎資料的時間點摘要統計資料,以及資料本身的選擇性複本。 若要深入瞭解如何建立快照集,請移至 https://aka.ms/azureml/howto/createsnapshots 。
deprecate
使用新資料集的指標取代資料集。
deprecate(deprecate_by_dataset_id, deprecated_by_definition_version=None)
參數
傳回
無。
傳回類型
備註
已取代的資料集定義會在取用時記錄警告。 若要完全禁止取用資料集定義,請將其封存。
如果意外取代資料集定義,請使用 reactivate 來啟動它。
reactivate
to_pandas_dataframe
執行此資料集定義所定義的轉換管線,以建立 Pandas 資料框架。
to_pandas_dataframe()
傳回
Pandas 資料框架。
傳回類型
備註
傳回記憶體中完全具體化的 Pandas DataFrame。
to_spark_dataframe
建立 Spark DataFrame,以執行此資料流程所定義的轉換管線。
to_spark_dataframe()
傳回
Spark DataFrame。
傳回類型
備註
傳回的 Spark 資料框架只是執行計畫,而且實際上不包含任何資料,因為 Spark 資料框架會延遲評估。
意見反應
https://aka.ms/ContentUserFeedback。
即將登場:在 2024 年,我們將逐步淘汰 GitHub 問題作為內容的意見反應機制,並將它取代為新的意見反應系統。 如需詳細資訊,請參閱:提交並檢視相關的意見反應