OpenDatasetBase クラス

継承用のオープン データセットの基底クラス。

継承
OpenDatasetBase

コンストラクター

OpenDatasetBase(cols: Optional[List[str]] = None, enable_telemetry: bool = True, **kwargs)

パラメーター

cols
既定値: None
enable_telemetry
既定値: True

メソッド

get_file_dataset

オープン データセットのファイル データセットを取得します。

get_tabular_dataset

BLOB URL を使用して AbstractTabularOpenDataset を初期化します。

to_pandas_dataframe

pandas データフレームへ。

to_spark_dataframe

spark データフレームへ。

get_file_dataset

オープン データセットのファイル データセットを取得します。

get_file_dataset(start_date: datetime.datetime = None, end_date: datetime.datetime = None, enable_telemetry: bool = True, **kwargs) -> azureml.data.file_dataset.FileDataset

パラメーター

cls
type
必須

現在のクラス

start_date
datetime
必須

開始日。既定値は None です

end_date
datetime
必須

終了日。既定値は None です

enable_telemetry
bool
必須

テレメトリを有効にするかどうか。既定値は True です

戻り値

ファイル データセット

の戻り値の型 :

get_tabular_dataset

BLOB URL を使用して AbstractTabularOpenDataset を初期化します。

get_tabular_dataset(start_date: datetime.datetime = None, end_date: datetime.datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> azureml.data.tabular_dataset.TabularDataset

パラメーター

cls
type
必須

オープン データセットの型名。

start_date
datetime
必須

クエリ実行の開始日 (その日付を含む)。

end_date
datetime
必須

クエリ実行の終了日 (その日付を含む)。

cols
list[str]
必須

取得する列名のリスト。 None の場合、すべての列が取得されます。

enable_telemetry
bool
必須

テレメトリを有効にするかどうか。UT の場合にのみ無効になります。

戻り値

TabularDataset

の戻り値の型 :

to_pandas_dataframe

pandas データフレームへ。

to_pandas_dataframe() -> pandas.core.frame.DataFrame

to_spark_dataframe

spark データフレームへ。

to_spark_dataframe()

属性

cols

取得対象の列名のリストを取得します。

data

OpenDataset オブジェクトのデータを取得します。

id

オープン データの場所 ID を取得します。

log_properties

ログのプロパティを取得します。

registry_id

バックエンドで登録されているこのパブリック データセットのレジストリ ID を取得します。

このレジストリ ID は、保存場所などの最新のメタデータを取得するために使用されます。 すべてのパブリック データ サブクラスが _registry_id を割り当てることを想定しています。

戻り値

レジストリ ID 文字列。

の戻り値の型 :

str

time_column_name

時刻列の名前。