次の方法で共有


OpenDatasetBase クラス

継承用のオープン データセットの基底クラス。

開いているデータセットを構築します。

継承
OpenDatasetBase

コンストラクター

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

パラメーター

名前 説明
cols

データセットから読み込む列名の一覧(既定値は None)

規定値: None
enable_telemetry

このデータセットでテレメトリを有効にするかどうか、既定値は True です

規定値: True
kwargs
必須

フィルターの args

メソッド

get_file_dataset

オープン データセットのファイル データセットを取得します。

get_tabular_dataset

BLOB URL を使用して AbstractTabularOpenDataset を初期化します。

to_pandas_dataframe

pandas データフレームへ。

to_spark_dataframe

spark データフレームへ。

get_file_dataset

オープン データセットのファイル データセットを取得します。

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

パラメーター

名前 説明
cls
必須

現在のクラス

start_date
必須

開始日。既定値は None です

end_date
必須

終了日。既定値は None です

enable_telemetry
必須

テレメトリを有効にするかどうか。既定値は True です

戻り値

説明

ファイル データセット

get_tabular_dataset

BLOB URL を使用して AbstractTabularOpenDataset を初期化します。

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

パラメーター

名前 説明
cls
必須

オープン データセットの型名。

start_date
必須

クエリ実行の開始日 (その日付を含む)。

end_date
必須

クエリ実行の終了日 (その日付を含む)。

cols
必須

取得する列名のリスト。 None の場合、すべての列が取得されます。

enable_telemetry
必須

テレメトリを有効にするかどうか。UT の場合にのみ無効になります。

戻り値

説明

TabularDataset

to_pandas_dataframe

pandas データフレームへ。

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

spark データフレームへ。

to_spark_dataframe()

属性

cols

取得対象の列名のリストを取得します。

data

OpenDataset オブジェクトのデータを取得します。

id

オープン データの場所 ID を取得します。

log_properties

ログのプロパティを取得します。

registry_id

バックエンドで登録されているこのパブリック データセットのレジストリ ID を取得します。

このレジストリ ID は、保存場所などの最新のメタデータを取得するために使用されます。 すべてのパブリック データ サブクラスが _registry_id を割り当てることを想定しています。

戻り値

説明
str

レジストリ ID 文字列。

time_column_name

時刻列の名前。