OpenDatasetBase クラス

継承のためにデータセット基本クラスを開きます。

開いているデータセットを構築します。

コンストラクター

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

パラメーター

名前	説明
cols	list[str] データセットから読み込む列名の一覧 (既定値は None) 規定値: None
enable_telemetry	bool このデータセットでテレメトリを有効にするかどうかを指定します。既定値は True です。規定値: True
kwargs 必須	dict フィルターの引数

メソッド

get_file_dataset	開いているデータセットのファイルデータセットを取得します。
get_tabular_dataset	BLOB URL を使用して AbstractTabularOpenDataset を初期化します。
to_pandas_dataframe	pandas データフレームに。
to_spark_dataframe	データフレームを Spark する。

get_file_dataset

開いているデータセットのファイルデータセットを取得します。

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

パラメーター

名前	説明
cls 必須	type 現在のクラス
start_date 必須	datetime 開始日、既定値は None
end_date 必須	datetime 終了日、既定値は [なし]
enable_telemetry 必須	bool テレメトリを有効にするかどうか、既定値は True

戻り値

型	説明
FileDataset	ファイルデータセット

get_tabular_dataset

BLOB URL を使用して AbstractTabularOpenDataset を初期化します。

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

パラメーター

名前	説明
cls 必須	type Open Dataset の型名。
start_date 必須	datetime 包括的にクエリを実行する開始日。
end_date 必須	datetime 包括的にクエリを実行する終了日。
cols 必須	list[str] 取得する列名の一覧。なしはすべての列を取得します。
enable_telemetry 必須	bool テレメトリを有効にするかどうか。UT に対してのみ無効にします。

戻り値

型	説明
TabularDataset	表形式データセット

to_pandas_dataframe

pandas データフレームに。

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

データフレームを Spark する。

to_spark_dataframe()

属性

cols

取得する列名リストを取得します。

data

OpenDataset オブジェクトのデータを取得します。

id

開いているデータの場所 ID を取得します。

log_properties

ログのプロパティを取得します。

registry_id

バックエンドに登録されているこのパブリックデータセットのレジストリ ID を取得します。

このレジストリ ID は、ストレージの場所などの最新のメタデータを取得するために使用されます。すべてのパブリックデータサブクラスに_registry_idを割り当てる必要があります。

戻り値

型	説明
str	レジストリ ID 文字列。

time_column_name

時刻列名。

次の方法で共有

OpenDatasetBase クラス

コンストラクター

パラメーター

メソッド

get_file_dataset

パラメーター

戻り値

get_tabular_dataset

パラメーター

戻り値

to_pandas_dataframe

to_spark_dataframe

属性

cols

data

id

log_properties

registry_id

戻り値

time_column_name

フィードバック