次の方法で共有


OpenDatasetBase クラス

継承のためにデータセット基本クラスを開きます。

開いているデータセットを構築します。

コンストラクター

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

パラメーター

名前 説明
cols

データセットから読み込む列名の一覧 (既定値は None)

規定値: None
enable_telemetry

このデータセットでテレメトリを有効にするかどうかを指定します。既定値は True です。

規定値: True
kwargs
必須

フィルターの引数

メソッド

get_file_dataset

開いているデータセットのファイル データセットを取得します。

get_tabular_dataset

BLOB URL を使用して AbstractTabularOpenDataset を初期化します。

to_pandas_dataframe

pandas データフレームに。

to_spark_dataframe

データフレームを Spark する。

get_file_dataset

開いているデータセットのファイル データセットを取得します。

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

パラメーター

名前 説明
cls
必須

現在のクラス

start_date
必須

開始日、既定値は None

end_date
必須

終了日、既定値は [なし]

enable_telemetry
必須

テレメトリを有効にするかどうか、既定値は True

戻り値

説明

ファイル データセット

get_tabular_dataset

BLOB URL を使用して AbstractTabularOpenDataset を初期化します。

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

パラメーター

名前 説明
cls
必須

Open Dataset の型名。

start_date
必須

包括的にクエリを実行する開始日。

end_date
必須

包括的にクエリを実行する終了日。

cols
必須

取得する列名の一覧。 なしはすべての列を取得します。

enable_telemetry
必須

テレメトリを有効にするかどうか。UT に対してのみ無効にします。

戻り値

説明

表形式データセット

to_pandas_dataframe

pandas データフレームに。

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

データフレームを Spark する。

to_spark_dataframe()

属性

cols

取得する列名リストを取得します。

data

OpenDataset オブジェクトのデータを取得します。

id

開いているデータの場所 ID を取得します。

log_properties

ログのプロパティを取得します。

registry_id

バックエンドに登録されているこのパブリック データセットのレジストリ ID を取得します。

このレジストリ ID は、ストレージの場所などの最新のメタデータを取得するために使用されます。 すべてのパブリック データ サブクラスに_registry_idを割り当てる必要があります。

戻り値

説明
str

レジストリ ID 文字列。

time_column_name

時刻列名。