OpenDatasetBase クラス
継承のためにデータセット基本クラスを開きます。
開いているデータセットを構築します。
コンストラクター
OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)
パラメーター
名前 | 説明 |
---|---|
cols
|
データセットから読み込む列名の一覧 (既定値は None) 規定値: None
|
enable_telemetry
|
このデータセットでテレメトリを有効にするかどうかを指定します。既定値は True です。 規定値: True
|
kwargs
必須
|
フィルターの引数 |
メソッド
get_file_dataset |
開いているデータセットのファイル データセットを取得します。 |
get_tabular_dataset |
BLOB URL を使用して AbstractTabularOpenDataset を初期化します。 |
to_pandas_dataframe |
pandas データフレームに。 |
to_spark_dataframe |
データフレームを Spark する。 |
get_file_dataset
開いているデータセットのファイル データセットを取得します。
get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset
パラメーター
名前 | 説明 |
---|---|
cls
必須
|
現在のクラス |
start_date
必須
|
開始日、既定値は None |
end_date
必須
|
終了日、既定値は [なし] |
enable_telemetry
必須
|
テレメトリを有効にするかどうか、既定値は True |
戻り値
型 | 説明 |
---|---|
ファイル データセット |
get_tabular_dataset
BLOB URL を使用して AbstractTabularOpenDataset を初期化します。
get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset
パラメーター
名前 | 説明 |
---|---|
cls
必須
|
Open Dataset の型名。 |
start_date
必須
|
包括的にクエリを実行する開始日。 |
end_date
必須
|
包括的にクエリを実行する終了日。 |
cols
必須
|
取得する列名の一覧。 なしはすべての列を取得します。 |
enable_telemetry
必須
|
テレメトリを有効にするかどうか。UT に対してのみ無効にします。 |
戻り値
型 | 説明 |
---|---|
表形式データセット |
to_pandas_dataframe
pandas データフレームに。
to_pandas_dataframe() -> DataFrame
to_spark_dataframe
データフレームを Spark する。
to_spark_dataframe()
属性
cols
取得する列名リストを取得します。
data
OpenDataset オブジェクトのデータを取得します。
id
開いているデータの場所 ID を取得します。
log_properties
ログのプロパティを取得します。
registry_id
バックエンドに登録されているこのパブリック データセットのレジストリ ID を取得します。
このレジストリ ID は、ストレージの場所などの最新のメタデータを取得するために使用されます。 すべてのパブリック データ サブクラスに_registry_idを割り当てる必要があります。
戻り値
型 | 説明 |
---|---|
レジストリ ID 文字列。 |
time_column_name
時刻列名。