Condividi tramite


OpenDatasetBase Classe

Aprire La classe base set di dati per ereditare.

Costruire set di dati aperti.

Ereditarietà
OpenDatasetBase

Costruttore

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

Parametri

cols
list[str]
valore predefinito: None

Elenco di nomi di colonne da caricare dal set di dati, impostazione predefinita none

enable_telemetry
bool
valore predefinito: True

Se abilitare i dati di telemetria in questo set di dati, il valore predefinito è True

kwargs
dict
Necessario

args per il filtro

Metodi

get_file_dataset

Ottenere il set di dati di file per aprire il set di dati.

get_tabular_dataset

Inizializzare AbstractTabularOpenDataset con URL BLOB.

to_pandas_dataframe

Per pandas dataframe.

to_spark_dataframe

Per spark dataframe.

get_file_dataset

Ottenere il set di dati di file per aprire il set di dati.

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

Parametri

cls
type
Necessario

classe corrente

start_date
datetime
Necessario

data di inizio, impostazione predefinita none

end_date
datetime
Necessario

data di fine, impostazione predefinita none

enable_telemetry
bool
Necessario

abilitare i dati di telemetria o meno, impostazione predefinita su True

Restituisce

set di dati file

Tipo restituito

get_tabular_dataset

Inizializzare AbstractTabularOpenDataset con URL BLOB.

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

Parametri

cls
type
Necessario

nome del tipo del set di dati Open.

start_date
datetime
Necessario

Data di inizio per eseguire query in modo inclusivo.

end_date
datetime
Necessario

Data di fine per eseguire query in modo inclusivo.

cols
list[str]
Necessario

Elenco di nomi di colonna da recuperare. Nessuno otterrà tutte le colonne.

enable_telemetry
bool
Necessario

Se abilitare i dati di telemetria, disabilitati solo per l'UT.

Restituisce

TabularDataset

Tipo restituito

to_pandas_dataframe

Per pandas dataframe.

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

Per spark dataframe.

to_spark_dataframe()

Attributi

cols

Ottenere l'elenco dei nomi di colonna da recuperare.

data

Ottenere i dati dell'oggetto OpenDataset.

id

Ottenere l'ID percorso dei dati aperti.

log_properties

Ottenere le proprietà del log.

registry_id

Ottenere l'ID del Registro di sistema di questo set di dati pubblico registrato nel back-end.

Questo ID del Registro di sistema viene usato per ottenere i metadati più recenti, ad esempio il percorso di archiviazione. Si prevede che tutte le sottoclassi di dati pubbliche vengano assegnate _registry_id.

Restituisce

Stringa ID registro.

Tipo restituito

str

time_column_name

Nome colonna temporale.