Dela via


OpenDatasetBase Klass

Öppna Basklass för datauppsättning för ärv.

Skapa öppna datauppsättningar.

Arv
OpenDatasetBase

Konstruktor

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

Parametrar

cols
list[str]
standardvärde: None

En lista med kolumnnamn som ska läsas in från datauppsättningen, standardvärdet Ingen

enable_telemetry
bool
standardvärde: True

Om telemetri ska aktiveras för den här datauppsättningen är standardvärdet True

kwargs
dict
Obligatorisk

args för filter

Metoder

get_file_dataset

Hämta fildatauppsättningen för öppen datauppsättning.

get_tabular_dataset

Initiera AbstractTabularOpenDataset med blob-URL.

to_pandas_dataframe

Till Pandas-dataram.

to_spark_dataframe

Så här gnistrar du dataram.

get_file_dataset

Hämta fildatauppsättningen för öppen datauppsättning.

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

Parametrar

cls
type
Obligatorisk

aktuell klass

start_date
datetime
Obligatorisk

startdatum, standardvärdet Ingen

end_date
datetime
Obligatorisk

slutdatum, standardvärdet Ingen

enable_telemetry
bool
Obligatorisk

aktivera telemetri eller inte, standardvärdet True

Returer

fildatauppsättning

Returtyp

get_tabular_dataset

Initiera AbstractTabularOpenDataset med blob-URL.

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

Parametrar

cls
type
Obligatorisk

typnamn för Open Dataset.

start_date
datetime
Obligatorisk

Startdatumet för att fråga inkluderande.

end_date
datetime
Obligatorisk

Slutdatumet för att fråga inkluderande.

cols
list[str]
Obligatorisk

En lista över kolumnnamn som ska hämtas. Ingen hämtar alla kolumner.

enable_telemetry
bool
Obligatorisk

Om telemetri ska aktiveras, endast inaktiverat för UT.

Returer

TabularDataset

Returtyp

to_pandas_dataframe

Till Pandas-dataram.

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

Så här gnistrar du dataram.

to_spark_dataframe()

Attribut

cols

Hämta listan med kolumnnamn.

data

Hämta data för OpenDataset-objektet.

id

Hämta plats-ID för öppna data.

log_properties

Hämta loggegenskaper.

registry_id

Hämta register-ID:t för den här offentliga datauppsättningen som är registrerad på serverdelen.

Det här register-ID:t används för att hämta senaste metadata som lagringsplats. Förvänta dig att alla offentliga dataunderklasser tilldelar _registry_id.

Returer

Register-ID-sträng.

Returtyp

str

time_column_name

Tidskolumnnamn.