Aracılığıyla paylaş


OpenDatasetBase Sınıf

Devralma için Veri Kümesi Temel Sınıfı'nı açın.

Açık veri kümeleri oluşturma.

Devralma
OpenDatasetBase

Oluşturucu

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

Parametreler

Name Description
cols

Veri kümesinden yüklenip varsayılan değer Yok olan sütun adlarının listesi

Default value: None
enable_telemetry

Bu veri kümesinde telemetrinin etkinleştirilip etkinleştirilmeyileceği, varsayılan olarak True olarak ayarlanır

Default value: True
kwargs
Gerekli

filtre için args

Yöntemler

get_file_dataset

Açık veri kümesi için dosya veri kümesini alın.

get_tabular_dataset

Blob URL'si ile AbstractTabularOpenDataset'i başlatın.

to_pandas_dataframe

Pandas veri çerçevesine.

to_spark_dataframe

Veri çerçevesini spark etmek için.

get_file_dataset

Açık veri kümesi için dosya veri kümesini alın.

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

Parametreler

Name Description
cls
Gerekli

current sınıfı

start_date
Gerekli

başlangıç tarihi, varsayılan değer Yok

end_date
Gerekli

bitiş tarihi, varsayılan değer Yok olur

enable_telemetry
Gerekli

telemetriyi etkinleştir veya etkinleştir, varsayılan değer True'dır

Döndürülenler

Tür Description

dosya veri kümesi

get_tabular_dataset

Blob URL'si ile AbstractTabularOpenDataset'i başlatın.

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

Parametreler

Name Description
cls
Gerekli

Açık Veri Kümesinin tür adı.

start_date
Gerekli

Dahil olmak üzere sorgu için başlangıç tarihi.

end_date
Gerekli

Dahil olmak üzere sorgu için bitiş tarihi.

cols
Gerekli

Alınacak sütun adlarının listesi. Hiçbiri tüm sütunları almayacak.

enable_telemetry
Gerekli

Telemetrinin etkinleştirilip etkinleştirilmeyileceği, yalnızca UT için devre dışı bırakılıp bırakılmadığı.

Döndürülenler

Tür Description

TabularDataset

to_pandas_dataframe

Pandas veri çerçevesine.

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

Veri çerçevesini spark etmek için.

to_spark_dataframe()

Öznitelikler

cols

Alınacak sütun adı listesini alın.

data

OpenDataset Nesnesinin verilerini alın.

id

Açık verilerin konum kimliğini alın.

log_properties

Günlük özelliklerini alma.

registry_id

Arka uçta kayıtlı bu genel veri kümesinin kayıt defteri kimliğini alın.

Bu kayıt defteri kimliği, depolama konumu gibi en son meta verileri almak için kullanılır. Tüm genel veri alt sınıflarının _registry_id atamasını bekleyebilirsiniz.

Döndürülenler

Tür Description
str

Kayıt defteri kimlik dizesi.

time_column_name

Saat sütunu adı.