Partager via


OpenDatasetBase Classe

Ouvrez la classe de base du jeu de données pour hériter.

Créez des jeux de données ouverts.

Constructeur

OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)

Paramètres

Nom Description
cols

Liste des noms de colonnes à charger à partir du jeu de données, par défaut sur None

Valeur par défaut: None
enable_telemetry

Indique s’il faut activer la télémétrie sur ce jeu de données, la valeur par défaut est True

Valeur par défaut: True
kwargs
Obligatoire

arguments pour le filtre

Méthodes

get_file_dataset

Obtenez le jeu de données de fichier pour le jeu de données ouvert.

get_tabular_dataset

Initialisez AbstractTabularOpenDataset avec l’URL de l’objet blob.

to_pandas_dataframe

Pour pandas dataframe.

to_spark_dataframe

Pour spark dataframe.

get_file_dataset

Obtenez le jeu de données de fichier pour le jeu de données ouvert.

get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset

Paramètres

Nom Description
cls
Obligatoire

classe actuelle

start_date
Obligatoire

date de début, valeur par défaut None

end_date
Obligatoire

date de fin, valeur par défaut None

enable_telemetry
Obligatoire

activer la télémétrie ou non, la valeur par défaut est True

Retours

Type Description

jeu de données de fichiers

get_tabular_dataset

Initialisez AbstractTabularOpenDataset avec l’URL de l’objet blob.

get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset

Paramètres

Nom Description
cls
Obligatoire

nom de type du jeu de données Ouvert.

start_date
Obligatoire

Date de début à interroger inclusivement.

end_date
Obligatoire

Date de fin à interroger inclusivement.

cols
Obligatoire

Liste des noms de colonnes à récupérer. Aucun n’obtient toutes les colonnes.

enable_telemetry
Obligatoire

Indique s’il faut activer la télémétrie, désactivée uniquement pour l’UT.

Retours

Type Description

EnsembleDeDonnéesTabulaires

to_pandas_dataframe

Pour pandas dataframe.

to_pandas_dataframe() -> DataFrame

to_spark_dataframe

Pour spark dataframe.

to_spark_dataframe()

Attributs

cols

Obtenez la liste des noms de colonne à récupérer.

data

Obtenez les données de l’objet OpenDataset.

id

Obtenez l’ID d’emplacement des données ouvertes.

log_properties

Obtenir les propriétés du journal.

registry_id

Obtenez l’ID de Registre de ce jeu de données public inscrit sur le serveur principal.

Cet ID de Registre est utilisé pour obtenir les dernières métadonnées telles que l’emplacement de stockage. Attendez-vous à ce que toutes les sous-classes de données publiques attribuent _registry_id.

Retours

Type Description
str

Chaîne d’ID de Registre.

time_column_name

Nom de colonne d’heure.