OpenDatasetBase Classe
Ouvrez la classe de base du jeu de données pour hériter.
Créez des jeux de données ouverts.
Constructeur
OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)
Paramètres
Nom | Description |
---|---|
cols
|
Liste des noms de colonnes à charger à partir du jeu de données, par défaut sur None Valeur par défaut: None
|
enable_telemetry
|
Indique s’il faut activer la télémétrie sur ce jeu de données, la valeur par défaut est True Valeur par défaut: True
|
kwargs
Obligatoire
|
arguments pour le filtre |
Méthodes
get_file_dataset |
Obtenez le jeu de données de fichier pour le jeu de données ouvert. |
get_tabular_dataset |
Initialisez AbstractTabularOpenDataset avec l’URL de l’objet blob. |
to_pandas_dataframe |
Pour pandas dataframe. |
to_spark_dataframe |
Pour spark dataframe. |
get_file_dataset
Obtenez le jeu de données de fichier pour le jeu de données ouvert.
get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset
Paramètres
Nom | Description |
---|---|
cls
Obligatoire
|
classe actuelle |
start_date
Obligatoire
|
date de début, valeur par défaut None |
end_date
Obligatoire
|
date de fin, valeur par défaut None |
enable_telemetry
Obligatoire
|
activer la télémétrie ou non, la valeur par défaut est True |
Retours
Type | Description |
---|---|
jeu de données de fichiers |
get_tabular_dataset
Initialisez AbstractTabularOpenDataset avec l’URL de l’objet blob.
get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset
Paramètres
Nom | Description |
---|---|
cls
Obligatoire
|
nom de type du jeu de données Ouvert. |
start_date
Obligatoire
|
Date de début à interroger inclusivement. |
end_date
Obligatoire
|
Date de fin à interroger inclusivement. |
cols
Obligatoire
|
Liste des noms de colonnes à récupérer. Aucun n’obtient toutes les colonnes. |
enable_telemetry
Obligatoire
|
Indique s’il faut activer la télémétrie, désactivée uniquement pour l’UT. |
Retours
Type | Description |
---|---|
EnsembleDeDonnéesTabulaires |
to_pandas_dataframe
Pour pandas dataframe.
to_pandas_dataframe() -> DataFrame
to_spark_dataframe
Pour spark dataframe.
to_spark_dataframe()
Attributs
cols
Obtenez la liste des noms de colonne à récupérer.
data
Obtenez les données de l’objet OpenDataset.
id
Obtenez l’ID d’emplacement des données ouvertes.
log_properties
Obtenir les propriétés du journal.
registry_id
Obtenez l’ID de Registre de ce jeu de données public inscrit sur le serveur principal.
Cet ID de Registre est utilisé pour obtenir les dernières métadonnées telles que l’emplacement de stockage. Attendez-vous à ce que toutes les sous-classes de données publiques attribuent _registry_id.
Retours
Type | Description |
---|---|
Chaîne d’ID de Registre. |
time_column_name
Nom de colonne d’heure.