OpenDatasetBase Clase
Abre la clase base del conjunto de datos para heredar.
Construya conjuntos de datos abiertos.
- Herencia
-
OpenDatasetBase
Constructor
OpenDatasetBase(cols: List[str] | None = None, enable_telemetry: bool = True, **kwargs)
Parámetros
Lista de nombres de columnas que se van a cargar desde el conjunto de datos, el valor predeterminado es None.
- enable_telemetry
- bool
Si se habilita la telemetría en este conjunto de datos, el valor predeterminado es True.
Métodos
get_file_dataset |
Obtiene el conjunto de datos de archivo para el conjunto de datos abierto. |
get_tabular_dataset |
Inicialice AbstractTabularOpenDataset con la dirección URL del blob. |
to_pandas_dataframe |
Para trama de datos de Pandas. |
to_spark_dataframe |
Para trama de datos de Spark. |
get_file_dataset
Obtiene el conjunto de datos de archivo para el conjunto de datos abierto.
get_file_dataset(start_date: datetime = None, end_date: datetime = None, enable_telemetry: bool = True, **kwargs) -> FileDataset
Parámetros
Devoluciones
conjunto de datos de archivo
Tipo de valor devuelto
get_tabular_dataset
Inicialice AbstractTabularOpenDataset con la dirección URL del blob.
get_tabular_dataset(start_date: datetime = None, end_date: datetime = None, cols: List[str] = None, enable_telemetry: bool = True, **kwargs) -> TabularDataset
Parámetros
Lista de nombres de columna que se recuperarán. El valor None obtendrá todas las columnas.
Devoluciones
TabularDataset
Tipo de valor devuelto
to_pandas_dataframe
Para trama de datos de Pandas.
to_pandas_dataframe() -> DataFrame
to_spark_dataframe
Para trama de datos de Spark.
to_spark_dataframe()
Atributos
cols
Obtiene la lista de nombres de columna que se recuperará.
data
Obtiene los datos del objeto OpenDataset.
id
Obtiene el identificador de ubicación de los datos abiertos.
log_properties
Obtiene las propiedades del registro.
registry_id
Obtiene el identificador del registro de este conjunto de datos público registrado en el back-end.
Este identificador del registro se usa para obtener los metadatos más recientes, como la ubicación de almacenamiento. Se espera que todas las subclases de datos públicas asignen _registry_id.
Devoluciones
Cadena de identificador del registro.
Tipo de valor devuelto
time_column_name
Nombre de la columna de hora.
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de