dataset_partition_prep Módulo

Contiene funcionalidad para especificar la preparación de la partición del conjunto de datos.

La preparación de la partición se produce automáticamente cuando se usa una clase opendatasets que requiere una partición de datos, como la clase NycTlcGreen.

Funciones

prep_partition_datetime

Prepare la ruta de acceso de partición "year=\d+/month=\d+/".

prep_partition_datetime(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, pattern: List[str])

Parámetros

Nombre Description
dflow
Requerido
<xref:azureml.dataprep.Dataflow>

Instancia de dataprep.Dataflow.

start_date
Requerido

Fecha y hora de inicio del conjunto de datos.

end_date
Requerido

Fecha y hora de finalización del conjunto de datos.

pattern
Requerido

El patrón datetime.

prep_partition_puYear_puMonth

Prepare la ruta de acceso de partición "year=\d+/month=\d+/".

prep_partition_puYear_puMonth(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['puYear', 'puMonth'])

Parámetros

Nombre Description
dflow
Requerido
<xref:azureml.dataprep.Dataflow>

Instancia de dataprep.Dataflow.

start_date
Requerido

Fecha y hora de inicio del conjunto de datos.

end_date
Requerido

Fecha y hora de finalización del conjunto de datos.

pattern
Requerido

El patrón datetime.

Parámetros de palabra clave únicamente

Nombre Description
pattern
valor predeterminado: ['puYear', 'puMonth']

prep_partition_year

Prepare la ruta de acceso de partición "year=\d+/month=\d+/".

prep_partition_year(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year'])

Parámetros

Nombre Description
dflow
Requerido
<xref:azureml.dataprep.Dataflow>

Instancia de dataprep.Dataflow.

start_date
Requerido

Fecha y hora de inicio del conjunto de datos.

end_date
Requerido

Fecha y hora de finalización del conjunto de datos.

pattern
Requerido

El patrón datetime.

Parámetros de palabra clave únicamente

Nombre Description
pattern
valor predeterminado: ['year']

prep_partition_year_month

Prepare la ruta de acceso de partición "year=\d+/month=\d+/".

prep_partition_year_month(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month'])

Parámetros

Nombre Description
dflow
Requerido
<xref:azureml.dataprep.Dataflow>

Instancia de dataprep.Dataflow.

start_date
Requerido

Fecha y hora de inicio del conjunto de datos.

end_date
Requerido

Fecha y hora de finalización del conjunto de datos.

pattern
Requerido

El patrón datetime.

Parámetros de palabra clave únicamente

Nombre Description
pattern
valor predeterminado: ['year', 'month']

prep_partition_year_month_day

Prepare la ruta de acceso de partición "year=\d+/month=\d+/".

prep_partition_year_month_day(dflow: EnginelessDataflow, start_date: datetime, end_date: datetime, *, pattern: List[str] = ['year', 'month', 'day'])

Parámetros

Nombre Description
dflow
Requerido
<xref:azureml.dataprep.Dataflow>

Instancia de dataprep.Dataflow.

start_date
Requerido

Fecha y hora de inicio del conjunto de datos.

end_date
Requerido

Fecha y hora de finalización del conjunto de datos.

pattern
Requerido

El patrón datetime.

Parámetros de palabra clave únicamente

Nombre Description
pattern
valor predeterminado: ['year', 'month', 'day']