Áreas de trabajo de Microsoft.MachineLearningServices/datasets 2020-05-01-preview
Definición de recursos de Bicep
El tipo de recurso workspaces/datasets se puede implementar con operaciones que tienen como destino:
- Grupos de recursos: consulte los comandos de implementación del grupo de recursos.
Para obtener una lista de las propiedades modificadas en cada versión de api, consulte registro de cambios.
Formato de los recursos
Para crear un recurso Microsoft.MachineLearningServices/workspaces/datasets, agregue el siguiente bicep a la plantilla.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
name: 'string'
parent: resourceSymbolicName
datasetType: 'string'
parameters: {
header: 'string'
includePath: bool
partitionFormat: 'string'
path: {
dataPath: {
datastoreName: 'string'
relativePath: 'string'
}
httpUrl: 'string'
}
query: {
datastoreName: 'string'
query: 'string'
}
separator: 'string'
sourceType: 'string'
}
registration: {
description: 'string'
name: 'string'
tags: {
{customized property}: 'string'
}
}
skipValidation: bool
timeSeries: {
coarseGrainTimestamp: 'string'
fineGrainTimestamp: 'string'
}
}
Valores de propiedad
workspaces/datasets
Nombre | Descripción | Value |
---|---|---|
name | El nombre del recurso Vea cómo establecer nombres y tipos para recursos secundarios en Bicep. |
string (obligatorio) |
primario | En Bicep, puede especificar el recurso primario para un recurso secundario. Solo tiene que agregar esta propiedad cuando el recurso secundario se declara fuera del recurso primario. Para más información, consulte Recurso secundario fuera del recurso primario. |
Nombre simbólico del recurso de tipo: áreas de trabajo |
datasetType | Especifica el tipo de conjunto de datos. | 'file' 'tabular' (obligatorio) |
parámetros | DatasetCreateRequestParameters (obligatorio) | |
registro | DatasetCreateRequestRegistration (obligatorio) | |
skipValidation | Omita la validación que garantiza que los datos se puedan cargar desde el conjunto de datos antes del registro. | bool |
timeSeries | DatasetCreateRequestTimeSeries |
DatasetCreateRequestParameters
Nombre | Descripción | Valor |
---|---|---|
header | Tipo de encabezado. | 'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers' |
includePath | Valor booleano para mantener la información de ruta de acceso como columna en el conjunto de datos. El valor predeterminado es False. Es útil al leer varios archivos y para saber en qué archivo se originó un registro determinado o mantener información útil en la ruta de acceso del archivo. | bool |
partitionFormat | La información de partición de cada ruta de acceso se extraerá en columnas según el formato especificado. La parte de formato "{column_name}" crea una columna de cadena y "{column_name:yyyy/MM/dd/HH/mm/ss}" crea la columna datetime, donde "yyyy", "MM", "dd", "HH", "mm" y "ss" se usan para extraer el año, mes, día, hora, minutos y segundos para el tipo datetime. El formato debe empezar en la posición de la primera clave de partición hasta el final de la ruta de acceso del archivo. Por ejemplo, dada la ruta de acceso '.. /USA/2019/01/01/data.parquet' donde la partición es por país o región y hora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una columna de cadena 'CountryOrRegion' con el valor 'USA' y una columna datetime 'PartitionDate' con el valor '2019-01-01-01 | string |
path | DatasetCreateRequestParametersPath | |
Query | DatasetCreateRequestParametersQuery | |
separador | Separador usado para dividir columnas para "delimited_files" sourceType. | string |
sourceType | Tipo de origen de datos. | 'delimited_files' 'json_lines_files' 'parquet_files' |
DatasetCreateRequestParametersPath
Nombre | Descripción | Valor |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Dirección URL http. | string |
DatasetCreateRequestParametersPathDataPath
Nombre | Descripción | Valor |
---|---|---|
datastoreName | Nombre del almacén de datos. | string |
relativePath | Ruta de acceso dentro del almacén de datos. | string |
DatasetCreateRequestParametersQuery
Nombre | Descripción | Valor |
---|---|---|
datastoreName | Nombre del almacén de datos de SQL/PostgreSQL/MySQL. | string |
Query | SQL Quey. | string |
DatasetCreateRequestRegistration
Nombre | Descripción | Valor |
---|---|---|
description | Descripción del conjunto de datos. | string |
name | Nombre del conjunto de datos. | string |
etiquetas | Etiquetas asociadas al conjunto de datos. | object |
DatasetCreateRequestTimeSeries
Nombre | Descripción | Valor |
---|---|---|
coarseGrainTimestamp | Nombre de columna que se va a usar como CoarseGrainTimestamp. Solo se puede usar si se especifica "fineGrainTimestamp" y no puede ser el mismo que "fineGrainTimestamp". | string |
fineGrainTimestamp | Nombre de columna que se va a usar como FineGrainTimestamp | string |
Plantillas de inicio rápido
Las siguientes plantillas de inicio rápido implementan este tipo de recurso.
Plantilla | Descripción |
---|---|
Creación de un conjunto de datos de archivo a partir de la ruta de acceso relativa en el almacén de datos |
Esta plantilla crea un conjunto de datos de archivo a partir de una ruta de acceso relativa en el almacén de datos en el área de trabajo de Azure Machine Learning. |
Creación de un conjunto de datos de archivos en el área de trabajo de AML desde la dirección URL web |
Esta plantilla crea un conjunto de datos de archivos a partir de la dirección URL web en el área de trabajo de Azure Machine Learning. |
Creación de un conjunto de datos tabular a partir de la ruta de acceso relativa en el almacén de datos |
Esta plantilla crea un conjunto de datos tabular a partir de una ruta de acceso relativa en el almacén de datos en el área de trabajo de Azure Machine Learning. |
Creación de un conjunto de datos tabular a partir del almacén de datos SQL/PostgreSQL/MySQL |
Esta plantilla crea un conjunto de datos tabular a partir de una consulta SQL en el almacén de datos SQL/PostgreSQL/MySQL en el área de trabajo de Azure Machine Learning. |
Creación de un conjunto de datos tabular en el área de trabajo de AML desde la dirección URL web |
Esta plantilla crea un conjunto de datos tabular a partir de la dirección URL web en el área de trabajo de Azure Machine Learning. |
Creación de un área de trabajo de AML con varios conjuntos de datos & almacenes de datos |
Esta plantilla crea un área de trabajo de Azure Machine Learning con varios conjuntos de datos & almacenes de datos. |
Definición de recursos de plantilla de ARM
El tipo de recurso workspaces/datasets se puede implementar con operaciones destinadas a:
- Grupos de recursos: consulte los comandos de implementación del grupo de recursos.
Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.
Formato de los recursos
Para crear un recurso Microsoft.MachineLearningServices/workspaces/datasets, agregue el siguiente JSON a la plantilla.
{
"type": "Microsoft.MachineLearningServices/workspaces/datasets",
"apiVersion": "2020-05-01-preview",
"name": "string",
"datasetType": "string",
"parameters": {
"header": "string",
"includePath": "bool",
"partitionFormat": "string",
"path": {
"dataPath": {
"datastoreName": "string",
"relativePath": "string"
},
"httpUrl": "string"
},
"query": {
"datastoreName": "string",
"query": "string"
},
"separator": "string",
"sourceType": "string"
},
"registration": {
"description": "string",
"name": "string",
"tags": {
"{customized property}": "string"
}
},
"skipValidation": "bool",
"timeSeries": {
"coarseGrainTimestamp": "string",
"fineGrainTimestamp": "string"
}
}
Valores de propiedad
workspaces/datasets
Nombre | Descripción | Value |
---|---|---|
type | Tipo de recurso | "Microsoft.MachineLearningServices/workspaces/datasets" |
apiVersion | La versión de la API de recursos | "2020-05-01-preview" |
name | El nombre del recurso Vea cómo establecer nombres y tipos para recursos secundarios en plantillas de ARM JSON. |
string (obligatorio) |
datasetType | Especifica el tipo de conjunto de datos. | 'file' 'tabular' (obligatorio) |
parámetros | DatasetCreateRequestParameters (obligatorio) | |
registro | DatasetCreateRequestRegistration (obligatorio) | |
skipValidation | Omita la validación que garantiza que los datos se pueden cargar desde el conjunto de datos antes del registro. | bool |
timeSeries | DatasetCreateRequestTimeSeries |
DatasetCreateRequestParameters
Nombre | Descripción | Valor |
---|---|---|
header | Tipo de encabezado. | 'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers' |
includePath | Valor booleano para mantener la información de ruta de acceso como columna en el conjunto de datos. El valor predeterminado es False. Es útil al leer varios archivos y para saber en qué archivo se originó un registro determinado o mantener información útil en la ruta de acceso del archivo. | bool |
partitionFormat | La información de partición de cada ruta de acceso se extraerá en columnas según el formato especificado. La parte de formato "{column_name}" crea una columna de cadena y "{column_name:yyyy/MM/dd/HH/mm/ss}" crea la columna datetime, donde "yyyy", "MM", "dd", "HH", "mm" y "ss" se usan para extraer el año, mes, día, hora, minutos y segundos para el tipo datetime. El formato debe empezar en la posición de la primera clave de partición hasta el final de la ruta de acceso del archivo. Por ejemplo, dada la ruta de acceso '.. /USA/2019/01/01/data.parquet' donde la partición es por país o región y hora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una columna de cadena 'CountryOrRegion' con el valor 'USA' y una columna datetime 'PartitionDate' con el valor '2019-01-01-01 | string |
path | DatasetCreateRequestParametersPath | |
Query | DatasetCreateRequestParametersQuery | |
separador | Separador usado para dividir columnas para "delimited_files" sourceType. | string |
sourceType | Tipo de origen de datos. | 'delimited_files' 'json_lines_files' 'parquet_files' |
DatasetCreateRequestParametersPath
Nombre | Descripción | Valor |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Dirección URL http. | string |
DatasetCreateRequestParametersPathDataPath
Nombre | Descripción | Valor |
---|---|---|
datastoreName | Nombre del almacén de datos. | string |
relativePath | Ruta de acceso dentro del almacén de datos. | string |
DatasetCreateRequestParametersQuery
Nombre | Descripción | Valor |
---|---|---|
datastoreName | Nombre del almacén de datos de SQL/PostgreSQL/MySQL. | string |
Query | SQL Quey. | string |
DatasetCreateRequestRegistration
Nombre | Descripción | Valor |
---|---|---|
description | Descripción del conjunto de datos. | string |
name | Nombre del conjunto de datos. | string |
etiquetas | Etiquetas asociadas al conjunto de datos. | object |
DatasetCreateRequestTimeSeries
Nombre | Descripción | Valor |
---|---|---|
coarseGrainTimestamp | Nombre de columna que se va a usar como CoarseGrainTimestamp. Solo se puede usar si se especifica "fineGrainTimestamp" y no puede ser igual que "fineGrainTimestamp". | string |
fineGrainTimestamp | Nombre de columna que se va a usar como FineGrainTimestamp | string |
Plantillas de inicio rápido
Las siguientes plantillas de inicio rápido implementan este tipo de recurso.
Plantilla | Descripción |
---|---|
Creación de un conjunto de datos de archivo a partir de la ruta de acceso relativa en el almacén de datos |
Esta plantilla crea un conjunto de datos de archivo a partir de la ruta de acceso relativa en el almacén de datos del área de trabajo de Azure Machine Learning. |
Creación de un conjunto de datos de archivos en el área de trabajo de AML desde la dirección URL web |
Esta plantilla crea un conjunto de datos de archivos a partir de la dirección URL web en el área de trabajo de Azure Machine Learning. |
Creación de un conjunto de datos tabular a partir de la ruta de acceso relativa en el almacén de datos |
Esta plantilla crea un conjunto de datos tabular a partir de una ruta de acceso relativa en el almacén de datos del área de trabajo de Azure Machine Learning. |
Creación de un conjunto de datos tabular a partir del almacén de datos de SQL/PostgreSQL/MySQL |
Esta plantilla crea un conjunto de datos tabular a partir de una consulta SQL en el almacén de datos SQL,PostgreSQL/MySQL en el área de trabajo de Azure Machine Learning. |
Creación de un conjunto de datos tabular en el área de trabajo de AML desde la dirección URL web |
Esta plantilla crea un conjunto de datos tabular a partir de la dirección URL web en el área de trabajo de Azure Machine Learning. |
Creación de un área de trabajo de AML con varios conjuntos de datos & almacenes de datos |
Esta plantilla crea un área de trabajo de Azure Machine Learning con varios conjuntos de datos & almacenes de datos. |
Definición de recursos de Terraform (proveedor AzAPI)
El tipo de recurso workspaces/datasets se puede implementar con operaciones que tienen como destino:
- Grupos de recursos
Para obtener una lista de las propiedades modificadas en cada versión de api, consulte registro de cambios.
Formato de los recursos
Para crear un recurso Microsoft.MachineLearningServices/workspaces/datasets, agregue el siguiente terraform a la plantilla.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name = "string"
parent_id = "string"
body = jsonencode({
datasetType = "string"
parameters = {
header = "string"
includePath = bool
partitionFormat = "string"
path = {
dataPath = {
datastoreName = "string"
relativePath = "string"
}
httpUrl = "string"
}
query = {
datastoreName = "string"
query = "string"
}
separator = "string"
sourceType = "string"
}
registration = {
description = "string"
name = "string"
tags = {
{customized property} = "string"
}
}
skipValidation = bool
timeSeries = {
coarseGrainTimestamp = "string"
fineGrainTimestamp = "string"
}
})
}
Valores de propiedad
workspaces/datasets
Nombre | Descripción | Value |
---|---|---|
type | Tipo de recurso | "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview" |
name | El nombre del recurso | string (obligatorio) |
parent_id | Identificador del recurso que es el elemento primario de este recurso. | Identificador del recurso de tipo: áreas de trabajo |
datasetType | Especifica el tipo de conjunto de datos. | "file" "tabular" (obligatorio) |
parámetros | DatasetCreateRequestParameters (obligatorio) | |
registro | DatasetCreateRequestRegistration (obligatorio) | |
skipValidation | Omita la validación que garantiza que los datos se pueden cargar desde el conjunto de datos antes del registro. | bool |
timeSeries | DatasetCreateRequestTimeSeries |
DatasetCreateRequestParameters
Nombre | Descripción | Valor |
---|---|---|
header | Tipo de encabezado. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Valor booleano para mantener la información de ruta de acceso como columna en el conjunto de datos. El valor predeterminado es False. Es útil al leer varios archivos y para saber en qué archivo se originó un registro determinado o mantener información útil en la ruta de acceso del archivo. | bool |
partitionFormat | La información de partición de cada ruta de acceso se extraerá en columnas según el formato especificado. La parte de formato "{column_name}" crea una columna de cadena y "{column_name:yyyy/MM/dd/HH/mm/ss}" crea la columna datetime, donde "yyyy", "MM", "dd", "HH", "mm" y "ss" se usan para extraer el año, mes, día, hora, minutos y segundos para el tipo datetime. El formato debe empezar en la posición de la primera clave de partición hasta el final de la ruta de acceso del archivo. Por ejemplo, dada la ruta de acceso '.. /USA/2019/01/01/data.parquet' donde la partición es por país o región y hora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una columna de cadena 'CountryOrRegion' con el valor 'USA' y una columna datetime 'PartitionDate' con el valor '2019-01-01-01' | string |
path | DatasetCreateRequestParametersPath | |
Query | DatasetCreateRequestParametersQuery | |
separador | Separador usado para dividir columnas para "delimited_files" sourceType. | string |
sourceType | Tipo de origen de datos. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Nombre | Descripción | Valor |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | Dirección URL http. | string |
DatasetCreateRequestParametersPathDataPath
Nombre | Descripción | Valor |
---|---|---|
datastoreName | Nombre del almacén de datos. | string |
relativePath | Ruta de acceso dentro del almacén de datos. | string |
DatasetCreateRequestParametersQuery
Nombre | Descripción | Valor |
---|---|---|
datastoreName | Nombre del almacén de datos de SQL/PostgreSQL/MySQL. | string |
Query | SQL Quey. | string |
DatasetCreateRequestRegistration
Nombre | Descripción | Valor |
---|---|---|
description | Descripción del conjunto de datos. | string |
name | Nombre del conjunto de datos. | string |
etiquetas | Etiquetas asociadas al conjunto de datos. | object |
DatasetCreateRequestTimeSeries
Nombre | Descripción | Valor |
---|---|---|
coarseGrainTimestamp | Nombre de columna que se va a usar como CoarseGrainTimestamp. Solo se puede usar si se especifica "fineGrainTimestamp" y no puede ser igual que "fineGrainTimestamp". | string |
fineGrainTimestamp | Nombre de columna que se va a usar como FineGrainTimestamp | string |
Comentarios
https://aka.ms/ContentUserFeedback.
Próximamente: A lo largo de 2024 iremos eliminando gradualmente GitHub Issues como mecanismo de comentarios sobre el contenido y lo sustituiremos por un nuevo sistema de comentarios. Para más información, vea:Enviar y ver comentarios de