Compartir a través de


Áreas de trabajo de Microsoft.MachineLearningServices/datasets 2020-05-01-preview

Definición de recursos de Bicep

El tipo de recurso workspaces/datasets se puede implementar con operaciones que tienen como destino:

Para obtener una lista de las propiedades modificadas en cada versión de api, consulte registro de cambios.

Formato de los recursos

Para crear un recurso Microsoft.MachineLearningServices/workspaces/datasets, agregue el siguiente bicep a la plantilla.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  name: 'string'
  parent: resourceSymbolicName
  datasetType: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {
      {customized property}: 'string'
    }
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Valores de propiedad

workspaces/datasets

Nombre Descripción Value
name El nombre del recurso

Vea cómo establecer nombres y tipos para recursos secundarios en Bicep.
string (obligatorio)
primario En Bicep, puede especificar el recurso primario para un recurso secundario. Solo tiene que agregar esta propiedad cuando el recurso secundario se declara fuera del recurso primario.

Para más información, consulte Recurso secundario fuera del recurso primario.
Nombre simbólico del recurso de tipo: áreas de trabajo
datasetType Especifica el tipo de conjunto de datos. 'file'
'tabular' (obligatorio)
parámetros DatasetCreateRequestParameters (obligatorio)
registro DatasetCreateRequestRegistration (obligatorio)
skipValidation Omita la validación que garantiza que los datos se puedan cargar desde el conjunto de datos antes del registro. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nombre Descripción Valor
header Tipo de encabezado. 'all_files_have_same_headers'
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath Valor booleano para mantener la información de ruta de acceso como columna en el conjunto de datos. El valor predeterminado es False. Es útil al leer varios archivos y para saber en qué archivo se originó un registro determinado o mantener información útil en la ruta de acceso del archivo. bool
partitionFormat La información de partición de cada ruta de acceso se extraerá en columnas según el formato especificado. La parte de formato "{column_name}" crea una columna de cadena y "{column_name:yyyy/MM/dd/HH/mm/ss}" crea la columna datetime, donde "yyyy", "MM", "dd", "HH", "mm" y "ss" se usan para extraer el año, mes, día, hora, minutos y segundos para el tipo datetime. El formato debe empezar en la posición de la primera clave de partición hasta el final de la ruta de acceso del archivo. Por ejemplo, dada la ruta de acceso '.. /USA/2019/01/01/data.parquet' donde la partición es por país o región y hora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una columna de cadena 'CountryOrRegion' con el valor 'USA' y una columna datetime 'PartitionDate' con el valor '2019-01-01-01 string
path DatasetCreateRequestParametersPath
Query DatasetCreateRequestParametersQuery
separador Separador usado para dividir columnas para "delimited_files" sourceType. string
sourceType Tipo de origen de datos. 'delimited_files'
'json_lines_files'
'parquet_files'

DatasetCreateRequestParametersPath

Nombre Descripción Valor
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Dirección URL http. string

DatasetCreateRequestParametersPathDataPath

Nombre Descripción Valor
datastoreName Nombre del almacén de datos. string
relativePath Ruta de acceso dentro del almacén de datos. string

DatasetCreateRequestParametersQuery

Nombre Descripción Valor
datastoreName Nombre del almacén de datos de SQL/PostgreSQL/MySQL. string
Query SQL Quey. string

DatasetCreateRequestRegistration

Nombre Descripción Valor
description Descripción del conjunto de datos. string
name Nombre del conjunto de datos. string
etiquetas Etiquetas asociadas al conjunto de datos. object

DatasetCreateRequestTimeSeries

Nombre Descripción Valor
coarseGrainTimestamp Nombre de columna que se va a usar como CoarseGrainTimestamp. Solo se puede usar si se especifica "fineGrainTimestamp" y no puede ser el mismo que "fineGrainTimestamp". string
fineGrainTimestamp Nombre de columna que se va a usar como FineGrainTimestamp string

Plantillas de inicio rápido

Las siguientes plantillas de inicio rápido implementan este tipo de recurso.

Plantilla Descripción
Creación de un conjunto de datos de archivo a partir de la ruta de acceso relativa en el almacén de datos

Implementación en Azure
Esta plantilla crea un conjunto de datos de archivo a partir de una ruta de acceso relativa en el almacén de datos en el área de trabajo de Azure Machine Learning.
Creación de un conjunto de datos de archivos en el área de trabajo de AML desde la dirección URL web

Implementación en Azure
Esta plantilla crea un conjunto de datos de archivos a partir de la dirección URL web en el área de trabajo de Azure Machine Learning.
Creación de un conjunto de datos tabular a partir de la ruta de acceso relativa en el almacén de datos

Implementación en Azure
Esta plantilla crea un conjunto de datos tabular a partir de una ruta de acceso relativa en el almacén de datos en el área de trabajo de Azure Machine Learning.
Creación de un conjunto de datos tabular a partir del almacén de datos SQL/PostgreSQL/MySQL

Implementación en Azure
Esta plantilla crea un conjunto de datos tabular a partir de una consulta SQL en el almacén de datos SQL/PostgreSQL/MySQL en el área de trabajo de Azure Machine Learning.
Creación de un conjunto de datos tabular en el área de trabajo de AML desde la dirección URL web

Implementación en Azure
Esta plantilla crea un conjunto de datos tabular a partir de la dirección URL web en el área de trabajo de Azure Machine Learning.
Creación de un área de trabajo de AML con varios conjuntos de datos & almacenes de datos

Implementación en Azure
Esta plantilla crea un área de trabajo de Azure Machine Learning con varios conjuntos de datos & almacenes de datos.

Definición de recursos de plantilla de ARM

El tipo de recurso workspaces/datasets se puede implementar con operaciones destinadas a:

Para obtener una lista de las propiedades modificadas en cada versión de API, consulte registro de cambios.

Formato de los recursos

Para crear un recurso Microsoft.MachineLearningServices/workspaces/datasets, agregue el siguiente JSON a la plantilla.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {
      "{customized property}": "string"
    }
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Valores de propiedad

workspaces/datasets

Nombre Descripción Value
type Tipo de recurso "Microsoft.MachineLearningServices/workspaces/datasets"
apiVersion La versión de la API de recursos "2020-05-01-preview"
name El nombre del recurso

Vea cómo establecer nombres y tipos para recursos secundarios en plantillas de ARM JSON.
string (obligatorio)
datasetType Especifica el tipo de conjunto de datos. 'file'
'tabular' (obligatorio)
parámetros DatasetCreateRequestParameters (obligatorio)
registro DatasetCreateRequestRegistration (obligatorio)
skipValidation Omita la validación que garantiza que los datos se pueden cargar desde el conjunto de datos antes del registro. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nombre Descripción Valor
header Tipo de encabezado. 'all_files_have_same_headers'
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath Valor booleano para mantener la información de ruta de acceso como columna en el conjunto de datos. El valor predeterminado es False. Es útil al leer varios archivos y para saber en qué archivo se originó un registro determinado o mantener información útil en la ruta de acceso del archivo. bool
partitionFormat La información de partición de cada ruta de acceso se extraerá en columnas según el formato especificado. La parte de formato "{column_name}" crea una columna de cadena y "{column_name:yyyy/MM/dd/HH/mm/ss}" crea la columna datetime, donde "yyyy", "MM", "dd", "HH", "mm" y "ss" se usan para extraer el año, mes, día, hora, minutos y segundos para el tipo datetime. El formato debe empezar en la posición de la primera clave de partición hasta el final de la ruta de acceso del archivo. Por ejemplo, dada la ruta de acceso '.. /USA/2019/01/01/data.parquet' donde la partición es por país o región y hora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una columna de cadena 'CountryOrRegion' con el valor 'USA' y una columna datetime 'PartitionDate' con el valor '2019-01-01-01 string
path DatasetCreateRequestParametersPath
Query DatasetCreateRequestParametersQuery
separador Separador usado para dividir columnas para "delimited_files" sourceType. string
sourceType Tipo de origen de datos. 'delimited_files'
'json_lines_files'
'parquet_files'

DatasetCreateRequestParametersPath

Nombre Descripción Valor
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Dirección URL http. string

DatasetCreateRequestParametersPathDataPath

Nombre Descripción Valor
datastoreName Nombre del almacén de datos. string
relativePath Ruta de acceso dentro del almacén de datos. string

DatasetCreateRequestParametersQuery

Nombre Descripción Valor
datastoreName Nombre del almacén de datos de SQL/PostgreSQL/MySQL. string
Query SQL Quey. string

DatasetCreateRequestRegistration

Nombre Descripción Valor
description Descripción del conjunto de datos. string
name Nombre del conjunto de datos. string
etiquetas Etiquetas asociadas al conjunto de datos. object

DatasetCreateRequestTimeSeries

Nombre Descripción Valor
coarseGrainTimestamp Nombre de columna que se va a usar como CoarseGrainTimestamp. Solo se puede usar si se especifica "fineGrainTimestamp" y no puede ser igual que "fineGrainTimestamp". string
fineGrainTimestamp Nombre de columna que se va a usar como FineGrainTimestamp string

Plantillas de inicio rápido

Las siguientes plantillas de inicio rápido implementan este tipo de recurso.

Plantilla Descripción
Creación de un conjunto de datos de archivo a partir de la ruta de acceso relativa en el almacén de datos

Implementación en Azure
Esta plantilla crea un conjunto de datos de archivo a partir de la ruta de acceso relativa en el almacén de datos del área de trabajo de Azure Machine Learning.
Creación de un conjunto de datos de archivos en el área de trabajo de AML desde la dirección URL web

Implementación en Azure
Esta plantilla crea un conjunto de datos de archivos a partir de la dirección URL web en el área de trabajo de Azure Machine Learning.
Creación de un conjunto de datos tabular a partir de la ruta de acceso relativa en el almacén de datos

Implementación en Azure
Esta plantilla crea un conjunto de datos tabular a partir de una ruta de acceso relativa en el almacén de datos del área de trabajo de Azure Machine Learning.
Creación de un conjunto de datos tabular a partir del almacén de datos de SQL/PostgreSQL/MySQL

Implementación en Azure
Esta plantilla crea un conjunto de datos tabular a partir de una consulta SQL en el almacén de datos SQL,PostgreSQL/MySQL en el área de trabajo de Azure Machine Learning.
Creación de un conjunto de datos tabular en el área de trabajo de AML desde la dirección URL web

Implementación en Azure
Esta plantilla crea un conjunto de datos tabular a partir de la dirección URL web en el área de trabajo de Azure Machine Learning.
Creación de un área de trabajo de AML con varios conjuntos de datos & almacenes de datos

Implementación en Azure
Esta plantilla crea un área de trabajo de Azure Machine Learning con varios conjuntos de datos & almacenes de datos.

Definición de recursos de Terraform (proveedor AzAPI)

El tipo de recurso workspaces/datasets se puede implementar con operaciones que tienen como destino:

  • Grupos de recursos

Para obtener una lista de las propiedades modificadas en cada versión de api, consulte registro de cambios.

Formato de los recursos

Para crear un recurso Microsoft.MachineLearningServices/workspaces/datasets, agregue el siguiente terraform a la plantilla.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  parent_id = "string"
  body = jsonencode({
    datasetType = "string"
    parameters = {
      header = "string"
      includePath = bool
      partitionFormat = "string"
      path = {
        dataPath = {
          datastoreName = "string"
          relativePath = "string"
        }
        httpUrl = "string"
      }
      query = {
        datastoreName = "string"
        query = "string"
      }
      separator = "string"
      sourceType = "string"
    }
    registration = {
      description = "string"
      name = "string"
      tags = {
        {customized property} = "string"
      }
    }
    skipValidation = bool
    timeSeries = {
      coarseGrainTimestamp = "string"
      fineGrainTimestamp = "string"
    }
  })
}

Valores de propiedad

workspaces/datasets

Nombre Descripción Value
type Tipo de recurso "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name El nombre del recurso string (obligatorio)
parent_id Identificador del recurso que es el elemento primario de este recurso. Identificador del recurso de tipo: áreas de trabajo
datasetType Especifica el tipo de conjunto de datos. "file"
"tabular" (obligatorio)
parámetros DatasetCreateRequestParameters (obligatorio)
registro DatasetCreateRequestRegistration (obligatorio)
skipValidation Omita la validación que garantiza que los datos se pueden cargar desde el conjunto de datos antes del registro. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nombre Descripción Valor
header Tipo de encabezado. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Valor booleano para mantener la información de ruta de acceso como columna en el conjunto de datos. El valor predeterminado es False. Es útil al leer varios archivos y para saber en qué archivo se originó un registro determinado o mantener información útil en la ruta de acceso del archivo. bool
partitionFormat La información de partición de cada ruta de acceso se extraerá en columnas según el formato especificado. La parte de formato "{column_name}" crea una columna de cadena y "{column_name:yyyy/MM/dd/HH/mm/ss}" crea la columna datetime, donde "yyyy", "MM", "dd", "HH", "mm" y "ss" se usan para extraer el año, mes, día, hora, minutos y segundos para el tipo datetime. El formato debe empezar en la posición de la primera clave de partición hasta el final de la ruta de acceso del archivo. Por ejemplo, dada la ruta de acceso '.. /USA/2019/01/01/data.parquet' donde la partición es por país o región y hora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una columna de cadena 'CountryOrRegion' con el valor 'USA' y una columna datetime 'PartitionDate' con el valor '2019-01-01-01' string
path DatasetCreateRequestParametersPath
Query DatasetCreateRequestParametersQuery
separador Separador usado para dividir columnas para "delimited_files" sourceType. string
sourceType Tipo de origen de datos. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Nombre Descripción Valor
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Dirección URL http. string

DatasetCreateRequestParametersPathDataPath

Nombre Descripción Valor
datastoreName Nombre del almacén de datos. string
relativePath Ruta de acceso dentro del almacén de datos. string

DatasetCreateRequestParametersQuery

Nombre Descripción Valor
datastoreName Nombre del almacén de datos de SQL/PostgreSQL/MySQL. string
Query SQL Quey. string

DatasetCreateRequestRegistration

Nombre Descripción Valor
description Descripción del conjunto de datos. string
name Nombre del conjunto de datos. string
etiquetas Etiquetas asociadas al conjunto de datos. object

DatasetCreateRequestTimeSeries

Nombre Descripción Valor
coarseGrainTimestamp Nombre de columna que se va a usar como CoarseGrainTimestamp. Solo se puede usar si se especifica "fineGrainTimestamp" y no puede ser igual que "fineGrainTimestamp". string
fineGrainTimestamp Nombre de columna que se va a usar como FineGrainTimestamp string