Condividi tramite


Aree di lavoro Microsoft.MachineLearningServices/set di dati 2020-05-01-preview

Definizione di risorsa Bicep

Il tipo di risorsa aree di lavoro/set di dati può essere distribuito con operazioni destinate:

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato di risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/datasets, aggiungere il modello Bicep seguente.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  name: 'string'
  parent: resourceSymbolicName
  datasetType: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {}
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Valori delle proprietà

aree di lavoro/set di dati

Nome Descrizione valore
name Nome della risorsa

Vedere come impostare nomi e tipi per le risorse figlio in Bicep.
stringa (obbligatoria)
padre In Bicep è possibile specificare la risorsa padre per una risorsa figlio. È necessario aggiungere questa proprietà solo quando la risorsa figlio viene dichiarata all'esterno della risorsa padre.

Per altre informazioni, vedere Risorsa figlio esterna alla risorsa padre.
Nome simbolico per la risorsa di tipo: aree di lavoro
set di datiType Specifica il tipo di set di dati. 'file'
'tabulare' (obbligatorio)
parametri Set di datiCreateRequestParameters (obbligatorio)
registrazione Set di datiCreateRequestRegistration (obbligatorio)
skipValidation Ignorare la convalida che garantisce che i dati possano essere caricati dal set di dati prima della registrazione. bool
timeSeries Set di datiCreateRequestTimeSeries

Set di datiCreateRequestParameters

Nome Descrizione Valore
header Tipo di intestazione. 'all_files_have_same_headers'
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath Boolean per mantenere le informazioni sul percorso come colonna nel set di dati. Il valore predefinito è False. Questo è utile quando si legge più file e si vuole sapere quale file ha origine un determinato record o mantenere informazioni utili nel percorso file. bool
partitionFormat Le informazioni di partizione di ogni percorso verranno estratte in colonne in base al formato specificato. La parte di formato '{column_name}' crea una colonna stringa e '{column_name:y/MM/dd/HH/mm/ss}' crea una colonna datetime, dove 'y', 'MM', 'dd', 'HH', 'mm' e 'ss' vengono usati per estrarre anno, mese, giorno, ora e secondo per il tipo datetime. Il formato deve iniziare dalla posizione della prima chiave di partizione fino alla fine del percorso del file. Ad esempio, dato il percorso '.. /USA/2019/01/01/data.parquet' dove la partizione è per paese/area geografica e ora, partition_format='/{CountryOrRegion}/{PartitionDate:yy/MM/dd}/data.csv' crea una colonna stringa 'CountryOrRegion' con il valore 'USA' e una colonna datetime 'PartitionDate' con il valore '2019-01-01 string
path Set di datiCreateRequestParametersPath
query Set di datiCreateRequestParametersQuery
separator Separatore usato per suddividere le colonne per il tipo di origine 'delimited_files'. string
sourceType Tipo di origine dati. 'delimited_files'
'json_lines_files'
'parquet_files'

Set di datiCreateRequestParametersPath

Nome Descrizione Valore
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl URL Http. string

DatasetCreateRequestParametersPathDataPath

Nome Descrizione Valore
datastoreName Nome dell'archivio dati. string
relativePath Percorso all'interno dell'archivio dati. string

Set di datiCreateRequestParametersQuery

Nome Descrizione Valore
datastoreName Nome dell'archivio dati SQL/PostgreSQL/MySQL. string
query SQL Quey. string

Set di datiCreateRequestRegistration

Nome Descrizione Valore
description Descrizione del set di dati. string
name Nome del set di dati. string
tags Tag associati al set di dati. object

Set di datiCreateRequestTimeSeries

Nome Descrizione Valore
grossolanaGrainTimestamp Nome di colonna da usare come GrossaGrainTimestamp. Può essere usato solo se 'fineGrainTimestamp' è specificato e non può essere uguale a 'fineGrainTimestamp'. string
fineGrainTimestamp Nome colonna da usare come FineGrainTimestamp string

Modelli di avvio rapido

I modelli di avvio rapido seguenti distribuiscono questo tipo di risorsa.

Modello Descrizione
Creare un set di dati file dal percorso relativo nell'archivio dati

Distribuisci in Azure
Questo modello crea un set di dati di file dal percorso relativo nell'archivio dati nell'area di lavoro di Azure Machine Learning.
Creare un set di dati file nell'area di lavoro AML dall'URL Web

Distribuisci in Azure
Questo modello crea un set di dati di file dall'URL Web nell'area di lavoro di Azure Machine Learning.
Creare un set di dati tabulare dal percorso relativo nell'archivio dati

Distribuisci in Azure
Questo modello crea un set di dati tabulare dal percorso relativo nell'archivio dati nell'area di lavoro di Azure Machine Learning.
Creare un set di dati tabulare da SQL/PostgreSQL/MySQL Datastore

Distribuisci in Azure
Questo modello crea un set di dati tabulare da query SQL in SQL/PostgreSQL/MySQL datastore nell'area di lavoro di Azure Machine Learning.
Creare un set di dati tabulare nell'area di lavoro AML dall'URL Web

Distribuisci in Azure
Questo modello crea un set di dati tabulare dall'URL Web nell'area di lavoro di Azure Machine Learning.
Creare un'area di lavoro AML con più set di dati & archivi dati

Distribuisci in Azure
Questo modello crea un'area di lavoro di Azure Machine Learning con più set di dati & archivi dati.

Definizione della risorsa modello di Resource Manager

Il tipo di risorsa aree di lavoro/set di dati può essere distribuito con operazioni destinate:

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.

Formato di risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/datasets, aggiungere il codice JSON seguente al modello.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {}
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Valori delle proprietà

aree di lavoro/set di dati

Nome Descrizione Valore
tipo Tipo di risorsa 'Microsoft.MachineLearningServices/workspaces/datasets'
apiVersion Versione dell'API risorsa '2020-05-01-preview'
name Nome della risorsa

Vedere come impostare nomi e tipi per le risorse figlio nei modelli di RESOURCE JSON.
stringa (obbligatoria)
set di datiType Specifica il tipo di set di dati. 'file'
'tabulare' (obbligatorio)
parametri Set di datiCreateRequestParameters (obbligatorio)
registrazione Set di datiCreateRequestRegistration (obbligatorio)
skipValidation Ignorare la convalida che garantisce che i dati possano essere caricati dal set di dati prima della registrazione. bool
timeSeries Set di datiCreateRequestTimeSeries

Set di datiCreateRequestParameters

Nome Descrizione Valore
header Tipo di intestazione. 'all_files_have_same_headers'
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath Boolean per mantenere le informazioni sul percorso come colonna nel set di dati. Il valore predefinito è False. Questo è utile quando si legge più file e si vuole sapere quale file ha origine un determinato record o mantenere informazioni utili nel percorso file. bool
partitionFormat Le informazioni di partizione di ogni percorso verranno estratte in colonne in base al formato specificato. La parte di formato '{column_name}' crea una colonna stringa e '{column_name:y/MM/dd/HH/mm/ss}' crea una colonna datetime, dove 'y', 'MM', 'dd', 'HH', 'mm' e 'ss' vengono usati per estrarre anno, mese, giorno, ora e secondo per il tipo datetime. Il formato deve iniziare dalla posizione della prima chiave di partizione fino alla fine del percorso del file. Ad esempio, dato il percorso '.. /USA/2019/01/01/data.parquet' dove la partizione è per paese/area geografica e ora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una colonna stringa 'CountryOrRegion' con il valore 'USA' e una colonna datetime 'PartitionDate' con il valore '2019-01-01 string
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
separator Separatore utilizzato per dividere le colonne per sourceType 'delimited_files'. string
sourceType Tipo di origine dati. 'delimited_files'
'json_lines_files'
'parquet_files'

DatasetCreateRequestParametersPath

Nome Descrizione Valore
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl URL HTTP. string

DatasetCreateRequestParametersPathDataPath

Nome Descrizione Valore
datastoreName Nome dell'archivio dati. string
relativePath Percorso all'interno dell'archivio dati. string

DatasetCreateRequestParametersQuery

Nome Descrizione Valore
datastoreName Nome dell'archivio dati SQL/PostgreSQL/MySQL. string
query SQL Quey. string

DatasetCreateRequestRegistration

Nome Descrizione Valore
description Descrizione del set di dati. string
name Nome del set di dati. string
tags Tag associati al set di dati. object

DatasetCreateRequestTimeSeries

Nome Descrizione Valore
grossolanaGrainTimestamp Nome di colonna da utilizzare come CoarseGrainTimestamp. Può essere usato solo se 'fineGrainTimestamp' è specificato e non può essere uguale a 'fineGrainTimestamp'. string
fineGrainTimestamp Nome colonna da usare come FineGrainTimestamp string

Modelli di avvio rapido

I modelli di avvio rapido seguenti distribuiscono questo tipo di risorsa.

Modello Descrizione
Creare un set di dati di file dal percorso relativo nell'archivio dati

Distribuisci in Azure
Questo modello crea un set di dati di file dal percorso relativo nell'archivio dati nell'area di lavoro di Azure Machine Learning.
Creare un set di dati file nell'area di lavoro AML dall'URL Web

Distribuisci in Azure
Questo modello crea un set di dati di file dall'URL Web nell'area di lavoro di Azure Machine Learning.
Creare un set di dati tabulare dal percorso relativo nell'archivio dati

Distribuisci in Azure
Questo modello crea un set di dati tabulare dal percorso relativo nell'archivio dati nell'area di lavoro di Azure Machine Learning.
Creare un set di dati tabulare da SQL/PostgreSQL/Archivio dati MySQL

Distribuisci in Azure
Questo modello crea un set di dati tabulare dalla query SQL nell'archivio dati SQL/PostgreSQL/MySQL nell'area di lavoro di Azure Machine Learning.
Creare un set di dati tabulare nell'area di lavoro AML dall'URL Web

Distribuisci in Azure
Questo modello crea un set di dati tabulare dall'URL Web nell'area di lavoro di Azure Machine Learning.
Creare un'area di lavoro AML con più set di dati & archivi dati

Distribuisci in Azure
Questo modello crea un'area di lavoro di Azure Machine Learning con più set di dati & archivi dati.

Definizione della risorsa Terraform (provider AzAPI)

Il tipo di risorsa aree di lavoro/set di dati può essere distribuito con operazioni destinate:

  • Gruppi di risorse

Per un elenco delle proprietà modificate in ogni versione dell'API, vedere Log delle modifiche.

Formato di risorsa

Per creare una risorsa Microsoft.MachineLearningServices/workspaces/datasets, aggiungere il codice Terraform seguente al modello.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  parent_id = "string"
  body = jsonencode({
    datasetType = "string"
    parameters = {
      header = "string"
      includePath = bool
      partitionFormat = "string"
      path = {
        dataPath = {
          datastoreName = "string"
          relativePath = "string"
        }
        httpUrl = "string"
      }
      query = {
        datastoreName = "string"
        query = "string"
      }
      separator = "string"
      sourceType = "string"
    }
    registration = {
      description = "string"
      name = "string"
      tags = {}
    }
    skipValidation = bool
    timeSeries = {
      coarseGrainTimestamp = "string"
      fineGrainTimestamp = "string"
    }
  })
}

Valori delle proprietà

aree di lavoro/set di dati

Nome Descrizione Valore
tipo Tipo di risorsa "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name Nome della risorsa stringa (obbligatorio)
parent_id ID della risorsa padre per questa risorsa. ID per la risorsa di tipo: aree di lavoro
datasetType Specifica il tipo di set di dati. "file"
"tabulare" (obbligatorio)
parametri DatasetCreateRequestParameters (obbligatorio)
registrazione DatasetCreateRequestRegistration (obbligatorio)
skipValidation Ignorare la convalida che garantisce che i dati possano essere caricati dal set di dati prima della registrazione. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nome Descrizione Valore
header Tipo di intestazione. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Valore booleano per mantenere le informazioni sul percorso come colonna nel set di dati. Il valore predefinito è False. Ciò è utile quando si leggono più file e si vuole sapere da quale file proviene un determinato record o per mantenere informazioni utili nel percorso del file. bool
partitionFormat Le informazioni sulla partizione di ogni percorso verranno estratte in colonne in base al formato specificato. La parte di formato '{column_name}' crea una colonna stringa e '{column_name:a/MM/dd/HH/mm/ss}' crea una colonna datetime, dove 'aaaa', 'MM', 'dd', 'HH', 'mm' e 'ss' vengono usati per estrarre anno, mese, giorno, ora, minuto e secondo per il tipo datetime. Il formato deve iniziare dalla posizione della prima chiave di partizione fino alla fine del percorso del file. Ad esempio, dato il percorso '.. /USA/2019/01/01/data.parquet' dove la partizione è per paese/area geografica e ora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una colonna stringa 'CountryOrRegion' con il valore 'USA' e una colonna datetime 'PartitionDate' con il valore '2019-01-01 string
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
separator Separatore utilizzato per dividere le colonne per sourceType 'delimited_files'. string
sourceType Tipo di origine dati. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Nome Descrizione Valore
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl URL HTTP. string

DatasetCreateRequestParametersPathDataPath

Nome Descrizione Valore
datastoreName Nome dell'archivio dati. string
relativePath Percorso all'interno dell'archivio dati. string

DatasetCreateRequestParametersQuery

Nome Descrizione Valore
datastoreName Nome dell'archivio dati SQL/PostgreSQL/MySQL. string
query SQL Quey. string

DatasetCreateRequestRegistration

Nome Descrizione Valore
description Descrizione del set di dati. string
name Nome del set di dati. string
tags Tag associati al set di dati. object

DatasetCreateRequestTimeSeries

Nome Descrizione Valore
grossolanaGrainTimestamp Nome di colonna da utilizzare come CoarseGrainTimestamp. Può essere usato solo se 'fineGrainTimestamp' è specificato e non può essere uguale a 'fineGrainTimestamp'. string
fineGrainTimestamp Nome colonna da usare come FineGrainTimestamp string