Aree di lavoro Di Microsoft.MachineLearningServices/set di dati
Definizione di risorsa Bicep
Il tipo di risorsa aree di lavoro/set di dati può essere distribuito con operazioni destinate:
- Gruppi di risorse - Vedere i comandi di distribuzione del gruppo di risorse
Per un elenco delle proprietà modificate in ogni versione dell'API, vedere log delle modifiche.
Formato di risorsa
Per creare una risorsa Microsoft.MachineLearningServices/workspaces/datasets, aggiungere il modello Bicep seguente.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
name: 'string'
parent: resourceSymbolicName
datasetType: 'string'
parameters: {
header: 'string'
includePath: bool
partitionFormat: 'string'
path: {
dataPath: {
datastoreName: 'string'
relativePath: 'string'
}
httpUrl: 'string'
}
query: {
datastoreName: 'string'
query: 'string'
}
separator: 'string'
sourceType: 'string'
}
registration: {
description: 'string'
name: 'string'
tags: {}
}
skipValidation: bool
timeSeries: {
coarseGrainTimestamp: 'string'
fineGrainTimestamp: 'string'
}
}
Valori delle proprietà
aree di lavoro/set di dati
Nome | Descrizione | valore |
---|---|---|
name | Nome della risorsa Vedere come impostare nomi e tipi per le risorse figlio in Bicep. |
stringa (obbligatoria) |
padre | In Bicep è possibile specificare la risorsa padre per una risorsa figlio. È necessario aggiungere questa proprietà solo quando la risorsa figlio viene dichiarata all'esterno della risorsa padre. Per altre informazioni, vedere Risorsa figlio esterna alla risorsa padre. |
Nome simbolico per la risorsa di tipo: aree di lavoro |
set di datiType | Specifica il tipo di set di dati. | 'file' 'tabulare' (obbligatorio) |
parametri | Set di datiCreateRequestParameters (obbligatorio) | |
registrazione | Set di datiCreateRequestRegistration (obbligatorio) | |
skipValidation | Ignorare la convalida che garantisce che i dati possano essere caricati dal set di dati prima della registrazione. | bool |
timeSeries | Set di datiCreateRequestTimeSeries |
Set di datiCreateRequestParameters
Nome | Descrizione | Valore |
---|---|---|
header | Tipo di intestazione. | 'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers' |
includePath | Boolean per mantenere le informazioni sul percorso come colonna nel set di dati. Il valore predefinito è False. Questo è utile quando si legge più file e si vuole sapere quale file ha origine un determinato record o mantenere informazioni utili nel percorso file. | bool |
partitionFormat | Le informazioni di partizione di ogni percorso verranno estratte in colonne in base al formato specificato. La parte di formato '{column_name}' crea una colonna stringa e '{column_name:y/MM/dd/HH/mm/ss}' crea una colonna datetime, dove 'y', 'MM', 'dd', 'HH', 'mm' e 'ss' vengono usati per estrarre anno, mese, giorno, ora e secondo per il tipo datetime. Il formato deve iniziare dalla posizione della prima chiave di partizione fino alla fine del percorso del file. Ad esempio, dato il percorso '.. /USA/2019/01/01/data.parquet' dove la partizione è per paese/area geografica e ora, partition_format='/{CountryOrRegion}/{PartitionDate:yy/MM/dd}/data.csv' crea una colonna stringa 'CountryOrRegion' con il valore 'USA' e una colonna datetime 'PartitionDate' con il valore '2019-01-01 | string |
path | Set di datiCreateRequestParametersPath | |
query | Set di datiCreateRequestParametersQuery | |
separator | Separatore usato per suddividere le colonne per il tipo di origine 'delimited_files'. | string |
sourceType | Tipo di origine dati. | 'delimited_files' 'json_lines_files' 'parquet_files' |
Set di datiCreateRequestParametersPath
Nome | Descrizione | Valore |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | URL Http. | string |
DatasetCreateRequestParametersPathDataPath
Nome | Descrizione | Valore |
---|---|---|
datastoreName | Nome dell'archivio dati. | string |
relativePath | Percorso all'interno dell'archivio dati. | string |
Set di datiCreateRequestParametersQuery
Nome | Descrizione | Valore |
---|---|---|
datastoreName | Nome dell'archivio dati SQL/PostgreSQL/MySQL. | string |
query | SQL Quey. | string |
DatasetCreateRequestRegistration
Nome | Descrizione | Valore |
---|---|---|
description | Descrizione del set di dati. | string |
name | Nome del set di dati. | string |
tags | Tag associati al set di dati. | object |
DatasetCreateRequestTimeSeries
Nome | Descrizione | Valore |
---|---|---|
grossolanaGrainTimestamp | Nome di colonna da utilizzare come CoarseGrainTimestamp. Può essere usato solo se 'fineGrainTimestamp' è specificato e non può essere uguale a 'fineGrainTimestamp'. | string |
fineGrainTimestamp | Nome colonna da usare come FineGrainTimestamp | string |
Modelli di avvio rapido
I modelli di avvio rapido seguenti distribuiscono questo tipo di risorsa.
Modello | Descrizione |
---|---|
Creare un set di dati di file dal percorso relativo nell'archivio dati |
Questo modello crea un set di dati di file dal percorso relativo nell'archivio dati nell'area di lavoro di Azure Machine Learning. |
Creare un set di dati file nell'area di lavoro AML dall'URL Web |
Questo modello crea un set di dati di file dall'URL Web nell'area di lavoro di Azure Machine Learning. |
Creare un set di dati tabulare dal percorso relativo nell'archivio dati |
Questo modello crea un set di dati tabulare dal percorso relativo nell'archivio dati nell'area di lavoro di Azure Machine Learning. |
Creare un set di dati tabulare da SQL/PostgreSQL/Archivio dati MySQL |
Questo modello crea un set di dati tabulare dalla query SQL nell'archivio dati SQL/PostgreSQL/MySQL nell'area di lavoro di Azure Machine Learning. |
Creare un set di dati tabulare nell'area di lavoro AML dall'URL Web |
Questo modello crea un set di dati tabulare dall'URL Web nell'area di lavoro di Azure Machine Learning. |
Creare un'area di lavoro AML con più set di dati & archivi dati |
Questo modello crea un'area di lavoro di Azure Machine Learning con più set di dati & archivi dati. |
Definizione di risorsa del modello di Resource Manager
Il tipo di risorsa aree di lavoro/set di dati può essere distribuito con operazioni destinate:
- Gruppi di risorse - Vedere i comandi di distribuzione dei gruppi di risorse
Per un elenco delle proprietà modificate in ogni versione dell'API, vedere Log delle modifiche.
Formato di risorsa
Per creare una risorsa Microsoft.MachineLearningServices/workspaces/datasets, aggiungere il codice JSON seguente al modello.
{
"type": "Microsoft.MachineLearningServices/workspaces/datasets",
"apiVersion": "2020-05-01-preview",
"name": "string",
"datasetType": "string",
"parameters": {
"header": "string",
"includePath": "bool",
"partitionFormat": "string",
"path": {
"dataPath": {
"datastoreName": "string",
"relativePath": "string"
},
"httpUrl": "string"
},
"query": {
"datastoreName": "string",
"query": "string"
},
"separator": "string",
"sourceType": "string"
},
"registration": {
"description": "string",
"name": "string",
"tags": {}
},
"skipValidation": "bool",
"timeSeries": {
"coarseGrainTimestamp": "string",
"fineGrainTimestamp": "string"
}
}
Valori delle proprietà
aree di lavoro/set di dati
Nome | Descrizione | Valore |
---|---|---|
tipo | Tipo di risorsa | 'Microsoft.MachineLearningServices/workspaces/datasets' |
apiVersion | Versione dell'API della risorsa | '2020-05-01-preview' |
name | Nome della risorsa Informazioni su come impostare nomi e tipi per le risorse figlio nei modelli di Resource Manager JSON. |
stringa (obbligatorio) |
datasetType | Specifica il tipo di set di dati. | 'file' 'tabular' (obbligatorio) |
parametri | DatasetCreateRequestParameters (obbligatorio) | |
registrazione | DatasetCreateRequestRegistration (obbligatorio) | |
skipValidation | Ignorare la convalida che garantisce che i dati possano essere caricati dal set di dati prima della registrazione. | bool |
timeSeries | DatasetCreateRequestTimeSeries |
DatasetCreateRequestParameters
Nome | Descrizione | Valore |
---|---|---|
header | Tipo di intestazione. | 'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers' |
includePath | Valore booleano per mantenere le informazioni sul percorso come colonna nel set di dati. Il valore predefinito è False. Ciò è utile quando si leggono più file e si vuole sapere da quale file proviene un determinato record o per mantenere informazioni utili nel percorso del file. | bool |
partitionFormat | Le informazioni sulla partizione di ogni percorso verranno estratte in colonne in base al formato specificato. La parte di formato '{column_name}' crea una colonna stringa e '{column_name:a/MM/dd/HH/mm/ss}' crea una colonna datetime, dove 'aaaa', 'MM', 'dd', 'HH', 'mm' e 'ss' vengono usati per estrarre anno, mese, giorno, ora, minuto e secondo per il tipo datetime. Il formato deve iniziare dalla posizione della prima chiave di partizione fino alla fine del percorso del file. Ad esempio, dato il percorso '.. /USA/2019/01/01/data.parquet' dove la partizione è per paese/area geografica e ora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una colonna stringa 'CountryOrRegion' con il valore 'USA' e una colonna datetime 'PartitionDate' con il valore '2019-01-01 | string |
path | DatasetCreateRequestParametersPath | |
query | DatasetCreateRequestParametersQuery | |
separator | Separatore utilizzato per dividere le colonne per sourceType 'delimited_files'. | string |
sourceType | Tipo di origine dati. | 'delimited_files' 'json_lines_files' 'parquet_files' |
DatasetCreateRequestParametersPath
Nome | Descrizione | Valore |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | URL HTTP. | string |
DatasetCreateRequestParametersPathDataPath
Nome | Descrizione | Valore |
---|---|---|
datastoreName | Nome dell'archivio dati. | string |
relativePath | Percorso all'interno dell'archivio dati. | string |
DatasetCreateRequestParametersQuery
Nome | Descrizione | Valore |
---|---|---|
datastoreName | Nome dell'archivio dati SQL/PostgreSQL/MySQL. | string |
query | SQL Quey. | string |
DatasetCreateRequestRegistration
Nome | Descrizione | Valore |
---|---|---|
description | Descrizione del set di dati. | string |
name | Nome del set di dati. | string |
tags | Tag associati al set di dati. | object |
DatasetCreateRequestTimeSeries
Nome | Descrizione | Valore |
---|---|---|
grossolanaGrainTimestamp | Nome di colonna da utilizzare come CoarseGrainTimestamp. Può essere usato solo se 'fineGrainTimestamp' è specificato e non può essere uguale a 'fineGrainTimestamp'. | string |
fineGrainTimestamp | Nome colonna da usare come FineGrainTimestamp | string |
Modelli di avvio rapido
I modelli di avvio rapido seguenti distribuiscono questo tipo di risorsa.
Modello | Descrizione |
---|---|
Creare un set di dati di file dal percorso relativo nell'archivio dati |
Questo modello crea un set di dati di file dal percorso relativo nell'archivio dati nell'area di lavoro di Azure Machine Learning. |
Creare un set di dati file nell'area di lavoro AML dall'URL Web |
Questo modello crea un set di dati di file dall'URL Web nell'area di lavoro di Azure Machine Learning. |
Creare un set di dati tabulare dal percorso relativo nell'archivio dati |
Questo modello crea un set di dati tabulare dal percorso relativo nell'archivio dati nell'area di lavoro di Azure Machine Learning. |
Creare un set di dati tabulare da SQL/PostgreSQL/Archivio dati MySQL |
Questo modello crea un set di dati tabulare dalla query SQL nell'archivio dati SQL/PostgreSQL/MySQL nell'area di lavoro di Azure Machine Learning. |
Creare un set di dati tabulare nell'area di lavoro AML dall'URL Web |
Questo modello crea un set di dati tabulare dall'URL Web nell'area di lavoro di Azure Machine Learning. |
Creare un'area di lavoro AML con più set di dati & archivi dati |
Questo modello crea un'area di lavoro di Azure Machine Learning con più set di dati & archivi dati. |
Definizione della risorsa Terraform (provider AzAPI)
Il tipo di risorsa aree di lavoro/set di dati può essere distribuito con operazioni destinate:
- Gruppi di risorse
Per un elenco delle proprietà modificate in ogni versione dell'API, vedere Log delle modifiche.
Formato di risorsa
Per creare una risorsa Microsoft.MachineLearningServices/workspaces/datasets, aggiungere il codice Terraform seguente al modello.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name = "string"
parent_id = "string"
body = jsonencode({
datasetType = "string"
parameters = {
header = "string"
includePath = bool
partitionFormat = "string"
path = {
dataPath = {
datastoreName = "string"
relativePath = "string"
}
httpUrl = "string"
}
query = {
datastoreName = "string"
query = "string"
}
separator = "string"
sourceType = "string"
}
registration = {
description = "string"
name = "string"
tags = {}
}
skipValidation = bool
timeSeries = {
coarseGrainTimestamp = "string"
fineGrainTimestamp = "string"
}
})
}
Valori delle proprietà
aree di lavoro/set di dati
Nome | Descrizione | Valore |
---|---|---|
tipo | Tipo di risorsa | "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview" |
name | Nome della risorsa | stringa (obbligatorio) |
parent_id | ID della risorsa padre per questa risorsa. | ID per la risorsa di tipo: aree di lavoro |
datasetType | Specifica il tipo di set di dati. | "file" "tabulare" (obbligatorio) |
parametri | DatasetCreateRequestParameters (obbligatorio) | |
registrazione | DatasetCreateRequestRegistration (obbligatorio) | |
skipValidation | Ignorare la convalida che garantisce che i dati possano essere caricati dal set di dati prima della registrazione. | bool |
timeSeries | DatasetCreateRequestTimeSeries |
DatasetCreateRequestParameters
Nome | Descrizione | Valore |
---|---|---|
header | Tipo di intestazione. | "all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers" |
includePath | Valore booleano per mantenere le informazioni sul percorso come colonna nel set di dati. Il valore predefinito è False. Ciò è utile quando si leggono più file e si vuole sapere da quale file proviene un determinato record o per mantenere informazioni utili nel percorso del file. | bool |
partitionFormat | Le informazioni sulla partizione di ogni percorso verranno estratte in colonne in base al formato specificato. La parte di formato '{column_name}' crea una colonna stringa e '{column_name:a/MM/dd/HH/mm/ss}' crea una colonna datetime, dove 'aaaa', 'MM', 'dd', 'HH', 'mm' e 'ss' vengono usati per estrarre anno, mese, giorno, ora, minuto e secondo per il tipo datetime. Il formato deve iniziare dalla posizione della prima chiave di partizione fino alla fine del percorso del file. Ad esempio, dato il percorso '.. /USA/2019/01/01/data.parquet' dove la partizione è per paese/area geografica e ora, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' crea una colonna stringa 'CountryOrRegion' con il valore 'USA' e una colonna datetime 'PartitionDate' con il valore '2019-01-01 | string |
path | DatasetCreateRequestParametersPath | |
query | DatasetCreateRequestParametersQuery | |
separator | Separatore utilizzato per dividere le colonne per sourceType 'delimited_files'. | string |
sourceType | Tipo di origine dati. | "delimited_files" "json_lines_files" "parquet_files" |
DatasetCreateRequestParametersPath
Nome | Descrizione | Valore |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | URL HTTP. | string |
DatasetCreateRequestParametersPathDataPath
Nome | Descrizione | Valore |
---|---|---|
datastoreName | Nome dell'archivio dati. | string |
relativePath | Percorso all'interno dell'archivio dati. | string |
DatasetCreateRequestParametersQuery
Nome | Descrizione | Valore |
---|---|---|
datastoreName | Nome dell'archivio dati SQL/PostgreSQL/MySQL. | string |
query | SQL Quey. | string |
DatasetCreateRequestRegistration
Nome | Descrizione | Valore |
---|---|---|
description | Descrizione del set di dati. | string |
name | Nome del set di dati. | string |
tags | Tag associati al set di dati. | object |
DatasetCreateRequestTimeSeries
Nome | Descrizione | Valore |
---|---|---|
grossolanaGrainTimestamp | Nome di colonna da usare come GrossaGrainTimestamp. Può essere usato solo se 'fineGrainTimestamp' è specificato e non può essere uguale a 'fineGrainTimestamp'. | string |
fineGrainTimestamp | Nome colonna da usare come FineGrainTimestamp | string |
Commenti e suggerimenti
https://aka.ms/ContentUserFeedback.
Presto disponibile: Nel corso del 2024 verranno gradualmente disattivati i problemi di GitHub come meccanismo di feedback per il contenuto e ciò verrà sostituito con un nuovo sistema di feedback. Per altre informazioni, vedereInvia e visualizza il feedback per