Espaces de travail/jeux de données Microsoft.MachineLearningServices 2020-05-01-preview
Définition de ressource Bicep
Le type de ressource espaces de travail/jeux de données peut être déployé avec des opérations qui ciblent :
- Groupes de ressources - Voir commandes de déploiement de groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.
Format des ressources
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/datasets, ajoutez le Bicep suivant à votre modèle.
resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
name: 'string'
parent: resourceSymbolicName
datasetType: 'string'
parameters: {
header: 'string'
includePath: bool
partitionFormat: 'string'
path: {
dataPath: {
datastoreName: 'string'
relativePath: 'string'
}
httpUrl: 'string'
}
query: {
datastoreName: 'string'
query: 'string'
}
separator: 'string'
sourceType: 'string'
}
registration: {
description: 'string'
name: 'string'
tags: {
{customized property}: 'string'
}
}
skipValidation: bool
timeSeries: {
coarseGrainTimestamp: 'string'
fineGrainTimestamp: 'string'
}
}
Valeurs de propriétés
espaces de travail/jeux de données
Nom | Description | Valeur |
---|---|---|
name | Nom de la ressource Découvrez comment définir des noms et des types pour des ressources enfants dans Bicep. |
chaîne (obligatoire) |
parent | Dans Bicep, vous pouvez spécifier la ressource parente pour une ressource enfant. Vous devez uniquement ajouter cette propriété lorsque la ressource enfant est déclarée en dehors de la ressource parente. Pour plus d’informations, consultez Ressource enfant en dehors de la ressource parente. |
Nom symbolique de la ressource de type : espaces de travail |
datasetType | Spécifie le type de jeu de données. | 'file' 'tabulaire' (obligatoire) |
parameters | DatasetCreateRequestParameters (obligatoire) | |
inscription | DatasetCreateRequestRegistration (obligatoire) | |
skipValidation | Ignorez la validation qui garantit que les données peuvent être chargées à partir du jeu de données avant l’inscription. | bool |
timeSeries | DatasetCreateRequestTimeSeries |
DatasetCreateRequestParameters
Nom | Description | Valeur |
---|---|---|
en-tête | Type d’en-tête. | 'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers' |
includePath | Booléen pour conserver les informations de chemin d’accès sous forme de colonne dans le jeu de données. Valeur par défaut False. Cela est utile lors de la lecture de plusieurs fichiers et que vous souhaitez savoir de quel fichier provient un enregistrement particulier ou pour conserver des informations utiles dans le chemin du fichier. | bool |
partitionFormat | Les informations de partition de chaque chemin sont extraites en colonnes en fonction du format spécifié. La partie de format « {column_name} » crée une colonne de chaîne, et « {column_name:yyyy/MM/dd/HH/mm/ss} » crée une colonne DateHeure, où « yyyy », « MM », « dd », « HH », « mm » et « ss » sont utilisés pour extraire l’année, le mois, le jour, l’heure, les minutes et les secondes pour le type DateHeure. Le format doit commencer à partir de la position de la première clé de partition et se poursuivre jusqu’à la fin du chemin d’accès au fichier. Par exemple, étant donné le chemin d’accès '.. /USA/2019/01/01/data.parquet' où la partition est par pays/région et heure, partition_format='/{CountryOrRegion}/{PartitionDate :yyyy/MM/dd}/data.csv' crée une colonne de chaîne 'CountryOrRegion' avec la valeur 'USA' et une colonne datetime 'PartitionDate' avec la valeur '2019-01-01 | string |
path | DatasetCreateRequestParametersPath | |
query | DatasetCreateRequestParametersQuery | |
separator | Séparateur utilisé pour fractionner les colonnes pour « delimited_files » sourceType. | string |
sourceType | Type de source de données. | 'delimited_files' 'json_lines_files' 'parquet_files' |
DatasetCreateRequestParametersPath
Nom | Description | Valeur |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | URL Http. | string |
DatasetCreateRequestParametersPathDataPath
Nom | Description | Valeur |
---|---|---|
datastoreName | Nom du magasin de données. | string |
relativePath | Chemin d’accès dans le magasin de données. | string |
DatasetCreateRequestParametersQuery
Nom | Description | Valeur |
---|---|---|
datastoreName | Nom du magasin de données SQL/PostgreSQL/MySQL. | string |
query | SQL Quey. | string |
DatasetCreateRequestRegistration
Nom | Description | Valeur |
---|---|---|
description | Description du jeu de données. | string |
name | Le nom du dataset. | string |
tags | Balises associées au jeu de données. | object |
DatasetCreateRequestTimeSeries
Nom | Description | Valeur |
---|---|---|
coarseGrainTimestamp | Nom de colonne à utiliser comme CoarseGrainTimestamp. Ne peut être utilisé que si « fineGrainTimestamp » est spécifié et ne peut pas être identique à « fineGrainTimestamp ». | string |
fineGrainTimestamp | Nom de colonne à utiliser comme FineGrainTimestamp | string |
Modèles de démarrage rapide
Les modèles de démarrage rapide suivants déploient ce type de ressource.
Modèle | Description |
---|---|
Créer un jeu de données de fichiers à partir du chemin relatif dans le magasin de données |
Ce modèle crée un jeu de données de fichier à partir du chemin relatif dans le magasin de données dans l’espace de travail Azure Machine Learning. |
Créer un jeu de données de fichier dans l’espace de travail AML à partir d’une URL web |
Ce modèle crée un jeu de données de fichier à partir de l’URL web dans l’espace de travail Azure Machine Learning. |
Créer un jeu de données tabulaire à partir du chemin relatif dans le magasin de données |
Ce modèle crée un jeu de données tabulaire à partir du chemin relatif dans le magasin de données dans l’espace de travail Azure Machine Learning. |
Créer un jeu de données tabulaire à partir du magasin de données SQL/PostgreSQL/MySQL |
Ce modèle crée un jeu de données tabulaire à partir d’une requête SQL dans le magasin de données SQL/PostgreSQL/MySQL dans l’espace de travail Azure Machine Learning. |
Créer un jeu de données tabulaire dans l’espace de travail AML à partir d’une URL web |
Ce modèle crée un jeu de données tabulaire à partir de l’URL web dans l’espace de travail Azure Machine Learning. |
Créer un espace de travail AML avec plusieurs jeux de données & magasins de données |
Ce modèle crée un espace de travail Azure Machine Learning avec plusieurs jeux de données & magasins de données. |
Définition de ressources de modèle ARM
Le type de ressource espaces de travail/jeux de données peut être déployé avec des opérations qui ciblent :
- Groupes de ressources - Voir commandes de déploiement de groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.
Format des ressources
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/datasets, ajoutez le code JSON suivant à votre modèle.
{
"type": "Microsoft.MachineLearningServices/workspaces/datasets",
"apiVersion": "2020-05-01-preview",
"name": "string",
"datasetType": "string",
"parameters": {
"header": "string",
"includePath": "bool",
"partitionFormat": "string",
"path": {
"dataPath": {
"datastoreName": "string",
"relativePath": "string"
},
"httpUrl": "string"
},
"query": {
"datastoreName": "string",
"query": "string"
},
"separator": "string",
"sourceType": "string"
},
"registration": {
"description": "string",
"name": "string",
"tags": {
"{customized property}": "string"
}
},
"skipValidation": "bool",
"timeSeries": {
"coarseGrainTimestamp": "string",
"fineGrainTimestamp": "string"
}
}
Valeurs de propriétés
espaces de travail/jeux de données
Nom | Description | Valeur |
---|---|---|
type | Type de ressource | « Microsoft.MachineLearningServices/workspaces/datasets » |
apiVersion | Version de l’API de ressource | « 2020-05-01-preview » |
name | Nom de la ressource Découvrez comment définir des noms et des types pour des ressources enfants dans des modèles ARM JSON. |
chaîne (obligatoire) |
datasetType | Spécifie le type de jeu de données. | 'file' 'tabulaire' (obligatoire) |
parameters | DatasetCreateRequestParameters (obligatoire) | |
inscription | DatasetCreateRequestRegistration (obligatoire) | |
skipValidation | Ignorez la validation qui garantit que les données peuvent être chargées à partir du jeu de données avant l’inscription. | bool |
timeSeries | DatasetCreateRequestTimeSeries |
DatasetCreateRequestParameters
Nom | Description | Valeur |
---|---|---|
en-tête | Type d’en-tête. | 'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers' |
includePath | Booléen pour conserver les informations de chemin d’accès sous forme de colonne dans le jeu de données. Valeur par défaut False. Cela est utile lors de la lecture de plusieurs fichiers et que vous souhaitez savoir de quel fichier provient un enregistrement particulier ou pour conserver des informations utiles dans le chemin du fichier. | bool |
partitionFormat | Les informations de partition de chaque chemin sont extraites en colonnes en fonction du format spécifié. La partie de format « {column_name} » crée une colonne de chaîne, et « {column_name:yyyy/MM/dd/HH/mm/ss} » crée une colonne DateHeure, où « yyyy », « MM », « dd », « HH », « mm » et « ss » sont utilisés pour extraire l’année, le mois, le jour, l’heure, les minutes et les secondes pour le type DateHeure. Le format doit commencer à partir de la position de la première clé de partition et se poursuivre jusqu’à la fin du chemin d’accès au fichier. Par exemple, étant donné le chemin '.. /USA/2019/01/01/data.parquet' où la partition est par pays/région et heure, partition_format='/{CountryOrRegion}/{PartitionDate :yyyy/MM/dd}/data.csv' crée une colonne de chaîne 'CountryOrRegion' avec la valeur 'USA' et une colonne datetime 'PartitionDate' avec la valeur '2019-01-01-01 | string |
path | DatasetCreateRequestParametersPath | |
query | DatasetCreateRequestParametersQuery | |
separator | Séparateur utilisé pour fractionner les colonnes pour « delimited_files » sourceType. | string |
sourceType | Type de source de données. | 'delimited_files' 'json_lines_files' 'parquet_files' |
DatasetCreateRequestParametersPath
Nom | Description | Valeur |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | URL HTTP. | string |
DatasetCreateRequestParametersPathDataPath
Nom | Description | Valeur |
---|---|---|
datastoreName | Nom du magasin de données. | string |
relativePath | Chemin dans le magasin de données. | string |
DatasetCreateRequestParametersQuery
Nom | Description | Valeur |
---|---|---|
datastoreName | Nom du magasin de données SQL/PostgreSQL/MySQL. | string |
query | SQL Quey. | string |
DatasetCreateRequestRegistration
Nom | Description | Valeur |
---|---|---|
description | Description du jeu de données. | string |
name | Le nom du dataset. | string |
tags | Balises associées au jeu de données. | object |
DatasetCreateRequestTimeSeries
Nom | Description | Valeur |
---|---|---|
coarseGrainTimestamp | Nom de colonne à utiliser en tant que CoarseGrainTimestamp. Ne peut être utilisé que si « fineGrainTimestamp » est spécifié et ne peut pas être identique à « fineGrainTimestamp ». | string |
fineGrainTimestamp | Nom de colonne à utiliser comme FineGrainTimestamp | string |
Modèles de démarrage rapide
Les modèles de démarrage rapide suivants déploient ce type de ressource.
Modèle | Description |
---|---|
Créer un jeu de données de fichier à partir du chemin relatif dans le magasin de données |
Ce modèle crée un jeu de données de fichier à partir du chemin relatif dans le magasin de données dans l’espace de travail Azure Machine Learning. |
Créer un jeu de données de fichier dans l’espace de travail AML à partir d’une URL web |
Ce modèle crée un jeu de données de fichier à partir de l’URL web dans l’espace de travail Azure Machine Learning. |
Créer un jeu de données tabulaire à partir du chemin relatif dans le magasin de données |
Ce modèle crée un jeu de données tabulaire à partir du chemin relatif dans le magasin de données dans l’espace de travail Azure Machine Learning. |
Créer un jeu de données tabulaire à partir d’un magasin de données SQL/PostgreSQL/MySQL |
Ce modèle crée un jeu de données tabulaire à partir d’une requête SQL dans le magasin de données SQL/PostgreSQL/MySQL dans l’espace de travail Azure Machine Learning. |
Créer un jeu de données tabulaire dans l’espace de travail AML à partir d’une URL web |
Ce modèle crée un jeu de données tabulaire à partir de l’URL web dans l’espace de travail Azure Machine Learning. |
Créer un espace de travail AML avec plusieurs jeux de données & magasins de données |
Ce modèle crée un espace de travail Azure Machine Learning avec plusieurs jeux de données & magasins de données. |
Définition de ressource Terraform (fournisseur AzAPI)
Le type de ressource workspaces/datasets peut être déployé avec des opérations qui ciblent :
- Groupes de ressources
Pour obtenir la liste des propriétés modifiées dans chaque version d’API, consultez journal des modifications.
Format des ressources
Pour créer une ressource Microsoft.MachineLearningServices/workspaces/datasets, ajoutez le Terraform suivant à votre modèle.
resource "azapi_resource" "symbolicname" {
type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name = "string"
parent_id = "string"
body = jsonencode({
datasetType = "string"
parameters = {
header = "string"
includePath = bool
partitionFormat = "string"
path = {
dataPath = {
datastoreName = "string"
relativePath = "string"
}
httpUrl = "string"
}
query = {
datastoreName = "string"
query = "string"
}
separator = "string"
sourceType = "string"
}
registration = {
description = "string"
name = "string"
tags = {
{customized property} = "string"
}
}
skipValidation = bool
timeSeries = {
coarseGrainTimestamp = "string"
fineGrainTimestamp = "string"
}
})
}
Valeurs de propriétés
workspaces/datasets
Nom | Description | Valeur |
---|---|---|
type | Type de ressource | « Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview » |
name | Nom de la ressource | string (obligatoire) |
parent_id | ID de la ressource qui est le parent de cette ressource. | ID pour la ressource de type : espaces de travail |
datasetType | Spécifie le type de jeu de données. | « file » « tabulaire » (obligatoire) |
parameters | DatasetCreateRequestParameters (obligatoire) | |
inscription | DatasetCreateRequestRegistration (obligatoire) | |
skipValidation | Ignorez la validation qui garantit que les données peuvent être chargées à partir du jeu de données avant l’inscription. | bool |
timeSeries | DatasetCreateRequestTimeSeries |
DatasetCreateRequestParameters
Nom | Description | Valeur |
---|---|---|
en-tête | Type d’en-tête. | « all_files_have_same_headers » « combine_all_files_headers » « no_headers » « only_first_file_has_headers » |
includePath | Booléen pour conserver les informations de chemin d’accès sous forme de colonne dans le jeu de données. Valeur par défaut False. Cela est utile lors de la lecture de plusieurs fichiers et que vous souhaitez savoir de quel fichier provient un enregistrement particulier ou pour conserver des informations utiles dans le chemin du fichier. | bool |
partitionFormat | Les informations de partition de chaque chemin sont extraites en colonnes en fonction du format spécifié. La partie de format « {column_name} » crée une colonne de chaîne, et « {column_name:yyyy/MM/dd/HH/mm/ss} » crée une colonne DateHeure, où « yyyy », « MM », « dd », « HH », « mm » et « ss » sont utilisés pour extraire l’année, le mois, le jour, l’heure, les minutes et les secondes pour le type DateHeure. Le format doit commencer à partir de la position de la première clé de partition et se poursuivre jusqu’à la fin du chemin d’accès au fichier. Par exemple, étant donné le chemin '.. /USA/2019/01/01/data.parquet' où la partition est par pays/région et heure, partition_format='/{CountryOrRegion}/{PartitionDate :yyyy/MM/dd}/data.csv' crée une colonne de chaîne 'CountryOrRegion' avec la valeur 'USA' et une colonne datetime 'PartitionDate' avec la valeur '2019-01-01-01 | string |
path | DatasetCreateRequestParametersPath | |
query | DatasetCreateRequestParametersQuery | |
separator | Séparateur utilisé pour fractionner les colonnes pour « delimited_files » sourceType. | string |
sourceType | Type de source de données. | « delimited_files » « json_lines_files » « parquet_files » |
DatasetCreateRequestParametersPath
Nom | Description | Valeur |
---|---|---|
dataPath | DatasetCreateRequestParametersPathDataPath | |
httpUrl | URL HTTP. | string |
DatasetCreateRequestParametersPathDataPath
Nom | Description | Valeur |
---|---|---|
datastoreName | Nom du magasin de données. | string |
relativePath | Chemin dans le magasin de données. | string |
DatasetCreateRequestParametersQuery
Nom | Description | Valeur |
---|---|---|
datastoreName | Nom du magasin de données SQL/PostgreSQL/MySQL. | string |
query | SQL Quey. | string |
DatasetCreateRequestRegistration
Nom | Description | Valeur |
---|---|---|
description | Description du jeu de données. | string |
name | Le nom du dataset. | string |
tags | Balises associées au jeu de données. | object |
DatasetCreateRequestTimeSeries
Nom | Description | Valeur |
---|---|---|
coarseGrainTimestamp | Nom de colonne à utiliser en tant que CoarseGrainTimestamp. Ne peut être utilisé que si « fineGrainTimestamp » est spécifié et ne peut pas être identique à « fineGrainTimestamp ». | string |
fineGrainTimestamp | Nom de colonne à utiliser comme FineGrainTimestamp | string |
Commentaires
https://aka.ms/ContentUserFeedback.
Bientôt disponible : Tout au long de 2024, nous allons supprimer progressivement GitHub Issues comme mécanisme de commentaires pour le contenu et le remplacer par un nouveau système de commentaires. Pour plus d’informations, consultezEnvoyer et afficher des commentaires pour