Espaces de travail/jeux de données Microsoft.MachineLearningServices 2020-05-01-preview

Définition de ressource Bicep

Le type de ressource espaces de travail/jeux de données peut être déployé avec des opérations qui ciblent :

Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.

Format des ressources

Pour créer une ressource Microsoft.MachineLearningServices/workspaces/datasets, ajoutez le Bicep suivant à votre modèle.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  name: 'string'
  parent: resourceSymbolicName
  datasetType: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {
      {customized property}: 'string'
    }
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Valeurs de propriétés

espaces de travail/jeux de données

Nom Description Valeur
name Nom de la ressource

Découvrez comment définir des noms et des types pour des ressources enfants dans Bicep.
chaîne (obligatoire)
parent Dans Bicep, vous pouvez spécifier la ressource parente pour une ressource enfant. Vous devez uniquement ajouter cette propriété lorsque la ressource enfant est déclarée en dehors de la ressource parente.

Pour plus d’informations, consultez Ressource enfant en dehors de la ressource parente.
Nom symbolique de la ressource de type : espaces de travail
datasetType Spécifie le type de jeu de données. 'file'
'tabulaire' (obligatoire)
parameters DatasetCreateRequestParameters (obligatoire)
inscription DatasetCreateRequestRegistration (obligatoire)
skipValidation Ignorez la validation qui garantit que les données peuvent être chargées à partir du jeu de données avant l’inscription. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nom Description Valeur
en-tête Type d’en-tête. 'all_files_have_same_headers'
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath Booléen pour conserver les informations de chemin d’accès sous forme de colonne dans le jeu de données. Valeur par défaut False. Cela est utile lors de la lecture de plusieurs fichiers et que vous souhaitez savoir de quel fichier provient un enregistrement particulier ou pour conserver des informations utiles dans le chemin du fichier. bool
partitionFormat Les informations de partition de chaque chemin sont extraites en colonnes en fonction du format spécifié. La partie de format « {column_name} » crée une colonne de chaîne, et « {column_name:yyyy/MM/dd/HH/mm/ss} » crée une colonne DateHeure, où « yyyy », « MM », « dd », « HH », « mm » et « ss » sont utilisés pour extraire l’année, le mois, le jour, l’heure, les minutes et les secondes pour le type DateHeure. Le format doit commencer à partir de la position de la première clé de partition et se poursuivre jusqu’à la fin du chemin d’accès au fichier. Par exemple, étant donné le chemin d’accès '.. /USA/2019/01/01/data.parquet' où la partition est par pays/région et heure, partition_format='/{CountryOrRegion}/{PartitionDate :yyyy/MM/dd}/data.csv' crée une colonne de chaîne 'CountryOrRegion' avec la valeur 'USA' et une colonne datetime 'PartitionDate' avec la valeur '2019-01-01 string
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
separator Séparateur utilisé pour fractionner les colonnes pour « delimited_files » sourceType. string
sourceType Type de source de données. 'delimited_files'
'json_lines_files'
'parquet_files'

DatasetCreateRequestParametersPath

Nom Description Valeur
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl URL Http. string

DatasetCreateRequestParametersPathDataPath

Nom Description Valeur
datastoreName Nom du magasin de données. string
relativePath Chemin d’accès dans le magasin de données. string

DatasetCreateRequestParametersQuery

Nom Description Valeur
datastoreName Nom du magasin de données SQL/PostgreSQL/MySQL. string
query SQL Quey. string

DatasetCreateRequestRegistration

Nom Description Valeur
description Description du jeu de données. string
name Le nom du dataset. string
tags Balises associées au jeu de données. object

DatasetCreateRequestTimeSeries

Nom Description Valeur
coarseGrainTimestamp Nom de colonne à utiliser comme CoarseGrainTimestamp. Ne peut être utilisé que si « fineGrainTimestamp » est spécifié et ne peut pas être identique à « fineGrainTimestamp ». string
fineGrainTimestamp Nom de colonne à utiliser comme FineGrainTimestamp string

Modèles de démarrage rapide

Les modèles de démarrage rapide suivants déploient ce type de ressource.

Modèle Description
Créer un jeu de données de fichiers à partir du chemin relatif dans le magasin de données

Déployer sur Azure
Ce modèle crée un jeu de données de fichier à partir du chemin relatif dans le magasin de données dans l’espace de travail Azure Machine Learning.
Créer un jeu de données de fichier dans l’espace de travail AML à partir d’une URL web

Déployer sur Azure
Ce modèle crée un jeu de données de fichier à partir de l’URL web dans l’espace de travail Azure Machine Learning.
Créer un jeu de données tabulaire à partir du chemin relatif dans le magasin de données

Déployer sur Azure
Ce modèle crée un jeu de données tabulaire à partir du chemin relatif dans le magasin de données dans l’espace de travail Azure Machine Learning.
Créer un jeu de données tabulaire à partir du magasin de données SQL/PostgreSQL/MySQL

Déployer sur Azure
Ce modèle crée un jeu de données tabulaire à partir d’une requête SQL dans le magasin de données SQL/PostgreSQL/MySQL dans l’espace de travail Azure Machine Learning.
Créer un jeu de données tabulaire dans l’espace de travail AML à partir d’une URL web

Déployer sur Azure
Ce modèle crée un jeu de données tabulaire à partir de l’URL web dans l’espace de travail Azure Machine Learning.
Créer un espace de travail AML avec plusieurs jeux de données & magasins de données

Déployer sur Azure
Ce modèle crée un espace de travail Azure Machine Learning avec plusieurs jeux de données & magasins de données.

Définition de ressources de modèle ARM

Le type de ressource espaces de travail/jeux de données peut être déployé avec des opérations qui ciblent :

Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.

Format des ressources

Pour créer une ressource Microsoft.MachineLearningServices/workspaces/datasets, ajoutez le code JSON suivant à votre modèle.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {
      "{customized property}": "string"
    }
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Valeurs de propriétés

espaces de travail/jeux de données

Nom Description Valeur
type Type de ressource « Microsoft.MachineLearningServices/workspaces/datasets »
apiVersion Version de l’API de ressource « 2020-05-01-preview »
name Nom de la ressource

Découvrez comment définir des noms et des types pour des ressources enfants dans des modèles ARM JSON.
chaîne (obligatoire)
datasetType Spécifie le type de jeu de données. 'file'
'tabulaire' (obligatoire)
parameters DatasetCreateRequestParameters (obligatoire)
inscription DatasetCreateRequestRegistration (obligatoire)
skipValidation Ignorez la validation qui garantit que les données peuvent être chargées à partir du jeu de données avant l’inscription. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nom Description Valeur
en-tête Type d’en-tête. 'all_files_have_same_headers'
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath Booléen pour conserver les informations de chemin d’accès sous forme de colonne dans le jeu de données. Valeur par défaut False. Cela est utile lors de la lecture de plusieurs fichiers et que vous souhaitez savoir de quel fichier provient un enregistrement particulier ou pour conserver des informations utiles dans le chemin du fichier. bool
partitionFormat Les informations de partition de chaque chemin sont extraites en colonnes en fonction du format spécifié. La partie de format « {column_name} » crée une colonne de chaîne, et « {column_name:yyyy/MM/dd/HH/mm/ss} » crée une colonne DateHeure, où « yyyy », « MM », « dd », « HH », « mm » et « ss » sont utilisés pour extraire l’année, le mois, le jour, l’heure, les minutes et les secondes pour le type DateHeure. Le format doit commencer à partir de la position de la première clé de partition et se poursuivre jusqu’à la fin du chemin d’accès au fichier. Par exemple, étant donné le chemin '.. /USA/2019/01/01/data.parquet' où la partition est par pays/région et heure, partition_format='/{CountryOrRegion}/{PartitionDate :yyyy/MM/dd}/data.csv' crée une colonne de chaîne 'CountryOrRegion' avec la valeur 'USA' et une colonne datetime 'PartitionDate' avec la valeur '2019-01-01-01 string
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
separator Séparateur utilisé pour fractionner les colonnes pour « delimited_files » sourceType. string
sourceType Type de source de données. 'delimited_files'
'json_lines_files'
'parquet_files'

DatasetCreateRequestParametersPath

Nom Description Valeur
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl URL HTTP. string

DatasetCreateRequestParametersPathDataPath

Nom Description Valeur
datastoreName Nom du magasin de données. string
relativePath Chemin dans le magasin de données. string

DatasetCreateRequestParametersQuery

Nom Description Valeur
datastoreName Nom du magasin de données SQL/PostgreSQL/MySQL. string
query SQL Quey. string

DatasetCreateRequestRegistration

Nom Description Valeur
description Description du jeu de données. string
name Le nom du dataset. string
tags Balises associées au jeu de données. object

DatasetCreateRequestTimeSeries

Nom Description Valeur
coarseGrainTimestamp Nom de colonne à utiliser en tant que CoarseGrainTimestamp. Ne peut être utilisé que si « fineGrainTimestamp » est spécifié et ne peut pas être identique à « fineGrainTimestamp ». string
fineGrainTimestamp Nom de colonne à utiliser comme FineGrainTimestamp string

Modèles de démarrage rapide

Les modèles de démarrage rapide suivants déploient ce type de ressource.

Modèle Description
Créer un jeu de données de fichier à partir du chemin relatif dans le magasin de données

Déployer sur Azure
Ce modèle crée un jeu de données de fichier à partir du chemin relatif dans le magasin de données dans l’espace de travail Azure Machine Learning.
Créer un jeu de données de fichier dans l’espace de travail AML à partir d’une URL web

Déployer sur Azure
Ce modèle crée un jeu de données de fichier à partir de l’URL web dans l’espace de travail Azure Machine Learning.
Créer un jeu de données tabulaire à partir du chemin relatif dans le magasin de données

Déployer sur Azure
Ce modèle crée un jeu de données tabulaire à partir du chemin relatif dans le magasin de données dans l’espace de travail Azure Machine Learning.
Créer un jeu de données tabulaire à partir d’un magasin de données SQL/PostgreSQL/MySQL

Déployer sur Azure
Ce modèle crée un jeu de données tabulaire à partir d’une requête SQL dans le magasin de données SQL/PostgreSQL/MySQL dans l’espace de travail Azure Machine Learning.
Créer un jeu de données tabulaire dans l’espace de travail AML à partir d’une URL web

Déployer sur Azure
Ce modèle crée un jeu de données tabulaire à partir de l’URL web dans l’espace de travail Azure Machine Learning.
Créer un espace de travail AML avec plusieurs jeux de données & magasins de données

Déployer sur Azure
Ce modèle crée un espace de travail Azure Machine Learning avec plusieurs jeux de données & magasins de données.

Définition de ressource Terraform (fournisseur AzAPI)

Le type de ressource workspaces/datasets peut être déployé avec des opérations qui ciblent :

  • Groupes de ressources

Pour obtenir la liste des propriétés modifiées dans chaque version d’API, consultez journal des modifications.

Format des ressources

Pour créer une ressource Microsoft.MachineLearningServices/workspaces/datasets, ajoutez le Terraform suivant à votre modèle.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  parent_id = "string"
  body = jsonencode({
    datasetType = "string"
    parameters = {
      header = "string"
      includePath = bool
      partitionFormat = "string"
      path = {
        dataPath = {
          datastoreName = "string"
          relativePath = "string"
        }
        httpUrl = "string"
      }
      query = {
        datastoreName = "string"
        query = "string"
      }
      separator = "string"
      sourceType = "string"
    }
    registration = {
      description = "string"
      name = "string"
      tags = {
        {customized property} = "string"
      }
    }
    skipValidation = bool
    timeSeries = {
      coarseGrainTimestamp = "string"
      fineGrainTimestamp = "string"
    }
  })
}

Valeurs de propriétés

workspaces/datasets

Nom Description Valeur
type Type de ressource « Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview »
name Nom de la ressource string (obligatoire)
parent_id ID de la ressource qui est le parent de cette ressource. ID pour la ressource de type : espaces de travail
datasetType Spécifie le type de jeu de données. « file »
« tabulaire » (obligatoire)
parameters DatasetCreateRequestParameters (obligatoire)
inscription DatasetCreateRequestRegistration (obligatoire)
skipValidation Ignorez la validation qui garantit que les données peuvent être chargées à partir du jeu de données avant l’inscription. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nom Description Valeur
en-tête Type d’en-tête. « all_files_have_same_headers »
« combine_all_files_headers »
« no_headers »
« only_first_file_has_headers »
includePath Booléen pour conserver les informations de chemin d’accès sous forme de colonne dans le jeu de données. Valeur par défaut False. Cela est utile lors de la lecture de plusieurs fichiers et que vous souhaitez savoir de quel fichier provient un enregistrement particulier ou pour conserver des informations utiles dans le chemin du fichier. bool
partitionFormat Les informations de partition de chaque chemin sont extraites en colonnes en fonction du format spécifié. La partie de format « {column_name} » crée une colonne de chaîne, et « {column_name:yyyy/MM/dd/HH/mm/ss} » crée une colonne DateHeure, où « yyyy », « MM », « dd », « HH », « mm » et « ss » sont utilisés pour extraire l’année, le mois, le jour, l’heure, les minutes et les secondes pour le type DateHeure. Le format doit commencer à partir de la position de la première clé de partition et se poursuivre jusqu’à la fin du chemin d’accès au fichier. Par exemple, étant donné le chemin '.. /USA/2019/01/01/data.parquet' où la partition est par pays/région et heure, partition_format='/{CountryOrRegion}/{PartitionDate :yyyy/MM/dd}/data.csv' crée une colonne de chaîne 'CountryOrRegion' avec la valeur 'USA' et une colonne datetime 'PartitionDate' avec la valeur '2019-01-01-01 string
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
separator Séparateur utilisé pour fractionner les colonnes pour « delimited_files » sourceType. string
sourceType Type de source de données. « delimited_files »
« json_lines_files »
« parquet_files »

DatasetCreateRequestParametersPath

Nom Description Valeur
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl URL HTTP. string

DatasetCreateRequestParametersPathDataPath

Nom Description Valeur
datastoreName Nom du magasin de données. string
relativePath Chemin dans le magasin de données. string

DatasetCreateRequestParametersQuery

Nom Description Valeur
datastoreName Nom du magasin de données SQL/PostgreSQL/MySQL. string
query SQL Quey. string

DatasetCreateRequestRegistration

Nom Description Valeur
description Description du jeu de données. string
name Le nom du dataset. string
tags Balises associées au jeu de données. object

DatasetCreateRequestTimeSeries

Nom Description Valeur
coarseGrainTimestamp Nom de colonne à utiliser en tant que CoarseGrainTimestamp. Ne peut être utilisé que si « fineGrainTimestamp » est spécifié et ne peut pas être identique à « fineGrainTimestamp ». string
fineGrainTimestamp Nom de colonne à utiliser comme FineGrainTimestamp string