Espaces de travail/jeux de données Microsoft.MachineLearningServices 2020-05-01-preview

Article
01/11/2024

Définition de ressource Bicep

Le type de ressource espaces de travail/jeux de données peut être déployé avec des opérations qui ciblent :

Groupes de ressources - Voir commandes de déploiement de groupes de ressources

Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.

Format des ressources

Pour créer une ressource Microsoft.MachineLearningServices/workspaces/datasets, ajoutez le Bicep suivant à votre modèle.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  name: 'string'
  parent: resourceSymbolicName
  datasetType: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {
      {customized property}: 'string'
    }
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Valeurs de propriétés

espaces de travail/jeux de données

Nom	Description	Valeur
name	Nom de la ressource Découvrez comment définir des noms et des types pour des ressources enfants dans Bicep.	chaîne (obligatoire)
parent	Dans Bicep, vous pouvez spécifier la ressource parente pour une ressource enfant. Vous devez uniquement ajouter cette propriété lorsque la ressource enfant est déclarée en dehors de la ressource parente. Pour plus d’informations, consultez Ressource enfant en dehors de la ressource parente.	Nom symbolique de la ressource de type : espaces de travail
datasetType	Spécifie le type de jeu de données.	'file' 'tabulaire' (obligatoire)
parameters		DatasetCreateRequestParameters (obligatoire)
inscription		DatasetCreateRequestRegistration (obligatoire)
skipValidation	Ignorez la validation qui garantit que les données peuvent être chargées à partir du jeu de données avant l’inscription.	bool
timeSeries		DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nom	Description	Valeur
en-tête	Type d’en-tête.	'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers'
includePath	Booléen pour conserver les informations de chemin d’accès sous forme de colonne dans le jeu de données. Valeur par défaut False. Cela est utile lors de la lecture de plusieurs fichiers et que vous souhaitez savoir de quel fichier provient un enregistrement particulier ou pour conserver des informations utiles dans le chemin du fichier.	bool
partitionFormat	Les informations de partition de chaque chemin sont extraites en colonnes en fonction du format spécifié. La partie de format « {column_name} » crée une colonne de chaîne, et « {column_name:yyyy/MM/dd/HH/mm/ss} » crée une colonne DateHeure, où « yyyy », « MM », « dd », « HH », « mm » et « ss » sont utilisés pour extraire l’année, le mois, le jour, l’heure, les minutes et les secondes pour le type DateHeure. Le format doit commencer à partir de la position de la première clé de partition et se poursuivre jusqu’à la fin du chemin d’accès au fichier. Par exemple, étant donné le chemin d’accès '.. /USA/2019/01/01/data.parquet' où la partition est par pays/région et heure, partition_format='/{CountryOrRegion}/{PartitionDate :yyyy/MM/dd}/data.csv' crée une colonne de chaîne 'CountryOrRegion' avec la valeur 'USA' et une colonne datetime 'PartitionDate' avec la valeur '2019-01-01	string
path		DatasetCreateRequestParametersPath
query		DatasetCreateRequestParametersQuery
separator	Séparateur utilisé pour fractionner les colonnes pour « delimited_files » sourceType.	string
sourceType	Type de source de données.	'delimited_files' 'json_lines_files' 'parquet_files'

DatasetCreateRequestParametersPath

Nom	Description	Valeur
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	URL Http.	string

DatasetCreateRequestParametersPathDataPath

Nom	Description	Valeur
datastoreName	Nom du magasin de données.	string
relativePath	Chemin d’accès dans le magasin de données.	string

DatasetCreateRequestParametersQuery

Nom	Description	Valeur
datastoreName	Nom du magasin de données SQL/PostgreSQL/MySQL.	string
query	SQL Quey.	string

DatasetCreateRequestRegistration

Nom	Description	Valeur
description	Description du jeu de données.	string
name	Le nom du dataset.	string
tags	Balises associées au jeu de données.	object

DatasetCreateRequestTimeSeries

Nom	Description	Valeur
coarseGrainTimestamp	Nom de colonne à utiliser comme CoarseGrainTimestamp. Ne peut être utilisé que si « fineGrainTimestamp » est spécifié et ne peut pas être identique à « fineGrainTimestamp ».	string
fineGrainTimestamp	Nom de colonne à utiliser comme FineGrainTimestamp	string

Modèles de démarrage rapide

Les modèles de démarrage rapide suivants déploient ce type de ressource.

Modèle	Description
Créer un jeu de données de fichiers à partir du chemin relatif dans le magasin de données	Ce modèle crée un jeu de données de fichier à partir du chemin relatif dans le magasin de données dans l’espace de travail Azure Machine Learning.
Créer un jeu de données de fichier dans l’espace de travail AML à partir d’une URL web	Ce modèle crée un jeu de données de fichier à partir de l’URL web dans l’espace de travail Azure Machine Learning.
Créer un jeu de données tabulaire à partir du chemin relatif dans le magasin de données	Ce modèle crée un jeu de données tabulaire à partir du chemin relatif dans le magasin de données dans l’espace de travail Azure Machine Learning.
Créer un jeu de données tabulaire à partir du magasin de données SQL/PostgreSQL/MySQL	Ce modèle crée un jeu de données tabulaire à partir d’une requête SQL dans le magasin de données SQL/PostgreSQL/MySQL dans l’espace de travail Azure Machine Learning.
Créer un jeu de données tabulaire dans l’espace de travail AML à partir d’une URL web	Ce modèle crée un jeu de données tabulaire à partir de l’URL web dans l’espace de travail Azure Machine Learning.
Créer un espace de travail AML avec plusieurs jeux de données & magasins de données	Ce modèle crée un espace de travail Azure Machine Learning avec plusieurs jeux de données & magasins de données.

Définition de ressources de modèle ARM

Le type de ressource espaces de travail/jeux de données peut être déployé avec des opérations qui ciblent :

Groupes de ressources - Voir commandes de déploiement de groupes de ressources

Pour obtenir la liste des propriétés modifiées dans chaque version de l’API, consultez journal des modifications.

Format des ressources

Pour créer une ressource Microsoft.MachineLearningServices/workspaces/datasets, ajoutez le code JSON suivant à votre modèle.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {
      "{customized property}": "string"
    }
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Valeurs de propriétés

espaces de travail/jeux de données

Nom	Description	Valeur
type	Type de ressource	« Microsoft.MachineLearningServices/workspaces/datasets »
apiVersion	Version de l’API de ressource	« 2020-05-01-preview »
name	Nom de la ressource Découvrez comment définir des noms et des types pour des ressources enfants dans des modèles ARM JSON.	chaîne (obligatoire)
datasetType	Spécifie le type de jeu de données.	'file' 'tabulaire' (obligatoire)
parameters		DatasetCreateRequestParameters (obligatoire)
inscription		DatasetCreateRequestRegistration (obligatoire)
skipValidation	Ignorez la validation qui garantit que les données peuvent être chargées à partir du jeu de données avant l’inscription.	bool
timeSeries		DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nom	Description	Valeur
en-tête	Type d’en-tête.	'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers'
includePath	Booléen pour conserver les informations de chemin d’accès sous forme de colonne dans le jeu de données. Valeur par défaut False. Cela est utile lors de la lecture de plusieurs fichiers et que vous souhaitez savoir de quel fichier provient un enregistrement particulier ou pour conserver des informations utiles dans le chemin du fichier.	bool
partitionFormat	Les informations de partition de chaque chemin sont extraites en colonnes en fonction du format spécifié. La partie de format « {column_name} » crée une colonne de chaîne, et « {column_name:yyyy/MM/dd/HH/mm/ss} » crée une colonne DateHeure, où « yyyy », « MM », « dd », « HH », « mm » et « ss » sont utilisés pour extraire l’année, le mois, le jour, l’heure, les minutes et les secondes pour le type DateHeure. Le format doit commencer à partir de la position de la première clé de partition et se poursuivre jusqu’à la fin du chemin d’accès au fichier. Par exemple, étant donné le chemin '.. /USA/2019/01/01/data.parquet' où la partition est par pays/région et heure, partition_format='/{CountryOrRegion}/{PartitionDate :yyyy/MM/dd}/data.csv' crée une colonne de chaîne 'CountryOrRegion' avec la valeur 'USA' et une colonne datetime 'PartitionDate' avec la valeur '2019-01-01-01	string
path		DatasetCreateRequestParametersPath
query		DatasetCreateRequestParametersQuery
separator	Séparateur utilisé pour fractionner les colonnes pour « delimited_files » sourceType.	string
sourceType	Type de source de données.	'delimited_files' 'json_lines_files' 'parquet_files'

DatasetCreateRequestParametersPath

Nom	Description	Valeur
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	URL HTTP.	string

DatasetCreateRequestParametersPathDataPath

Nom	Description	Valeur
datastoreName	Nom du magasin de données.	string
relativePath	Chemin dans le magasin de données.	string

DatasetCreateRequestParametersQuery

Nom	Description	Valeur
datastoreName	Nom du magasin de données SQL/PostgreSQL/MySQL.	string
query	SQL Quey.	string

DatasetCreateRequestRegistration

Nom	Description	Valeur
description	Description du jeu de données.	string
name	Le nom du dataset.	string
tags	Balises associées au jeu de données.	object

DatasetCreateRequestTimeSeries

Nom	Description	Valeur
coarseGrainTimestamp	Nom de colonne à utiliser en tant que CoarseGrainTimestamp. Ne peut être utilisé que si « fineGrainTimestamp » est spécifié et ne peut pas être identique à « fineGrainTimestamp ».	string
fineGrainTimestamp	Nom de colonne à utiliser comme FineGrainTimestamp	string

Modèles de démarrage rapide

Les modèles de démarrage rapide suivants déploient ce type de ressource.

Modèle	Description
Créer un jeu de données de fichier à partir du chemin relatif dans le magasin de données	Ce modèle crée un jeu de données de fichier à partir du chemin relatif dans le magasin de données dans l’espace de travail Azure Machine Learning.
Créer un jeu de données de fichier dans l’espace de travail AML à partir d’une URL web	Ce modèle crée un jeu de données de fichier à partir de l’URL web dans l’espace de travail Azure Machine Learning.
Créer un jeu de données tabulaire à partir du chemin relatif dans le magasin de données	Ce modèle crée un jeu de données tabulaire à partir du chemin relatif dans le magasin de données dans l’espace de travail Azure Machine Learning.
Créer un jeu de données tabulaire à partir d’un magasin de données SQL/PostgreSQL/MySQL	Ce modèle crée un jeu de données tabulaire à partir d’une requête SQL dans le magasin de données SQL/PostgreSQL/MySQL dans l’espace de travail Azure Machine Learning.
Créer un jeu de données tabulaire dans l’espace de travail AML à partir d’une URL web	Ce modèle crée un jeu de données tabulaire à partir de l’URL web dans l’espace de travail Azure Machine Learning.
Créer un espace de travail AML avec plusieurs jeux de données & magasins de données	Ce modèle crée un espace de travail Azure Machine Learning avec plusieurs jeux de données & magasins de données.

Définition de ressource Terraform (fournisseur AzAPI)

Le type de ressource workspaces/datasets peut être déployé avec des opérations qui ciblent :

Groupes de ressources

Pour obtenir la liste des propriétés modifiées dans chaque version d’API, consultez journal des modifications.

Format des ressources

Pour créer une ressource Microsoft.MachineLearningServices/workspaces/datasets, ajoutez le Terraform suivant à votre modèle.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  parent_id = "string"
  body = jsonencode({
    datasetType = "string"
    parameters = {
      header = "string"
      includePath = bool
      partitionFormat = "string"
      path = {
        dataPath = {
          datastoreName = "string"
          relativePath = "string"
        }
        httpUrl = "string"
      }
      query = {
        datastoreName = "string"
        query = "string"
      }
      separator = "string"
      sourceType = "string"
    }
    registration = {
      description = "string"
      name = "string"
      tags = {
        {customized property} = "string"
      }
    }
    skipValidation = bool
    timeSeries = {
      coarseGrainTimestamp = "string"
      fineGrainTimestamp = "string"
    }
  })
}

Valeurs de propriétés

workspaces/datasets

Nom	Description	Valeur
type	Type de ressource	« Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview »
name	Nom de la ressource	string (obligatoire)
parent_id	ID de la ressource qui est le parent de cette ressource.	ID pour la ressource de type : espaces de travail
datasetType	Spécifie le type de jeu de données.	« file » « tabulaire » (obligatoire)
parameters		DatasetCreateRequestParameters (obligatoire)
inscription		DatasetCreateRequestRegistration (obligatoire)
skipValidation	Ignorez la validation qui garantit que les données peuvent être chargées à partir du jeu de données avant l’inscription.	bool
timeSeries		DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Nom	Description	Valeur
en-tête	Type d’en-tête.	« all_files_have_same_headers » « combine_all_files_headers » « no_headers » « only_first_file_has_headers »
includePath	Booléen pour conserver les informations de chemin d’accès sous forme de colonne dans le jeu de données. Valeur par défaut False. Cela est utile lors de la lecture de plusieurs fichiers et que vous souhaitez savoir de quel fichier provient un enregistrement particulier ou pour conserver des informations utiles dans le chemin du fichier.	bool
partitionFormat	Les informations de partition de chaque chemin sont extraites en colonnes en fonction du format spécifié. La partie de format « {column_name} » crée une colonne de chaîne, et « {column_name:yyyy/MM/dd/HH/mm/ss} » crée une colonne DateHeure, où « yyyy », « MM », « dd », « HH », « mm » et « ss » sont utilisés pour extraire l’année, le mois, le jour, l’heure, les minutes et les secondes pour le type DateHeure. Le format doit commencer à partir de la position de la première clé de partition et se poursuivre jusqu’à la fin du chemin d’accès au fichier. Par exemple, étant donné le chemin '.. /USA/2019/01/01/data.parquet' où la partition est par pays/région et heure, partition_format='/{CountryOrRegion}/{PartitionDate :yyyy/MM/dd}/data.csv' crée une colonne de chaîne 'CountryOrRegion' avec la valeur 'USA' et une colonne datetime 'PartitionDate' avec la valeur '2019-01-01-01	string
path		DatasetCreateRequestParametersPath
query		DatasetCreateRequestParametersQuery
separator	Séparateur utilisé pour fractionner les colonnes pour « delimited_files » sourceType.	string
sourceType	Type de source de données.	« delimited_files » « json_lines_files » « parquet_files »

DatasetCreateRequestParametersPath

Nom	Description	Valeur
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	URL HTTP.	string

DatasetCreateRequestParametersPathDataPath

Nom	Description	Valeur
datastoreName	Nom du magasin de données.	string
relativePath	Chemin dans le magasin de données.	string

DatasetCreateRequestParametersQuery

Nom	Description	Valeur
datastoreName	Nom du magasin de données SQL/PostgreSQL/MySQL.	string
query	SQL Quey.	string

DatasetCreateRequestRegistration

Nom	Description	Valeur
description	Description du jeu de données.	string
name	Le nom du dataset.	string
tags	Balises associées au jeu de données.	object

DatasetCreateRequestTimeSeries

Nom	Description	Valeur
coarseGrainTimestamp	Nom de colonne à utiliser en tant que CoarseGrainTimestamp. Ne peut être utilisé que si « fineGrainTimestamp » est spécifié et ne peut pas être identique à « fineGrainTimestamp ».	string
fineGrainTimestamp	Nom de colonne à utiliser comme FineGrainTimestamp	string

Espaces de travail/jeux de données Microsoft.MachineLearningServices 2020-05-01-preview

Définition de ressource Bicep

Format des ressources

Valeurs de propriétés

espaces de travail/jeux de données

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestTimeSeries

Modèles de démarrage rapide

Définition de ressources de modèle ARM

Format des ressources

Valeurs de propriétés

espaces de travail/jeux de données

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestTimeSeries

Modèles de démarrage rapide

Définition de ressource Terraform (fournisseur AzAPI)

Format des ressources

Valeurs de propriétés

workspaces/datasets

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestTimeSeries

Commentaires

Commentaires

Ressources supplémentaires