Sdílet prostřednictvím


Pracovní prostory a datové sady Microsoft.MachineLearningServices 2020-05-01-preview

Definice prostředku Bicep

Typ prostředku pracovních prostorů nebo datových sad je možné nasadit s operacemi, na které cílí:

Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.

Formát prostředku

Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/datasets, přidejte do šablony následující bicep.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  name: 'string'
  parent: resourceSymbolicName
  datasetType: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {
      {customized property}: 'string'
    }
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Hodnoty vlastností

pracovní prostory/datové sady

Název Description Hodnota
name Název prostředku

Přečtěte si, jak nastavit názvy a typy pro podřízené prostředky v Bicepu.
string (povinné)
Nadřazené V nástroji Bicep můžete zadat nadřazený prostředek pro podřízený prostředek. Tuto vlastnost stačí přidat pouze v případě, že je podřízený prostředek deklarován mimo nadřazený prostředek.

Další informace najdete v tématu Podřízený prostředek mimo nadřazený prostředek.
Symbolický název prostředku typu: pracovní prostory
datasetType Určuje typ datové sady. 'file'
Tabulkový (povinné)
parameters DatasetCreateRequestParameters (povinné)
registrace DatasetCreateRequestRegistration (povinné)
skipValidation Přeskočte ověření, které zajistí, že se data dají načíst z datové sady před registrací. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Název Description Hodnota
header Typ záhlaví. "all_files_have_same_headers"
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath Logická hodnota pro zachování informací o cestě jako sloupce v datové sadě. Výchozí hodnota je False. To je užitečné při čtení více souborů a chcete zjistit, ze kterého souboru konkrétní záznam pochází, nebo chcete mít v cestě k souboru užitečné informace. bool
partitionFormat Informace o oddílech každé cesty budou extrahovány do sloupců na základě zadaného formátu. Formátovací část {column_name} vytvoří sloupec řetězce a {column_name:yyyy/MM/dd/HH/mm/ss} vytvoří sloupec datetime, kde "yyyy", "MM", "dd", "HH", "mm" a "ss" se používají k extrakci roku, měsíce, dne, hodiny, minuty a sekundy pro typ datetime. Formát by měl začínat od pozice prvního klíče oddílu až do konce cesty k souboru. Například vzhledem k cestě '.. /USA/2019/01/01/data.parquet' kde je oddíl podle země/oblasti a času, partition_format=/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv vytvoří řetězecový sloupec CountryOrRegion s hodnotou USA a sloupec datetime PartitionDate s hodnotou 2019-01-01 řetězec
program DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
Oddělovač Oddělovač použitý k rozdělení sloupců pro sourceType delimited_files. řetězec
Sourcetype Typ zdroje dat. 'delimited_files'
'json_lines_files'
'parquet_files'

DatasetCreateRequestParametersPath

Název Description Hodnota
cesta k datům DatasetCreateRequestParametersPathDataPath
httpUrl Adresa URL protokolu HTTP. řetězec

DatasetCreateRequestParametersPathDataPath

Název Description Hodnota
název_úložiště_dat Název úložiště dat. řetězec
relativePath Cesta v úložišti dat. řetězec

DatasetCreateRequestParametersQuery

Název Description Hodnota
název_úložiště_dat Název úložiště dat SQL, PostgreSQL nebo MySQL řetězec
query SQL Quey. řetězec

DatasetCreateRequestRegistration

Název Description Hodnota
description Popis datové sady. řetězec
name Název datové sady. řetězec
tags Značky přidružené k datové sadě object

DatasetCreateRequestTimeSeries

Název Description Hodnota
coarseGrainTimestamp Název sloupce, který se má použít jako HrubágrainTimestamp. Lze použít pouze v případě, že je zadána hodnota fineGrainTimestamp a nemůže být stejná jako fineGrainTimestamp. řetězec
fineGrainTimestamp Název sloupce, který se má použít jako FineGrainTimestamp řetězec

Šablony pro rychlý start

Následující šablony rychlého startu nasadí tento typ prostředku.

Template (Šablona) Description
Vytvoření datové sady souborů z relativní cesty v úložišti dat

Nasazení do Azure
Tato šablona vytvoří datovou sadu souboru z relativní cesty v úložišti dat v pracovním prostoru služby Azure Machine Learning.
Vytvoření datové sady souborů v pracovním prostoru AML z webové adresy URL

Nasazení do Azure
Tato šablona vytvoří datovou sadu souboru z webové adresy URL v pracovním prostoru Služby Azure Machine Learning.
Vytvoření tabulkové datové sady z relativní cesty v úložišti dat

Nasazení do Azure
Tato šablona vytvoří tabulkovou datovou sadu z relativní cesty v úložišti dat v pracovním prostoru Služby Azure Machine Learning.
Vytvoření tabulkové datové sady z úložiště dat SQL, PostgreSQL nebo MySQL

Nasazení do Azure
Tato šablona vytvoří tabulkovou datovou sadu z dotazu SQL v úložišti dat SQL, PostgreSQL nebo MySQL v pracovním prostoru služby Azure Machine Learning.
Vytvoření tabulkové datové sady v pracovním prostoru AML z webové adresy URL

Nasazení do Azure
Tato šablona vytvoří tabulkovou datovou sadu z webové adresy URL v pracovním prostoru Služby Azure Machine Learning.
Vytvoření pracovního prostoru AML s více datovými sadami & úložiště dat

Nasazení do Azure
Tato šablona vytvoří pracovní prostor Služby Azure Machine Learning s několika datovými sadami & úložišti dat.

Definice prostředku šablony ARM

Typ prostředku pracovních prostorů nebo datových sad je možné nasadit s operacemi, na které cílí:

Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.

Formát prostředku

Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/datasets, přidejte do šablony následující kód JSON.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {
      "{customized property}": "string"
    }
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Hodnoty vlastností

pracovní prostory/datové sady

Název Description Hodnota
typ Typ prostředku Microsoft.MachineLearningServices/workspaces/datasets
apiVersion Verze rozhraní API prostředků '2020-05-01-preview'
name Název prostředku

Podívejte se, jak nastavit názvy a typy pro podřízené prostředky v šablonách JSON ARM.
string (povinné)
datasetType Určuje typ datové sady. 'file'
Tabulkový (povinné)
parameters DatasetCreateRequestParameters (povinné)
registrace DatasetCreateRequestRegistration (povinné)
skipValidation Přeskočte ověření, které zajistí, že se data dají načíst z datové sady před registrací. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Název Description Hodnota
header Typ záhlaví. "all_files_have_same_headers"
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath Logická hodnota pro zachování informací o cestě jako sloupce v datové sadě. Výchozí hodnota je False. To je užitečné při čtení více souborů a chcete zjistit, ze kterého souboru konkrétní záznam pochází, nebo chcete mít v cestě k souboru užitečné informace. bool
partitionFormat Informace o oddílech každé cesty budou extrahovány do sloupců na základě zadaného formátu. Formátovací část {column_name} vytvoří sloupec řetězce a {column_name:yyyy/MM/dd/HH/mm/ss} vytvoří sloupec datetime, kde "yyyy", "MM", "dd", "HH", "mm" a "ss" se používají k extrakci roku, měsíce, dne, hodiny, minuty a sekundy pro typ datetime. Formát by měl začínat od pozice prvního klíče oddílu až do konce cesty k souboru. Například vzhledem k cestě '.. /USA/2019/01/01/data.parquet' kde je oddíl podle země/oblasti a času, partition_format='/{CountryOrRegion}/{PartitionDate:yy/MM/dd}/data.csv' vytvoří sloupec řetězce CountryOrRegion s hodnotou USA a sloupcem datetime PartitionDate s hodnotou 2019-01-01-01. řetězec
program DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
Oddělovač Oddělovač použitý k rozdělení sloupců pro "delimited_files" sourceType. řetězec
Sourcetype Typ zdroje dat. "delimited_files"
'json_lines_files'
"parquet_files"

DatasetCreateRequestParametersPath

Název Description Hodnota
cesta k datům DatasetCreateRequestParametersPathDataPath
adresa URL http Adresa URL protokolu HTTP. řetězec

DatasetCreateRequestParametersPathDataPath

Název Description Hodnota
název_úložiště_dat Název úložiště dat. řetězec
relativePath Cesta v rámci úložiště dat. řetězec

DatasetCreateRequestParametersQuery

Název Description Hodnota
název_úložiště_dat Název úložiště dat SQL/PostgreSQL/MySQL. řetězec
query SQL Quey. řetězec

DatasetCreateRequestRegistration

Název Description Hodnota
description Popis datové sady. řetězec
name Název datové sady. řetězec
tags Značky přidružené k datové sadě object

DatasetCreateRequestTimeSeries

Název Description Hodnota
hrubé časové razítko Název sloupce, který se má použít jako Hrubá_hodnota_času_hrubé_užitky. Lze použít pouze v případě, že je zadána hodnota fineGrainTimestamp a nemůže být stejná jako fineGrainTimestamp. řetězec
fineGrainTimestamp Název sloupce, který se použije jako FineGrainTimestamp řetězec

Šablony pro rychlý start

Následující šablony pro rychlý start nasadí tento typ prostředku.

Template (Šablona) Description
Vytvoření datové sady souboru z relativní cesty v úložišti dat

Nasazení do Azure
Tato šablona vytvoří datovou sadu souboru z relativní cesty v úložišti dat v pracovním prostoru Azure Machine Learning.
Vytvoření datové sady souborů v pracovním prostoru AML z webové adresy URL

Nasazení do Azure
Tato šablona vytvoří datovou sadu souboru z adresy URL webu v pracovním prostoru Azure Machine Learning.
Vytvoření tabulkové datové sady z relativní cesty v úložišti dat

Nasazení do Azure
Tato šablona vytvoří tabulkovou datovou sadu z relativní cesty v úložišti dat v pracovním prostoru Azure Machine Learning.
Vytvoření tabulkové datové sady z úložiště dat SQL, PostgreSQL nebo MySQL

Nasazení do Azure
Tato šablona vytvoří tabulkovou datovou sadu z dotazu SQL v úložišti dat SQL, PostgreSQL nebo MySQL v pracovním prostoru Azure Machine Learning.
Vytvoření tabulkové datové sady v pracovním prostoru AML z webové adresy URL

Nasazení do Azure
Tato šablona vytvoří tabulkovou datovou sadu z webové adresy URL v pracovním prostoru Azure Machine Learning.
Vytvoření pracovního prostoru AML s několika datovými sadami & úložišti dat

Nasazení do Azure
Tato šablona vytvoří pracovní prostor Azure Machine Learning s několika datovými sadami & úložištích dat.

Definice prostředku Terraform (poskytovatel AzAPI)

Typ prostředku pracovních prostorů nebo datových sad je možné nasadit s operacemi, které cílí na:

  • Skupiny prostředků

Seznam změněných vlastností v jednotlivých verzích rozhraní API najdete v protokolu změn.

Formát prostředku

Pokud chcete vytvořit prostředek Microsoft.MachineLearningServices/workspaces/datasets, přidejte do šablony následující Terraform.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  parent_id = "string"
  body = jsonencode({
    datasetType = "string"
    parameters = {
      header = "string"
      includePath = bool
      partitionFormat = "string"
      path = {
        dataPath = {
          datastoreName = "string"
          relativePath = "string"
        }
        httpUrl = "string"
      }
      query = {
        datastoreName = "string"
        query = "string"
      }
      separator = "string"
      sourceType = "string"
    }
    registration = {
      description = "string"
      name = "string"
      tags = {
        {customized property} = "string"
      }
    }
    skipValidation = bool
    timeSeries = {
      coarseGrainTimestamp = "string"
      fineGrainTimestamp = "string"
    }
  })
}

Hodnoty vlastností

pracovní prostory/datové sady

Název Description Hodnota
typ Typ prostředku Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview
name Název prostředku string (povinné)
parent_id ID prostředku, který je nadřazený pro tento prostředek. ID prostředku typu: pracovní prostory
datasetType Určuje typ datové sady. "file"
"tabulkový" (povinné)
parameters DatasetCreateRequestParameters (povinné)
registrace DatasetCreateRequestRegistration (povinné)
skipValidation Přeskočte ověření, které zajistí, že se data dají načíst z datové sady před registrací. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Název Description Hodnota
header Typ záhlaví. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Logická hodnota pro zachování informací o cestě jako sloupce v datové sadě. Výchozí hodnota je False. To je užitečné při čtení více souborů a chcete zjistit, ze kterého souboru konkrétní záznam pochází, nebo chcete mít v cestě k souboru užitečné informace. bool
partitionFormat Informace o oddílech každé cesty budou extrahovány do sloupců na základě zadaného formátu. Formátovací část {column_name} vytvoří sloupec řetězce a {column_name:yyyy/MM/dd/HH/mm/ss} vytvoří sloupec datetime, kde "yyyy", "MM", "dd", "HH", "mm" a "ss" se používají k extrakci roku, měsíce, dne, hodiny, minuty a sekundy pro typ datetime. Formát by měl začínat od pozice prvního klíče oddílu až do konce cesty k souboru. Například vzhledem k cestě '.. /USA/2019/01/01/data.parquet' kde je oddíl podle země/oblasti a času, partition_format=/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv vytvoří řetězecový sloupec CountryOrRegion s hodnotou USA a sloupec datetime PartitionDate s hodnotou 2019-01-01 řetězec
program DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
Oddělovač Oddělovač použitý k rozdělení sloupců pro sourceType delimited_files. řetězec
Sourcetype Typ zdroje dat. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Název Description Hodnota
cesta k datům DatasetCreateRequestParametersPathDataPath
httpUrl Adresa URL protokolu HTTP. řetězec

DatasetCreateRequestParametersPathDataPath

Název Description Hodnota
název_úložiště_dat Název úložiště dat. řetězec
relativePath Cesta v úložišti dat. řetězec

DatasetCreateRequestParametersQuery

Název Description Hodnota
název_úložiště_dat Název úložiště dat SQL, PostgreSQL nebo MySQL řetězec
query SQL Quey. řetězec

DatasetCreateRequestRegistration

Název Description Hodnota
description Popis datové sady. řetězec
name Název datové sady. řetězec
tags Značky přidružené k datové sadě object

DatasetCreateRequestTimeSeries

Název Description Hodnota
coarseGrainTimestamp Název sloupce, který se má použít jako HrubágrainTimestamp. Lze použít pouze v případě, že je zadána hodnota fineGrainTimestamp a nemůže být stejná jako fineGrainTimestamp. řetězec
fineGrainTimestamp Název sloupce, který se má použít jako FineGrainTimestamp řetězec