Microsoft.MachineLearningServices-werkruimten/gegevenssets 2020-05-01-preview

Artikel
01/11/2024

Bicep-resourcedefinitie

Het resourcetype werkruimten/gegevenssets kan worden geïmplementeerd met bewerkingen die zijn gericht op:

Resourcegroepen - Zie opdrachten voor resourcegroepimplementatie

Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.

Resource-indeling

Als u een resource Microsoft.MachineLearningServices/workspaces/datasets wilt maken, voegt u de volgende Bicep toe aan uw sjabloon.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  name: 'string'
  parent: resourceSymbolicName
  datasetType: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {
      {customized property}: 'string'
    }
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Eigenschapswaarden

werkruimten/gegevenssets

Naam	Description	Waarde
naam	De resourcenaam Meer informatie over het instellen van namen en typen voor onderliggende resources in Bicep.	tekenreeks (vereist)
Bovenliggende	In Bicep kunt u de bovenliggende resource voor een onderliggende resource opgeven. U hoeft deze eigenschap alleen toe te voegen wanneer de onderliggende resource buiten de bovenliggende resource wordt gedeclareerd. Zie Onderliggende resource buiten bovenliggende resource voor meer informatie.	Symbolische naam voor resource van het type: werkruimten
datasetType	Hiermee geeft u het type gegevensset op.	'bestand' 'tabellair' (vereist)
parameters		DatasetCreateRequestParameters (vereist)
Registratie		DatasetCreateRequestRegistration (vereist)
skipValidation	Sla validatie over die ervoor zorgt dat gegevens uit de gegevensset kunnen worden geladen vóór de registratie.	booleaans
timeSeries		DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Naam	Description	Waarde
koptekst	Kopteksttype.	'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers'
includePath	Booleaanse waarde om padgegevens als kolom in de gegevensset te bewaren. Standaard ingesteld op False. Dit is handig bij het lezen van meerdere bestanden en wilt weten van welk bestand een bepaalde record afkomstig is of nuttige informatie in het bestandspad bewaren.	booleaans
partitionFormat	De partitiegegevens van elk pad worden geëxtraheerd in kolommen op basis van de opgegeven indeling. Met het opmaakonderdeel {column_name} wordt een tekenreekskolom gemaakt en met {column_name:yyyy/MM/dd/HH/mm/ss} wordt de datum/tijdkolom gemaakt, waarbij 'jjjj', 'MM', 'dd', 'uu', 'mm' en 'ss' worden gebruikt om jaar, maand, dag, uur, minuut en seconde te extraheren voor het datum/tijd-type. De indeling moet beginnen vanaf de positie van de eerste partitiesleutel tot het einde van het bestandspad. Bijvoorbeeld, gegeven het pad '.. /USA/2019/01/01/data.parquet' waarbij de partitie is per land/regio en tijd, partition_format='/{CountryOrRegion}/{PartitionDate:yyyyy/MM/dd}/data.csv' maakt een tekenreekskolom 'CountryOrRegion' met de waarde 'USA' en een datum/tijd-kolom 'PartitionDate' met de waarde '2019-01-01-01	tekenreeks
leertraject		DatasetCreateRequestParametersPath
query		DatasetCreateRequestParametersQuery
scheidingsteken	Het scheidingsteken dat wordt gebruikt voor het splitsen van kolommen voor 'delimited_files' sourceType.	tekenreeks
Sourcetype	Gegevensbrontype.	'delimited_files' 'json_lines_files' 'parquet_files'

DatasetCreateRequestParametersPath

Naam	Description	Waarde
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	De HTTP-URL.	tekenreeks

DatasetCreateRequestParametersPathDataPath

Naam	Description	Waarde
datastoreName	De naam van het gegevensarchief.	tekenreeks
relativePath	Pad binnen het gegevensarchief.	tekenreeks

DatasetCreateRequestParametersQuery

Naam	Description	Waarde
datastoreName	De naam van het SQL/PostgreSQL/MySQL-gegevensarchief.	tekenreeks
query	SQL Quey.	tekenreeks

DatasetCreateRequestRegistration

Naam	Description	Waarde
beschrijving	De beschrijving voor de gegevensset.	tekenreeks
naam	De naam van de gegevensset.	tekenreeks
tags	Tags die zijn gekoppeld aan de gegevensset.	object

DatasetCreateRequestTimeSeries

Naam	Description	Waarde
coarseGrainTimestamp	Kolomnaam die moet worden gebruikt als CoarseGrainTimestamp. Kan alleen worden gebruikt als 'fineGrainTimestamp' is opgegeven en niet hetzelfde kan zijn als 'fineGrainTimestamp'.	tekenreeks
fineGrainTimestamp	Kolomnaam die moet worden gebruikt als FineGrainTimestamp	tekenreeks

Snelstartsjablonen

Met de volgende quickstart-sjablonen wordt dit resourcetype geïmplementeerd.

Template	Beschrijving
Bestandsgegevensset maken van relatief pad in gegevensarchief	Met deze sjabloon maakt u een bestandsgegevensset op basis van het relatieve pad in het gegevensarchief in de Azure Machine Learning-werkruimte.
Bestandsgegevensset maken in AML-werkruimte op basis van web-URL	Met deze sjabloon wordt een bestandsgegevensset gemaakt op basis van web-URL in een Azure Machine Learning-werkruimte.
Een tabellaire gegevensset maken op basis van een relatief pad in het gegevensarchief	Met deze sjabloon maakt u een tabellaire gegevensset op basis van het relatieve pad in het gegevensarchief in de Azure Machine Learning-werkruimte.
Tabelgegevensset maken op basis van SQL/PostgreSQL/MySQL-gegevensarchief	Met deze sjabloon wordt een tabellaire gegevensset gemaakt op basis van een SQL-query in het SQL-/PostgreSQL-/MySQL-gegevensarchief in de Azure Machine Learning-werkruimte.
Tabelgegevensset maken in AML-werkruimte op basis van web-URL	Met deze sjabloon maakt u een tabellaire gegevensset op basis van web-URL in de Azure Machine Learning-werkruimte.
AML-werkruimte maken met meerdere gegevenssets & gegevensarchieven	Met deze sjabloon maakt u een Azure Machine Learning-werkruimte met meerdere gegevenssets & gegevensarchieven.

Resourcedefinitie van ARM-sjabloon

Het resourcetype werkruimten/gegevenssets kan worden geïmplementeerd met bewerkingen die zijn gericht op:

Resourcegroepen - Zie opdrachten voor resourcegroepimplementatie

Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.

Resource-indeling

Als u een resource Microsoft.MachineLearningServices/workspaces/datasets wilt maken, voegt u de volgende JSON toe aan uw sjabloon.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {
      "{customized property}": "string"
    }
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Eigenschapswaarden

werkruimten/gegevenssets

Naam	Description	Waarde
type	Het resourcetype	'Microsoft.MachineLearningServices/workspaces/datasets'
apiVersion	De resource-API-versie	'2020-05-01-preview'
naam	De resourcenaam Meer informatie over het instellen van namen en typen voor onderliggende resources in JSON ARM-sjablonen.	tekenreeks (vereist)
datasetType	Hiermee geeft u het type gegevensset op.	'bestand' 'tabellair' (vereist)
parameters		DatasetCreateRequestParameters (vereist)
Registratie		DatasetCreateRequestRegistration (vereist)
skipValidation	Sla validatie over die ervoor zorgt dat gegevens uit de gegevensset kunnen worden geladen vóór de registratie.	booleaans
timeSeries		DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Naam	Description	Waarde
koptekst	Kopteksttype.	'all_files_have_same_headers' 'combine_all_files_headers' 'no_headers' 'only_first_file_has_headers'
includePath	Booleaanse waarde om padgegevens als kolom in de gegevensset te bewaren. Standaard ingesteld op False. Dit is handig bij het lezen van meerdere bestanden en wilt weten van welk bestand een bepaalde record afkomstig is of nuttige informatie in het bestandspad bewaren.	booleaans
partitionFormat	De partitiegegevens van elk pad worden geëxtraheerd in kolommen op basis van de opgegeven indeling. Met het opmaakonderdeel {column_name} wordt een tekenreekskolom gemaakt en met {column_name:yyyy/MM/dd/HH/mm/ss} wordt de datum/tijdkolom gemaakt, waarbij 'jjjj', 'MM', 'dd', 'uu', 'mm' en 'ss' worden gebruikt om jaar, maand, dag, uur, minuut en seconde te extraheren voor het datum/tijd-type. De indeling moet beginnen vanaf de positie van de eerste partitiesleutel tot het einde van het bestandspad. Bijvoorbeeld, gegeven het pad '.. /USA/2019/01/01/data.parquet' waarbij de partitie is per land/regio en tijd, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' maakt een tekenreekskolom 'CountryOrRegion' met de waarde 'USA' en een datum/tijd-kolom 'PartitionDate' met de waarde '2019-01-01-01	tekenreeks
leertraject		DatasetCreateRequestParametersPath
query		DatasetCreateRequestParametersQuery
scheidingsteken	Het scheidingsteken dat wordt gebruikt voor het splitsen van kolommen voor 'delimited_files' sourceType.	tekenreeks
Sourcetype	Gegevensbrontype.	'delimited_files' 'json_lines_files' 'parquet_files'

DatasetCreateRequestParametersPath

Naam	Description	Waarde
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	De HTTP-URL.	tekenreeks

DatasetCreateRequestParametersPathDataPath

Naam	Description	Waarde
datastoreName	De naam van het gegevensarchief.	tekenreeks
relativePath	Pad binnen het gegevensarchief.	tekenreeks

DatasetCreateRequestParametersQuery

Naam	Description	Waarde
datastoreName	De naam van het SQL/PostgreSQL/MySQL-gegevensarchief.	tekenreeks
query	SQL Quey.	tekenreeks

DatasetCreateRequestRegistration

Naam	Description	Waarde
beschrijving	De beschrijving voor de gegevensset.	tekenreeks
naam	De naam van de gegevensset.	tekenreeks
tags	Tags die zijn gekoppeld aan de gegevensset.	object

DatasetCreateRequestTimeSeries

Naam	Description	Waarde
coarseGrainTimestamp	Kolomnaam die moet worden gebruikt als CoarseGrainTimestamp. Kan alleen worden gebruikt als 'fineGrainTimestamp' is opgegeven en niet hetzelfde kan zijn als 'fineGrainTimestamp'.	tekenreeks
fineGrainTimestamp	Kolomnaam die moet worden gebruikt als FineGrainTimestamp	tekenreeks

Snelstartsjablonen

Met de volgende snelstartsjablonen wordt dit resourcetype geïmplementeerd.

Template	Beschrijving
Bestandsgegevensset maken van relatief pad in gegevensarchief	Met deze sjabloon maakt u een bestandsgegevensset op basis van het relatieve pad in het gegevensarchief in de Azure Machine Learning-werkruimte.
Bestandsgegevensset maken in AML-werkruimte op de web-URL	Met deze sjabloon maakt u een bestandsgegevensset op basis van web-URL in de Azure Machine Learning-werkruimte.
Tabelgegevensset maken op basis van relatief pad in gegevensarchief	Met deze sjabloon maakt u een tabellaire gegevensset op basis van het relatieve pad in het gegevensarchief in de Azure Machine Learning-werkruimte.
Tabelgegevensset maken vanuit SQL/PostgreSQL/MySQL-gegevensarchief	Met deze sjabloon wordt een tabellaire gegevensset gemaakt op basis van een SQL-query in het SQL-/PostgreSQL-/MySQL-gegevensarchief in de Azure Machine Learning-werkruimte.
Tabelgegevensset maken in AML-werkruimte op basis van web-URL	Met deze sjabloon maakt u een tabellaire gegevensset op basis van web-URL in de Azure Machine Learning-werkruimte.
Een AML-werkruimte maken met meerdere gegevenssets & gegevensarchieven	Met deze sjabloon maakt u een Azure Machine Learning-werkruimte met meerdere gegevenssets & gegevensarchieven.

Terraform-resourcedefinitie (AzAPI-provider)

Het resourcetype werkruimten/gegevenssets kan worden geïmplementeerd met bewerkingen die zijn gericht op:

Resourcegroepen

Zie wijzigingenlogboek voor een lijst met gewijzigde eigenschappen in elke API-versie.

Resource-indeling

Als u een Resource Microsoft.MachineLearningServices/workspaces/datasets wilt maken, voegt u de volgende Terraform toe aan uw sjabloon.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  parent_id = "string"
  body = jsonencode({
    datasetType = "string"
    parameters = {
      header = "string"
      includePath = bool
      partitionFormat = "string"
      path = {
        dataPath = {
          datastoreName = "string"
          relativePath = "string"
        }
        httpUrl = "string"
      }
      query = {
        datastoreName = "string"
        query = "string"
      }
      separator = "string"
      sourceType = "string"
    }
    registration = {
      description = "string"
      name = "string"
      tags = {
        {customized property} = "string"
      }
    }
    skipValidation = bool
    timeSeries = {
      coarseGrainTimestamp = "string"
      fineGrainTimestamp = "string"
    }
  })
}

Eigenschapswaarden

werkruimten/gegevenssets

Naam	Description	Waarde
type	Het resourcetype	"Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
naam	De resourcenaam	tekenreeks (vereist)
parent_id	De id van de resource die het bovenliggende item voor deze resource is.	Id voor resource van het type: werkruimten
datasetType	Hiermee geeft u het type gegevensset op.	"bestand" 'tabellair' (vereist)
parameters		DatasetCreateRequestParameters (vereist)
Registratie		DatasetCreateRequestRegistration (vereist)
skipValidation	Sla validatie over die ervoor zorgt dat gegevens uit de gegevensset kunnen worden geladen vóór de registratie.	booleaans
timeSeries		DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Naam	Description	Waarde
koptekst	Kopteksttype.	"all_files_have_same_headers" "combine_all_files_headers" "no_headers" "only_first_file_has_headers"
includePath	Booleaanse waarde om padgegevens als kolom in de gegevensset te bewaren. Standaard ingesteld op False. Dit is handig bij het lezen van meerdere bestanden en wilt weten van welk bestand een bepaalde record afkomstig is of nuttige informatie in het bestandspad bewaren.	booleaans
partitionFormat	De partitiegegevens van elk pad worden geëxtraheerd in kolommen op basis van de opgegeven indeling. Met het opmaakonderdeel {column_name} wordt een tekenreekskolom gemaakt en met {column_name:yyyy/MM/dd/HH/mm/ss} wordt de datum/tijdkolom gemaakt, waarbij 'jjjj', 'MM', 'dd', 'uu', 'mm' en 'ss' worden gebruikt om jaar, maand, dag, uur, minuut en seconde te extraheren voor het datum/tijd-type. De indeling moet beginnen vanaf de positie van de eerste partitiesleutel tot het einde van het bestandspad. Bijvoorbeeld, gegeven het pad '.. /USA/2019/01/01/data.parquet' waarbij de partitie is per land/regio en tijd, partition_format='/{CountryOrRegion}/{PartitionDate:yyyyy/MM/dd}/data.csv' maakt een tekenreekskolom 'CountryOrRegion' met de waarde 'USA' en een datum/tijd-kolom 'PartitionDate' met de waarde '2019-01-01-01	tekenreeks
leertraject		DatasetCreateRequestParametersPath
query		DatasetCreateRequestParametersQuery
scheidingsteken	Het scheidingsteken dat wordt gebruikt voor het splitsen van kolommen voor 'delimited_files' sourceType.	tekenreeks
Sourcetype	Gegevensbrontype.	"delimited_files" "json_lines_files" "parquet_files"

DatasetCreateRequestParametersPath

Naam	Description	Waarde
dataPath		DatasetCreateRequestParametersPathDataPath
httpUrl	De HTTP-URL.	tekenreeks

DatasetCreateRequestParametersPathDataPath

Naam	Description	Waarde
datastoreName	De naam van het gegevensarchief.	tekenreeks
relativePath	Pad binnen het gegevensarchief.	tekenreeks

DatasetCreateRequestParametersQuery

Naam	Description	Waarde
datastoreName	De naam van het SQL/PostgreSQL/MySQL-gegevensarchief.	tekenreeks
query	SQL Quey.	tekenreeks

DatasetCreateRequestRegistration

Naam	Description	Waarde
beschrijving	De beschrijving voor de gegevensset.	tekenreeks
naam	De naam van de gegevensset.	tekenreeks
tags	Tags die zijn gekoppeld aan de gegevensset.	object

DatasetCreateRequestTimeSeries

Naam	Description	Waarde
coarseGrainTimestamp	Kolomnaam die moet worden gebruikt als CoarseGrainTimestamp. Kan alleen worden gebruikt als 'fineGrainTimestamp' is opgegeven en niet hetzelfde kan zijn als 'fineGrainTimestamp'.	tekenreeks
fineGrainTimestamp	Kolomnaam die moet worden gebruikt als FineGrainTimestamp	tekenreeks

Microsoft.MachineLearningServices-werkruimten/gegevenssets 2020-05-01-preview

Bicep-resourcedefinitie

Resource-indeling

Eigenschapswaarden

werkruimten/gegevenssets

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestTimeSeries

Snelstartsjablonen

Resourcedefinitie van ARM-sjabloon

Resource-indeling

Eigenschapswaarden

werkruimten/gegevenssets

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestTimeSeries

Snelstartsjablonen

Terraform-resourcedefinitie (AzAPI-provider)

Resource-indeling

Eigenschapswaarden

werkruimten/gegevenssets

DatasetCreateRequestParameters

DatasetCreateRequestParametersPath

DatasetCreateRequestParametersPathDataPath

DatasetCreateRequestParametersQuery

DatasetCreateRequestRegistration

DatasetCreateRequestTimeSeries

Feedback

Feedback

Aanvullende resources