Share via


Microsoft.MachineLearningServices çalışma alanları/veri kümeleri 2020-05-01-preview

Bicep kaynak tanımı

Çalışma alanları/veri kümeleri kaynak türü, aşağıdakileri hedefleyen işlemlerle dağıtılabilir:

Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.

Kaynak biçimi

Microsoft.MachineLearningServices/workspaces/datasets kaynağı oluşturmak için şablonunuza aşağıdaki Bicep'i ekleyin.

resource symbolicname 'Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview' = {
  name: 'string'
  parent: resourceSymbolicName
  datasetType: 'string'
  parameters: {
    header: 'string'
    includePath: bool
    partitionFormat: 'string'
    path: {
      dataPath: {
        datastoreName: 'string'
        relativePath: 'string'
      }
      httpUrl: 'string'
    }
    query: {
      datastoreName: 'string'
      query: 'string'
    }
    separator: 'string'
    sourceType: 'string'
  }
  registration: {
    description: 'string'
    name: 'string'
    tags: {
      {customized property}: 'string'
    }
  }
  skipValidation: bool
  timeSeries: {
    coarseGrainTimestamp: 'string'
    fineGrainTimestamp: 'string'
  }
}

Özellik değerleri

çalışma alanları/veri kümeleri

Ad Açıklama Değer
name Kaynak adı

Bicep'te alt kaynaklar için adları ve türleri ayarlamayı öğrenin.
dize (gerekli)
Üst Bicep'te alt kaynak için üst kaynağı belirtebilirsiniz. Bu özelliği yalnızca alt kaynak üst kaynağın dışında bildirildiğinde eklemeniz gerekir.

Daha fazla bilgi için bkz . Üst kaynağın dışındaki alt kaynak.
Kaynak türü için sembolik ad: çalışma alanları
datasetType Veri kümesi türünü belirtir. 'file'
'tabular' (gerekli)
parameters DatasetCreateRequestParameters (gerekli)
kayıt DatasetCreateRequestRegistration (gerekli)
skipValidation Kayıttan önce verilerin veri kümesinden yüklenebilmesini sağlayan doğrulamayı atlayın. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Ad Açıklama Değer
üst bilgi Üst bilgi türü. 'all_files_have_same_headers'
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath Veri kümesinde yol bilgilerini sütun olarak tutmak için Boole değeri. Varsayılan değer False'tur. Bu, birden çok dosyayı okurken ve belirli bir kaydın hangi dosyadan kaynaklandığını bilmek veya yararlı bilgileri dosya yolunda tutmak istediğinizde yararlıdır. bool
partitionFormat Her yolun bölüm bilgileri belirtilen biçime göre sütunlara ayıklanır. '{column_name}' biçim bölümü dize sütunu oluşturur ve '{column_name:yyyy/AA/GG/HH/aa/ss}' datetime sütunu oluşturur; burada tarih saat türü için yıl, ay, gün, saat, dakika ve saniyeyi ayıklamak için 'yyyy', 'MM', 'dd', 'SS', 'd' ve 'ss' kullanılır. Biçim, ilk bölüm anahtarının konumundan dosya yolunun sonuna kadar başlamalıdır. Örneğin, '.. /USA/2019/01/01/data.parquet' bölümün ülkeye/bölgeye ve zamana göre olduğu yer, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' değeri 'USA' olan bir 'CountryOrRegion' dize sütunu ve '2019-01-01' değeriyle 'PartitionDate' tarih saat sütunu oluşturur string
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
Ayırıcı 'delimited_files' sourceType için sütunları bölmek için kullanılan ayırıcı. string
Sourcetype Veri kaynağı türü. 'delimited_files'
'json_lines_files'
'parquet_files'

DatasetCreateRequestParametersPath

Ad Açıklama Değer
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Http URL'si. string

DatasetCreateRequestParametersPathDataPath

Ad Açıklama Değer
datastoreName Veri deposu adı. string
Relativepath Veri deposu içindeki yol. string

DatasetCreateRequestParametersQuery

Ad Açıklama Değer
datastoreName SQL/PostgreSQL/MySQL veri deposu adı. string
query SQL Quey. string

DatasetCreateRequestRegistration

Ad Açıklama Değer
açıklama Veri kümesinin açıklaması. string
name Veri kümesinin adı. string
etiketler Veri kümesiyle ilişkili etiketler. object

DatasetCreateRequestTimeSeries

Ad Açıklama Değer
coarseGrainTimestamp CoarseGrainTimestamp olarak kullanılacak sütun adı. Yalnızca 'fineGrainTimestamp' belirtilirse ve 'fineGrainTimestamp' ile aynı olamazsa kullanılabilir. string
fineGrainTimestamp FineGrainTimestamp olarak kullanılacak sütun adı string

Hızlı başlangıç şablonları

Aşağıdaki hızlı başlangıç şablonları bu kaynak türünü dağıtır.

Şablon Description
Datastore'da Göreli Yoldan Dosya Veri Kümesi Oluşturma

Azure’a dağıtın
Bu şablon, Azure Machine Learning çalışma alanındaki veri deposundaki göreli yoldan bir dosya veri kümesi oluşturur.
WEB URL'sinden AML çalışma alanında Dosya Veri Kümesi oluşturma

Azure’a dağıtın
Bu şablon, Azure Machine Learning çalışma alanındaki Web URL'sinden bir dosya veri kümesi oluşturur.
Datastore'da Göreli Yoldan Tablosal Veri Kümesi Oluşturma

Azure’a dağıtın
Bu şablon, Azure Machine Learning çalışma alanındaki veri deposundaki göreli yoldan bir tablosal veri kümesi oluşturur.
SQL/PostgreSQL/MySQL Veri Deposundan Tablosal Veri Kümesi Oluşturma

Azure’a dağıtın
Bu şablon, Azure Machine Learning çalışma alanındaki SQL/PostgreSQL/MySQL veri deposundaki SQL sorgusundan tablosal bir veri kümesi oluşturur.
WEB URL'sinden AML çalışma alanında Tablosal Veri Kümesi oluşturma

Azure’a dağıtın
Bu şablon, Azure Machine Learning çalışma alanındaki Web URL'sinden bir tablosal veri kümesi oluşturur.
Birden çok Veri Kümesi & Veri Depoları ile AML çalışma alanı oluşturma

Azure’a dağıtın
Bu şablon, veri depoları & birden çok veri kümesiyle Azure Machine Learning çalışma alanı oluşturur.

ARM şablonu kaynak tanımı

Çalışma alanları/veri kümeleri kaynak türü, aşağıdakileri hedefleyen işlemlerle dağıtılabilir:

Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.

Kaynak biçimi

Microsoft.MachineLearningServices/workspaces/datasets kaynağı oluşturmak için şablonunuza aşağıdaki JSON'u ekleyin.

{
  "type": "Microsoft.MachineLearningServices/workspaces/datasets",
  "apiVersion": "2020-05-01-preview",
  "name": "string",
  "datasetType": "string",
  "parameters": {
    "header": "string",
    "includePath": "bool",
    "partitionFormat": "string",
    "path": {
      "dataPath": {
        "datastoreName": "string",
        "relativePath": "string"
      },
      "httpUrl": "string"
    },
    "query": {
      "datastoreName": "string",
      "query": "string"
    },
    "separator": "string",
    "sourceType": "string"
  },
  "registration": {
    "description": "string",
    "name": "string",
    "tags": {
      "{customized property}": "string"
    }
  },
  "skipValidation": "bool",
  "timeSeries": {
    "coarseGrainTimestamp": "string",
    "fineGrainTimestamp": "string"
  }
}

Özellik değerleri

çalışma alanları/veri kümeleri

Ad Açıklama Değer
tür Kaynak türü 'Microsoft.MachineLearningServices/workspaces/datasets'
apiVersion Kaynak API'sinin sürümü '2020-05-01-preview'
name Kaynak adı

Bkz. JSON ARM şablonlarında alt kaynaklar için adları ve türleri ayarlama.
dize (gerekli)
datasetType Veri kümesi türünü belirtir. 'file'
'tabular' (gerekli)
parameters DatasetCreateRequestParameters (gerekli)
kayıt DatasetCreateRequestRegistration (gerekli)
skipValidation Kayıttan önce veri kümesinden veri yüklenebilmesini sağlayan doğrulamayı atlayın. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Ad Açıklama Değer
üst bilgi Üst bilgi türü. 'all_files_have_same_headers'
'combine_all_files_headers'
'no_headers'
'only_first_file_has_headers'
includePath Yol bilgilerini veri kümesinde sütun olarak tutmak için Boole değeri. Varsayılan değer False'tur. Bu, birden çok dosyayı okurken ve belirli bir kaydın hangi dosyadan kaynaklandığını bilmek veya dosya yolunda yararlı bilgileri tutmak için yararlıdır. bool
partitionFormat Her yolun bölüm bilgileri belirtilen biçime göre sütunlara ayıklanır. '{column_name}' biçim bölümü dize sütunu oluşturur ve '{column_name:yyyy/AA/GG/SS/aa/ss}' datetime sütunu oluşturur; burada tarih saat türü için yıl, ay, gün, saat, dakika ve saniyeyi ayıklamak için 'yyyy', 'MM', 'dd', 'SS', 'mm' ve 'ss' kullanılır. Biçim, ilk bölüm anahtarının konumundan dosya yolunun sonuna kadar başlamalıdır. Örneğin, '.. /USA/2019/01/01/data.parquet' bölümün ülkeye/bölgeye ve zamana göre olduğu yer, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' değeri 'USA' olan bir 'CountryOrRegion' dize sütunu ve '2019-01-01' değeriyle 'PartitionDate' tarih saat sütunu oluşturur string
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
Ayırıcı 'delimited_files' sourceType için sütunları bölmek için kullanılan ayırıcı. string
Sourcetype Veri kaynağı türü. 'delimited_files'
'json_lines_files'
'parquet_files'

DatasetCreateRequestParametersPath

Ad Açıklama Değer
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Http URL'si. string

DatasetCreateRequestParametersPathDataPath

Ad Açıklama Değer
datastoreName Veri deposu adı. string
Relativepath Veri deposu içindeki yol. string

DatasetCreateRequestParametersQuery

Ad Açıklama Değer
datastoreName SQL/PostgreSQL/MySQL veri deposu adı. string
query SQL Quey. string

DatasetCreateRequestRegistration

Ad Açıklama Değer
açıklama Veri kümesinin açıklaması. string
name Veri kümesinin adı. string
etiketler Veri kümesiyle ilişkili etiketler. object

DatasetCreateRequestTimeSeries

Ad Açıklama Değer
coarseGrainTimestamp CoarseGrainTimestamp olarak kullanılacak sütun adı. Yalnızca 'fineGrainTimestamp' belirtilirse ve 'fineGrainTimestamp' ile aynı olamazsa kullanılabilir. string
fineGrainTimestamp FineGrainTimestamp olarak kullanılacak sütun adı string

Hızlı başlangıç şablonları

Aşağıdaki hızlı başlangıç şablonları bu kaynak türünü dağıtır.

Şablon Description
Veri Deposundaki Göreli Yoldan Dosya Veri Kümesi Oluşturma

Azure’a dağıtın
Bu şablon, Azure Machine Learning çalışma alanındaki veri deposundaki göreli yoldan bir dosya veri kümesi oluşturur.
Web URL'sinden AML çalışma alanında Dosya Veri Kümesi oluşturma

Azure’a dağıtın
Bu şablon, Azure Machine Learning çalışma alanındaki Web URL'sinden bir dosya veri kümesi oluşturur.
Veri Deposundaki Göreli Yoldan Tablosal Veri Kümesi Oluşturma

Azure’a dağıtın
Bu şablon, Azure Machine Learning çalışma alanındaki veri deposundaki göreli yoldan tablosal bir veri kümesi oluşturur.
SQL/PostgreSQL/MySQL Veri Deposundan Tablosal Veri Kümesi Oluşturma

Azure’a dağıtın
Bu şablon, Azure Machine Learning çalışma alanındaki SQL/PostgreSQL/MySQL veri deposundaki SQL sorgusundan tablosal bir veri kümesi oluşturur.
Web URL'sinden AML çalışma alanında Tablolu Veri Kümesi oluşturma

Azure’a dağıtın
Bu şablon, Azure Machine Learning çalışma alanındaki Web URL'sinden tablosal bir veri kümesi oluşturur.
Birden çok Veri Kümesi & Veri Depoları ile AML çalışma alanı oluşturma

Azure’a dağıtın
Bu şablon, veri depoları & birden çok veri kümesiyle Azure Machine Learning çalışma alanı oluşturur.

Terraform (AzAPI sağlayıcısı) kaynak tanımı

Çalışma alanları/veri kümeleri kaynak türü, aşağıdakileri hedefleyen işlemlerle dağıtılabilir:

  • Kaynak grupları

Her API sürümünde değiştirilen özelliklerin listesi için bkz. değişiklik günlüğü.

Kaynak biçimi

Microsoft.MachineLearningServices/workspaces/datasets kaynağı oluşturmak için şablonunuza aşağıdaki Terraform'u ekleyin.

resource "azapi_resource" "symbolicname" {
  type = "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
  name = "string"
  parent_id = "string"
  body = jsonencode({
    datasetType = "string"
    parameters = {
      header = "string"
      includePath = bool
      partitionFormat = "string"
      path = {
        dataPath = {
          datastoreName = "string"
          relativePath = "string"
        }
        httpUrl = "string"
      }
      query = {
        datastoreName = "string"
        query = "string"
      }
      separator = "string"
      sourceType = "string"
    }
    registration = {
      description = "string"
      name = "string"
      tags = {
        {customized property} = "string"
      }
    }
    skipValidation = bool
    timeSeries = {
      coarseGrainTimestamp = "string"
      fineGrainTimestamp = "string"
    }
  })
}

Özellik değerleri

çalışma alanları/veri kümeleri

Ad Açıklama Değer
tür Kaynak türü "Microsoft.MachineLearningServices/workspaces/datasets@2020-05-01-preview"
name Kaynak adı dize (gerekli)
parent_id Bu kaynağın üst öğesi olan kaynağın kimliği. Kaynak türü: çalışma alanları kimliği
datasetType Veri kümesi türünü belirtir. "dosya"
"tablosal" (gerekli)
parameters DatasetCreateRequestParameters (gerekli)
kayıt DatasetCreateRequestRegistration (gerekli)
skipValidation Kayıttan önce verilerin veri kümesinden yüklenebilmesini sağlayan doğrulamayı atlayın. bool
timeSeries DatasetCreateRequestTimeSeries

DatasetCreateRequestParameters

Ad Açıklama Değer
üst bilgi Üst bilgi türü. "all_files_have_same_headers"
"combine_all_files_headers"
"no_headers"
"only_first_file_has_headers"
includePath Veri kümesinde yol bilgilerini sütun olarak tutmak için Boole değeri. Varsayılan değer False'tur. Bu, birden çok dosyayı okurken ve belirli bir kaydın hangi dosyadan kaynaklandığını bilmek veya yararlı bilgileri dosya yolunda tutmak istediğinizde yararlıdır. bool
partitionFormat Her yolun bölüm bilgileri belirtilen biçime göre sütunlara ayıklanır. '{column_name}' biçim bölümü dize sütunu oluşturur ve '{column_name:yyyy/AA/GG/HH/aa/ss}' datetime sütunu oluşturur; burada tarih saat türü için yıl, ay, gün, saat, dakika ve saniyeyi ayıklamak için 'yyyy', 'MM', 'dd', 'SS', 'd' ve 'ss' kullanılır. Biçim, ilk bölüm anahtarının konumundan dosya yolunun sonuna kadar başlamalıdır. Örneğin, '.. /USA/2019/01/01/data.parquet' bölümün ülkeye/bölgeye ve zamana göre olduğu yer, partition_format='/{CountryOrRegion}/{PartitionDate:yyyy/MM/dd}/data.csv' değeri 'USA' olan bir 'CountryOrRegion' dize sütunu ve '2019-01-01' değeriyle 'PartitionDate' tarih saat sütunu oluşturur string
path DatasetCreateRequestParametersPath
query DatasetCreateRequestParametersQuery
Ayırıcı 'delimited_files' sourceType için sütunları bölmek için kullanılan ayırıcı. string
Sourcetype Veri kaynağı türü. "delimited_files"
"json_lines_files"
"parquet_files"

DatasetCreateRequestParametersPath

Ad Açıklama Değer
dataPath DatasetCreateRequestParametersPathDataPath
httpUrl Http URL'si. string

DatasetCreateRequestParametersPathDataPath

Ad Açıklama Değer
datastoreName Veri deposu adı. string
Relativepath Veri deposu içindeki yol. string

DatasetCreateRequestParametersQuery

Ad Açıklama Değer
datastoreName SQL/PostgreSQL/MySQL veri deposu adı. string
query SQL Quey. string

DatasetCreateRequestRegistration

Ad Açıklama Değer
açıklama Veri kümesinin açıklaması. string
name Veri kümesinin adı. string
etiketler Veri kümesiyle ilişkili etiketler. object

DatasetCreateRequestTimeSeries

Ad Açıklama Değer
coarseGrainTimestamp CoarseGrainTimestamp olarak kullanılacak sütun adı. Yalnızca 'fineGrainTimestamp' belirtilirse ve 'fineGrainTimestamp' ile aynı olamazsa kullanılabilir. string
fineGrainTimestamp FineGrainTimestamp olarak kullanılacak sütun adı string