Aracılığıyla paylaş


AbstractDataset Sınıf

Azure Machine Learning'de temel veri kümesi sınıfı.

Veri kümesi örnekleri oluşturmak için lütfen sınıfa ve FileDatasetFactory sınıfa başvurunTabularDatasetFactory.

Sınıf AbstractDataset oluşturucu.

Bu oluşturucu doğrudan çağrılmayacak. Veri kümesinin sınıf ve FileDatasetFactory sınıf kullanılarak TabularDatasetFactory oluşturulması amaçlanmıştır.

Devralma
builtins.object
AbstractDataset

Oluşturucu

AbstractDataset()

Yöntemler

add_tags

Bu veri kümesinin etiketler sözlüğüne anahtar değer çiftleri ekleyin.

as_named_input

Bu veri kümesi için çalıştırmadaki gerçekleştirilmiş veri kümesini almak için kullanılacak bir ad sağlayın.

get_all

Çalışma alanındaki tüm kayıtlı veri kümelerini alın.

get_by_id

Çalışma alanına kaydedilen bir Veri Kümesi alın.

get_by_name

Kayıt adına göre çalışma alanından kayıtlı bir Veri Kümesi alın.

get_partition_key_values

partition_keys benzersiz anahtar değerlerini döndürür.

partition_keys tam bölüm anahtarları kümesinin geçerli bir alt kümesi olup olmadığını doğrulayın, partition_keys benzersiz anahtar değerlerini döndür, partition_keys Yok ise bu veri kümesinin tüm bölüm anahtarlarını alarak benzersiz anahtar bileşimlerini döndürmek için varsayılan olarak


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
register

Veri kümesini sağlanan çalışma alanına kaydedin.

remove_tags

Belirtilen anahtarları bu veri kümesinin etiket sözlüğünden kaldırın.

unregister_all_versions

Çalışma alanından bu veri kümesinin kayıt adı altındaki tüm sürümlerin kaydını kaldırın.

update

Veri kümesinin yerinde güncelleştirmesini gerçekleştirin.

add_tags

Bu veri kümesinin etiketler sözlüğüne anahtar değer çiftleri ekleyin.

add_tags(tags=None)

Parametreler

Name Description
tags
Gerekli

Eklenecek etiketlerin sözlüğü.

Döndürülenler

Tür Description

Güncelleştirilmiş veri kümesi nesnesi.

as_named_input

Bu veri kümesi için çalıştırmadaki gerçekleştirilmiş veri kümesini almak için kullanılacak bir ad sağlayın.

as_named_input(name)

Parametreler

Name Description
name
Gerekli
str

Çalıştırma için veri kümesinin adı.

Döndürülenler

Tür Description

Veri Kümesinin çalıştırmada nasıl gerçekleştirilmesi gerektiğini açıklayan yapılandırma nesnesi.

Açıklamalar

Buradaki ad yalnızca bir Azure Machine Learning çalıştırması içinde geçerli olacaktır. Adın yalnızca alfasayısal ve alt çizgi karakterleri içermesi gerekir, bu nedenle ortam değişkeni olarak kullanılabilir hale getirilebilir. İki yaklaşım kullanarak bir çalıştırma bağlamında veri kümesini almak için bu adı kullanabilirsiniz:

  • Ortam Değişkeni:

    Ad ortam değişkeni adı olacak ve gerçekleştirilmiş veri kümesi ortam değişkeninin değeri olarak kullanılabilir hale getirilecektir. Veri kümesi indirilir veya bağlanırsa, değer indirilen/bağlanan yol olur. Örnek:


   # in your job submission notebook/script:
   dataset.as_named_input('foo').as_download('/tmp/dataset')

   # in the script that will be executed in the run
   import os
   path = os.environ['foo'] # path will be /tmp/dataset

Not

Veri kümesi doğrudan moda ayarlanırsa, değer veri kümesi kimliği olur. Daha sonra

Dataset.get_by_id(os.environ['foo']) yaparak veri kümesi nesnesini alma

  • Run.input_datasets:

    Bu, anahtarın bu yöntemde belirttiğiniz veri kümesi adı ve değerin gerçekleştirilmiş veri kümesi olacağı bir sözlüktür. İndirilen ve bağlanan veri kümesi için değer indirilen/bağlanan yol olur. Doğrudan mod için değer, iş gönderimi betiğinizde belirttiğiniz veri kümesi nesnesiyle aynı olur.


   # in your job submission notebook/script:
   dataset.as_named_input('foo') # direct mode

   # in the script that will be executed in the run
   run = Run.get_context()
   run.input_datasets['foo'] # this returns the dataset object from above.

get_all

Çalışma alanındaki tüm kayıtlı veri kümelerini alın.

static get_all(workspace)

Parametreler

Name Description
workspace
Gerekli

Veri kümelerinin kayıtlı olduğu mevcut AzureML çalışma alanı.

Döndürülenler

Tür Description

Kayıt adlarına göre anahtarlanan TabularDataset ve FileDataset nesnelerinin sözlüğü.

get_by_id

Çalışma alanına kaydedilen bir Veri Kümesi alın.

static get_by_id(workspace, id, **kwargs)

Parametreler

Name Description
workspace
Gerekli

Veri Kümesinin kaydedildiği mevcut AzureML çalışma alanı.

id
Gerekli
str

Veri kümesinin kimliği.

Döndürülenler

Tür Description

Veri kümesi nesnesi. Veri kümesi kayıtlıysa, kayıt adı ve sürümü de döndürülür.

get_by_name

Kayıt adına göre çalışma alanından kayıtlı bir Veri Kümesi alın.

static get_by_name(workspace, name, version='latest', **kwargs)

Parametreler

Name Description
workspace
Gerekli

Veri Kümesinin kayıtlı olduğu mevcut AzureML çalışma alanı.

name
Gerekli
str

Kayıt adı.

version
Gerekli
int

Kayıt sürümü. Varsayılan olarak 'en son' olarak ayarlanır.

Döndürülenler

Tür Description

Kayıtlı veri kümesi nesnesi.

get_partition_key_values

partition_keys benzersiz anahtar değerlerini döndürür.

partition_keys tam bölüm anahtarları kümesinin geçerli bir alt kümesi olup olmadığını doğrulayın, partition_keys benzersiz anahtar değerlerini döndür, partition_keys Yok ise bu veri kümesinin tüm bölüm anahtarlarını alarak benzersiz anahtar bileşimlerini döndürmek için varsayılan olarak


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)

Parametreler

Name Description
partition_keys
Gerekli

bölüm anahtarları

register

Veri kümesini sağlanan çalışma alanına kaydedin.

register(workspace, name, description=None, tags=None, create_new_version=False)

Parametreler

Name Description
workspace
Gerekli

Veri kümesini kaydetmek için çalışma alanı.

name
Gerekli
str

Veri kümesinin kaydedilecek adı.

description
Gerekli
str

Veri kümesinin metin açıklaması. Varsayılan değer Yok'tır.

tags
Gerekli

Veri kümesine vermek için anahtar değer etiketleri sözlüğü. Varsayılan değer Yok'tır.

create_new_version
Gerekli

Veri kümesini belirtilen ad altında yeni bir sürüm olarak kaydetmek için Boole değeri.

Döndürülenler

Tür Description

Kayıtlı veri kümesi nesnesi.

remove_tags

Belirtilen anahtarları bu veri kümesinin etiket sözlüğünden kaldırın.

remove_tags(tags=None)

Parametreler

Name Description
tags
Gerekli

Kaldırılacak anahtarların listesi.

Döndürülenler

Tür Description

Güncelleştirilmiş veri kümesi nesnesi.

unregister_all_versions

Çalışma alanından bu veri kümesinin kayıt adı altındaki tüm sürümlerin kaydını kaldırın.

unregister_all_versions()

Açıklamalar

İşlem hiçbir kaynak veriyi değiştirmez.

update

Veri kümesinin yerinde güncelleştirmesini gerçekleştirin.

update(description=None, tags=None)

Parametreler

Name Description
description
Gerekli
str

Veri kümesi için kullanılacak yeni açıklama. Bu açıklama, mevcut açıklamanın yerini alır. Varsayılan olarak mevcut açıklamayı kullanır. Açıklamayı temizlemek için boş dize girin.

tags
Gerekli

Veri kümesini güncelleştirmek için etiket sözlüğü. Bu etiketler veri kümesi için mevcut etiketlerin yerini alır. Varsayılan olarak mevcut etiketler kullanılır. Etiketleri temizlemek için boş sözlük girin.

Döndürülenler

Tür Description

Güncelleştirilmiş veri kümesi nesnesi.

Öznitelikler

data_changed_time

Kaynak verilerin değiştirilme süresini döndürür.

Döndürülenler

Tür Description

Kaynak verilerde en son değişikliğin gerçekleştiği zaman.

Açıklamalar

Dosya tabanlı veri kaynağı için veri değiştirme süresi kullanılabilir. Veri kaynağı değişiklik olup olmadığını denetlemek için desteklenmediğinde hiçbiri döndürülmeyecek.

description

Kayıt açıklamasını iade edin.

Döndürülenler

Tür Description
str

Veri kümesi açıklaması.

id

Veri kümesinin tanımlayıcısını döndürür.

Döndürülenler

Tür Description
str

Veri kümesi kimliği. Veri kümesi herhangi bir çalışma alanına kaydedilmezse kimlik Yok olur.

name

Kayıt adını döndürür.

Döndürülenler

Tür Description
str

Veri kümesi adı.

partition_keys

Bölüm anahtarlarını döndür.

Döndürülenler

Tür Description

bölüm anahtarları

tags

Kayıt etiketlerini iade edin.

Döndürülenler

Tür Description
str

Veri kümesi etiketleri.

version

Kayıt sürümünü iade edin.

Döndürülenler

Tür Description
int

Veri kümesi sürümü.