Aracılığıyla paylaş


AbstractDataset Sınıf

Azure Machine Learning'de temel veri kümesi sınıfı.

Veri kümesi örnekleri oluşturmak için lütfen sınıfa ve FileDatasetFactory sınıfa başvurunTabularDatasetFactory.

Sınıf AbstractDataset oluşturucu.

Bu oluşturucu doğrudan çağrılmayacak. Veri kümesinin sınıf ve FileDatasetFactory sınıf kullanılarak TabularDatasetFactory oluşturulması amaçlanmıştır.

Devralma
builtins.object
AbstractDataset

Oluşturucu

AbstractDataset()

Yöntemler

add_tags

Bu veri kümesinin etiketler sözlüğüne anahtar değer çiftleri ekleyin.

as_named_input

Bu veri kümesi için çalıştırmadaki gerçekleştirilmiş veri kümesini almak için kullanılacak bir ad sağlayın.

get_all

Çalışma alanındaki tüm kayıtlı veri kümelerini alın.

get_by_id

Çalışma alanına kaydedilen bir Veri Kümesi alın.

get_by_name

Kayıt adına göre çalışma alanından kayıtlı bir Veri Kümesi alın.

get_partition_key_values

partition_keys benzersiz anahtar değerlerini döndürür.

partition_keys tam bölüm anahtarları kümesinin geçerli bir alt kümesi olup olmadığını doğrulayın, partition_keys benzersiz anahtar değerlerini döndür, partition_keys Yok ise bu veri kümesinin tüm bölüm anahtarlarını alarak benzersiz anahtar bileşimlerini döndürmek için varsayılan olarak


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
register

Veri kümesini sağlanan çalışma alanına kaydedin.

remove_tags

Belirtilen anahtarları bu veri kümesinin etiket sözlüğünden kaldırın.

unregister_all_versions

Çalışma alanından bu veri kümesinin kayıt adı altındaki tüm sürümlerin kaydını kaldırın.

update

Veri kümesinin yerinde güncelleştirmesini gerçekleştirin.

add_tags

Bu veri kümesinin etiketler sözlüğüne anahtar değer çiftleri ekleyin.

add_tags(tags=None)

Parametreler

tags
dict[str, str]
Gerekli

Eklenecek etiketlerin sözlüğü.

Döndürülenler

Güncelleştirilmiş veri kümesi nesnesi.

Dönüş türü

as_named_input

Bu veri kümesi için çalıştırmadaki gerçekleştirilmiş veri kümesini almak için kullanılacak bir ad sağlayın.

as_named_input(name)

Parametreler

name
str
Gerekli

Çalıştırma için veri kümesinin adı.

Döndürülenler

Veri Kümesinin çalıştırmada nasıl gerçekleştirilmesi gerektiğini açıklayan yapılandırma nesnesi.

Dönüş türü

Açıklamalar

Buradaki ad yalnızca bir Azure Machine Learning çalıştırması içinde geçerli olacaktır. Adın yalnızca alfasayısal ve alt çizgi karakterleri içermesi gerekir, bu nedenle ortam değişkeni olarak kullanılabilir hale getirilebilir. İki yaklaşım kullanarak bir çalıştırma bağlamında veri kümesini almak için bu adı kullanabilirsiniz:

  • Ortam Değişkeni:

    Ad ortam değişkeni adı olacak ve gerçekleştirilmiş veri kümesi ortam değişkeninin değeri olarak kullanılabilir hale getirilecektir. Veri kümesi indirilir veya bağlanırsa, değer indirilen/bağlanan yol olur. Örnek:


   # in your job submission notebook/script:
   dataset.as_named_input('foo').as_download('/tmp/dataset')

   # in the script that will be executed in the run
   import os
   path = os.environ['foo'] # path will be /tmp/dataset

Not

Veri kümesi doğrudan moda ayarlanırsa, değer veri kümesi kimliği olur. Daha sonra

Dataset.get_by_id(os.environ['foo']) yaparak veri kümesi nesnesini alma

  • Run.input_datasets:

    Bu, anahtarın bu yöntemde belirttiğiniz veri kümesi adı ve değerin gerçekleştirilmiş veri kümesi olacağı bir sözlüktür. İndirilen ve bağlanan veri kümesi için değer indirilen/bağlanan yol olur. Doğrudan mod için değer, iş gönderimi betiğinizde belirttiğiniz veri kümesi nesnesiyle aynı olur.


   # in your job submission notebook/script:
   dataset.as_named_input('foo') # direct mode

   # in the script that will be executed in the run
   run = Run.get_context()
   run.input_datasets['foo'] # this returns the dataset object from above.

get_all

Çalışma alanındaki tüm kayıtlı veri kümelerini alın.

static get_all(workspace)

Parametreler

workspace
Workspace
Gerekli

Veri kümelerinin kayıtlı olduğu mevcut AzureML çalışma alanı.

Döndürülenler

Kayıt adlarına göre anahtarlanan TabularDataset ve FileDataset nesnelerinin sözlüğü.

Dönüş türü

get_by_id

Çalışma alanına kaydedilen bir Veri Kümesi alın.

static get_by_id(workspace, id, **kwargs)

Parametreler

workspace
Workspace
Gerekli

Veri Kümesinin kaydedildiği mevcut AzureML çalışma alanı.

id
str
Gerekli

Veri kümesinin kimliği.

Döndürülenler

Veri kümesi nesnesi. Veri kümesi kayıtlıysa, kayıt adı ve sürümü de döndürülür.

Dönüş türü

get_by_name

Kayıt adına göre çalışma alanından kayıtlı bir Veri Kümesi alın.

static get_by_name(workspace, name, version='latest', **kwargs)

Parametreler

workspace
Workspace
Gerekli

Veri Kümesinin kayıtlı olduğu mevcut AzureML çalışma alanı.

name
str
Gerekli

Kayıt adı.

version
int
Gerekli

Kayıt sürümü. Varsayılan olarak 'en son' olarak ayarlanır.

Döndürülenler

Kayıtlı veri kümesi nesnesi.

Dönüş türü

get_partition_key_values

partition_keys benzersiz anahtar değerlerini döndürür.

partition_keys tam bölüm anahtarları kümesinin geçerli bir alt kümesi olup olmadığını doğrulayın, partition_keys benzersiz anahtar değerlerini döndür, partition_keys Yok ise bu veri kümesinin tüm bölüm anahtarlarını alarak benzersiz anahtar bileşimlerini döndürmek için varsayılan olarak


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)

Parametreler

partition_keys
list[str]
Gerekli

bölüm anahtarları

register

Veri kümesini sağlanan çalışma alanına kaydedin.

register(workspace, name, description=None, tags=None, create_new_version=False)

Parametreler

workspace
Workspace
Gerekli

Veri kümesini kaydetmek için çalışma alanı.

name
str
Gerekli

Veri kümesinin kaydedilecek adı.

description
str
Gerekli

Veri kümesinin metin açıklaması. Varsayılan değer Yok'tır.

tags
dict[str, str]
Gerekli

Veri kümesine vermek için anahtar değer etiketleri sözlüğü. Varsayılan değer Yok'tır.

create_new_version
bool
Gerekli

Veri kümesini belirtilen ad altında yeni bir sürüm olarak kaydetmek için Boole değeri.

Döndürülenler

Kayıtlı veri kümesi nesnesi.

Dönüş türü

remove_tags

Belirtilen anahtarları bu veri kümesinin etiket sözlüğünden kaldırın.

remove_tags(tags=None)

Parametreler

tags
list[str]
Gerekli

Kaldırılacak anahtarların listesi.

Döndürülenler

Güncelleştirilmiş veri kümesi nesnesi.

Dönüş türü

unregister_all_versions

Çalışma alanından bu veri kümesinin kayıt adı altındaki tüm sürümlerin kaydını kaldırın.

unregister_all_versions()

Açıklamalar

İşlem hiçbir kaynak veriyi değiştirmez.

update

Veri kümesinin yerinde güncelleştirmesini gerçekleştirin.

update(description=None, tags=None)

Parametreler

description
str
Gerekli

Veri kümesi için kullanılacak yeni açıklama. Bu açıklama, mevcut açıklamanın yerini alır. Varsayılan olarak mevcut açıklamayı kullanır. Açıklamayı temizlemek için boş dize girin.

tags
dict[str, str]
Gerekli

Veri kümesini güncelleştirmek için etiket sözlüğü. Bu etiketler veri kümesi için mevcut etiketlerin yerini alır. Varsayılan olarak mevcut etiketler kullanılır. Etiketleri temizlemek için boş sözlük girin.

Döndürülenler

Güncelleştirilmiş veri kümesi nesnesi.

Dönüş türü

Öznitelikler

data_changed_time

Kaynak verilerin değiştirilme süresini döndürür.

Döndürülenler

Kaynak verilerde en son değişikliğin gerçekleştiği zaman.

Dönüş türü

Açıklamalar

Dosya tabanlı veri kaynağı için veri değiştirme süresi kullanılabilir. Veri kaynağı değişiklik olup olmadığını denetlemek için desteklenmediğinde hiçbiri döndürülmeyecek.

description

Kayıt açıklamasını iade edin.

Döndürülenler

Veri kümesi açıklaması.

Dönüş türü

str

id

Veri kümesinin tanımlayıcısını döndürür.

Döndürülenler

Veri kümesi kimliği. Veri kümesi herhangi bir çalışma alanına kaydedilmezse kimlik Yok olur.

Dönüş türü

str

name

Kayıt adını döndürür.

Döndürülenler

Veri kümesi adı.

Dönüş türü

str

partition_keys

Bölüm anahtarlarını döndür.

Döndürülenler

bölüm anahtarları

Dönüş türü

tags

Kayıt etiketlerini iade edin.

Döndürülenler

Veri kümesi etiketleri.

Dönüş türü

str

version

Kayıt sürümünü iade edin.

Döndürülenler

Veri kümesi sürümü.

Dönüş türü

int