AbstractDataset Sınıf
Azure Machine Learning'de temel veri kümesi sınıfı.
Veri kümesi örnekleri oluşturmak için lütfen sınıfa ve FileDatasetFactory sınıfa başvurunTabularDatasetFactory.
Sınıf AbstractDataset oluşturucu.
Bu oluşturucu doğrudan çağrılmayacak. Veri kümesinin sınıf ve FileDatasetFactory sınıf kullanılarak TabularDatasetFactory oluşturulması amaçlanmıştır.
- Devralma
-
builtins.objectAbstractDataset
Oluşturucu
AbstractDataset()
Yöntemler
add_tags |
Bu veri kümesinin etiketler sözlüğüne anahtar değer çiftleri ekleyin. |
as_named_input |
Bu veri kümesi için çalıştırmadaki gerçekleştirilmiş veri kümesini almak için kullanılacak bir ad sağlayın. |
get_all |
Çalışma alanındaki tüm kayıtlı veri kümelerini alın. |
get_by_id |
Çalışma alanına kaydedilen bir Veri Kümesi alın. |
get_by_name |
Kayıt adına göre çalışma alanından kayıtlı bir Veri Kümesi alın. |
get_partition_key_values |
partition_keys benzersiz anahtar değerlerini döndürür. partition_keys tam bölüm anahtarları kümesinin geçerli bir alt kümesi olup olmadığını doğrulayın, partition_keys benzersiz anahtar değerlerini döndür, partition_keys Yok ise bu veri kümesinin tüm bölüm anahtarlarını alarak benzersiz anahtar bileşimlerini döndürmek için varsayılan olarak
|
register |
Veri kümesini sağlanan çalışma alanına kaydedin. |
remove_tags |
Belirtilen anahtarları bu veri kümesinin etiket sözlüğünden kaldırın. |
unregister_all_versions |
Çalışma alanından bu veri kümesinin kayıt adı altındaki tüm sürümlerin kaydını kaldırın. |
update |
Veri kümesinin yerinde güncelleştirmesini gerçekleştirin. |
add_tags
Bu veri kümesinin etiketler sözlüğüne anahtar değer çiftleri ekleyin.
add_tags(tags=None)
Parametreler
Name | Description |
---|---|
tags
Gerekli
|
Eklenecek etiketlerin sözlüğü. |
Döndürülenler
Tür | Description |
---|---|
Güncelleştirilmiş veri kümesi nesnesi. |
as_named_input
Bu veri kümesi için çalıştırmadaki gerçekleştirilmiş veri kümesini almak için kullanılacak bir ad sağlayın.
as_named_input(name)
Parametreler
Name | Description |
---|---|
name
Gerekli
|
Çalıştırma için veri kümesinin adı. |
Döndürülenler
Tür | Description |
---|---|
Veri Kümesinin çalıştırmada nasıl gerçekleştirilmesi gerektiğini açıklayan yapılandırma nesnesi. |
Açıklamalar
Buradaki ad yalnızca bir Azure Machine Learning çalıştırması içinde geçerli olacaktır. Adın yalnızca alfasayısal ve alt çizgi karakterleri içermesi gerekir, bu nedenle ortam değişkeni olarak kullanılabilir hale getirilebilir. İki yaklaşım kullanarak bir çalıştırma bağlamında veri kümesini almak için bu adı kullanabilirsiniz:
Ortam Değişkeni:
Ad ortam değişkeni adı olacak ve gerçekleştirilmiş veri kümesi ortam değişkeninin değeri olarak kullanılabilir hale getirilecektir. Veri kümesi indirilir veya bağlanırsa, değer indirilen/bağlanan yol olur. Örnek:
# in your job submission notebook/script:
dataset.as_named_input('foo').as_download('/tmp/dataset')
# in the script that will be executed in the run
import os
path = os.environ['foo'] # path will be /tmp/dataset
Not
Veri kümesi doğrudan moda ayarlanırsa, değer veri kümesi kimliği olur. Daha sonra
Dataset.get_by_id(os.environ['foo']) yaparak veri kümesi nesnesini alma
Run.input_datasets:
Bu, anahtarın bu yöntemde belirttiğiniz veri kümesi adı ve değerin gerçekleştirilmiş veri kümesi olacağı bir sözlüktür. İndirilen ve bağlanan veri kümesi için değer indirilen/bağlanan yol olur. Doğrudan mod için değer, iş gönderimi betiğinizde belirttiğiniz veri kümesi nesnesiyle aynı olur.
# in your job submission notebook/script:
dataset.as_named_input('foo') # direct mode
# in the script that will be executed in the run
run = Run.get_context()
run.input_datasets['foo'] # this returns the dataset object from above.
get_all
Çalışma alanındaki tüm kayıtlı veri kümelerini alın.
static get_all(workspace)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Veri kümelerinin kayıtlı olduğu mevcut AzureML çalışma alanı. |
Döndürülenler
Tür | Description |
---|---|
Kayıt adlarına göre anahtarlanan TabularDataset ve FileDataset nesnelerinin sözlüğü. |
get_by_id
Çalışma alanına kaydedilen bir Veri Kümesi alın.
static get_by_id(workspace, id, **kwargs)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Veri Kümesinin kaydedildiği mevcut AzureML çalışma alanı. |
id
Gerekli
|
Veri kümesinin kimliği. |
Döndürülenler
Tür | Description |
---|---|
Veri kümesi nesnesi. Veri kümesi kayıtlıysa, kayıt adı ve sürümü de döndürülür. |
get_by_name
Kayıt adına göre çalışma alanından kayıtlı bir Veri Kümesi alın.
static get_by_name(workspace, name, version='latest', **kwargs)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Veri Kümesinin kayıtlı olduğu mevcut AzureML çalışma alanı. |
name
Gerekli
|
Kayıt adı. |
version
Gerekli
|
Kayıt sürümü. Varsayılan olarak 'en son' olarak ayarlanır. |
Döndürülenler
Tür | Description |
---|---|
Kayıtlı veri kümesi nesnesi. |
get_partition_key_values
partition_keys benzersiz anahtar değerlerini döndürür.
partition_keys tam bölüm anahtarları kümesinin geçerli bir alt kümesi olup olmadığını doğrulayın, partition_keys benzersiz anahtar değerlerini döndür, partition_keys Yok ise bu veri kümesinin tüm bölüm anahtarlarını alarak benzersiz anahtar bileşimlerini döndürmek için varsayılan olarak
# get all partition key value pairs
partitions = ds.get_partition_key_values()
# Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]
partitions = ds.get_partition_key_values(['country'])
# Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)
Parametreler
Name | Description |
---|---|
partition_keys
Gerekli
|
bölüm anahtarları |
register
Veri kümesini sağlanan çalışma alanına kaydedin.
register(workspace, name, description=None, tags=None, create_new_version=False)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Veri kümesini kaydetmek için çalışma alanı. |
name
Gerekli
|
Veri kümesinin kaydedilecek adı. |
description
Gerekli
|
Veri kümesinin metin açıklaması. Varsayılan değer Yok'tır. |
tags
Gerekli
|
Veri kümesine vermek için anahtar değer etiketleri sözlüğü. Varsayılan değer Yok'tır. |
create_new_version
Gerekli
|
Veri kümesini belirtilen ad altında yeni bir sürüm olarak kaydetmek için Boole değeri. |
Döndürülenler
Tür | Description |
---|---|
Kayıtlı veri kümesi nesnesi. |
remove_tags
Belirtilen anahtarları bu veri kümesinin etiket sözlüğünden kaldırın.
remove_tags(tags=None)
Parametreler
Name | Description |
---|---|
tags
Gerekli
|
Kaldırılacak anahtarların listesi. |
Döndürülenler
Tür | Description |
---|---|
Güncelleştirilmiş veri kümesi nesnesi. |
unregister_all_versions
Çalışma alanından bu veri kümesinin kayıt adı altındaki tüm sürümlerin kaydını kaldırın.
unregister_all_versions()
Açıklamalar
İşlem hiçbir kaynak veriyi değiştirmez.
update
Veri kümesinin yerinde güncelleştirmesini gerçekleştirin.
update(description=None, tags=None)
Parametreler
Name | Description |
---|---|
description
Gerekli
|
Veri kümesi için kullanılacak yeni açıklama. Bu açıklama, mevcut açıklamanın yerini alır. Varsayılan olarak mevcut açıklamayı kullanır. Açıklamayı temizlemek için boş dize girin. |
tags
Gerekli
|
Veri kümesini güncelleştirmek için etiket sözlüğü. Bu etiketler veri kümesi için mevcut etiketlerin yerini alır. Varsayılan olarak mevcut etiketler kullanılır. Etiketleri temizlemek için boş sözlük girin. |
Döndürülenler
Tür | Description |
---|---|
Güncelleştirilmiş veri kümesi nesnesi. |
Öznitelikler
data_changed_time
Kaynak verilerin değiştirilme süresini döndürür.
Döndürülenler
Tür | Description |
---|---|
Kaynak verilerde en son değişikliğin gerçekleştiği zaman. |
Açıklamalar
Dosya tabanlı veri kaynağı için veri değiştirme süresi kullanılabilir. Veri kaynağı değişiklik olup olmadığını denetlemek için desteklenmediğinde hiçbiri döndürülmeyecek.
description
id
Veri kümesinin tanımlayıcısını döndürür.
Döndürülenler
Tür | Description |
---|---|
Veri kümesi kimliği. Veri kümesi herhangi bir çalışma alanına kaydedilmezse kimlik Yok olur. |