AbstractDataset Sınıf
Azure Machine Learning'de temel veri kümesi sınıfı.
Veri kümesi örnekleri oluşturmak için lütfen sınıfa ve FileDatasetFactory sınıfa başvurunTabularDatasetFactory.
Sınıf AbstractDataset oluşturucu.
Bu oluşturucu doğrudan çağrılmayacak. Veri kümesinin sınıf ve FileDatasetFactory sınıf kullanılarak TabularDatasetFactory oluşturulması amaçlanmıştır.
- Devralma
-
builtins.objectAbstractDataset
Oluşturucu
AbstractDataset()
Yöntemler
add_tags |
Bu veri kümesinin etiketler sözlüğüne anahtar değer çiftleri ekleyin. |
as_named_input |
Bu veri kümesi için çalıştırmadaki gerçekleştirilmiş veri kümesini almak için kullanılacak bir ad sağlayın. |
get_all |
Çalışma alanındaki tüm kayıtlı veri kümelerini alın. |
get_by_id |
Çalışma alanına kaydedilen bir Veri Kümesi alın. |
get_by_name |
Kayıt adına göre çalışma alanından kayıtlı bir Veri Kümesi alın. |
get_partition_key_values |
partition_keys benzersiz anahtar değerlerini döndürür. partition_keys tam bölüm anahtarları kümesinin geçerli bir alt kümesi olup olmadığını doğrulayın, partition_keys benzersiz anahtar değerlerini döndür, partition_keys Yok ise bu veri kümesinin tüm bölüm anahtarlarını alarak benzersiz anahtar bileşimlerini döndürmek için varsayılan olarak
|
register |
Veri kümesini sağlanan çalışma alanına kaydedin. |
remove_tags |
Belirtilen anahtarları bu veri kümesinin etiket sözlüğünden kaldırın. |
unregister_all_versions |
Çalışma alanından bu veri kümesinin kayıt adı altındaki tüm sürümlerin kaydını kaldırın. |
update |
Veri kümesinin yerinde güncelleştirmesini gerçekleştirin. |
add_tags
Bu veri kümesinin etiketler sözlüğüne anahtar değer çiftleri ekleyin.
add_tags(tags=None)
Parametreler
Döndürülenler
Güncelleştirilmiş veri kümesi nesnesi.
Dönüş türü
as_named_input
Bu veri kümesi için çalıştırmadaki gerçekleştirilmiş veri kümesini almak için kullanılacak bir ad sağlayın.
as_named_input(name)
Parametreler
Döndürülenler
Veri Kümesinin çalıştırmada nasıl gerçekleştirilmesi gerektiğini açıklayan yapılandırma nesnesi.
Dönüş türü
Açıklamalar
Buradaki ad yalnızca bir Azure Machine Learning çalıştırması içinde geçerli olacaktır. Adın yalnızca alfasayısal ve alt çizgi karakterleri içermesi gerekir, bu nedenle ortam değişkeni olarak kullanılabilir hale getirilebilir. İki yaklaşım kullanarak bir çalıştırma bağlamında veri kümesini almak için bu adı kullanabilirsiniz:
Ortam Değişkeni:
Ad ortam değişkeni adı olacak ve gerçekleştirilmiş veri kümesi ortam değişkeninin değeri olarak kullanılabilir hale getirilecektir. Veri kümesi indirilir veya bağlanırsa, değer indirilen/bağlanan yol olur. Örnek:
# in your job submission notebook/script:
dataset.as_named_input('foo').as_download('/tmp/dataset')
# in the script that will be executed in the run
import os
path = os.environ['foo'] # path will be /tmp/dataset
Not
Veri kümesi doğrudan moda ayarlanırsa, değer veri kümesi kimliği olur. Daha sonra
Dataset.get_by_id(os.environ['foo']) yaparak veri kümesi nesnesini alma
Run.input_datasets:
Bu, anahtarın bu yöntemde belirttiğiniz veri kümesi adı ve değerin gerçekleştirilmiş veri kümesi olacağı bir sözlüktür. İndirilen ve bağlanan veri kümesi için değer indirilen/bağlanan yol olur. Doğrudan mod için değer, iş gönderimi betiğinizde belirttiğiniz veri kümesi nesnesiyle aynı olur.
# in your job submission notebook/script:
dataset.as_named_input('foo') # direct mode
# in the script that will be executed in the run
run = Run.get_context()
run.input_datasets['foo'] # this returns the dataset object from above.
get_all
Çalışma alanındaki tüm kayıtlı veri kümelerini alın.
static get_all(workspace)
Parametreler
Döndürülenler
Kayıt adlarına göre anahtarlanan TabularDataset ve FileDataset nesnelerinin sözlüğü.
Dönüş türü
get_by_id
Çalışma alanına kaydedilen bir Veri Kümesi alın.
static get_by_id(workspace, id, **kwargs)
Parametreler
Döndürülenler
Veri kümesi nesnesi. Veri kümesi kayıtlıysa, kayıt adı ve sürümü de döndürülür.
Dönüş türü
get_by_name
Kayıt adına göre çalışma alanından kayıtlı bir Veri Kümesi alın.
static get_by_name(workspace, name, version='latest', **kwargs)
Parametreler
Döndürülenler
Kayıtlı veri kümesi nesnesi.
Dönüş türü
get_partition_key_values
partition_keys benzersiz anahtar değerlerini döndürür.
partition_keys tam bölüm anahtarları kümesinin geçerli bir alt kümesi olup olmadığını doğrulayın, partition_keys benzersiz anahtar değerlerini döndür, partition_keys Yok ise bu veri kümesinin tüm bölüm anahtarlarını alarak benzersiz anahtar bileşimlerini döndürmek için varsayılan olarak
# get all partition key value pairs
partitions = ds.get_partition_key_values()
# Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]
partitions = ds.get_partition_key_values(['country'])
# Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)
Parametreler
register
Veri kümesini sağlanan çalışma alanına kaydedin.
register(workspace, name, description=None, tags=None, create_new_version=False)
Parametreler
Veri kümesine vermek için anahtar değer etiketleri sözlüğü. Varsayılan değer Yok'tır.
- create_new_version
- bool
Veri kümesini belirtilen ad altında yeni bir sürüm olarak kaydetmek için Boole değeri.
Döndürülenler
Kayıtlı veri kümesi nesnesi.
Dönüş türü
remove_tags
Belirtilen anahtarları bu veri kümesinin etiket sözlüğünden kaldırın.
remove_tags(tags=None)
Parametreler
Döndürülenler
Güncelleştirilmiş veri kümesi nesnesi.
Dönüş türü
unregister_all_versions
Çalışma alanından bu veri kümesinin kayıt adı altındaki tüm sürümlerin kaydını kaldırın.
unregister_all_versions()
Açıklamalar
İşlem hiçbir kaynak veriyi değiştirmez.
update
Veri kümesinin yerinde güncelleştirmesini gerçekleştirin.
update(description=None, tags=None)
Parametreler
- description
- str
Veri kümesi için kullanılacak yeni açıklama. Bu açıklama, mevcut açıklamanın yerini alır. Varsayılan olarak mevcut açıklamayı kullanır. Açıklamayı temizlemek için boş dize girin.
Veri kümesini güncelleştirmek için etiket sözlüğü. Bu etiketler veri kümesi için mevcut etiketlerin yerini alır. Varsayılan olarak mevcut etiketler kullanılır. Etiketleri temizlemek için boş sözlük girin.
Döndürülenler
Güncelleştirilmiş veri kümesi nesnesi.
Dönüş türü
Öznitelikler
data_changed_time
Kaynak verilerin değiştirilme süresini döndürür.
Döndürülenler
Kaynak verilerde en son değişikliğin gerçekleştiği zaman.
Dönüş türü
Açıklamalar
Dosya tabanlı veri kaynağı için veri değiştirme süresi kullanılabilir. Veri kaynağı değişiklik olup olmadığını denetlemek için desteklenmediğinde hiçbiri döndürülmeyecek.
description
id
Veri kümesinin tanımlayıcısını döndürür.
Döndürülenler
Veri kümesi kimliği. Veri kümesi herhangi bir çalışma alanına kaydedilmezse kimlik Yok olur.
Dönüş türü
name
partition_keys
tags
version
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin