DatasetSnapshot Sınıf
Bir snapsot almak, durumunu döndürmek ve bir veri çerçevesine dönüştürmek için veri kümesi anlık görüntülerini işlemleriyle yönetir.
Not
Bu sınıf kullanım dışıdır. Daha fazla bilgi için bkz. https://aka.ms/dataset-deprecation.
Sınıfının yönteminden create_snapshotDataset bir DataSnapshot nesnesi döndürülür.
Veri kümesi anlık görüntüsü, Profil ile verilerin isteğe bağlı gerçekleştirilmiş bir kopyasının birleşimidir.
Veri Kümesi Anlık Görüntüleri hakkında daha fazla bilgi edinmek için https://aka.ms/azureml/howto/createsnapshots
- Devralma
-
builtins.objectDatasetSnapshot
Oluşturucu
DatasetSnapshot(workspace, snapshot_name, dataset_id, definition_version=None, time_stamp=None, profile_action_id=None, datastore_name=None, relative_path=None, dataset_name=None)
Parametreler
- workspace
- <xref:azureml.core.Workspace.>
Veri kümesinin kayıtlı olduğu çalışma alanı.
Yöntemler
compare_profiles |
Geçerli veri kümesi profilini rhs_dataset profiliyle karşılaştırın. Profiller yoksa, bu yöntem bir özel durum oluşturur. |
get |
Veri kümesinin anlık görüntüsünü anlık görüntü adına göre alın. |
get_all |
Verilen Veri Kümesinin tüm anlık görüntülerini alın. |
get_profile |
Veri kümesi anlık görüntüsünün profilini alın. |
get_status |
Veri kümesi anlık görüntüsü oluşturma durumunu alın. |
is_data_snapshot_available |
Anlık görüntünün gerçekleştirilmiş kopyasının kullanılabilir olup olmadığını denetleyin. |
to_pandas_dataframe |
Anlık görüntüyle kaydedilen verileri yükleyerek bir Pandas DataFrame oluşturun. |
to_spark_dataframe |
Anlık görüntüyle kaydedilen verileri yükleyerek bir Spark DataFrame oluşturun. |
wait_for_completion |
DatasetSnapshot generaton işleminin tamamlanmasını bekleyin. |
compare_profiles
Geçerli veri kümesi profilini rhs_dataset profiliyle karşılaştırın.
Profiller yoksa, bu yöntem bir özel durum oluşturur.
compare_profiles(rhs_dataset_snapshot, include_columns=None, exclude_columns=None, histogram_compare_method=HistogramCompareMethod.WASSERSTEIN)
Parametreler
Karşılaştırmada dışlanacak sütun adlarının listesi.
- histogram_compare_method
- HistogramCompareMethod
Karşılaştırma yöntemini açıklayan bir sabit listesi, örneğin: WASSERSTEIN veya ENERGY.
Döndürülenler
Profiller arasındaki fark.
Dönüş türü
get
Veri kümesinin anlık görüntüsünü anlık görüntü adına göre alın.
static get(workspace, snapshot_name, dataset_name=None, dataset_id=None)
Parametreler
- dataset_name
Veri Kümesinin adı.
Döndürülenler
DatasetSnapshot nesnesi.
Dönüş türü
get_all
Verilen Veri Kümesinin tüm anlık görüntülerini alın.
static get_all(workspace, dataset_name)
Parametreler
- dataset_name
Veri Kümesinin adı.
Döndürülenler
Veri kümesi anlık görüntülerinin listesi
Dönüş türü
get_profile
Veri kümesi anlık görüntüsünün profilini alın.
get_profile()
Döndürülenler
Veri Kümesi anlık görüntüsünün DataProfile'i
Dönüş türü
get_status
Veri kümesi anlık görüntüsü oluşturma durumunu alın.
get_status()
Döndürülenler
Veri kümesi anlık görüntüsünün durumu.
Dönüş türü
is_data_snapshot_available
Anlık görüntünün gerçekleştirilmiş kopyasının kullanılabilir olup olmadığını denetleyin.
is_data_snapshot_available()
Döndürülenler
Veri anlık görüntüsü varsa True.
Dönüş türü
to_pandas_dataframe
Anlık görüntüyle kaydedilen verileri yükleyerek bir Pandas DataFrame oluşturun.
to_pandas_dataframe()
Döndürülenler
A Pandas DataFrame.
Dönüş türü
Açıklamalar
Pandas DataFrame bellekte tamamen gerçekleştirilmiştir. Anlık görüntü ile create_data_snapshot=False
oluşturulduysa bir özel durum oluşturulur. Anlık görüntünün veri içerip içermediğini denetlemek için işlevini is_data_snapshot_availablekullanın.
to_spark_dataframe
Anlık görüntüyle kaydedilen verileri yükleyerek bir Spark DataFrame oluşturun.
to_spark_dataframe()
Döndürülenler
A Spark DataFrame.
Dönüş türü
Açıklamalar
Döndürülen Spark Dataframe yalnızca bir yürütme planıdır ve Spark Dataframe'ler gevşek bir şekilde değerlendirildiğinden herhangi bir veri içermez. Anlık görüntü ile create_data_snapshot=False
oluşturulduysa, verilere erişmeye çalıştığınızda bir özel durum oluşur. Anlık görüntünün veri içerip içermediğini denetlemek için kullanın is_data_snapshot_available.
wait_for_completion
DatasetSnapshot generaton işleminin tamamlanmasını bekleyin.
wait_for_completion(show_output=True, status_update_frequency=10)
Parametreler
- status_update_frequency
- int
Eylem çalıştırma durumu güncelleştirme sıklığı (saniye cinsinden).
Öznitelikler
dataset_id
name
Veri kümesi anlık görüntüsü adını alın.
Döndürülenler
Veri kümesi anlık görüntüsü adı.
Dönüş türü
workspace
Veri Kümesinin kayıtlı olduğu Azure Machine Learning çalışma alanını alın.
Döndürülenler
Veri Kümesinin kayıtlı olduğu çalışma alanı.
Dönüş türü
Geri Bildirim
https://aka.ms/ContentUserFeedback.
Çok yakında: 2024 boyunca, içerik için geri bildirim mekanizması olarak GitHub Sorunları’nı kullanımdan kaldıracak ve yeni bir geri bildirim sistemiyle değiştireceğiz. Daha fazla bilgi için bkz.Gönderin ve geri bildirimi görüntüleyin