DatasetSnapshot Sınıf
Bir snapsot almak, durumunu döndürmek ve bir veri çerçevesine dönüştürmek için veri kümesi anlık görüntülerini işlemleriyle yönetir.
Not
Bu sınıf kullanım dışıdır. Daha fazla bilgi için bkz. https://aka.ms/dataset-deprecation.
Sınıfının yönteminden create_snapshotDataset bir DataSnapshot nesnesi döndürülür.
Veri kümesi anlık görüntüsü, Profil ile verilerin isteğe bağlı gerçekleştirilmiş bir kopyasının birleşimidir.
Veri Kümesi Anlık Görüntüleri hakkında daha fazla bilgi edinmek için https://aka.ms/azureml/howto/createsnapshots
- Devralma
-
builtins.objectDatasetSnapshot
Oluşturucu
DatasetSnapshot(workspace, snapshot_name, dataset_id, definition_version=None, time_stamp=None, profile_action_id=None, datastore_name=None, relative_path=None, dataset_name=None)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
<xref:azureml.core.Workspace.>
Veri kümesinin kayıtlı olduğu çalışma alanı. |
snapshot_name
Gerekli
|
Veri kümesi anlık görüntüsünün adı. |
dataset_id
Gerekli
|
Veri Kümesinin tanımlayıcısı. |
definition_version
Gerekli
|
Veri Kümesinin tanım sürümü. |
time_stamp
Gerekli
|
Anlık görüntü oluşturma zamanı. |
profile_action_id
Gerekli
|
Anlık görüntü profili eylem kimliği. |
datastore_name
Gerekli
|
Anlık görüntü veri deposu adı. |
relative_path
Gerekli
|
Anlık görüntü verilerinin göreli yolu. |
dataset_name
Gerekli
|
Veri Kümesinin adı. |
Yöntemler
compare_profiles |
Geçerli veri kümesi profilini rhs_dataset profiliyle karşılaştırın. Profiller yoksa, bu yöntem bir özel durum oluşturur. |
get |
Veri kümesinin anlık görüntüsünü anlık görüntü adına göre alın. |
get_all |
Verilen Veri Kümesinin tüm anlık görüntülerini alın. |
get_profile |
Veri kümesi anlık görüntüsünün profilini alın. |
get_status |
Veri kümesi anlık görüntüsü oluşturma durumunu alın. |
is_data_snapshot_available |
Anlık görüntünün gerçekleştirilmiş kopyasının kullanılabilir olup olmadığını denetleyin. |
to_pandas_dataframe |
Anlık görüntüyle kaydedilen verileri yükleyerek bir Pandas DataFrame oluşturun. |
to_spark_dataframe |
Anlık görüntüyle kaydedilen verileri yükleyerek bir Spark DataFrame oluşturun. |
wait_for_completion |
DatasetSnapshot generaton işleminin tamamlanmasını bekleyin. |
compare_profiles
Geçerli veri kümesi profilini rhs_dataset profiliyle karşılaştırın.
Profiller yoksa, bu yöntem bir özel durum oluşturur.
compare_profiles(rhs_dataset_snapshot, include_columns=None, exclude_columns=None, histogram_compare_method=HistogramCompareMethod.WASSERSTEIN)
Parametreler
Name | Description |
---|---|
rhs_dataset_snapshot
Gerekli
|
Karşılaştıracak veri kümesi anlık görüntüsü. |
include_columns
|
Karşılaştırmaya eklenecek sütun adlarının listesi. Default value: None
|
exclude_columns
|
Karşılaştırmada dışlanacak sütun adlarının listesi. Default value: None
|
histogram_compare_method
|
Karşılaştırma yöntemini açıklayan bir sabit listesi, örneğin: WASSERSTEIN veya ENERGY. Default value: HistogramCompareMethod.WASSERSTEIN
|
Döndürülenler
Tür | Description |
---|---|
<xref:azureml.dataprep.api.engineapi.typedefinitions.DataProfileDifference>
|
Profiller arasındaki fark. |
get
Veri kümesinin anlık görüntüsünü anlık görüntü adına göre alın.
static get(workspace, snapshot_name, dataset_name=None, dataset_id=None)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Veri kümesinin kayıtlı olduğu çalışma alanı. |
snapshot_name
Gerekli
|
Veri kümesi anlık görüntüsünün adı. |
dataset_name
Gerekli
|
Veri Kümesinin adı. |
dataset_id
Gerekli
|
Veri Kümesinin tanımlayıcısı. |
Döndürülenler
Tür | Description |
---|---|
DatasetSnapshot nesnesi. |
get_all
Verilen Veri Kümesinin tüm anlık görüntülerini alın.
static get_all(workspace, dataset_name)
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Veri kümesinin kayıtlı olduğu çalışma alanı. |
dataset_name
Gerekli
|
Veri Kümesinin adı. |
Döndürülenler
Tür | Description |
---|---|
Veri kümesi anlık görüntülerinin listesi |
get_profile
Veri kümesi anlık görüntüsünün profilini alın.
get_profile()
Döndürülenler
Tür | Description |
---|---|
<xref:azureml.dataprep.DataProfile>
|
Veri Kümesi anlık görüntüsünün DataProfile'i |
get_status
Veri kümesi anlık görüntüsü oluşturma durumunu alın.
get_status()
Döndürülenler
Tür | Description |
---|---|
Veri kümesi anlık görüntüsünün durumu. |
is_data_snapshot_available
Anlık görüntünün gerçekleştirilmiş kopyasının kullanılabilir olup olmadığını denetleyin.
is_data_snapshot_available()
Döndürülenler
Tür | Description |
---|---|
Veri anlık görüntüsü varsa True. |
to_pandas_dataframe
Anlık görüntüyle kaydedilen verileri yükleyerek bir Pandas DataFrame oluşturun.
to_pandas_dataframe()
Döndürülenler
Tür | Description |
---|---|
A Pandas DataFrame. |
Açıklamalar
Pandas DataFrame bellekte tamamen gerçekleştirilmiştir. Anlık görüntü ile create_data_snapshot=False
oluşturulduysa bir özel durum oluşturulur. Anlık görüntünün veri içerip içermediğini denetlemek için işlevini is_data_snapshot_availablekullanın.
to_spark_dataframe
Anlık görüntüyle kaydedilen verileri yükleyerek bir Spark DataFrame oluşturun.
to_spark_dataframe()
Döndürülenler
Tür | Description |
---|---|
A Spark DataFrame. |
Açıklamalar
Döndürülen Spark Dataframe yalnızca bir yürütme planıdır ve Spark Dataframe'ler gevşek bir şekilde değerlendirildiğinden herhangi bir veri içermez. Anlık görüntü ile create_data_snapshot=False
oluşturulduysa, verilere erişmeye çalıştığınızda bir özel durum oluşur. Anlık görüntünün veri içerip içermediğini denetlemek için kullanın is_data_snapshot_available.
wait_for_completion
DatasetSnapshot generaton işleminin tamamlanmasını bekleyin.
wait_for_completion(show_output=True, status_update_frequency=10)
Parametreler
Name | Description |
---|---|
show_output
|
Yöntemin çıkışı yazdırıp yazdıracağını gösterir. Default value: True
|
status_update_frequency
|
Eylem çalıştırma durumu güncelleştirme sıklığı (saniye cinsinden). Default value: 10
|
Öznitelikler
dataset_id
name
Veri kümesi anlık görüntüsü adını alın.
Döndürülenler
Tür | Description |
---|---|
Veri kümesi anlık görüntüsü adı. |
workspace
Veri Kümesinin kayıtlı olduğu Azure Machine Learning çalışma alanını alın.
Döndürülenler
Tür | Description |
---|---|
Veri Kümesinin kayıtlı olduğu çalışma alanı. |