Aracılığıyla paylaş


DatasetSnapshot Sınıf

Bir snapsot almak, durumunu döndürmek ve bir veri çerçevesine dönüştürmek için veri kümesi anlık görüntülerini işlemleriyle yönetir.

Not

Bu sınıf kullanım dışıdır. Daha fazla bilgi için bkz. https://aka.ms/dataset-deprecation.

Sınıfının yönteminden create_snapshotDataset bir DataSnapshot nesnesi döndürülür.

Veri kümesi anlık görüntüsü, Profil ile verilerin isteğe bağlı gerçekleştirilmiş bir kopyasının birleşimidir.

Veri Kümesi Anlık Görüntüleri hakkında daha fazla bilgi edinmek için https://aka.ms/azureml/howto/createsnapshots

Devralma
builtins.object
DatasetSnapshot

Oluşturucu

DatasetSnapshot(workspace, snapshot_name, dataset_id, definition_version=None, time_stamp=None, profile_action_id=None, datastore_name=None, relative_path=None, dataset_name=None)

Parametreler

Name Description
workspace
Gerekli
<xref:azureml.core.Workspace.>

Veri kümesinin kayıtlı olduğu çalışma alanı.

snapshot_name
Gerekli
str

Veri kümesi anlık görüntüsünün adı.

dataset_id
Gerekli
str

Veri Kümesinin tanımlayıcısı.

definition_version
Gerekli
str

Veri Kümesinin tanım sürümü.

time_stamp
Gerekli

Anlık görüntü oluşturma zamanı.

profile_action_id
Gerekli
str

Anlık görüntü profili eylem kimliği.

datastore_name
Gerekli
str

Anlık görüntü veri deposu adı.

relative_path
Gerekli
str

Anlık görüntü verilerinin göreli yolu.

dataset_name
Gerekli
str

Veri Kümesinin adı.

Yöntemler

compare_profiles

Geçerli veri kümesi profilini rhs_dataset profiliyle karşılaştırın.

Profiller yoksa, bu yöntem bir özel durum oluşturur.

get

Veri kümesinin anlık görüntüsünü anlık görüntü adına göre alın.

get_all

Verilen Veri Kümesinin tüm anlık görüntülerini alın.

get_profile

Veri kümesi anlık görüntüsünün profilini alın.

get_status

Veri kümesi anlık görüntüsü oluşturma durumunu alın.

is_data_snapshot_available

Anlık görüntünün gerçekleştirilmiş kopyasının kullanılabilir olup olmadığını denetleyin.

to_pandas_dataframe

Anlık görüntüyle kaydedilen verileri yükleyerek bir Pandas DataFrame oluşturun.

to_spark_dataframe

Anlık görüntüyle kaydedilen verileri yükleyerek bir Spark DataFrame oluşturun.

wait_for_completion

DatasetSnapshot generaton işleminin tamamlanmasını bekleyin.

compare_profiles

Geçerli veri kümesi profilini rhs_dataset profiliyle karşılaştırın.

Profiller yoksa, bu yöntem bir özel durum oluşturur.

compare_profiles(rhs_dataset_snapshot, include_columns=None, exclude_columns=None, histogram_compare_method=HistogramCompareMethod.WASSERSTEIN)

Parametreler

Name Description
rhs_dataset_snapshot
Gerekli

Karşılaştıracak veri kümesi anlık görüntüsü.

include_columns

Karşılaştırmaya eklenecek sütun adlarının listesi.

Default value: None
exclude_columns

Karşılaştırmada dışlanacak sütun adlarının listesi.

Default value: None
histogram_compare_method

Karşılaştırma yöntemini açıklayan bir sabit listesi, örneğin: WASSERSTEIN veya ENERGY.

Default value: HistogramCompareMethod.WASSERSTEIN

Döndürülenler

Tür Description
<xref:azureml.dataprep.api.engineapi.typedefinitions.DataProfileDifference>

Profiller arasındaki fark.

get

Veri kümesinin anlık görüntüsünü anlık görüntü adına göre alın.

static get(workspace, snapshot_name, dataset_name=None, dataset_id=None)

Parametreler

Name Description
workspace
Gerekli

Veri kümesinin kayıtlı olduğu çalışma alanı.

snapshot_name
Gerekli
str

Veri kümesi anlık görüntüsünün adı.

dataset_name
Gerekli

Veri Kümesinin adı.

dataset_id
Gerekli

Veri Kümesinin tanımlayıcısı.

Döndürülenler

Tür Description

DatasetSnapshot nesnesi.

get_all

Verilen Veri Kümesinin tüm anlık görüntülerini alın.

static get_all(workspace, dataset_name)

Parametreler

Name Description
workspace
Gerekli

Veri kümesinin kayıtlı olduğu çalışma alanı.

dataset_name
Gerekli

Veri Kümesinin adı.

Döndürülenler

Tür Description

Veri kümesi anlık görüntülerinin listesi

get_profile

Veri kümesi anlık görüntüsünün profilini alın.

get_profile()

Döndürülenler

Tür Description
<xref:azureml.dataprep.DataProfile>

Veri Kümesi anlık görüntüsünün DataProfile'i

get_status

Veri kümesi anlık görüntüsü oluşturma durumunu alın.

get_status()

Döndürülenler

Tür Description
str

Veri kümesi anlık görüntüsünün durumu.

is_data_snapshot_available

Anlık görüntünün gerçekleştirilmiş kopyasının kullanılabilir olup olmadığını denetleyin.

is_data_snapshot_available()

Döndürülenler

Tür Description

Veri anlık görüntüsü varsa True.

to_pandas_dataframe

Anlık görüntüyle kaydedilen verileri yükleyerek bir Pandas DataFrame oluşturun.

to_pandas_dataframe()

Döndürülenler

Tür Description

A Pandas DataFrame.

Açıklamalar

Pandas DataFrame bellekte tamamen gerçekleştirilmiştir. Anlık görüntü ile create_data_snapshot=Falseoluşturulduysa bir özel durum oluşturulur. Anlık görüntünün veri içerip içermediğini denetlemek için işlevini is_data_snapshot_availablekullanın.

to_spark_dataframe

Anlık görüntüyle kaydedilen verileri yükleyerek bir Spark DataFrame oluşturun.

to_spark_dataframe()

Döndürülenler

Tür Description

A Spark DataFrame.

Açıklamalar

Döndürülen Spark Dataframe yalnızca bir yürütme planıdır ve Spark Dataframe'ler gevşek bir şekilde değerlendirildiğinden herhangi bir veri içermez. Anlık görüntü ile create_data_snapshot=Falseoluşturulduysa, verilere erişmeye çalıştığınızda bir özel durum oluşur. Anlık görüntünün veri içerip içermediğini denetlemek için kullanın is_data_snapshot_available.

wait_for_completion

DatasetSnapshot generaton işleminin tamamlanmasını bekleyin.

wait_for_completion(show_output=True, status_update_frequency=10)

Parametreler

Name Description
show_output

Yöntemin çıkışı yazdırıp yazdıracağını gösterir.

Default value: True
status_update_frequency
int

Eylem çalıştırma durumu güncelleştirme sıklığı (saniye cinsinden).

Default value: 10

Öznitelikler

dataset_id

Veri kümesi tanımlayıcısını alın.

Döndürülenler

Tür Description
str

Veri Kümesi Kimliği.

name

Veri kümesi anlık görüntüsü adını alın.

Döndürülenler

Tür Description
str

Veri kümesi anlık görüntüsü adı.

workspace

Veri Kümesinin kayıtlı olduğu Azure Machine Learning çalışma alanını alın.

Döndürülenler

Tür Description

Veri Kümesinin kayıtlı olduğu çalışma alanı.