Aracılığıyla paylaş


DatasetSnapshot Sınıf

Bir snapsot almak, durumunu döndürmek ve bir veri çerçevesine dönüştürmek için veri kümesi anlık görüntülerini işlemleriyle yönetir.

Not

Bu sınıf kullanım dışıdır. Daha fazla bilgi için bkz. https://aka.ms/dataset-deprecation.

Sınıfının yönteminden create_snapshotDataset bir DataSnapshot nesnesi döndürülür.

Veri kümesi anlık görüntüsü, Profil ile verilerin isteğe bağlı gerçekleştirilmiş bir kopyasının birleşimidir.

Veri Kümesi Anlık Görüntüleri hakkında daha fazla bilgi edinmek için https://aka.ms/azureml/howto/createsnapshots

Devralma
builtins.object
DatasetSnapshot

Oluşturucu

DatasetSnapshot(workspace, snapshot_name, dataset_id, definition_version=None, time_stamp=None, profile_action_id=None, datastore_name=None, relative_path=None, dataset_name=None)

Parametreler

workspace
<xref:azureml.core.Workspace.>
Gerekli

Veri kümesinin kayıtlı olduğu çalışma alanı.

snapshot_name
str
Gerekli

Veri kümesi anlık görüntüsünün adı.

dataset_id
str
Gerekli

Veri Kümesinin tanımlayıcısı.

definition_version
str
Gerekli

Veri Kümesinin tanım sürümü.

time_stamp
datetime
Gerekli

Anlık görüntü oluşturma zamanı.

profile_action_id
str
Gerekli

Anlık görüntü profili eylem kimliği.

datastore_name
str
Gerekli

Anlık görüntü veri deposu adı.

relative_path
str
Gerekli

Anlık görüntü verilerinin göreli yolu.

dataset_name
str
Gerekli

Veri Kümesinin adı.

Yöntemler

compare_profiles

Geçerli veri kümesi profilini rhs_dataset profiliyle karşılaştırın.

Profiller yoksa, bu yöntem bir özel durum oluşturur.

get

Veri kümesinin anlık görüntüsünü anlık görüntü adına göre alın.

get_all

Verilen Veri Kümesinin tüm anlık görüntülerini alın.

get_profile

Veri kümesi anlık görüntüsünün profilini alın.

get_status

Veri kümesi anlık görüntüsü oluşturma durumunu alın.

is_data_snapshot_available

Anlık görüntünün gerçekleştirilmiş kopyasının kullanılabilir olup olmadığını denetleyin.

to_pandas_dataframe

Anlık görüntüyle kaydedilen verileri yükleyerek bir Pandas DataFrame oluşturun.

to_spark_dataframe

Anlık görüntüyle kaydedilen verileri yükleyerek bir Spark DataFrame oluşturun.

wait_for_completion

DatasetSnapshot generaton işleminin tamamlanmasını bekleyin.

compare_profiles

Geçerli veri kümesi profilini rhs_dataset profiliyle karşılaştırın.

Profiller yoksa, bu yöntem bir özel durum oluşturur.

compare_profiles(rhs_dataset_snapshot, include_columns=None, exclude_columns=None, histogram_compare_method=HistogramCompareMethod.WASSERSTEIN)

Parametreler

rhs_dataset_snapshot
DatasetSnapshot
Gerekli

Karşılaştıracak veri kümesi anlık görüntüsü.

include_columns
list[str]
varsayılan değer: None

Karşılaştırmaya eklenecek sütun adlarının listesi.

exclude_columns
list[str]
varsayılan değer: None

Karşılaştırmada dışlanacak sütun adlarının listesi.

histogram_compare_method
HistogramCompareMethod
varsayılan değer: HistogramCompareMethod.WASSERSTEIN

Karşılaştırma yöntemini açıklayan bir sabit listesi, örneğin: WASSERSTEIN veya ENERGY.

Döndürülenler

Profiller arasındaki fark.

Dönüş türü

<xref:azureml.dataprep.api.engineapi.typedefinitions.DataProfileDifference>

get

Veri kümesinin anlık görüntüsünü anlık görüntü adına göre alın.

static get(workspace, snapshot_name, dataset_name=None, dataset_id=None)

Parametreler

workspace
Workspace
Gerekli

Veri kümesinin kayıtlı olduğu çalışma alanı.

snapshot_name
str
Gerekli

Veri kümesi anlık görüntüsünün adı.

dataset_name
Gerekli

Veri Kümesinin adı.

dataset_id
uuid
Gerekli

Veri Kümesinin tanımlayıcısı.

Döndürülenler

DatasetSnapshot nesnesi.

Dönüş türü

get_all

Verilen Veri Kümesinin tüm anlık görüntülerini alın.

static get_all(workspace, dataset_name)

Parametreler

workspace
Workspace
Gerekli

Veri kümesinin kayıtlı olduğu çalışma alanı.

dataset_name
Gerekli

Veri Kümesinin adı.

Döndürülenler

Veri kümesi anlık görüntülerinin listesi

Dönüş türü

get_profile

Veri kümesi anlık görüntüsünün profilini alın.

get_profile()

Döndürülenler

Veri Kümesi anlık görüntüsünün DataProfile'i

Dönüş türü

<xref:azureml.dataprep.DataProfile>

get_status

Veri kümesi anlık görüntüsü oluşturma durumunu alın.

get_status()

Döndürülenler

Veri kümesi anlık görüntüsünün durumu.

Dönüş türü

str

is_data_snapshot_available

Anlık görüntünün gerçekleştirilmiş kopyasının kullanılabilir olup olmadığını denetleyin.

is_data_snapshot_available()

Döndürülenler

Veri anlık görüntüsü varsa True.

Dönüş türü

to_pandas_dataframe

Anlık görüntüyle kaydedilen verileri yükleyerek bir Pandas DataFrame oluşturun.

to_pandas_dataframe()

Döndürülenler

A Pandas DataFrame.

Dönüş türü

Açıklamalar

Pandas DataFrame bellekte tamamen gerçekleştirilmiştir. Anlık görüntü ile create_data_snapshot=Falseoluşturulduysa bir özel durum oluşturulur. Anlık görüntünün veri içerip içermediğini denetlemek için işlevini is_data_snapshot_availablekullanın.

to_spark_dataframe

Anlık görüntüyle kaydedilen verileri yükleyerek bir Spark DataFrame oluşturun.

to_spark_dataframe()

Döndürülenler

A Spark DataFrame.

Dönüş türü

Açıklamalar

Döndürülen Spark Dataframe yalnızca bir yürütme planıdır ve Spark Dataframe'ler gevşek bir şekilde değerlendirildiğinden herhangi bir veri içermez. Anlık görüntü ile create_data_snapshot=Falseoluşturulduysa, verilere erişmeye çalıştığınızda bir özel durum oluşur. Anlık görüntünün veri içerip içermediğini denetlemek için kullanın is_data_snapshot_available.

wait_for_completion

DatasetSnapshot generaton işleminin tamamlanmasını bekleyin.

wait_for_completion(show_output=True, status_update_frequency=10)

Parametreler

show_output
bool
varsayılan değer: True

Yöntemin çıkışı yazdırıp yazdıracağını gösterir.

status_update_frequency
int
varsayılan değer: 10

Eylem çalıştırma durumu güncelleştirme sıklığı (saniye cinsinden).

Öznitelikler

dataset_id

Veri kümesi tanımlayıcısını alın.

Döndürülenler

Veri Kümesi Kimliği.

Dönüş türü

str

name

Veri kümesi anlık görüntüsü adını alın.

Döndürülenler

Veri kümesi anlık görüntüsü adı.

Dönüş türü

str

workspace

Veri Kümesinin kayıtlı olduğu Azure Machine Learning çalışma alanını alın.

Döndürülenler

Veri Kümesinin kayıtlı olduğu çalışma alanı.

Dönüş türü