Aracılığıyla paylaş


DatasetDefinition Sınıf

Bir Veri Kümesindeki verilerin nasıl okunacağını ve dönüştürüleceğini belirten bir dizi adımı tanımlar.

Not

Bu sınıf kullanım dışıdır. Daha fazla bilgi için bkz. https://aka.ms/dataset-deprecation.

Azure Machine Learning çalışma alanına kayıtlı bir veri kümesinin, her biri çağrılarak update_definitionoluşturulan birden çok tanımı olabilir. Her tanımın benzersiz bir tanımlayıcısı vardır. Geçerli tanım, oluşturulan en son tanımdır.

Kayıtlı olmayan Veri Kümeleri için yalnızca bir tanım vardır.

Veri kümesi tanımları sınıfı için <xref:azureml.dataprep.Dataflow> listelenen tüm dönüştürmeleri destekler: bkz http://aka.ms/azureml/howto/transformdata. . Veri Kümesi Tanımları hakkında daha fazla bilgi edinmek için adresine https://aka.ms/azureml/howto/versiondatagidin.

Veri kümesi tanım nesnesini başlatın.

Devralma
azureml.dataprep.api.engineless_dataflow.EnginelessDataflow
DatasetDefinition

Oluşturucu

DatasetDefinition(workspace=None, dataset_id=None, version_id=None, dataflow=None, dataflow_json=None, notes=None, etag=None, created_time=None, modified_time=None, state=None, deprecated_by_dataset_id=None, deprecated_by_definition_version=None, data_path=None, dataset=None, file_type='Unknown')

Parametreler

Name Description
workspace
Gerekli
str

Veri kümesinin kayıtlı olduğu çalışma alanı.

dataset_id
Gerekli
str

Veri kümesi tanımlayıcısı.

version_id
Gerekli
str

Tanım sürümü.

dataflow
Gerekli
str

Veri Akışı nesnesi.

dataflow_json
Gerekli

Dataflow json.

notes
Gerekli
str

Tanım hakkında isteğe bağlı bilgiler.

etag
Gerekli
str

Etag.

created_time
Gerekli

Tanımın oluşturma zamanı.

modified_time
Gerekli

Tanımın son değiştirilme zamanı.

deprecated_by_dataset_id
Gerekli
str

Bu tanımı kullanımdan kaldıran Veri Kümesinin kimliği.

deprecated_by_definition_version
Gerekli
str

Tanımın bu tanımı kullanımdan kaldıran sürümü.

data_path
Gerekli

Veri yolu.

dataset
Gerekli

Üst Veri Kümesi nesnesi.

Yöntemler

archive

Veri kümesi tanımını arşivle.

create_snapshot

Kayıtlı Veri Kümesinin anlık görüntüsünü oluşturun.

deprecate

Yeni Veri Kümesinin işaretçisiyle Veri Kümesini kullanımdan kaldırın.

reactivate

Veri kümesi tanımını yeniden etkinleştirin.

Kullanım dışı bırakılan veya arşivlenen veri kümesi tanımları üzerinde çalışır.

to_pandas_dataframe

Bu veri kümesi tanımı tarafından tanımlanan dönüştürme işlem hattını yürüterek bir Pandas veri çerçevesi oluşturun.

to_spark_dataframe

Bu Veri akışı tarafından tanımlanan dönüştürme işlem hattını yürütebilen bir Spark DataFrame oluşturun.

archive

Veri kümesi tanımını arşivle.

archive()

Döndürülenler

Tür Description

Yok.

Açıklamalar

Arşivlemeden sonra, veri kümesini alma girişimleri bir hatayla sonuçlanır. Yanlışlıkla arşivlenmişse etkinleştirmek için kullanın reactivate .

create_snapshot

Kayıtlı Veri Kümesinin anlık görüntüsünü oluşturun.

create_snapshot(snapshot_name, compute_target=None, create_data_snapshot=False, target_datastore=None)

Parametreler

Name Description
snapshot_name
Gerekli
str

Anlık görüntü adı. Anlık görüntü adları bir Veri Kümesi içinde benzersiz olmalıdır.

compute_target

Anlık görüntü profili oluşturmayı gerçekleştirmek için işlem hedefi. Atlanırsa, yerel işlem kullanılır.

Default value: None
create_data_snapshot

True ise verilerin gerçekleştirilmiş bir kopyası oluşturulur.

Default value: False
target_datastore

Anlık görüntünün kaydedileceği hedef veri deposu. Atlanırsa, anlık görüntü çalışma alanının varsayılan depolama alanında oluşturulur.

Default value: None

Döndürülenler

Tür Description

DatasetSnapshot nesnesi.

Açıklamalar

Anlık görüntüler, temel alınan verilerin zaman özet istatistikleri ve verilerin isteğe bağlı bir kopyasını yakalar. Anlık görüntü oluşturma hakkında daha fazla bilgi edinmek için adresine https://aka.ms/azureml/howto/createsnapshotsgidin.

deprecate

Yeni Veri Kümesinin işaretçisiyle Veri Kümesini kullanımdan kaldırın.

deprecate(deprecate_by_dataset_id, deprecated_by_definition_version=None)

Parametreler

Name Description
deprecate_by_dataset_id
Gerekli

Geçerli veri kümesinin kullanımdan kaldırılmasından sorumlu veri kümesi kimliği.

deprecated_by_definition_version
str

Geçerli veri kümesi tanımının kullanımdan kaldırılmasından sorumlu olan veri kümesi tanımı sürümü.

Default value: None

Döndürülenler

Tür Description

Yok.

Açıklamalar

Kullanım dışı bırakılan veri kümesi tanımları kullanıldığında uyarıları günlüğe kaydeder. Bir veri kümesi tanımının tüketılmasını tamamen engellemek için bu tanımı arşivleyin.

Veri kümesi tanımı yanlışlıkla kullanım dışı bırakıldıysa, bunu etkinleştirmek için kullanın reactivate .

reactivate

Veri kümesi tanımını yeniden etkinleştirin.

Kullanım dışı bırakılan veya arşivlenen veri kümesi tanımları üzerinde çalışır.

reactivate()

Döndürülenler

Tür Description

Yok.

to_pandas_dataframe

Bu veri kümesi tanımı tarafından tanımlanan dönüştürme işlem hattını yürüterek bir Pandas veri çerçevesi oluşturun.

to_pandas_dataframe()

Döndürülenler

Tür Description

A Pandas DataFrame.

Açıklamalar

Bellekte tamamen gerçekleştirilmiş bir Pandas DataFrame döndürür.

to_spark_dataframe

Bu Veri akışı tarafından tanımlanan dönüştürme işlem hattını yürütebilen bir Spark DataFrame oluşturun.

to_spark_dataframe()

Döndürülenler

Tür Description

A Spark DataFrame.

Açıklamalar

Döndürülen Spark Dataframe yalnızca bir yürütme planıdır ve Spark Dataframe'ler gevşek bir şekilde değerlendirildiğinden herhangi bir veri içermez.