DatasetDefinition Sınıf
Bir Veri Kümesindeki verilerin nasıl okunacağını ve dönüştürüleceğini belirten bir dizi adımı tanımlar.
Not
Bu sınıf kullanım dışıdır. Daha fazla bilgi için bkz. https://aka.ms/dataset-deprecation.
Azure Machine Learning çalışma alanına kayıtlı bir veri kümesinin, her biri çağrılarak update_definitionoluşturulan birden çok tanımı olabilir. Her tanımın benzersiz bir tanımlayıcısı vardır. Geçerli tanım, oluşturulan en son tanımdır.
Kayıtlı olmayan Veri Kümeleri için yalnızca bir tanım vardır.
Veri kümesi tanımları sınıfı için <xref:azureml.dataprep.Dataflow> listelenen tüm dönüştürmeleri destekler: bkz http://aka.ms/azureml/howto/transformdata. . Veri Kümesi Tanımları hakkında daha fazla bilgi edinmek için adresine https://aka.ms/azureml/howto/versiondatagidin.
Veri kümesi tanım nesnesini başlatın.
- Devralma
-
azureml.dataprep.api.engineless_dataflow.EnginelessDataflowDatasetDefinition
Oluşturucu
DatasetDefinition(workspace=None, dataset_id=None, version_id=None, dataflow=None, dataflow_json=None, notes=None, etag=None, created_time=None, modified_time=None, state=None, deprecated_by_dataset_id=None, deprecated_by_definition_version=None, data_path=None, dataset=None, file_type='Unknown')
Parametreler
Name | Description |
---|---|
workspace
Gerekli
|
Veri kümesinin kayıtlı olduğu çalışma alanı. |
dataset_id
Gerekli
|
Veri kümesi tanımlayıcısı. |
version_id
Gerekli
|
Tanım sürümü. |
dataflow
Gerekli
|
Veri Akışı nesnesi. |
dataflow_json
Gerekli
|
Dataflow json. |
notes
Gerekli
|
Tanım hakkında isteğe bağlı bilgiler. |
etag
Gerekli
|
Etag. |
created_time
Gerekli
|
Tanımın oluşturma zamanı. |
modified_time
Gerekli
|
Tanımın son değiştirilme zamanı. |
deprecated_by_dataset_id
Gerekli
|
Bu tanımı kullanımdan kaldıran Veri Kümesinin kimliği. |
deprecated_by_definition_version
Gerekli
|
Tanımın bu tanımı kullanımdan kaldıran sürümü. |
data_path
Gerekli
|
Veri yolu. |
dataset
Gerekli
|
Üst Veri Kümesi nesnesi. |
Yöntemler
archive |
Veri kümesi tanımını arşivle. |
create_snapshot |
Kayıtlı Veri Kümesinin anlık görüntüsünü oluşturun. |
deprecate |
Yeni Veri Kümesinin işaretçisiyle Veri Kümesini kullanımdan kaldırın. |
reactivate |
Veri kümesi tanımını yeniden etkinleştirin. Kullanım dışı bırakılan veya arşivlenen veri kümesi tanımları üzerinde çalışır. |
to_pandas_dataframe |
Bu veri kümesi tanımı tarafından tanımlanan dönüştürme işlem hattını yürüterek bir Pandas veri çerçevesi oluşturun. |
to_spark_dataframe |
Bu Veri akışı tarafından tanımlanan dönüştürme işlem hattını yürütebilen bir Spark DataFrame oluşturun. |
archive
Veri kümesi tanımını arşivle.
archive()
Döndürülenler
Tür | Description |
---|---|
Yok. |
Açıklamalar
Arşivlemeden sonra, veri kümesini alma girişimleri bir hatayla sonuçlanır. Yanlışlıkla arşivlenmişse etkinleştirmek için kullanın reactivate .
create_snapshot
Kayıtlı Veri Kümesinin anlık görüntüsünü oluşturun.
create_snapshot(snapshot_name, compute_target=None, create_data_snapshot=False, target_datastore=None)
Parametreler
Name | Description |
---|---|
snapshot_name
Gerekli
|
Anlık görüntü adı. Anlık görüntü adları bir Veri Kümesi içinde benzersiz olmalıdır. |
compute_target
|
ComputeTarget veya
str
Anlık görüntü profili oluşturmayı gerçekleştirmek için işlem hedefi. Atlanırsa, yerel işlem kullanılır. Default value: None
|
create_data_snapshot
|
True ise verilerin gerçekleştirilmiş bir kopyası oluşturulur. Default value: False
|
target_datastore
|
Anlık görüntünün kaydedileceği hedef veri deposu. Atlanırsa, anlık görüntü çalışma alanının varsayılan depolama alanında oluşturulur. Default value: None
|
Döndürülenler
Tür | Description |
---|---|
DatasetSnapshot nesnesi. |
Açıklamalar
Anlık görüntüler, temel alınan verilerin zaman özet istatistikleri ve verilerin isteğe bağlı bir kopyasını yakalar. Anlık görüntü oluşturma hakkında daha fazla bilgi edinmek için adresine https://aka.ms/azureml/howto/createsnapshotsgidin.
deprecate
Yeni Veri Kümesinin işaretçisiyle Veri Kümesini kullanımdan kaldırın.
deprecate(deprecate_by_dataset_id, deprecated_by_definition_version=None)
Parametreler
Name | Description |
---|---|
deprecate_by_dataset_id
Gerekli
|
Geçerli veri kümesinin kullanımdan kaldırılmasından sorumlu veri kümesi kimliği. |
deprecated_by_definition_version
|
Geçerli veri kümesi tanımının kullanımdan kaldırılmasından sorumlu olan veri kümesi tanımı sürümü. Default value: None
|
Döndürülenler
Tür | Description |
---|---|
Yok. |
Açıklamalar
Kullanım dışı bırakılan veri kümesi tanımları kullanıldığında uyarıları günlüğe kaydeder. Bir veri kümesi tanımının tüketılmasını tamamen engellemek için bu tanımı arşivleyin.
Veri kümesi tanımı yanlışlıkla kullanım dışı bırakıldıysa, bunu etkinleştirmek için kullanın reactivate .
reactivate
Veri kümesi tanımını yeniden etkinleştirin.
Kullanım dışı bırakılan veya arşivlenen veri kümesi tanımları üzerinde çalışır.
reactivate()
Döndürülenler
Tür | Description |
---|---|
Yok. |
to_pandas_dataframe
Bu veri kümesi tanımı tarafından tanımlanan dönüştürme işlem hattını yürüterek bir Pandas veri çerçevesi oluşturun.
to_pandas_dataframe()
Döndürülenler
Tür | Description |
---|---|
A Pandas DataFrame. |
Açıklamalar
Bellekte tamamen gerçekleştirilmiş bir Pandas DataFrame döndürür.
to_spark_dataframe
Bu Veri akışı tarafından tanımlanan dönüştürme işlem hattını yürütebilen bir Spark DataFrame oluşturun.
to_spark_dataframe()
Döndürülenler
Tür | Description |
---|---|
A Spark DataFrame. |
Açıklamalar
Döndürülen Spark Dataframe yalnızca bir yürütme planıdır ve Spark Dataframe'ler gevşek bir şekilde değerlendirildiğinden herhangi bir veri içermez.