AbstractDataset Kelas
Kelas dasar himpunan data di Azure Machine Learning.
Silakan merujuk ke kelas TabularDatasetFactory dan kelas FileDatasetFactory untuk membuat instans himpunan data.
Konstruktor Class AbstractDataset.
Konstruktor ini tidak seharusnya dipanggil secara langsung. Himpunan data dimaksudkan untuk dibuat menggunakan TabularDatasetFactory kelas dan FileDatasetFactory kelas.
- Warisan
-
builtins.objectAbstractDataset
Konstruktor
AbstractDataset()
Metode
add_tags |
Menambahkan pasangan kunci nilai ke kamus tag himpunan data ini. |
as_named_input |
Berikan nama untuk himpunan data ini yang akan digunakan untuk mengambil materialisasi himpunan data dalam eksekusi. |
get_all |
Dapatkan semua himpunan data yang terdaftar di ruang kerja. |
get_by_id |
Dapatkan Himpunan Data yang disimpan ke ruang kerja. |
get_by_name |
Mendapatkan Himpunan data terdaftar dari ruang kerja dengan nama pendaftarannya. |
get_partition_key_values |
Memunculkan nilai kunci unik partition_keys. memvalidasi apakah partition_keys adalah subset yang valid dari set lengkap tombol partisi, memunculkan nilai kunci unik partition_keys, defaultnya untuk memunculkan kombinasi tombol unik dengan mengambil set lengkap kunci partisi himpunan data ini jika partition_keys bernilai None
|
register |
Daftarkan himpunan data ke ruang kerja yang disediakan. |
remove_tags |
Hapus kunci yang ditentukan dari kamus tag himpunan data ini. |
unregister_all_versions |
Batalkan pendaftaran semua versi dengan nama pendaftaran himpunan data ini dari ruang kerja. |
update |
Lakukan pembaruan himpunan data di tempat. |
add_tags
Menambahkan pasangan kunci nilai ke kamus tag himpunan data ini.
add_tags(tags=None)
Parameter
Mengembalikan
Objek himpunan data yang diperbarui.
Tipe hasil
as_named_input
Berikan nama untuk himpunan data ini yang akan digunakan untuk mengambil materialisasi himpunan data dalam eksekusi.
as_named_input(name)
Parameter
Mengembalikan
Objek konfigurasi yang menjelaskan bagaimana Himpunan Data harus terwujud dalam eksekusi.
Tipe hasil
Keterangan
Nama di sini hanya akan berlaku di dalam eksekusi Azure Machine Learning. Nama hanya boleh berisi karakter alfanumerik dan garis bawah sehingga dapat tersedia sebagai variabel lingkungan. Anda dapat menggunakan nama ini untuk mengambil himpunan data dalam konteks eksekusi menggunakan dua pendekatan:
Variabel Lingkungan:
Nama tersebut akan menjadi nama variabel lingkungan dan materialisasi himpunan data yang akan tersedia sebagai nilai variabel lingkungan. Jika himpunan data diunduh atau dipasang, nilainya akan menjadi jalur yang diunduh/dipasang. Contohnya:
# in your job submission notebook/script:
dataset.as_named_input('foo').as_download('/tmp/dataset')
# in the script that will be executed in the run
import os
path = os.environ['foo'] # path will be /tmp/dataset
Catatan
Jika himpunan data diatur ke mode langsung, maka nilainya adalah ID himpunan data. Kemudian Anda dapat
mengambil objek himpunan data dengan melakukan Dataset.get_by_id(os.environ['foo'])
Run.input_datasets:
Ini adalah kamus tempat kunci akan menjadi nama himpunan data yang Anda tentukan dalam metode ini dan nilainya akan menjadi materialisasi himpunan data. Untuk himpunan data yang diunduh dan dipasang, nilainya akan menjadi jalur yang diunduh/dipasang. Untuk mode langsung, nilainya akan menjadi objek himpunan data yang sama dengan yang Anda tentukan dalam skrip pengiriman pekerjaan.
# in your job submission notebook/script:
dataset.as_named_input('foo') # direct mode
# in the script that will be executed in the run
run = Run.get_context()
run.input_datasets['foo'] # this returns the dataset object from above.
get_all
Dapatkan semua himpunan data yang terdaftar di ruang kerja.
static get_all(workspace)
Parameter
Mengembalikan
Kamus objek TabularDataset dan FileDataset yang di kunci dengan nama pendaftaran mereka.
Tipe hasil
get_by_id
Dapatkan Himpunan Data yang disimpan ke ruang kerja.
static get_by_id(workspace, id, **kwargs)
Parameter
Mengembalikan
Objek himpunan data. Jika himpunan data terdaftar, nama dan versi pendaftarannya juga akan ditampilkan.
Tipe hasil
get_by_name
Mendapatkan Himpunan data terdaftar dari ruang kerja dengan nama pendaftarannya.
static get_by_name(workspace, name, version='latest', **kwargs)
Parameter
- workspace
- Workspace
Ruang kerja Azure Machine Learning yang ada tempat Himpunan Data terdaftar.
Mengembalikan
Objek himpunan data terdaftar.
Tipe hasil
get_partition_key_values
Memunculkan nilai kunci unik partition_keys.
memvalidasi apakah partition_keys adalah subset yang valid dari set lengkap tombol partisi, memunculkan nilai kunci unik partition_keys, defaultnya untuk memunculkan kombinasi tombol unik dengan mengambil set lengkap kunci partisi himpunan data ini jika partition_keys bernilai None
# get all partition key value pairs
partitions = ds.get_partition_key_values()
# Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]
partitions = ds.get_partition_key_values(['country'])
# Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)
Parameter
register
Daftarkan himpunan data ke ruang kerja yang disediakan.
register(workspace, name, description=None, tags=None, create_new_version=False)
Parameter
Kamus tag nilai kunci untuk memberikan himpunan data. Default ke Tidak Ada.
- create_new_version
- bool
Boolean untuk mendaftarkan himpunan data sebagai versi baru di bawah nama yang ditentukan.
Mengembalikan
Objek himpunan data terdaftar.
Tipe hasil
remove_tags
Hapus kunci yang ditentukan dari kamus tag himpunan data ini.
remove_tags(tags=None)
Parameter
Mengembalikan
Objek himpunan data yang diperbarui.
Tipe hasil
unregister_all_versions
Batalkan pendaftaran semua versi dengan nama pendaftaran himpunan data ini dari ruang kerja.
unregister_all_versions()
Keterangan
Operasi tidak mengubah data sumber apa pun.
update
Lakukan pembaruan himpunan data di tempat.
update(description=None, tags=None)
Parameter
- description
- str
Deskripsi baru yang akan digunakan untuk himpunan data. Deskripsi ini menggantikan deskripsi yang ada. Default ke deskripsi yang ada. Untuk menghapus deskripsi, masukkan string kosong.
Kamus tag untuk memperbarui himpunan data. Tag ini akan menggantikan tag yang ada untuk himpunan data. Default ke tag yang ada. Untuk menghapus tag, masukkan kamus kosong.
Mengembalikan
Objek himpunan data yang diperbarui.
Tipe hasil
Atribut
data_changed_time
Mengembalikan data sumber waktu yang diubah.
Mengembalikan
Waktu ketika perubahan terbaru terjadi pada data sumber.
Tipe hasil
Keterangan
Waktu perubahan data tersedia untuk sumber data berbasis file. Tidak Ada akan dikembalikan ketika sumber data tidak didukung untuk memeriksa kapan perubahan telah terjadi.
description
id
Mengembalikan pengidentifikasi himpunan data.
Mengembalikan
Id himpunan data. Jika himpunan data tidak disimpan ke ruang kerja mana pun, id-nya adalah Tidak Ada.
Tipe hasil
name
partition_keys
tags
version
Saran dan Komentar
https://aka.ms/ContentUserFeedback.
Segera hadir: Sepanjang tahun 2024 kami akan menghentikan penggunaan GitHub Issues sebagai mekanisme umpan balik untuk konten dan menggantinya dengan sistem umpan balik baru. Untuk mengetahui informasi selengkapnya, lihat:Kirim dan lihat umpan balik untuk