AbstractDataset Kelas

Kelas dasar himpunan data di Azure Machine Learning.

Silakan merujuk ke kelas TabularDatasetFactory dan kelas FileDatasetFactory untuk membuat instans himpunan data.

Konstruktor Class AbstractDataset.

Konstruktor ini tidak seharusnya dipanggil secara langsung. Himpunan data dimaksudkan untuk dibuat menggunakan TabularDatasetFactory kelas dan FileDatasetFactory kelas.

Warisan
builtins.object
AbstractDataset

Konstruktor

AbstractDataset()

Metode

add_tags

Menambahkan pasangan kunci nilai ke kamus tag himpunan data ini.

as_named_input

Berikan nama untuk himpunan data ini yang akan digunakan untuk mengambil materialisasi himpunan data dalam eksekusi.

get_all

Dapatkan semua himpunan data yang terdaftar di ruang kerja.

get_by_id

Dapatkan Himpunan Data yang disimpan ke ruang kerja.

get_by_name

Mendapatkan Himpunan data terdaftar dari ruang kerja dengan nama pendaftarannya.

get_partition_key_values

Memunculkan nilai kunci unik partition_keys.

memvalidasi apakah partition_keys adalah subset yang valid dari set lengkap tombol partisi, memunculkan nilai kunci unik partition_keys, defaultnya untuk memunculkan kombinasi tombol unik dengan mengambil set lengkap kunci partisi himpunan data ini jika partition_keys bernilai None


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
register

Daftarkan himpunan data ke ruang kerja yang disediakan.

remove_tags

Hapus kunci yang ditentukan dari kamus tag himpunan data ini.

unregister_all_versions

Batalkan pendaftaran semua versi dengan nama pendaftaran himpunan data ini dari ruang kerja.

update

Lakukan pembaruan himpunan data di tempat.

add_tags

Menambahkan pasangan kunci nilai ke kamus tag himpunan data ini.

add_tags(tags=None)

Parameter

tags
dict[str, str]
Diperlukan

Kamus tag yang akan ditambahkan.

Mengembalikan

Objek himpunan data yang diperbarui.

Tipe hasil

as_named_input

Berikan nama untuk himpunan data ini yang akan digunakan untuk mengambil materialisasi himpunan data dalam eksekusi.

as_named_input(name)

Parameter

name
str
Diperlukan

Nama himpunan data untuk eksekusi.

Mengembalikan

Objek konfigurasi yang menjelaskan bagaimana Himpunan Data harus terwujud dalam eksekusi.

Tipe hasil

Keterangan

Nama di sini hanya akan berlaku di dalam eksekusi Azure Machine Learning. Nama hanya boleh berisi karakter alfanumerik dan garis bawah sehingga dapat tersedia sebagai variabel lingkungan. Anda dapat menggunakan nama ini untuk mengambil himpunan data dalam konteks eksekusi menggunakan dua pendekatan:

  • Variabel Lingkungan:

    Nama tersebut akan menjadi nama variabel lingkungan dan materialisasi himpunan data yang akan tersedia sebagai nilai variabel lingkungan. Jika himpunan data diunduh atau dipasang, nilainya akan menjadi jalur yang diunduh/dipasang. Contohnya:


   # in your job submission notebook/script:
   dataset.as_named_input('foo').as_download('/tmp/dataset')

   # in the script that will be executed in the run
   import os
   path = os.environ['foo'] # path will be /tmp/dataset

Catatan

Jika himpunan data diatur ke mode langsung, maka nilainya adalah ID himpunan data. Kemudian Anda dapat

mengambil objek himpunan data dengan melakukan Dataset.get_by_id(os.environ['foo'])

  • Run.input_datasets:

    Ini adalah kamus tempat kunci akan menjadi nama himpunan data yang Anda tentukan dalam metode ini dan nilainya akan menjadi materialisasi himpunan data. Untuk himpunan data yang diunduh dan dipasang, nilainya akan menjadi jalur yang diunduh/dipasang. Untuk mode langsung, nilainya akan menjadi objek himpunan data yang sama dengan yang Anda tentukan dalam skrip pengiriman pekerjaan.


   # in your job submission notebook/script:
   dataset.as_named_input('foo') # direct mode

   # in the script that will be executed in the run
   run = Run.get_context()
   run.input_datasets['foo'] # this returns the dataset object from above.

get_all

Dapatkan semua himpunan data yang terdaftar di ruang kerja.

static get_all(workspace)

Parameter

workspace
Workspace
Diperlukan

Ruang kerja AzureML yang ada tempat Himpunan data telah terdaftar.

Mengembalikan

Kamus objek TabularDataset dan FileDataset yang di kunci dengan nama pendaftaran mereka.

Tipe hasil

get_by_id

Dapatkan Himpunan Data yang disimpan ke ruang kerja.

static get_by_id(workspace, id, **kwargs)

Parameter

workspace
Workspace
Diperlukan

Ruang kerja AzureML yang ada tempat Himpunan data disimpan.

id
str
Diperlukan

Id himpunan data.

Mengembalikan

Objek himpunan data. Jika himpunan data terdaftar, nama dan versi pendaftarannya juga akan ditampilkan.

Tipe hasil

get_by_name

Mendapatkan Himpunan data terdaftar dari ruang kerja dengan nama pendaftarannya.

static get_by_name(workspace, name, version='latest', **kwargs)

Parameter

workspace
Workspace
Diperlukan

Ruang kerja Azure Machine Learning yang ada tempat Himpunan Data terdaftar.

name
str
Diperlukan

Nama registrasi.

version
int
Diperlukan

Versi pendaftaran. Default ke 'terbaru'.

Mengembalikan

Objek himpunan data terdaftar.

Tipe hasil

get_partition_key_values

Memunculkan nilai kunci unik partition_keys.

memvalidasi apakah partition_keys adalah subset yang valid dari set lengkap tombol partisi, memunculkan nilai kunci unik partition_keys, defaultnya untuk memunculkan kombinasi tombol unik dengan mengambil set lengkap kunci partisi himpunan data ini jika partition_keys bernilai None


   # get all partition key value pairs
   partitions = ds.get_partition_key_values()
   # Return [{'country': 'US', 'state': 'WA', 'partition_date': datetime('2020-1-1')}]

   partitions = ds.get_partition_key_values(['country'])
   # Return [{'country': 'US'}]
get_partition_key_values(partition_keys=None)

Parameter

partition_keys
list[str]
Diperlukan

kunci partisi

register

Daftarkan himpunan data ke ruang kerja yang disediakan.

register(workspace, name, description=None, tags=None, create_new_version=False)

Parameter

workspace
Workspace
Diperlukan

Ruang kerja untuk mendaftarkan himpunan data.

name
str
Diperlukan

Nama untuk mendaftarkan himpunan data.

description
str
Diperlukan

Deskripsi teks himpunan data. Default ke Tidak Ada.

tags
dict[str, str]
Diperlukan

Kamus tag nilai kunci untuk memberikan himpunan data. Default ke Tidak Ada.

create_new_version
bool
Diperlukan

Boolean untuk mendaftarkan himpunan data sebagai versi baru di bawah nama yang ditentukan.

Mengembalikan

Objek himpunan data terdaftar.

Tipe hasil

remove_tags

Hapus kunci yang ditentukan dari kamus tag himpunan data ini.

remove_tags(tags=None)

Parameter

tags
list[str]
Diperlukan

Daftar kunci yang akan dihapus.

Mengembalikan

Objek himpunan data yang diperbarui.

Tipe hasil

unregister_all_versions

Batalkan pendaftaran semua versi dengan nama pendaftaran himpunan data ini dari ruang kerja.

unregister_all_versions()

Keterangan

Operasi tidak mengubah data sumber apa pun.

update

Lakukan pembaruan himpunan data di tempat.

update(description=None, tags=None)

Parameter

description
str
Diperlukan

Deskripsi baru yang akan digunakan untuk himpunan data. Deskripsi ini menggantikan deskripsi yang ada. Default ke deskripsi yang ada. Untuk menghapus deskripsi, masukkan string kosong.

tags
dict[str, str]
Diperlukan

Kamus tag untuk memperbarui himpunan data. Tag ini akan menggantikan tag yang ada untuk himpunan data. Default ke tag yang ada. Untuk menghapus tag, masukkan kamus kosong.

Mengembalikan

Objek himpunan data yang diperbarui.

Tipe hasil

Atribut

data_changed_time

Mengembalikan data sumber waktu yang diubah.

Mengembalikan

Waktu ketika perubahan terbaru terjadi pada data sumber.

Tipe hasil

Keterangan

Waktu perubahan data tersedia untuk sumber data berbasis file. Tidak Ada akan dikembalikan ketika sumber data tidak didukung untuk memeriksa kapan perubahan telah terjadi.

description

Mengembalikan deskripsi pendaftaran.

Mengembalikan

Deskripsi himpunan data.

Tipe hasil

str

id

Mengembalikan pengidentifikasi himpunan data.

Mengembalikan

Id himpunan data. Jika himpunan data tidak disimpan ke ruang kerja mana pun, id-nya adalah Tidak Ada.

Tipe hasil

str

name

Memunculkan nama pendaftaran.

Mengembalikan

Nama himpunan data.

Tipe hasil

str

partition_keys

Memunculkan kunci partisi.

Mengembalikan

kunci partisi

Tipe hasil

tags

Mengembalikan tag pendaftaran.

Mengembalikan

Tag himpunan data.

Tipe hasil

str

version

Mengembalikan versi pendaftaran.

Mengembalikan

Versi himpunan data.

Tipe hasil

int