Bagikan melalui


DataReference Kelas

Mewakili referensi ke data di penyimpanan data.

DataReference menunjukkan jalur dalam datastore dan dapat digunakan untuk menjelaskan bagaimana dan di mana data harus disediakan dalam eksekusi. Ini bukan lagi pendekatan yang direkomendasikan untuk akses dan pengiriman data di Azure Machine Learning. Himpunan data mendukung pengaksesan data dari penyimpanan Azure Blob, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database, dan Azure Database for PostgreSQL melalui antarmuka terpadu dengan kemampuan manajemen data tambahan. Sebaiknya gunakan himpunan data untuk membaca data dalam proyek pembelajaran mesin Anda.

Untuk informasi selengkapnya tentang cara menggunakan himpunan data Azure Machine Learning dalam dua skenario umum, lihat artikel:

Konstruktor Class DataReference.

Warisan
builtins.object
DataReference

Konstruktor

DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)

Parameter

Nama Deskripsi
datastore
Diperlukan

Datastore ke referensi.

data_reference_name
str

Nama referensi data.

Nilai default: None
path_on_datastore
str

Jalur relatif di penyimpanan pendukung untuk referensi data.

Nilai default: None
mode
str

Operasi pada referensi data. Nilai yang didukung adalah 'mount' (default) dan 'download'.

Gunakan mode 'download' ketika skrip Anda mengharapkan jalur tertentu (misalnya, dikodekan secara permanen) untuk data input. Dalam kasus ini, tentukan jalur dengan parameter path_on_compute saat Anda mendeklarasikan DataReference. Azure Machine Learning akan mengunduh data yang ditentukan oleh jalur tersebut sebelum menjalankan skrip Anda.

Dengan mode 'mount', direktori sementara dibuat dengan data terpasang dan variabel lingkungan $AZUREML_DATAREFERENCE_<data_reference_name> diatur dengan jalur ke direktori sementara. Jika Anda meneruskan DataReference ke dalam daftar argumen untuk langkah alur (misalnya PythonScriptStep), kemudian referensi akan diperluas ke jalur data lokal saat runtime.

Nilai default: mount
path_on_compute
str

Jalur pada target komputasi untuk referensi data.

Nilai default: None
overwrite

Menunjukkan apakah akan mengambil alih data yang ada.

Nilai default: False
datastore
Diperlukan

Datastore ke referensi.

data_reference_name
Diperlukan
str

Nama referensi data.

path_on_datastore
Diperlukan
str

Jalur relatif di penyimpanan pendukung untuk referensi data.

mode
Diperlukan
str

Operasi pada referensi data. Nilai yang didukung 'mount' (default) dan 'download'.

Gunakan mode 'download' ketika skrip Anda mengharapkan jalur tertentu (misalnya, dikodekan secara permanen) untuk data input. Dalam kasus ini, tentukan jalur dengan parameter path_on_compute saat Anda mendeklarasikan DataReference. Azure Machine Learning akan mengunduh data yang ditentukan oleh jalur tersebut sebelum menjalankan skrip Anda.

Dengan mode 'mount', direktori sementara dibuat dengan data terpasang dan variabel lingkungan $AZUREML_DATAREFERENCE_<data_reference_name> diatur dengan jalur ke direktori sementara. Jika Anda meneruskan DataReference ke dalam daftar argumen untuk langkah alur (misalnya PythonScriptStep), kemudian referensi akan diperluas ke jalur data lokal saat runtime.

path_on_compute
Diperlukan
str

Jalur pada target komputasi untuk referensi data.

overwrite
Diperlukan

Menunjukkan apakah akan mengambil alih data yang ada.

Keterangan

DataReference menentukan lokasi data dan bagaimana data digunakan pada pengikatan komputasi target (pemasangan atau pengunggahan). Jalur ke data ke penyimpanan data dapat berupa root /, direktori di dalam penyimpanan data, atau file di penyimpanan data.

Metode

as_download

Alihkan operasi referensi data ke unduh.

Unduhan DataReference hanya mendukung Azure Blob dan Azure File Share. Untuk mengunduh data dari Azure Blob, Azure File Share, Azure Data Lake Gen1, dan Azure Data Lake Gen2, sebaiknya gunakan Himpunan Data Azure Machine Learning. Untuk informasi selengkapnya tentang cara membuat dan menggunakan Himpunan Data, silakan kunjungi https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount

Alihkan operasi referensi data ke pasang.

Pemasangan DataReference hanya mendukung Azure Blob. Untuk memasang data di Azure Blob, Azure File Share, Azure Data Lake Gen1, dan Azure Data Lake Gen2, sebaiknya gunakan Himpunan Data Azure Machine Learning. Untuk informasi selengkapnya tentang cara membuat dan menggunakan Himpunan Data, silakan kunjungi https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_upload

Alihkan operasi referensi data ke unggah.

Untuk informasi selengkapnya tentang komputasi dan datastore mana yang mendukung pengunggahan data, lihat: https://aka.ms/datastore-matrix.

create

Buat DataReference menggunakan DataPath dan DataPathComputeBinding.

path

Buat instans DataReference berdasarkan jalur yang diberikan.

to_config

Ubah objek DataReference menjadi objek DataReferenceConfiguration.

as_download

Alihkan operasi referensi data ke unduh.

Unduhan DataReference hanya mendukung Azure Blob dan Azure File Share. Untuk mengunduh data dari Azure Blob, Azure File Share, Azure Data Lake Gen1, dan Azure Data Lake Gen2, sebaiknya gunakan Himpunan Data Azure Machine Learning. Untuk informasi selengkapnya tentang cara membuat dan menggunakan Himpunan Data, silakan kunjungi https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_download(path_on_compute=None, overwrite=False)

Parameter

Nama Deskripsi
path_on_compute
str

Jalur pada komputasi untuk referensi data.

Nilai default: None
overwrite

Menunjukkan apakah akan mengambil alih data yang ada.

Nilai default: False

Mengembalikan

Jenis Deskripsi

Objek referensi data baru.

as_mount

Alihkan operasi referensi data ke pasang.

Pemasangan DataReference hanya mendukung Azure Blob. Untuk memasang data di Azure Blob, Azure File Share, Azure Data Lake Gen1, dan Azure Data Lake Gen2, sebaiknya gunakan Himpunan Data Azure Machine Learning. Untuk informasi selengkapnya tentang cara membuat dan menggunakan Himpunan Data, silakan kunjungi https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.

as_mount()

Mengembalikan

Jenis Deskripsi

Objek referensi data baru.

as_upload

Alihkan operasi referensi data ke unggah.

Untuk informasi selengkapnya tentang komputasi dan datastore mana yang mendukung pengunggahan data, lihat: https://aka.ms/datastore-matrix.

as_upload(path_on_compute=None, overwrite=False)

Parameter

Nama Deskripsi
path_on_compute
str

Jalur pada komputasi untuk referensi data.

Nilai default: None
overwrite

Menunjukkan apakah akan mengambil alih data yang ada.

Nilai default: False

Mengembalikan

Jenis Deskripsi

Objek referensi data baru.

create

Buat DataReference menggunakan DataPath dan DataPathComputeBinding.

static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)

Parameter

Nama Deskripsi
data_reference_name
str

Nama untuk referensi data yang akan dibuat.

Nilai default: None
datapath

[Wajib] Jalur data yang akan digunakan.

Nilai default: None
datapath_compute_binding

[Wajib] Pengikatan komputasi jalur data yang akan digunakan.

Nilai default: None

Mengembalikan

Jenis Deskripsi

Objek DataReference.

path

Buat instans DataReference berdasarkan jalur yang diberikan.

path(path=None, data_reference_name=None)

Parameter

Nama Deskripsi
path
str

Jalur di datastore.

Nilai default: None
data_reference_name
str

Nama referensi data.

Nilai default: None

Mengembalikan

Jenis Deskripsi

Objek referensi data.

to_config

Ubah objek DataReference menjadi objek DataReferenceConfiguration.

to_config()

Mengembalikan

Jenis Deskripsi

Objek DataReferenceConfiguration baru.