DataReference Kelas
Mewakili referensi ke data di penyimpanan data.
DataReference menunjukkan jalur dalam datastore dan dapat digunakan untuk menjelaskan bagaimana dan di mana data harus disediakan dalam eksekusi. Ini bukan lagi pendekatan yang direkomendasikan untuk akses dan pengiriman data di Azure Machine Learning. Himpunan data mendukung pengaksesan data dari penyimpanan Azure Blob, Azure Files, Azure Data Lake Storage Gen1, Azure Data Lake Storage Gen2, Azure SQL Database, dan Azure Database for PostgreSQL melalui antarmuka terpadu dengan kemampuan manajemen data tambahan. Sebaiknya gunakan himpunan data untuk membaca data dalam proyek pembelajaran mesin Anda.
Untuk informasi selengkapnya tentang cara menggunakan himpunan data Azure Machine Learning dalam dua skenario umum, lihat artikel:
Konstruktor Class DataReference.
- Warisan
-
builtins.objectDataReference
Konstruktor
DataReference(datastore, data_reference_name=None, path_on_datastore=None, mode='mount', path_on_compute=None, overwrite=False)
Parameter
Nama | Deskripsi |
---|---|
datastore
Diperlukan
|
Datastore ke referensi. |
data_reference_name
|
Nama referensi data. Nilai default: None
|
path_on_datastore
|
Jalur relatif di penyimpanan pendukung untuk referensi data. Nilai default: None
|
mode
|
Operasi pada referensi data. Nilai yang didukung adalah 'mount' (default) dan 'download'. Gunakan mode 'download' ketika skrip Anda mengharapkan jalur tertentu (misalnya, dikodekan secara permanen) untuk data input.
Dalam kasus ini, tentukan jalur dengan parameter Dengan mode 'mount', direktori sementara dibuat dengan data terpasang dan variabel lingkungan $AZUREML_DATAREFERENCE_<data_reference_name> diatur dengan jalur ke direktori sementara. Jika Anda meneruskan DataReference ke dalam daftar argumen untuk langkah alur (misalnya PythonScriptStep), kemudian referensi akan diperluas ke jalur data lokal saat runtime. Nilai default: mount
|
path_on_compute
|
Jalur pada target komputasi untuk referensi data. Nilai default: None
|
overwrite
|
Menunjukkan apakah akan mengambil alih data yang ada. Nilai default: False
|
datastore
Diperlukan
|
Datastore ke referensi. |
data_reference_name
Diperlukan
|
Nama referensi data. |
path_on_datastore
Diperlukan
|
Jalur relatif di penyimpanan pendukung untuk referensi data. |
mode
Diperlukan
|
Operasi pada referensi data. Nilai yang didukung 'mount' (default) dan 'download'. Gunakan mode 'download' ketika skrip Anda mengharapkan jalur tertentu (misalnya, dikodekan secara permanen) untuk data input.
Dalam kasus ini, tentukan jalur dengan parameter Dengan mode 'mount', direktori sementara dibuat dengan data terpasang dan variabel lingkungan $AZUREML_DATAREFERENCE_<data_reference_name> diatur dengan jalur ke direktori sementara. Jika Anda meneruskan DataReference ke dalam daftar argumen untuk langkah alur (misalnya PythonScriptStep), kemudian referensi akan diperluas ke jalur data lokal saat runtime. |
path_on_compute
Diperlukan
|
Jalur pada target komputasi untuk referensi data. |
overwrite
Diperlukan
|
Menunjukkan apakah akan mengambil alih data yang ada. |
Keterangan
DataReference menentukan lokasi data dan bagaimana data digunakan pada pengikatan komputasi target (pemasangan atau pengunggahan). Jalur ke data ke penyimpanan data dapat berupa root /, direktori di dalam penyimpanan data, atau file di penyimpanan data.
Metode
as_download |
Alihkan operasi referensi data ke unduh. Unduhan DataReference hanya mendukung Azure Blob dan Azure File Share. Untuk mengunduh data dari Azure Blob, Azure File Share, Azure Data Lake Gen1, dan Azure Data Lake Gen2, sebaiknya gunakan Himpunan Data Azure Machine Learning. Untuk informasi selengkapnya tentang cara membuat dan menggunakan Himpunan Data, silakan kunjungi https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets. |
as_mount |
Alihkan operasi referensi data ke pasang. Pemasangan DataReference hanya mendukung Azure Blob. Untuk memasang data di Azure Blob, Azure File Share, Azure Data Lake Gen1, dan Azure Data Lake Gen2, sebaiknya gunakan Himpunan Data Azure Machine Learning. Untuk informasi selengkapnya tentang cara membuat dan menggunakan Himpunan Data, silakan kunjungi https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets. |
as_upload |
Alihkan operasi referensi data ke unggah. Untuk informasi selengkapnya tentang komputasi dan datastore mana yang mendukung pengunggahan data, lihat: https://aka.ms/datastore-matrix. |
create |
Buat DataReference menggunakan DataPath dan DataPathComputeBinding. |
path |
Buat instans DataReference berdasarkan jalur yang diberikan. |
to_config |
Ubah objek DataReference menjadi objek DataReferenceConfiguration. |
as_download
Alihkan operasi referensi data ke unduh.
Unduhan DataReference hanya mendukung Azure Blob dan Azure File Share. Untuk mengunduh data dari Azure Blob, Azure File Share, Azure Data Lake Gen1, dan Azure Data Lake Gen2, sebaiknya gunakan Himpunan Data Azure Machine Learning. Untuk informasi selengkapnya tentang cara membuat dan menggunakan Himpunan Data, silakan kunjungi https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.
as_download(path_on_compute=None, overwrite=False)
Parameter
Nama | Deskripsi |
---|---|
path_on_compute
|
Jalur pada komputasi untuk referensi data. Nilai default: None
|
overwrite
|
Menunjukkan apakah akan mengambil alih data yang ada. Nilai default: False
|
Mengembalikan
Jenis | Deskripsi |
---|---|
Objek referensi data baru. |
as_mount
Alihkan operasi referensi data ke pasang.
Pemasangan DataReference hanya mendukung Azure Blob. Untuk memasang data di Azure Blob, Azure File Share, Azure Data Lake Gen1, dan Azure Data Lake Gen2, sebaiknya gunakan Himpunan Data Azure Machine Learning. Untuk informasi selengkapnya tentang cara membuat dan menggunakan Himpunan Data, silakan kunjungi https://docs.microsoft.com/en-us/azure/machine-learning/how-to-train-with-datasets.
as_mount()
Mengembalikan
Jenis | Deskripsi |
---|---|
Objek referensi data baru. |
as_upload
Alihkan operasi referensi data ke unggah.
Untuk informasi selengkapnya tentang komputasi dan datastore mana yang mendukung pengunggahan data, lihat: https://aka.ms/datastore-matrix.
as_upload(path_on_compute=None, overwrite=False)
Parameter
Nama | Deskripsi |
---|---|
path_on_compute
|
Jalur pada komputasi untuk referensi data. Nilai default: None
|
overwrite
|
Menunjukkan apakah akan mengambil alih data yang ada. Nilai default: False
|
Mengembalikan
Jenis | Deskripsi |
---|---|
Objek referensi data baru. |
create
Buat DataReference menggunakan DataPath dan DataPathComputeBinding.
static create(data_reference_name=None, datapath=None, datapath_compute_binding=None)
Parameter
Nama | Deskripsi |
---|---|
data_reference_name
|
Nama untuk referensi data yang akan dibuat. Nilai default: None
|
datapath
|
[Wajib] Jalur data yang akan digunakan. Nilai default: None
|
datapath_compute_binding
|
[Wajib] Pengikatan komputasi jalur data yang akan digunakan. Nilai default: None
|
Mengembalikan
Jenis | Deskripsi |
---|---|
Objek DataReference. |
path
Buat instans DataReference berdasarkan jalur yang diberikan.
path(path=None, data_reference_name=None)
Parameter
Nama | Deskripsi |
---|---|
path
|
Jalur di datastore. Nilai default: None
|
data_reference_name
|
Nama referensi data. Nilai default: None
|
Mengembalikan
Jenis | Deskripsi |
---|---|
Objek referensi data. |
to_config
Ubah objek DataReference menjadi objek DataReferenceConfiguration.
to_config()
Mengembalikan
Jenis | Deskripsi |
---|---|
Objek DataReferenceConfiguration baru. |