Bagikan melalui


Estimator Kelas

Mewakili estimator umum untuk melatih data menggunakan kerangka kerja yang disediakan.

TIDAK DIGUNAKAN LAGI. Gunakan objek ScriptRunConfig dengan lingkungan yang Anda tentukan sendiri atau lingkungan yang dikumpulkan Azure Machine Learning. Untuk pengenalan tentang cara mengonfigurasi eksekusi eksperimen dengan ScriptRunConfig, lihat Mengonfigurasi dan mengirimkan eksekusi pelatihan.

Kelas ini dirancang untuk digunakan dengan kerangka kerja pembelajaran mesin yang belum memiliki estimator Azure Machine Learning pra-konfigurasi. Estimator pra-konfigurasi tersedia untuk Chainer, PyTorch, TensorFlow, dan SKLearn. Untuk membuat Estimator yang tidak dikonfigurasi sebelumnya, lihat Melatih model dengan Azure Machine Learning menggunakan estimator.

Kelas Estimator membungkus informasi konfigurasi eksekusi untuk membantu menyederhanakan tugas menentukan bagaimana skrip dijalankan. Ini mendukung node tunggal serta menjalankan multi-node. Menjalankan estimator menghasilkan model di direktori output yang ditentukan dalam skrip pelatihan Anda.

Inisialisasi estimator.

azureml.core.environment._DEFAULT_SHM_SIZE digunakan. Untuk informasi selengkapnya, lihat Referensi eksekusi Docker. :type shm_size: str :p aram resume_from: Jalur data yang berisi file titik pemeriksaan atau model untuk melanjutkan eksperimen. :type resume_from: azureml.data.datapath.DataPath :p aram max_run_duration_seconds: Waktu maksimum yang diizinkan untuk eksekusi. Azure ML akan mencoba untuk secara otomatis

batalkan eksekusi jika membutuhkan waktu lebih lama dari nilai ini.

Warisan
azureml.train.estimator._mml_base_estimator.MMLBaseEstimator
Estimator

Konstruktor

Estimator(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, node_count=1, process_count_per_node=1, distributed_backend=None, distributed_training=None, use_gpu=False, use_docker=True, custom_docker_base_image=None, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, source_directory_data_store=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parameter

Nama Deskripsi
source_directory
Diperlukan
str

Direktori lokal yang berisi konfigurasi eksperimen dan file kode yang diperlukan untuk pekerjaan pelatihan.

compute_target
Diperlukan

Target komputasi di mana pelatihan akan terjadi. Ini bisa berupa objek atau untai (karakter) "lokal".

vm_size
Diperlukan
str

Ukuran mesin virtual dari target komputasi yang akan dibuat untuk pelatihan. Nilai yang didukung: Ukuran mesin virtual Azure apa pun.

vm_priority
Diperlukan
str

Prioritas mesin virtual dari target komputasi yang akan dibuat untuk pelatihan. Jika tidak ditentukan, 'khusus' akan digunakan.

Nilai yang didukung: 'dedicated' dan 'lowpriority'.

Ini berlaku hanya ketika parameter vm_size ditentukan dalam input.

entry_script
Diperlukan
str

Jalur relatif ke file yang digunakan untuk memulai pelatihan.

script_params
Diperlukan

Kamus argumen baris perintah untuk diteruskan ke skrip pelatihan yang ditentukan dalam entry_script.

node_count
Diperlukan
int

Jumlah node dalam target komputasi yang digunakan untuk pelatihan. Jika lebih besar dari 1, pekerjaan terdistribusi MPI akan dijalankan.

process_count_per_node
Diperlukan
int

Jumlah proses (atau "pekerja") untuk dijalankan pada setiap simpul. Jika lebih besar dari 1, pekerjaan terdistribusi MPI akan dijalankan. Hanya target AmlCompute yang didukung untuk pekerjaan terdistribusi.

distributed_backend
Diperlukan
str

Backend komunikasi untuk pelatihan terdistribusi.

TIDAK DIGUNAKAN LAGI. Gunakan parameter distributed_training.

Nilai yang didukung: 'mpi'. 'mpi' mewakili MPI /Horovod.

Parameter ini diperlukan ketika node_count atau process_count_per_node> 1.

Ketika node_count == 1 dan process_count_per_node == 1, tidak ada backend yang akan digunakan kecuali backend diatur secara eksplisit. Hanya target AmlCompute yang didukung untuk pelatihan terdistribusi.

distributed_training
Diperlukan
Mpi

Parameter untuk menjalankan pekerjaan pelatihan terdistribusi.

Untuk menjalankan pekerjaan terdistribusi dengan backend MPI, gunakan objek Mpi untuk menentukan process_count_per_node.

use_gpu
Diperlukan

Menunjukkan apakah lingkungan untuk menjalankan eksperimen harus mendukung GPU. Jika true, gambar Docker default berbasis GPU akan digunakan di lingkungan. Jika false, gambar berbasis CPU akan digunakan. Gambar Docker default (CPU atau GPU) hanya akan digunakan jika parameter custom_docker_image tidak diatur. Pengaturan ini hanya digunakan di target komputasi yang diaktifkan Docker.

use_docker
Diperlukan

Menentukan apakah lingkungan untuk menjalankan eksperimen harus berbasis Docker.

custom_docker_base_image
Diperlukan
str

Nama gambar Docker dari mana gambar yang akan digunakan untuk pelatihan akan dibuat.

TIDAK DIGUNAKAN LAGI. Gunakan parameter custom_docker_image.

Jika tidak diatur, gambar berbasis CPU default akan digunakan sebagai gambar dasar.

custom_docker_image
Diperlukan
str

Nama gambar Docker dari mana gambar yang akan digunakan untuk pelatihan akan dibuat. Jika tidak diatur, gambar berbasis CPU default akan digunakan sebagai gambar dasar. Hanya tentukan gambar yang tersedia di repositori docker publik (Docker Hub). Untuk menggunakan gambar dari repositori docker privat, gunakan parameter konstruktor environment_definition sebagai gantinya.

image_registry_details
Diperlukan

Detail dari registri gambar Docker.

user_managed
Diperlukan

Menentukan apakah Azure Machine Learning menggunakan kembali lingkungan Python yang ada. Jika false, lingkungan Python dibuat berdasarkan spesifikasi dependensi conda.

conda_packages
Diperlukan

Daftar untai yang mewakili paket conda yang akan ditambahkan ke lingkungan Python untuk eksperimen.

pip_packages
Diperlukan

Daftar untai (karakter) menunjukkan paket pip yang akan ditambahkan ke lingkungan Python untuk eksperimen.

conda_dependencies_file_path
Diperlukan
str

Jalur relatif ke file yaml dependensi conda. Jika ditentukan, Azure Machine Learning tidak akan memasang paket terkait kerangka kerja apa pun.

TIDAK DIGUNAKAN LAGI. Gunakan parameter conda_dependencies_file.

Tentukan antara conda_dependencies_file_path atau conda_dependencies_file. Jika keduanya ditentukan, conda_dependencies_file digunakan.

pip_requirements_file_path
Diperlukan
str

Jalur relatif ke file teks persyaratan pip.

TIDAK DIGUNAKAN LAGI. Gunakan parameter pip_requirements_file.

Parameter ini dapat ditentukan dalam kombinasi dengan parameter pip_packages. Tentukan antara pip_requirements_file_path atau pip_requirements_file. Jika keduanya ditentukan, pip_requirements_file digunakan.

conda_dependencies_file
Diperlukan
str

Jalur relatif ke file yaml dependensi conda. Jika ditentukan, Azure Machine Learning tidak akan memasang paket terkait kerangka kerja apa pun.

pip_requirements_file
Diperlukan
str

Jalur relatif ke file teks persyaratan pip. Parameter ini dapat ditentukan dalam kombinasi dengan parameter pip_packages.

environment_variables
Diperlukan

Kamus nama dan nilai variabel lingkungan. Variabel lingkungan ini diatur pada proses saat skrip pengguna sedang dijalankan.

environment_definition
Diperlukan

Definisi lingkungan untuk eksperimen. Ini termasuk PythonSection, DockerSection, dan variabel lingkungan. Opsi lingkungan apa pun yang tidak secara langsung diekspos melalui parameter lain ke konstruksi Penghitungan dapat diatur menggunakan parameter ini. Jika parameter ini ditentukan, parameter akan lebih diutamakan daripada parameter terkait lingkungan lainnya seperti use_gpu, custom_docker_image, conda_packages, atau pip_packages. Kesalahan akan dilaporkan pada kombinasi yang tidak valid.

inputs
Diperlukan

Daftar objek DataReference atau DatasetConsumptionConfig yang akan digunakan sebagai input.

source_directory_data_store
Diperlukan

Penyimpanan data pendukung untuk proyek bersama.

shm_size
Diperlukan
str

Ukuran blok memori bersama kontainer Docker. Jika tidak diatur, azureml.core.environment._DEFAULT_SHM_SIZE default digunakan. Untuk informasi selengkapnya, lihat Referensi eksekusi Docker.

resume_from
Diperlukan

Jalur data yang berisi file titik pemeriksaan atau model untuk melanjutkan eksperimen.

max_run_duration_seconds
Diperlukan
int

Waktu maksimum yang diizinkan untuk eksekusi. Azure ML akan mencoba membatalkan eksekusi secara otomatis jika memakan waktu lebih lama dari nilai ini.

source_directory
Diperlukan
str

Direktori lokal yang berisi konfigurasi eksperimen dan file kode yang diperlukan untuk pekerjaan pelatihan.

compute_target
Diperlukan

Target komputasi di mana pelatihan akan terjadi. Ini bisa berupa objek atau untai (karakter) "lokal".

vm_size
Diperlukan
str

Ukuran mesin virtual dari target komputasi yang akan dibuat untuk pelatihan. Nilai yang didukung: Ukuran mesin virtual Azure apa pun.

vm_priority
Diperlukan
str

Prioritas mesin virtual dari target komputasi yang akan dibuat untuk pelatihan. Jika tidak ditentukan, 'khusus' akan digunakan.

Nilai yang didukung: 'dedicated' dan 'lowpriority'.

Ini berlaku hanya ketika parameter vm_size ditentukan dalam input.

entry_script
Diperlukan
str

Jalur relatif ke file yang digunakan untuk memulai pelatihan.

script_params
Diperlukan

Kamus argumen baris perintah untuk diteruskan ke skrip pelatihan yang ditentukan dalam entry_script.

node_count
Diperlukan
int

Jumlah node dalam target komputasi yang digunakan untuk pelatihan. Jika lebih besar dari 1, pekerjaan terdistribusi MPI akan dijalankan. Hanya target AmlCompute yang didukung untuk pekerjaan terdistribusi.

process_count_per_node
Diperlukan
int

Jumlah proses per node. Jika lebih besar dari 1, pekerjaan terdistribusi MPI akan dijalankan. Hanya target AmlCompute yang didukung untuk pekerjaan terdistribusi.

distributed_backend
Diperlukan
str

Backend komunikasi untuk pelatihan terdistribusi.

TIDAK DIGUNAKAN LAGI. Gunakan parameter distributed_training.

Nilai yang didukung: 'mpi'. 'mpi' mewakili MPI /Horovod.

Parameter ini diperlukan ketika node_count atau process_count_per_node> 1.

Ketika node_count == 1 dan process_count_per_node == 1, tidak ada backend yang akan digunakan kecuali backend diatur secara eksplisit. Hanya target AmlCompute yang didukung untuk pelatihan terdistribusi.

distributed_training
Diperlukan
Mpi

Parameter untuk menjalankan pekerjaan pelatihan terdistribusi.

Untuk menjalankan pekerjaan terdistribusi dengan backend MPI, gunakan objek Mpi untuk menentukan process_count_per_node.

use_gpu
Diperlukan

Tentukan apakah lingkungan untuk menjalankan eksperimen harus mendukung GPU. Jika true, gambar Docker default berbasis GPU akan digunakan di lingkungan. Jika false, gambar berbasis CPU akan digunakan. Gambar Docker default (CPU atau GPU) hanya akan digunakan jika parameter custom_docker_image tidak diatur. Pengaturan ini hanya digunakan di target komputasi yang diaktifkan oleh Docker.

use_docker
Diperlukan

Tentukan apakah lingkungan untuk menjalankan eksperimen harus berbasis Docker.

custom_docker_base_image
Diperlukan
str

Nama gambar Docker dari mana gambar yang akan digunakan untuk pelatihan akan dibuat.

TIDAK DIGUNAKAN LAGI. Gunakan parameter custom_docker_image.

Jika tidak diatur, gambar berbasis CPU default akan digunakan sebagai gambar dasar.

custom_docker_image
Diperlukan
str

Nama gambar Docker dari mana gambar yang akan digunakan untuk pelatihan akan dibuat. Jika tidak diatur, gambar berbasis CPU default akan digunakan sebagai gambar dasar. Hanya tentukan gambar yang tersedia di repositori docker publik (Docker Hub). Untuk menggunakan gambar dari repositori docker privat, gunakan parameter konstruktor environment_definition sebagai gantinya.

image_registry_details
Diperlukan

Detail dari registri gambar Docker.

user_managed
Diperlukan

Menentukan apakah Azure Machine Learning menggunakan kembali lingkungan Python yang ada. Jika false, lingkungan Python dibuat berdasarkan spesifikasi dependensi conda.

conda_packages
Diperlukan

Daftar untai yang mewakili paket conda yang akan ditambahkan ke lingkungan Python untuk eksperimen.

pip_packages
Diperlukan

Daftar untai (karakter) menunjukkan paket pip yang akan ditambahkan ke lingkungan Python untuk eksperimen.

conda_dependencies_file_path
Diperlukan

Jalur relatif ke file yaml dependensi conda. Jika ditentukan, Azure Machine Learning tidak akan memasang paket terkait kerangka kerja apa pun.

TIDAK DIGUNAKAN LAGI. Gunakan parameter conda_dependencies_file.

Tentukan antara conda_dependencies_file_path atau conda_dependencies_file. Jika keduanya ditentukan, conda_dependencies_file digunakan.

pip_requirements_file_path
Diperlukan

Jalur relatif ke file teks persyaratan pip.

TIDAK DIGUNAKAN LAGI. Gunakan parameter pip_requirements_file.

Ini dapat dikombinasikan dengan paramater pip_packages. Tentukan antara pip_requirements_file_path atau pip_requirements_file. Jika keduanya ditentukan, pip_requirements_file digunakan.

pip_requirements_file
Diperlukan
str

Jalur relatif ke file teks persyaratan pip. Ini dapat dikombinasikan dengan paramater pip_packages.

environment_variables
Diperlukan

Sebuah kamus berisi nama dan nilai variabel lingkungan. Variabel lingkungan ini diatur pada proses saat skrip pengguna sedang dijalankan.

environment_definition
Diperlukan

Definisi lingkungan untuk eksperimen. Ini termasuk PythonSection, DockerSection, dan variabel lingkungan. Opsi lingkungan apa pun yang tidak secara langsung diekspos melalui parameter lain ke konstruksi Penghitungan dapat diatur menggunakan parameter ini. Jika parameter ini ditentukan, parameter akan lebih diutamakan daripada parameter terkait lingkungan lainnya seperti use_gpu, custom_docker_image, conda_packages, atau pip_packages. Kesalahan akan dilaporkan pada kombinasi yang tidak valid.

inputs
Diperlukan

Daftar objek DataReference atau DatasetConsumptionConfig yang akan digunakan sebagai input.

source_directory_data_store
Diperlukan

Penyimpanan data pendukung untuk proyek bersama.

shm_size
Diperlukan

Ukuran blok memori bersama kontainer Docker. Jika tidak diatur, defaultnya

_disable_validation
Diperlukan

Nonaktifkan validasi skrip sebelum menjalankan pengiriman. Default-nya adalah True.

_show_lint_warnings
Diperlukan

Tampilkan peringatan linting skrip. Defaultnya adalah False.

_show_package_warnings
Diperlukan

Tampilkan peringatan validasi paket. Defaultnya adalah False.