SKLearn Kelas

Membuat estimator untuk pelatihan dalam eksperimen Scikit-learn.

USANG. ScriptRunConfig Gunakan objek dengan lingkungan yang anda tentukan sendiri atau lingkungan AzureML-Tutorial yang dikumpulkan. Untuk pengenalan tentang mengonfigurasi eksekusi eksperimen SKLearn dengan ScriptRunConfig, lihat Melatih model scikit-learn dalam skala besar dengan Azure Machine Learning.

Estimator ini hanya mendukung pelatihan CPU simpul tunggal.

Versi yang didukung: 0.20.3

Menginisialisasi estimator Scikit-learn.

Konstruktor

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parameter

Nama Deskripsi
source_directory
Diperlukan
str

Direktori lokal yang berisi file konfigurasi eksperimen.

compute_target
Diperlukan

Target komputasi tempat pelatihan akan terjadi. Ini bisa menjadi objek atau string "lokal".

vm_size
Diperlukan
str

Ukuran VM dari target komputasi yang akan dibuat untuk pelatihan.

Nilai yang didukung: Ukuran Azure VM apa pun.

vm_priority
Diperlukan
str

Prioritas VM dari target komputasi yang akan dibuat untuk pelatihan. Jika tidak ditentukan, 'khusus' digunakan.

Nilai yang didukung: 'dedicated' dan 'lowpriority'.

Ini hanya berlaku ketika vm_size param ditentukan dalam input.

entry_script
Diperlukan
str

String yang mewakili jalur relatif ke file yang digunakan untuk memulai pelatihan.

script_params
Diperlukan

Kamus argumen baris perintah untuk diteruskan ke skrip pelatihan Anda yang ditentukan dalam entry_script.

custom_docker_image
Diperlukan
str

Nama gambar Docker tempat gambar yang akan digunakan untuk pelatihan akan dibangun. Jika tidak diatur, gambar berbasis CPU default akan digunakan sebagai gambar dasar.

image_registry_details
Diperlukan

Detail registri gambar Docker.

user_managed
Diperlukan

Menentukan apakah Azure ML menggunakan kembali lingkungan Python yang ada. False berarti bahwa AzureML akan membuat lingkungan Python berdasarkan spesifikasi dependensi conda.

conda_packages
Diperlukan

Daftar string yang mewakili paket conda yang akan ditambahkan ke lingkungan Python untuk eksperimen.

pip_packages
Diperlukan

Daftar string yang mewakili paket pip yang akan ditambahkan ke lingkungan Python untuk eksperimen.

conda_dependencies_file_path
Diperlukan
str

String yang mewakili jalur relatif ke file yaml dependensi conda. Jika ditentukan, Azure ML tidak akan menginstal paket terkait kerangka kerja apa pun. Ini dapat disediakan dalam kombinasi dengan conda_packages parameter . USANG. Gunakan parameter conda_dependencies_file.

pip_requirements_file_path
Diperlukan
str

String yang mewakili jalur relatif ke file teks persyaratan pip. Ini dapat disediakan dalam kombinasi dengan pip_packages parameter . USANG. Gunakan parameter pip_requirements_file.

conda_dependencies_file
Diperlukan
str

String yang mewakili jalur relatif ke file yaml dependensi conda. Jika ditentukan, Azure ML tidak akan menginstal paket terkait kerangka kerja apa pun. Ini dapat disediakan dalam kombinasi dengan conda_packages parameter .

pip_requirements_file
Diperlukan
str

String yang mewakili jalur relatif ke file teks persyaratan pip. Ini dapat disediakan dalam kombinasi dengan pip_packages parameter .

environment_variables
Diperlukan

Kamus nama dan nilai variabel lingkungan. Variabel lingkungan ini diatur pada proses di mana skrip pengguna sedang dijalankan.

environment_definition
Diperlukan

Definisi lingkungan untuk eksperimen mencakup variabel PythonSection, DockerSection, dan lingkungan. Opsi lingkungan apa pun yang tidak secara langsung diekspos melalui parameter lain ke konstruksi Estimator dapat diatur menggunakan environment_definition parameter. Jika parameter ini ditentukan, parameter akan lebih diutamakan daripada parameter terkait lingkungan lain seperti use_gpu, , custom_docker_image, conda_packagesatau pip_packages. Kesalahan akan dilaporkan kombinasi yang tidak valid.

inputs
Diperlukan

Daftar DataReference objek atau DatasetConsumptionConfig yang akan digunakan sebagai input.

shm_size
Diperlukan
str

Ukuran blok memori bersama kontainer Docker. Jika tidak diatur, azureml.core.environment._DEFAULT_SHM_SIZE default digunakan.

resume_from
Diperlukan

Jalur data yang berisi titik pemeriksaan atau file model untuk melanjutkan eksperimen.

max_run_duration_seconds
Diperlukan
int

Waktu maksimum yang diizinkan untuk eksekusi. Azure ML akan mencoba membatalkan eksekusi secara otomatis jika membutuhkan waktu lebih lama dari nilai ini.

framework_version
Diperlukan
str

Versi Scikit-learn yang akan digunakan untuk mengeksekusi kode pelatihan. SKLearn.get_supported_versions() mengembalikan daftar versi yang didukung oleh SDK saat ini.

source_directory
Diperlukan
str

Direktori lokal yang berisi file konfigurasi eksperimen.

compute_target
Diperlukan

Target komputasi tempat pelatihan akan terjadi. Ini bisa menjadi objek atau string "lokal".

vm_size
Diperlukan
str

Ukuran VM dari target komputasi yang akan dibuat untuk pelatihan. Nilai yang didukung: Ukuran Azure VM apa pun.

vm_priority
Diperlukan
str

Prioritas VM dari target komputasi yang akan dibuat untuk pelatihan. Jika tidak ditentukan, 'khusus' digunakan.

Nilai yang didukung: 'dedicated' dan 'lowpriority'.

Ini hanya berlaku ketika vm_size param ditentukan dalam input.

entry_script
Diperlukan
str

String yang mewakili jalur relatif ke file yang digunakan untuk memulai pelatihan.

script_params
Diperlukan

Kamus argumen baris perintah untuk diteruskan ke skrip pelatihan Anda yang ditentukan dalam entry_script.

use_docker
Diperlukan

Nilai bool yang menunjukkan apakah lingkungan untuk menjalankan eksperimen harus berbasis Docker.

custom_docker_image
Diperlukan
str

Nama gambar Docker tempat gambar yang akan digunakan untuk pelatihan akan dibangun. Jika tidak diatur, gambar berbasis CPU default akan digunakan sebagai gambar dasar.

image_registry_details
Diperlukan

Detail registri gambar Docker.

user_managed
Diperlukan

Menentukan apakah Azure ML menggunakan kembali lingkungan Python yang ada. False berarti bahwa AzureML akan membuat lingkungan Python berdasarkan spesifikasi dependensi conda.

conda_packages
Diperlukan

Daftar string yang mewakili paket conda yang akan ditambahkan ke lingkungan Python untuk eksperimen.

pip_packages
Diperlukan

Daftar string yang mewakili paket pip yang akan ditambahkan ke lingkungan Python untuk eksperimen.

conda_dependencies_file_path
Diperlukan
str

String yang mewakili jalur relatif ke file yaml dependensi conda. Jika ditentukan, Azure ML tidak akan menginstal paket terkait kerangka kerja apa pun. Ini dapat disediakan dalam kombinasi dengan conda_packages parameter . USANG. Gunakan parameter conda_dependencies_file.

pip_requirements_file_path
Diperlukan
str

String yang mewakili jalur relatif ke file teks persyaratan pip. Ini dapat disediakan dalam kombinasi dengan pip_packages parameter . USANG. Gunakan parameter pip_requirements_file.

conda_dependencies_file
Diperlukan
str

String yang mewakili jalur relatif ke file yaml dependensi conda. Jika ditentukan, Azure ML tidak akan menginstal paket terkait kerangka kerja apa pun. Ini dapat disediakan dalam kombinasi dengan conda_packages parameter .

pip_requirements_file
Diperlukan
str

String yang mewakili jalur relatif ke file teks persyaratan pip. Ini dapat disediakan dalam kombinasi dengan pip_packages parameter .

environment_variables
Diperlukan

Kamus nama dan nilai variabel lingkungan. Variabel lingkungan ini diatur pada proses di mana skrip pengguna sedang dijalankan.

environment_definition
Diperlukan

Definisi lingkungan untuk eksperimen mencakup variabel PythonSection, DockerSection, dan lingkungan. Opsi lingkungan apa pun yang tidak secara langsung diekspos melalui parameter lain ke konstruksi Estimator dapat diatur menggunakan environment_definition parameter. Jika parameter ini ditentukan, parameter akan lebih diutamakan daripada parameter terkait lingkungan lain seperti use_gpu, , custom_docker_image, conda_packagesatau pip_packages. Kesalahan akan dilaporkan kombinasi yang tidak valid.

inputs
Diperlukan

Daftar azureml.data.data_reference. Objek DataReference untuk digunakan sebagai input.

shm_size
Diperlukan
str

Ukuran blok memori bersama kontainer Docker. Jika tidak diatur, azureml.core.environment._DEFAULT_SHM_SIZE default digunakan.

resume_from
Diperlukan

Jalur data yang berisi titik pemeriksaan atau file model untuk melanjutkan eksperimen.

max_run_duration_seconds
Diperlukan
int

Waktu maksimum yang diizinkan untuk eksekusi. Azure ML akan mencoba membatalkan eksekusi secara otomatis jika membutuhkan waktu lebih lama dari nilai ini.

framework_version
Diperlukan
str

Versi Scikit-learn yang akan digunakan untuk mengeksekusi kode pelatihan. SKLearn.get_supported_versions() mengembalikan daftar versi yang didukung oleh SDK saat ini.

_enable_optimized_mode
Diperlukan

Aktifkan build lingkungan inkremental dengan gambar kerangka kerja bawaan untuk persiapan lingkungan yang lebih cepat. Gambar kerangka kerja bawaan dibangun di atas gambar dasar CPU/GPU default Azure ML dengan dependensi kerangka kerja yang telah diinstal sebelumnya.

_disable_validation
Diperlukan

Nonaktifkan validasi skrip sebelum menjalankan pengiriman. Defaultnya adalah True.

_show_lint_warnings
Diperlukan

Tampilkan peringatan linting skrip. Defaultnya adalah False.

_show_package_warnings
Diperlukan

Tampilkan peringatan validasi paket. Defaultnya adalah False.

Keterangan

Saat mengirimkan pekerjaan pelatihan, Azure ML menjalankan skrip Anda di lingkungan conda dalam kontainer Docker. Kontainer SKLearn memiliki dependensi berikut yang terinstal.

Dependensi | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Terbaru | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Gambar Docker memperluas Ubuntu 16.04.

Jika Anda perlu menginstal dependensi tambahan, Anda dapat menggunakan pip_packages parameter atau conda_packages , atau Anda dapat menyediakan file atau pip_requirements_file Andaconda_dependencies_file. Atau, Anda dapat membangun gambar Anda sendiri dan meneruskan custom_docker_image parameter ke konstruktor estimator.

Atribut

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'