Bagikan melalui


SKLearn Kelas

Membuat estimator untuk pelatihan dalam eksperimen Scikit-learn.

TIDAK DIGUNAKAN LAGI. Gunakan objek ScriptRunConfig dengan lingkungan yang Anda tentukan sendiri atau lingkungan yang dikuratori AzureML-Tutorial. Untuk pengenalan konfigurasi eksperimen SKLearn yang berjalan dengan ScriptRunConfig, lihat Melatih model scikit-learn dalam skala besar dengan Azure Machine Learning.

Estimator ini hanya mendukung pelatihan CPU node tunggal.

Versi yang didukung: 0.20.3

Menginisialisasi estimator Scikit-learn.

Warisan
azureml.train.estimator._framework_base_estimator._FrameworkBaseEstimator
SKLearn

Konstruktor

SKLearn(source_directory, *, compute_target=None, vm_size=None, vm_priority=None, entry_script=None, script_params=None, use_docker=True, custom_docker_image=None, image_registry_details=None, user_managed=False, conda_packages=None, pip_packages=None, conda_dependencies_file_path=None, pip_requirements_file_path=None, conda_dependencies_file=None, pip_requirements_file=None, environment_variables=None, environment_definition=None, inputs=None, shm_size=None, resume_from=None, max_run_duration_seconds=None, framework_version=None, _enable_optimized_mode=False, _disable_validation=True, _show_lint_warnings=False, _show_package_warnings=False)

Parameter

source_directory
str
Diperlukan

Direktori lokal yang berisi file konfigurasi eksperimen.

compute_target
AbstractComputeTarget atau str
Diperlukan

Target komputasi di mana pelatihan akan terjadi. Ini bisa berupa objek atau untai (karakter) "lokal".

vm_size
str
Diperlukan

Ukuran mesin virtual dari target komputasi yang akan dibuat untuk pelatihan.

Nilai yang didukung: Ukuran mesin virtual Azure apa pun.

vm_priority
str
Diperlukan

Prioritas mesin virtual dari target komputasi yang akan dibuat untuk pelatihan. Jika tidak ditentukan, 'khusus' akan digunakan.

Nilai yang didukung: 'khusus' dan 'prioritas rendah'.

Ini berlaku hanya jika vm_size param ditentukan dalam input.

entry_script
str
Diperlukan

Untai (karakter) yang menunjukkan jalur relatif ke file yang digunakan untuk memulai pelatihan.

script_params
dict
Diperlukan

Kamus argumen baris perintah untuk diteruskan ke skrip pelatihan yang ditentukan dalam entry_script.

custom_docker_image
str
Diperlukan

Nama gambar Docker tempat membuat gambar yang akan digunakan untuk pelatihan. Jika tidak diatur, gambar berbasis CPU default akan digunakan sebagai gambar dasar.

image_registry_details
ContainerRegistry
Diperlukan

Detail dari registri gambar Docker.

user_managed
bool
Diperlukan

Menentukan apakah Azure Machine Learning menggunakan kembali lingkungan Python yang ada. Jika False, Azure Machine Learning akan membuat lingkungan Python berdasarkan spesifikasi dependensi conda.

conda_packages
list
Diperlukan

Daftar untai (karakter) yang menunjukkan paket conda untuk ditambahkan ke lingkungan Python untuk eksperimen.

pip_packages
list
Diperlukan

Daftar untai (karakter) yang menunjukkan paket pip yang akan ditambahkan ke lingkungan Python untuk eksperimen.

conda_dependencies_file_path
str
Diperlukan

Untai (karakter) yang menunjukkan jalur relatif ke file yaml dependensi conda. Jika ditentukan, Azure Machine Learning tidak akan memasang paket terkait kerangka kerja apa pun. Ini dapat dilengkapi dengan kombinasi parameter conda_packages. TIDAK DIGUNAKAN LAGI. Gunakan parameter conda_dependencies_file.

pip_requirements_file_path
str
Diperlukan

Untai (karakter) yang menunjukkan jalur relatif ke file teks persyaratan pip. Ini dapat dilengkapi dengan kombinasi parameter pip_packages. TIDAK DIGUNAKAN LAGI. Gunakan parameter pip_requirements_file.

conda_dependencies_file
str
Diperlukan

Untai (karakter) yang menunjukkan jalur relatif ke file yaml dependensi conda. Jika ditentukan, Azure Machine Learning tidak akan memasang paket terkait kerangka kerja apa pun. Ini dapat dilengkapi dengan kombinasi parameter conda_packages.

pip_requirements_file
str
Diperlukan

Untai (karakter) yang menunjukkan jalur relatif ke file teks persyaratan pip. Ini dapat dilengkapi dengan kombinasi parameter pip_packages.

environment_variables
dict
Diperlukan

Sebuah kamus berisi nama dan nilai variabel lingkungan. Variabel lingkungan ini diatur pada proses tempat skrip pengguna sedang dijalankan.

environment_definition
Environment
Diperlukan

Definisi lingkungan untuk eksperimen mencakup variabel PythonSection, DockerSection, serta lingkungan. Opsi lingkungan apa pun yang tidak secara langsung diekspos melalui parameter lain ke konstruksi Estimator bisa diatur menggunakan parameter environment_definition. Jika parameter ini ditentukan, ini akan lebih diutamakan daripada parameter terkait lingkungan lainnya seperti use_gpu, custom_docker_image, conda_packages, atau pip_packages. Kesalahan akan dilaporkan sebagai kombinasi yang tidak valid.

inputs
list
Diperlukan

Daftar objek DataReference atau DatasetConsumptionConfig yang akan digunakan sebagai input.

shm_size
str
Diperlukan

Ukuran blok memori bersama kontainer Docker. Jika tidak diatur, azureml.core.environment._DEFAULT_SHM_SIZE default digunakan.

resume_from
DataPath
Diperlukan

Jalur data yang berisi file model atau titik pemeriksaan untuk melanjutkan eksperimen.

max_run_duration_seconds
int
Diperlukan

Waktu maksimum yang diizinkan untuk eksekusi. Azure Machine Learning akan mencoba membatalkan eksekusi secara otomatis jika memakan waktu lebih lama dari nilai ini.

framework_version
str
Diperlukan

Versi Scikit-learn yang akan digunakan untuk mengeksekusi kode pelatihan. SKLearn.get_supported_versions() mengembalikan daftar versi yang didukung oleh SDK saat ini.

source_directory
str
Diperlukan

Direktori lokal yang berisi file konfigurasi eksperimen.

compute_target
AbstractComputeTarget atau str
Diperlukan

Target komputasi di mana pelatihan akan terjadi. Ini bisa berupa objek atau untai (karakter) "lokal".

vm_size
str
Diperlukan

Ukuran mesin virtual dari target komputasi yang akan dibuat untuk pelatihan. Nilai yang didukung: Ukuran mesin virtual Azure apa pun.

vm_priority
str
Diperlukan

Prioritas mesin virtual dari target komputasi yang akan dibuat untuk pelatihan. Jika tidak ditentukan, 'khusus' akan digunakan.

Nilai yang didukung: 'khusus' dan 'prioritas rendah'.

Ini berlaku hanya jika vm_size param ditentukan dalam input.

entry_script
str
Diperlukan

Untai (karakter) yang menunjukkan jalur relatif ke file yang digunakan untuk memulai pelatihan.

script_params
dict
Diperlukan

Kamus argumen baris perintah untuk diteruskan ke skrip pelatihan yang ditentukan dalam entry_script.

use_docker
bool
Diperlukan

Nilai bool yang menunjukkan apakah lingkungan untuk menjalankan eksperimen harus berbasis Docker.

custom_docker_image
str
Diperlukan

Nama gambar Docker dari mana gambar yang akan digunakan untuk pelatihan akan dibuat. Jika tidak diatur, gambar berbasis CPU default akan digunakan sebagai gambar dasar.

image_registry_details
ContainerRegistry
Diperlukan

Detail dari registri gambar Docker.

user_managed
bool
Diperlukan

Menentukan apakah Azure Machine Learning menggunakan kembali lingkungan Python yang ada. Jika False, Azure Machine Learning akan membuat lingkungan Python berdasarkan spesifikasi dependensi conda.

conda_packages
list
Diperlukan

Daftar untai (karakter) yang menunjukkan paket conda untuk ditambahkan ke lingkungan Python untuk eksperimen.

pip_packages
list
Diperlukan

Daftar untai (karakter) yang menunjukkan paket pip yang akan ditambahkan ke lingkungan Python untuk eksperimen.

conda_dependencies_file_path
str
Diperlukan

Untai (karakter) yang menunjukkan jalur relatif ke file yaml dependensi conda. Jika ditentukan, Azure Machine Learning tidak akan memasang paket terkait kerangka kerja apa pun. Ini dapat dilengkapi dengan kombinasi parameter conda_packages. TIDAK DIGUNAKAN LAGI. Gunakan parameter conda_dependencies_file.

pip_requirements_file_path
str
Diperlukan

Untai (karakter) yang menunjukkan jalur relatif ke file teks persyaratan pip. Ini dapat dilengkapi dengan kombinasi parameter pip_packages. TIDAK DIGUNAKAN LAGI. Gunakan parameter pip_requirements_file.

conda_dependencies_file
str
Diperlukan

Untai (karakter) yang menunjukkan jalur relatif ke file yaml dependensi conda. Jika ditentukan, Azure Machine Learning tidak akan memasang paket terkait kerangka kerja apa pun. Ini dapat dilengkapi dengan kombinasi parameter conda_packages.

pip_requirements_file
str
Diperlukan

Untai (karakter) yang menunjukkan jalur relatif ke file teks persyaratan pip. Ini dapat dilengkapi dengan kombinasi parameter pip_packages.

environment_variables
dict
Diperlukan

Sebuah kamus berisi nama dan nilai variabel lingkungan. Variabel lingkungan ini diatur pada proses tempat skrip pengguna sedang dijalankan.

environment_definition
Environment
Diperlukan

Definisi lingkungan untuk eksperimen mencakup variabel PythonSection, DockerSection, serta lingkungan. Opsi lingkungan apa pun yang tidak secara langsung diekspos melalui parameter lain ke konstruksi Estimator bisa diatur menggunakan parameter environment_definition. Jika parameter ini ditentukan, ini akan lebih diutamakan daripada parameter terkait lingkungan lainnya seperti use_gpu, custom_docker_image, conda_packages, atau pip_packages. Kesalahan akan dilaporkan sebagai kombinasi yang tidak valid.

inputs
list
Diperlukan

Daftar azureml.data.data_reference. Objek DataReference untuk digunakan sebagai input.

shm_size
str
Diperlukan

Ukuran blok memori bersama kontainer Docker. Jika tidak diatur, azureml.core.environment._DEFAULT_SHM_SIZE default digunakan.

resume_from
DataPath
Diperlukan

Jalur data yang berisi file model atau titik pemeriksaan untuk melanjutkan eksperimen.

max_run_duration_seconds
int
Diperlukan

Waktu maksimum yang diizinkan untuk eksekusi. Azure Machine Learning akan mencoba membatalkan eksekusi secara otomatis jika memakan waktu lebih lama dari nilai ini.

framework_version
str
Diperlukan

Versi Scikit-learn yang akan digunakan untuk mengeksekusi kode pelatihan. SKLearn.get_supported_versions() mengembalikan daftar versi yang didukung oleh SDK saat ini.

_enable_optimized_mode
bool
Diperlukan

Aktifkan build lingkungan inkremental dengan gambar kerangka kerja bawaan untuk persiapan lingkungan yang lebih cepat. Gambar kerangka kerja bawaan dibangun di atas gambar dasar CPU/GPU default Azure ML dengan dependensi kerangka kerja yang telah diinstal sebelumnya.

_disable_validation
bool
Diperlukan

Nonaktifkan validasi skrip sebelum menjalankan pengiriman. Default-nya adalah True.

_show_lint_warnings
bool
Diperlukan

Tampilkan peringatan linting skrip. Defaultnya adalah False.

_show_package_warnings
bool
Diperlukan

Tampilkan peringatan validasi paket. Defaultnya adalah False.

Keterangan

Saat mengirimkan pekerjaan pelatihan, Azure Machine Learning menjalankan skrip Anda di lingkungan conda dalam kontainer Docker. Kontainer Scikit-learn telah menginstal dependensi berikut.

Dependensi | Scikit-learn 0.20.3 | ———————- | —————– | Python | 3.6.2 | azureml-defaults | Terbaru | IntelMpi | 2018.3.222 | scikit-learn | 0.20.3 | numpy | 1.16.2 | miniconda | 4.5.11 | scipy | 1.2.1 | joblib | 0.13.2 | git | 2.7.4 |

Gambar Docker memperluas Ubuntu 16.04.

Jika Anda perlu memasang dependensi tambahan, Anda dapat menggunakan parameter pip_packages atau conda_packages, atau Anda dapat menyediakan file pip_requirements_file atau conda_dependencies_file. Atau, Anda bisa membangun gambar Anda sendiri dan meneruskan parameter custom_docker_image ke konstruktor estimator.

Atribut

DEFAULT_VERSION

DEFAULT_VERSION = '0.20.3'

FRAMEWORK_NAME

FRAMEWORK_NAME = 'SKLearn'