Bagikan melalui


automl Paket

Berisi kelas pembelajaran mesin otomatis untuk Azure Machine Learning SDKv2.

Area utama termasuk mengelola tugas AutoML.

Kelas

ClassificationJob

Konfigurasi untuk Pekerjaan Klasifikasi AutoML.

Menginisialisasi tugas Klasifikasi AutoML baru.

ColumnTransformer

Pengaturan transformator kolom.

ForecastingJob

Konfigurasi untuk Tugas Prakiraan AutoML.

Menginisialisasi tugas Prakiraan AutoML baru.

ForecastingSettings

Pengaturan prakiraan untuk Pekerjaan AutoML.

ImageClassificationJob

Konfigurasi untuk pekerjaan Klasifikasi Gambar multi-kelas AutoML.

Menginisialisasi pekerjaan Klasifikasi Gambar multi-kelas AutoML baru.

ImageClassificationMultilabelJob

Konfigurasi untuk pekerjaan Klasifikasi Gambar multi-label AutoML.

Menginisialisasi pekerjaan Klasifikasi Gambar multi-label AutoML baru.

ImageClassificationSearchSpace

Cari ruang untuk tugas Klasifikasi Gambar AutoML dan Multilabel Klasifikasi Gambar.

ImageInstanceSegmentationJob

Konfigurasi untuk pekerjaan Segmentasi Instans Gambar AutoML.

Menginisialisasi pekerjaan Segmentasi Instans Gambar AutoML baru.

ImageLimitSettings

Batasi pengaturan untuk Vertikal Gambar AutoML.

ImageLimitSettings adalah kelas yang berisi parameter berikut: max_concurrent_trials, max_trials, dan timeout_minutes.

Ini adalah metode konfigurasi opsional untuk mengonfigurasi parameter batas seperti batas waktu, dll.

Catatan

Jumlah eksekusi bersamaan terjaga pada sumber daya yang tersedia dalam target komputasi yang ditentukan.

Pastikan bahwa target komputasi memiliki sumber daya yang tersedia untuk konkurensi yang diinginkan.

Tip

Ini adalah praktik yang baik untuk mencocokkan jumlah max_concurrent_trials dengan jumlah simpul dalam kluster.

Misalnya, jika Anda memiliki kluster dengan 4 simpul, atur max_concurrent_trials ke 4.

Contoh penggunaan

Konfigurasi ImageLimitSettings


   from azure.ai.ml import automl

   # Create the AutoML job with the related factory-function.
   image_instance_segmentation_job = automl.image_instance_segmentation(
       compute=compute_name,
       experiment_name=exp_name,
       training_data=my_training_data_input,
       validation_data=my_validation_data_input,
       target_column_name="label",
       primary_metric="MeanAveragePrecision",
       tags={"my_custom_tag": "custom value"},
   )
   # Set the limits for the AutoML job.
   image_instance_segmentation_job.set_limits(
       max_trials=10,
       max_concurrent_trials=2,
   )
   # Submit the AutoML job.
   image_instance_segmentation_job.submit()

Menginisialisasi objek ImageLimitSettings.

Konstruktor untuk ImageLimitSettings untuk AutoML Image Verticals.

ImageModelSettingsClassification

Pengaturan model untuk tugas Klasifikasi Gambar AutoML.

ImageModelSettingsObjectDetection

Pengaturan model untuk Tugas Deteksi Objek Gambar AutoML.

ImageObjectDetectionJob

Konfigurasi untuk pekerjaan Deteksi Objek Gambar AutoML.

Menginisialisasi pekerjaan Deteksi Objek Gambar AutoML baru.

ImageObjectDetectionSearchSpace

Ruang pencarian untuk tugas Deteksi Objek Gambar AutoML dan Segmentasi Instans Gambar.

ImageSweepSettings

Pengaturan pembersihan untuk semua Vertikal Gambar AutoML.

NlpFeaturizationSettings

Pengaturan fiturisasi untuk semua Vertikal AutoML NLP.

NlpFixedParameters

Objek untuk menampung parameter tetap untuk pekerjaan NLP.

NlpLimitSettings

Batasi pengaturan untuk semua Vertikal AutoML NLP.

NlpSearchSpace

Cari ruang untuk tugas AutoML NLP.

NlpSweepSettings

Pengaturan pembersihan untuk semua tugas AutoML NLP.

RegressionJob

Konfigurasi untuk Pekerjaan Regresi AutoML.

Menginisialisasi tugas Regresi AutoML baru.

SearchSpace

Kelas SearchSpace untuk vertikal AutoML.

StackEnsembleSettings

Pengaturan lanjutan untuk menyesuaikan Eksekusi StackEnsemble.

TabularFeaturizationSettings

Pengaturan fiturisasi untuk Pekerjaan AutoML.

TabularLimitSettings

Batasi pengaturan untuk Vertikal Tabel AutoML.

TextClassificationJob

Konfigurasi untuk Pekerjaan Klasifikasi Teks AutoML.

Menginisialisasi tugas Klasifikasi Teks AutoML baru.

TextClassificationMultilabelJob

Konfigurasi untuk Pekerjaan Multilabel Klasifikasi Teks AutoML.

Menginisialisasi tugas Multilabel Klasifikasi Teks AutoML baru.

TextNerJob

Konfigurasi untuk Pekerjaan AutoML Text NER.

Menginisialisasi tugas AutoML Text NER baru.

TrainingSettings

Kelas TrainingSettings untuk Azure Machine Learning.

Kelas TrainingSettings untuk Azure Machine Learning.

Enum

BlockedTransformers

Enum untuk semua model klasifikasi yang didukung oleh AutoML.

ClassificationModels

Enum untuk semua model klasifikasi yang didukung oleh AutoML.

ClassificationMultilabelPrimaryMetrics

Metrik utama untuk tugas multilabel klasifikasi.

ClassificationPrimaryMetrics

Metrik utama untuk tugas klasifikasi.

FeaturizationMode

Mode fiturisasi - menentukan mode fiturisasi data.

ForecastHorizonMode

Enum untuk menentukan mode pemilihan horizon prakiraan.

ForecastingModels

Enum untuk semua model prakiraan yang didukung oleh AutoML.

ForecastingPrimaryMetrics

Metrik utama untuk tugas Prakiraan.

InstanceSegmentationPrimaryMetrics

Metrik utama untuk tugas InstanceSegmentation.

LearningRateScheduler

Enum penjadwal tingkat pembelajaran.

LogTrainingMetrics

Berisi kelas pembelajaran mesin otomatis untuk Azure Machine Learning SDKv2.

Area utama termasuk mengelola tugas AutoML.

LogValidationLoss

Berisi kelas pembelajaran mesin otomatis untuk Azure Machine Learning SDKv2.

Area utama termasuk mengelola tugas AutoML.

NCrossValidationsMode

Menentukan bagaimana nilai validasi N-Cross ditentukan.

ObjectDetectionPrimaryMetrics

Metrik utama untuk tugas ObjectDetection Gambar.

RegressionModels

Enum untuk semua model Regresi yang didukung oleh AutoML.

RegressionPrimaryMetrics

Metrik utama untuk tugas Regresi.

SamplingAlgorithmType

Berisi kelas pembelajaran mesin otomatis untuk Azure Machine Learning SDKv2.

Area utama termasuk mengelola tugas AutoML.

ShortSeriesHandlingConfiguration

Parameter yang menentukan cara jika AutoML harus menangani rangkaian waktu yang singkat.

StochasticOptimizer

Pengoptimal stochastic untuk model gambar.

TargetAggregationFunction

Fungsi agregat target.

TargetLagsMode

Mode pemilihan jeda target.

TargetRollingWindowSizeMode

Mode ukuran jendela bergulir target.

UseStl

Konfigurasikan Dekomposisi STL dari kolom target rangkaian waktu.

ValidationMetricType

Metode komputasi metrik yang digunakan untuk metrik validasi dalam tugas gambar.

Fungsi

classification

Fungsi untuk membuat ClassificationJob.

Pekerjaan klasifikasi digunakan untuk melatih model yang paling baik memprediksi kelas sampel data. Berbagai model dilatih menggunakan data pelatihan. Model dengan performa terbaik pada data validasi berdasarkan metrik utama dipilih sebagai model akhir.

classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob

Parameter

training_data
Input

Data pelatihan yang akan digunakan dalam eksperimen. Data tersebut harus berisi fitur pelatihan dan kolom label (opsional untuk kolom bobot sampel).

target_column_name
str

Nama kolom label. Parameter ini berlaku untuk training_dataparameter , validation_data dan test_data

primary_metric

Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Nilai yang dapat diterima: akurasi, AUC_weighted, norm_macro_recall, average_precision_score_weighted, dan default precision_score_weighted ke akurasi

enable_model_explainability
bool

Pengaktifan penjelasan model AutoML terbaik di akhir semua perulangan pelatihan AutoML. Default Tidak Ada. Untuk informasi selengkapnya, lihat Interpretabilitas: penjelasan model dalam pembelajaran mesin otomatis.

weight_column_name
str

Nama kolom bobot sampel. ML otomatis mendukung kolom yang diberatkan sebagai input, menyebabkan baris dalam data dinaikkan atau diturunkan. Jika data input berasal dari panda.DataFrame yang tidak memiliki nama kolom, indeks kolom dapat digunakan dan dinyatakan sebagai bilangan bulat.

Parameter ini berlaku untuk training_data parameter dan validation_data

validation_data
Input

Data validasi yang digunakan dalam eksperimen. Data tersebut harus berisi fitur pelatihan dan kolom label (opsional untuk kolom bobot sampel).

Default ke Tidak Ada

validation_data_size
float

Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.

Tentukan validation_data untuk menyediakan data validasi, jika tidak, tetapkan n_cross_validations atau validation_data_size untuk mengekstrak data validasi dari data pelatihan yang ditentukan. Untuk lipatan validasi silang kustom, gunakan cv_split_column_names.

Untuk informasi selengkapnya, lihat Mengonfigurasi pemisahan data dan validasi silang dalam pembelajaran mesin otomatis.

Default ke Tidak Ada

n_cross_validations
Union[str, int]

Banyaknya validasi silang yang harus dilakukan ketika data validasi pengguna tidak ditentukan.

Tentukan validation_data untuk menyediakan data validasi, jika tidak, tetapkan n_cross_validations atau validation_data_size untuk mengekstrak data validasi dari data pelatihan yang ditentukan. Untuk lipatan validasi silang kustom, gunakan cv_split_column_names.

Untuk informasi selengkapnya, lihat Mengonfigurasi pemisahan data dan validasi silang dalam pembelajaran mesin otomatis.

Default ke Tidak Ada

cv_split_column_names
List[str]

Daftar nama untuk kolom yang berisi pemisahan validasi silang kustom. Masing-masing kolom pemisahan validasi silang mewakili satu pemisahan validasi silang yang setiap barisnya ditandai 1 untuk pelatihan atau 0 untuk validasi.

Default ke Tidak Ada

test_data
Input

Fitur Pengujian Model menggunakan himpunan data pengujian atau pemisahan data pengujian adalah fitur dalam status Pratinjau dan dapat berubah kapan saja. Data uji yang digunakan untuk uji coba yang secara otomatis akan dimulai setelah pelatihan model selesai. Uji coba akan mendapatkan prediksi menggunakan model terbaik dan menghitung metrik yang diberikan prediksi ini.

Jika parameter ini atau parameter test_data_size tidak ditentukan, uji coba tidak akan dijalankan secara otomatis setelah pelatihan model selesai. Data uji harus berisi fitur dan kolom label. Jika test_data ditentukan, parameter target_column_name juga harus ditentukan.

Default ke Tidak Ada

test_data_size
float

Fitur Pengujian Model menggunakan himpunan data pengujian atau pemisahan data pengujian adalah fitur dalam status Pratinjau dan dapat berubah kapan saja. Bilangan pecahan data pelatihan yang harus ditahan untuk data uji agar uji coba dapat secara otomatis dimulai setelah pelatihan model selesai. Uji coba akan mendapatkan prediksi menggunakan model terbaik dan menghitung metrik yang diberikan prediksi ini.

Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif. Jika test_data_size ditentukan bersamaan dengan validation_data_size, data uji akan dipisah dari training_data sebelum data validasi dipisah. Misalnya, jika validation_data_size=0.1, test_data_size=0.1, dan data pelatihan asli memiliki 1000 baris, data uji akan memiliki 100 baris, data validasi akan berisi 90 baris, dan data pelatihan akan memiliki 810 baris.

Untuk tugas berbasis regresi, metode pengambilan sampel acak akan digunakan. Untuk tugas klasifikasi, metode pengambilan sampel bertingkat akan digunakan. Prakiraan saat ini tidak mendukung penentuan himpunan data pengujian menggunakan pembagian latihan/pengujian.

Jika parameter ini atau parameter test_data tidak ditentukan, uji coba tidak akan dijalankan secara otomatis setelah pelatihan model selesai.

Default ke Tidak Ada

Mengembalikan

Objek pekerjaan yang dapat dikirimkan ke komputasi Azure ML untuk dieksekusi.

Tipe hasil

forecasting

Fungsi untuk membuat pekerjaan Prakiraan.

Tugas prakiraan digunakan untuk memprediksi nilai target untuk periode waktu mendatang berdasarkan data historis. Berbagai model dilatih menggunakan data pelatihan. Model dengan performa terbaik pada data validasi berdasarkan metrik utama dipilih sebagai model akhir.

forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob

Parameter

training_data
Input

Data pelatihan yang akan digunakan dalam eksperimen. Data tersebut harus berisi fitur pelatihan dan kolom label (opsional untuk kolom bobot sampel).

target_column_name
str

Nama kolom label. Parameter ini berlaku untuk training_dataparameter , validation_data dan test_data

primary_metric

Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Nilai yang dapat diterima: default r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error ke normalized_root_mean_squared_error

enable_model_explainability
bool

Pengaktifan penjelasan model AutoML terbaik di akhir semua perulangan pelatihan AutoML. Default Tidak Ada. Untuk informasi selengkapnya, lihat Interpretabilitas: penjelasan model dalam pembelajaran mesin otomatis.

weight_column_name
str

Nama kolom bobot sampel. ML otomatis mendukung kolom yang diberatkan sebagai input, menyebabkan baris dalam data dinaikkan atau diturunkan. Jika data input berasal dari panda.DataFrame yang tidak memiliki nama kolom, indeks kolom dapat digunakan dan dinyatakan sebagai bilangan bulat.

Parameter ini berlaku untuk training_data parameter dan validation_data

validation_data
Input

Data validasi yang digunakan dalam eksperimen. Data tersebut harus berisi fitur pelatihan dan kolom label (opsional untuk kolom bobot sampel).

Default ke Tidak Ada

validation_data_size
float

Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.

Tentukan validation_data untuk menyediakan data validasi, jika tidak, tetapkan n_cross_validations atau validation_data_size untuk mengekstrak data validasi dari data pelatihan yang ditentukan. Untuk lipatan validasi silang kustom, gunakan cv_split_column_names.

Untuk informasi selengkapnya, lihat Mengonfigurasi pemisahan data dan validasi silang dalam pembelajaran mesin otomatis.

Default ke Tidak Ada

n_cross_validations
Union[str, int]

Banyaknya validasi silang yang harus dilakukan ketika data validasi pengguna tidak ditentukan.

Tentukan validation_data untuk menyediakan data validasi, jika tidak, tetapkan n_cross_validations atau validation_data_size untuk mengekstrak data validasi dari data pelatihan yang ditentukan. Untuk lipatan validasi silang kustom, gunakan cv_split_column_names.

Untuk informasi selengkapnya, lihat Mengonfigurasi pemisahan data dan validasi silang dalam pembelajaran mesin otomatis.

Default ke Tidak Ada

cv_split_column_names
List[str]

Daftar nama untuk kolom yang berisi pemisahan validasi silang kustom. Masing-masing kolom pemisahan validasi silang mewakili satu pemisahan validasi silang yang setiap barisnya ditandai 1 untuk pelatihan atau 0 untuk validasi.

Default ke Tidak Ada

test_data
Input

Fitur Pengujian Model menggunakan himpunan data pengujian atau pemisahan data pengujian adalah fitur dalam status Pratinjau dan dapat berubah kapan saja. Data uji yang digunakan untuk uji coba yang secara otomatis akan dimulai setelah pelatihan model selesai. Uji coba akan mendapatkan prediksi menggunakan model terbaik dan menghitung metrik yang diberikan prediksi ini.

Jika parameter ini atau parameter test_data_size tidak ditentukan, uji coba tidak akan dijalankan secara otomatis setelah pelatihan model selesai. Data uji harus berisi fitur dan kolom label. Jika test_data ditentukan, parameter target_column_name juga harus ditentukan.

Default ke Tidak Ada

test_data_size
float

Fitur Pengujian Model menggunakan himpunan data pengujian atau pemisahan data pengujian adalah fitur dalam status Pratinjau dan dapat berubah kapan saja. Bilangan pecahan data pelatihan yang harus ditahan untuk data uji agar uji coba dapat secara otomatis dimulai setelah pelatihan model selesai. Uji coba akan mendapatkan prediksi menggunakan model terbaik dan menghitung metrik yang diberikan prediksi ini.

Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif. Jika test_data_size ditentukan bersamaan dengan validation_data_size, data uji akan dipisah dari training_data sebelum data validasi dipisah. Misalnya, jika validation_data_size=0.1, test_data_size=0.1, dan data pelatihan asli memiliki 1000 baris, data uji akan memiliki 100 baris, data validasi akan berisi 90 baris, dan data pelatihan akan memiliki 810 baris.

Untuk tugas berbasis regresi, metode pengambilan sampel acak akan digunakan. Untuk tugas klasifikasi, metode pengambilan sampel bertingkat akan digunakan. Prakiraan saat ini tidak mendukung penentuan himpunan data pengujian menggunakan pembagian latihan/pengujian.

Jika parameter ini atau parameter test_data tidak ditentukan, uji coba tidak akan dijalankan secara otomatis setelah pelatihan model selesai.

Default ke Tidak Ada

forecasting_settings
ForecastingSettings

Pengaturan untuk tugas prakiraan

Mengembalikan

Objek pekerjaan yang dapat dikirimkan ke komputasi Azure ML untuk dieksekusi.

Tipe hasil

image_classification

Membuat objek untuk pekerjaan Klasifikasi multi-kelas Gambar AutoML.

image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob

Parameter

training_data
Input

Data pelatihan yang akan digunakan dalam eksperimen.

target_column_name
str

Nama kolom label. Parameter ini berlaku untuk parameter training_data dan validation_data.

primary_metric

Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Nilai yang dapat diterima: akurasi, AUC_weighted, norm_macro_recall, average_precision_score_weighted, dan precision_score_weighted Default ke akurasi.

validation_data
Input

Data validasi yang digunakan dalam eksperimen.

validation_data_size
float

Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.

Tentukan validation_data untuk menyediakan data validasi, jika tidak, atur validation_data_size untuk mengekstrak data validasi dari data pelatihan yang ditentukan.

Default ke .2

kwargs
dict

Kamus parameter konfigurasi tambahan.

Mengembalikan

Objek pekerjaan klasifikasi gambar yang dapat dikirimkan ke komputasi Azure ML untuk dieksekusi.

Tipe hasil

image_classification_multilabel

Membuat objek untuk pekerjaan Klasifikasi multi-label Gambar AutoML.

image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob

Parameter

training_data
Input

Data pelatihan yang akan digunakan dalam eksperimen.

target_column_name
str

Nama kolom label. Parameter ini berlaku untuk parameter training_data dan validation_data.

primary_metric

Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Nilai yang dapat diterima: akurasi, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted, dan Default Iou ke Iou.

validation_data
Input

Data validasi yang digunakan dalam eksperimen.

validation_data_size
float

Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.

Tentukan validation_data untuk menyediakan data validasi, jika tidak, atur validation_data_size untuk mengekstrak data validasi dari data pelatihan yang ditentukan.

Default ke .2

kwargs
dict

Kamus parameter konfigurasi tambahan.

Mengembalikan

Objek pekerjaan klasifikasi multi-label gambar yang dapat dikirimkan ke komputasi Azure ML untuk dieksekusi.

Tipe hasil

image_instance_segmentation

Membuat objek untuk pekerjaan Segmentasi Instans Gambar AutoML.

image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob

Parameter

training_data
Input

Data pelatihan yang akan digunakan dalam eksperimen.

target_column_name
str

Nama kolom label. Parameter ini berlaku untuk parameter training_data dan validation_data.

primary_metric

Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Nilai yang dapat diterima: MeanAveragePrecision Default ke MeanAveragePrecision.

validation_data
Input

Data validasi yang digunakan dalam eksperimen.

validation_data_size
float

Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.

Tentukan validation_data untuk menyediakan data validasi, jika tidak, atur validation_data_size untuk mengekstrak data validasi dari data pelatihan yang ditentukan.

Default ke .2

kwargs
dict

Kamus parameter konfigurasi tambahan.

Mengembalikan

Pekerjaan segmentasi instans gambar

Tipe hasil

image_object_detection

Membuat objek untuk pekerjaan Deteksi Objek Gambar AutoML.

image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob

Parameter

training_data
Input

Data pelatihan yang akan digunakan dalam eksperimen.

target_column_name
str

Nama kolom label. Parameter ini berlaku untuk parameter training_data dan validation_data.

primary_metric

Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Nilai yang dapat diterima: MeanAveragePrecision Default ke MeanAveragePrecision.

validation_data
Input

Data validasi yang digunakan dalam eksperimen.

validation_data_size
float

Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.

Tentukan validation_data untuk menyediakan data validasi, jika tidak, atur validation_data_size untuk mengekstrak data validasi dari data pelatihan yang ditentukan.

Default ke .2

kwargs
dict

Kamus parameter konfigurasi tambahan.

Mengembalikan

Objek pekerjaan deteksi objek gambar yang dapat dikirimkan ke komputasi Azure ML untuk dieksekusi.

Tipe hasil

regression

Fungsi untuk membuat Pekerjaan Regresi.

Pekerjaan regresi digunakan untuk melatih model untuk memprediksi nilai berkelanjutan variabel target dari himpunan data. Berbagai model dilatih menggunakan data pelatihan. Model dengan performa terbaik pada data validasi berdasarkan metrik utama dipilih sebagai model akhir.

regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob

Parameter

training_data
Input

Data pelatihan yang akan digunakan dalam eksperimen. Data tersebut harus berisi fitur pelatihan dan kolom label (opsional untuk kolom bobot sampel).

target_column_name
str

Nama kolom label. Parameter ini berlaku untuk training_dataparameter , validation_data dan test_data

primary_metric

Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.

Nilai yang dapat diterima: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Default ke normalized_root_mean_squared_error

enable_model_explainability
bool

Pengaktifan penjelasan model AutoML terbaik di akhir semua perulangan pelatihan AutoML. Default Tidak Ada. Untuk informasi selengkapnya, lihat Interpretabilitas: penjelasan model dalam pembelajaran mesin otomatis.

weight_column_name
str

Nama kolom bobot sampel. ML otomatis mendukung kolom yang diberatkan sebagai input, menyebabkan baris dalam data dinaikkan atau diturunkan. Jika data input berasal dari panda.DataFrame yang tidak memiliki nama kolom, indeks kolom dapat digunakan dan dinyatakan sebagai bilangan bulat.

Parameter ini berlaku untuk training_data parameter dan validation_data

validation_data
Input

Data validasi yang digunakan dalam eksperimen. Data tersebut harus berisi fitur pelatihan dan kolom label (opsional untuk kolom bobot sampel).

Default ke Tidak Ada

validation_data_size
float

Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.

Tentukan validation_data untuk menyediakan data validasi, jika tidak, tetapkan n_cross_validations atau validation_data_size untuk mengekstrak data validasi dari data pelatihan yang ditentukan. Untuk lipatan validasi silang kustom, gunakan cv_split_column_names.

Untuk informasi selengkapnya, lihat Mengonfigurasi pemisahan data dan validasi silang dalam pembelajaran mesin otomatis.

Default ke Tidak Ada

n_cross_validations
Union[str, int]

Banyaknya validasi silang yang harus dilakukan ketika data validasi pengguna tidak ditentukan.

Tentukan validation_data untuk menyediakan data validasi, jika tidak, tetapkan n_cross_validations atau validation_data_size untuk mengekstrak data validasi dari data pelatihan yang ditentukan. Untuk lipatan validasi silang kustom, gunakan cv_split_column_names.

Untuk informasi selengkapnya, lihat Mengonfigurasi pemisahan data dan validasi silang dalam pembelajaran mesin otomatis.

Default ke Tidak Ada

cv_split_column_names
List[str]

Daftar nama untuk kolom yang berisi pemisahan validasi silang kustom. Masing-masing kolom pemisahan validasi silang mewakili satu pemisahan validasi silang yang setiap barisnya ditandai 1 untuk pelatihan atau 0 untuk validasi.

Default ke Tidak Ada

test_data
Input

Fitur Pengujian Model menggunakan himpunan data pengujian atau pemisahan data pengujian adalah fitur dalam status Pratinjau dan dapat berubah kapan saja. Data uji yang digunakan untuk uji coba yang secara otomatis akan dimulai setelah pelatihan model selesai. Uji coba akan mendapatkan prediksi menggunakan model terbaik dan menghitung metrik yang diberikan prediksi ini.

Jika parameter ini atau parameter test_data_size tidak ditentukan, uji coba tidak akan dijalankan secara otomatis setelah pelatihan model selesai. Data uji harus berisi fitur dan kolom label. Jika test_data ditentukan, parameter target_column_name juga harus ditentukan.

Default ke Tidak Ada

test_data_size
float

Fitur Pengujian Model menggunakan himpunan data pengujian atau pemisahan data pengujian adalah fitur dalam status Pratinjau dan dapat berubah kapan saja. Bilangan pecahan data pelatihan yang harus ditahan untuk data uji agar uji coba dapat secara otomatis dimulai setelah pelatihan model selesai. Uji coba akan mendapatkan prediksi menggunakan model terbaik dan menghitung metrik yang diberikan prediksi ini.

Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif. Jika test_data_size ditentukan bersamaan dengan validation_data_size, data uji akan dipisah dari training_data sebelum data validasi dipisah. Misalnya, jika validation_data_size=0.1, test_data_size=0.1, dan data pelatihan asli memiliki 1000 baris, data uji akan memiliki 100 baris, data validasi akan berisi 90 baris, dan data pelatihan akan memiliki 810 baris.

Untuk tugas berbasis regresi, metode pengambilan sampel acak akan digunakan. Untuk tugas klasifikasi, metode pengambilan sampel bertingkat akan digunakan. Prakiraan saat ini tidak mendukung penentuan himpunan data pengujian menggunakan pembagian latihan/pengujian.

Jika parameter ini atau parameter test_data tidak ditentukan, uji coba tidak akan dijalankan secara otomatis setelah pelatihan model selesai.

Default ke Tidak Ada

Mengembalikan

Objek pekerjaan yang dapat dikirimkan ke komputasi Azure ML untuk dieksekusi.

Tipe hasil

text_classification

Fungsi untuk membuat TextClassificationJob.

Pekerjaan klasifikasi teks digunakan untuk melatih model yang dapat memprediksi kelas/kategori data teks. Data pelatihan input harus menyertakan kolom target yang mengklasifikasikan teks ke dalam satu kelas.

text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob

Parameter

training_data
Input

Data pelatihan yang akan digunakan dalam eksperimen. Ini harus berisi fitur pelatihan dan kolom target.

target_column_name
str

Nama kolom target.

validation_data
Input

Data validasi yang digunakan dalam eksperimen. Ini harus berisi fitur pelatihan dan kolom target.

primary_metric
Union[str, ClassificationPrimaryMetrics]

Metrik utama untuk tugas. Nilai yang dapat diterima: akurasi, AUC_weighted, precision_score_weighted

log_verbosity
str

Tingkat verbositas log.

kwargs
dict

Kamus parameter konfigurasi tambahan.

Mengembalikan

Objek TextClassificationJob.

Tipe hasil

text_classification_multilabel

Fungsi untuk membuat TextClassificationMultilabelJob.

Pekerjaan multilabel klasifikasi teks digunakan untuk melatih model yang dapat memprediksi kelas/kategori data teks. Data pelatihan input harus menyertakan kolom target yang mengklasifikasikan teks ke dalam kelas. Untuk informasi selengkapnya tentang format data multilabel, lihat: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label

text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob

Parameter

training_data
Input

Data pelatihan yang akan digunakan dalam eksperimen. Ini harus berisi fitur pelatihan dan kolom target.

target_column_name
str

Nama kolom target.

validation_data
Input

Data validasi yang digunakan dalam eksperimen. Ini harus berisi fitur pelatihan dan kolom target.

primary_metric
str

Metrik utama untuk tugas. Nilai yang dapat diterima: akurasi

log_verbosity
str

Tingkat verbositas log.

kwargs
dict

Kamus parameter konfigurasi tambahan.

Mengembalikan

Objek TextClassificationMultilabelJob.

Tipe hasil

text_ner

Fungsi untuk membuat TextNerJob.

Teks bernama tugas pengenalan entitas digunakan untuk melatih model yang dapat memprediksi entitas bernama dalam teks. Data pelatihan input harus berupa file teks dalam format CoNLL. Untuk informasi selengkapnya tentang format data NER teks, lihat: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner

text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob

Parameter

training_data
Input

Data pelatihan yang akan digunakan dalam eksperimen. Ini harus berisi fitur pelatihan dan kolom target.

validation_data
Input

Data validasi yang digunakan dalam eksperimen. Ini harus berisi fitur pelatihan dan kolom target.

primary_metric
str

Metrik utama untuk tugas. Nilai yang dapat diterima: akurasi

log_verbosity
str

Tingkat verbositas log.

kwargs
dict

Kamus parameter konfigurasi tambahan.

Mengembalikan

Objek TextNerJob.

Tipe hasil