automl Paket
Berisi kelas pembelajaran mesin otomatis untuk Azure Machine Learning SDKv2.
Area utama termasuk mengelola tugas AutoML.
Kelas
ClassificationJob |
Konfigurasi untuk Pekerjaan Klasifikasi AutoML. Menginisialisasi tugas Klasifikasi AutoML baru. |
ColumnTransformer |
Pengaturan transformator kolom. |
ForecastingJob |
Konfigurasi untuk Tugas Prakiraan AutoML. Menginisialisasi tugas Prakiraan AutoML baru. |
ForecastingSettings |
Pengaturan prakiraan untuk Pekerjaan AutoML. |
ImageClassificationJob |
Konfigurasi untuk pekerjaan Klasifikasi Gambar multi-kelas AutoML. Menginisialisasi pekerjaan Klasifikasi Gambar multi-kelas AutoML baru. |
ImageClassificationMultilabelJob |
Konfigurasi untuk pekerjaan Klasifikasi Gambar multi-label AutoML. Menginisialisasi pekerjaan Klasifikasi Gambar multi-label AutoML baru. |
ImageClassificationSearchSpace |
Cari ruang untuk tugas Klasifikasi Gambar AutoML dan Multilabel Klasifikasi Gambar. |
ImageInstanceSegmentationJob |
Konfigurasi untuk pekerjaan Segmentasi Instans Gambar AutoML. Menginisialisasi pekerjaan Segmentasi Instans Gambar AutoML baru. |
ImageLimitSettings |
Batasi pengaturan untuk Vertikal Gambar AutoML. ImageLimitSettings adalah kelas yang berisi parameter berikut: max_concurrent_trials, max_trials, dan timeout_minutes. Ini adalah metode konfigurasi opsional untuk mengonfigurasi parameter batas seperti batas waktu, dll. Catatan Jumlah eksekusi bersamaan terjaga pada sumber daya yang tersedia dalam target komputasi yang ditentukan. Pastikan bahwa target komputasi memiliki sumber daya yang tersedia untuk konkurensi yang diinginkan. Tip Ini adalah praktik yang baik untuk mencocokkan jumlah max_concurrent_trials dengan jumlah simpul dalam kluster. Misalnya, jika Anda memiliki kluster dengan 4 simpul, atur max_concurrent_trials ke 4. Contoh penggunaan Konfigurasi ImageLimitSettings
Menginisialisasi objek ImageLimitSettings. Konstruktor untuk ImageLimitSettings untuk AutoML Image Verticals. |
ImageModelSettingsClassification |
Pengaturan model untuk tugas Klasifikasi Gambar AutoML. |
ImageModelSettingsObjectDetection |
Pengaturan model untuk Tugas Deteksi Objek Gambar AutoML. |
ImageObjectDetectionJob |
Konfigurasi untuk pekerjaan Deteksi Objek Gambar AutoML. Menginisialisasi pekerjaan Deteksi Objek Gambar AutoML baru. |
ImageObjectDetectionSearchSpace |
Ruang pencarian untuk tugas Deteksi Objek Gambar AutoML dan Segmentasi Instans Gambar. |
ImageSweepSettings |
Pengaturan pembersihan untuk semua Vertikal Gambar AutoML. |
NlpFeaturizationSettings |
Pengaturan fiturisasi untuk semua Vertikal AutoML NLP. |
NlpFixedParameters |
Objek untuk menampung parameter tetap untuk pekerjaan NLP. |
NlpLimitSettings |
Batasi pengaturan untuk semua Vertikal AutoML NLP. |
NlpSearchSpace |
Cari ruang untuk tugas AutoML NLP. |
NlpSweepSettings |
Pengaturan pembersihan untuk semua tugas AutoML NLP. |
RegressionJob |
Konfigurasi untuk Pekerjaan Regresi AutoML. Menginisialisasi tugas Regresi AutoML baru. |
SearchSpace |
Kelas SearchSpace untuk vertikal AutoML. |
StackEnsembleSettings |
Pengaturan lanjutan untuk menyesuaikan Eksekusi StackEnsemble. |
TabularFeaturizationSettings |
Pengaturan fiturisasi untuk Pekerjaan AutoML. |
TabularLimitSettings |
Batasi pengaturan untuk Vertikal Tabel AutoML. |
TextClassificationJob |
Konfigurasi untuk Pekerjaan Klasifikasi Teks AutoML. Menginisialisasi tugas Klasifikasi Teks AutoML baru. |
TextClassificationMultilabelJob |
Konfigurasi untuk Pekerjaan Multilabel Klasifikasi Teks AutoML. Menginisialisasi tugas Multilabel Klasifikasi Teks AutoML baru. |
TextNerJob |
Konfigurasi untuk Pekerjaan AutoML Text NER. Menginisialisasi tugas AutoML Text NER baru. |
TrainingSettings |
Kelas TrainingSettings untuk Azure Machine Learning. Kelas TrainingSettings untuk Azure Machine Learning. |
Enum
BlockedTransformers |
Enum untuk semua model klasifikasi yang didukung oleh AutoML. |
ClassificationModels |
Enum untuk semua model klasifikasi yang didukung oleh AutoML. |
ClassificationMultilabelPrimaryMetrics |
Metrik utama untuk tugas multilabel klasifikasi. |
ClassificationPrimaryMetrics |
Metrik utama untuk tugas klasifikasi. |
FeaturizationMode |
Mode fiturisasi - menentukan mode fiturisasi data. |
ForecastHorizonMode |
Enum untuk menentukan mode pemilihan horizon prakiraan. |
ForecastingModels |
Enum untuk semua model prakiraan yang didukung oleh AutoML. |
ForecastingPrimaryMetrics |
Metrik utama untuk tugas Prakiraan. |
InstanceSegmentationPrimaryMetrics |
Metrik utama untuk tugas InstanceSegmentation. |
LearningRateScheduler |
Enum penjadwal tingkat pembelajaran. |
LogTrainingMetrics |
Berisi kelas pembelajaran mesin otomatis untuk Azure Machine Learning SDKv2. Area utama termasuk mengelola tugas AutoML. |
LogValidationLoss |
Berisi kelas pembelajaran mesin otomatis untuk Azure Machine Learning SDKv2. Area utama termasuk mengelola tugas AutoML. |
NCrossValidationsMode |
Menentukan bagaimana nilai validasi N-Cross ditentukan. |
ObjectDetectionPrimaryMetrics |
Metrik utama untuk tugas ObjectDetection Gambar. |
RegressionModels |
Enum untuk semua model Regresi yang didukung oleh AutoML. |
RegressionPrimaryMetrics |
Metrik utama untuk tugas Regresi. |
SamplingAlgorithmType |
Berisi kelas pembelajaran mesin otomatis untuk Azure Machine Learning SDKv2. Area utama termasuk mengelola tugas AutoML. |
ShortSeriesHandlingConfiguration |
Parameter yang menentukan cara jika AutoML harus menangani rangkaian waktu yang singkat. |
StochasticOptimizer |
Pengoptimal stochastic untuk model gambar. |
TargetAggregationFunction |
Fungsi agregat target. |
TargetLagsMode |
Mode pemilihan jeda target. |
TargetRollingWindowSizeMode |
Mode ukuran jendela bergulir target. |
UseStl |
Konfigurasikan Dekomposisi STL dari kolom target rangkaian waktu. |
ValidationMetricType |
Metode komputasi metrik yang digunakan untuk metrik validasi dalam tugas gambar. |
Fungsi
classification
Fungsi untuk membuat ClassificationJob.
Pekerjaan klasifikasi digunakan untuk melatih model yang paling baik memprediksi kelas sampel data. Berbagai model dilatih menggunakan data pelatihan. Model dengan performa terbaik pada data validasi berdasarkan metrik utama dipilih sebagai model akhir.
classification(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> ClassificationJob
Parameter
- training_data
- Input
Data pelatihan yang akan digunakan dalam eksperimen. Data tersebut harus berisi fitur pelatihan dan kolom label (opsional untuk kolom bobot sampel).
- target_column_name
- str
Nama kolom label.
Parameter ini berlaku untuk training_data
parameter , validation_data
dan test_data
- primary_metric
Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Nilai yang dapat diterima: akurasi, AUC_weighted, norm_macro_recall, average_precision_score_weighted, dan default precision_score_weighted ke akurasi
- enable_model_explainability
- bool
Pengaktifan penjelasan model AutoML terbaik di akhir semua perulangan pelatihan AutoML. Default Tidak Ada. Untuk informasi selengkapnya, lihat Interpretabilitas: penjelasan model dalam pembelajaran mesin otomatis.
- weight_column_name
- str
Nama kolom bobot sampel. ML otomatis mendukung kolom yang diberatkan sebagai input, menyebabkan baris dalam data dinaikkan atau diturunkan. Jika data input berasal dari panda.DataFrame yang tidak memiliki nama kolom, indeks kolom dapat digunakan dan dinyatakan sebagai bilangan bulat.
Parameter ini berlaku untuk training_data
parameter dan validation_data
- validation_data
- Input
Data validasi yang digunakan dalam eksperimen. Data tersebut harus berisi fitur pelatihan dan kolom label (opsional untuk kolom bobot sampel).
Default ke Tidak Ada
- validation_data_size
- float
Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.
Tentukan validation_data
untuk menyediakan data validasi, jika tidak, tetapkan n_cross_validations
atau validation_data_size
untuk mengekstrak data validasi dari data pelatihan yang ditentukan.
Untuk lipatan validasi silang kustom, gunakan cv_split_column_names
.
Untuk informasi selengkapnya, lihat Mengonfigurasi pemisahan data dan validasi silang dalam pembelajaran mesin otomatis.
Default ke Tidak Ada
Banyaknya validasi silang yang harus dilakukan ketika data validasi pengguna tidak ditentukan.
Tentukan validation_data
untuk menyediakan data validasi, jika tidak, tetapkan n_cross_validations
atau validation_data_size
untuk mengekstrak data validasi dari data pelatihan yang ditentukan.
Untuk lipatan validasi silang kustom, gunakan cv_split_column_names
.
Untuk informasi selengkapnya, lihat Mengonfigurasi pemisahan data dan validasi silang dalam pembelajaran mesin otomatis.
Default ke Tidak Ada
Daftar nama untuk kolom yang berisi pemisahan validasi silang kustom. Masing-masing kolom pemisahan validasi silang mewakili satu pemisahan validasi silang yang setiap barisnya ditandai 1 untuk pelatihan atau 0 untuk validasi.
Default ke Tidak Ada
- test_data
- Input
Fitur Pengujian Model menggunakan himpunan data pengujian atau pemisahan data pengujian adalah fitur dalam status Pratinjau dan dapat berubah kapan saja. Data uji yang digunakan untuk uji coba yang secara otomatis akan dimulai setelah pelatihan model selesai. Uji coba akan mendapatkan prediksi menggunakan model terbaik dan menghitung metrik yang diberikan prediksi ini.
Jika parameter ini atau parameter test_data_size
tidak ditentukan, uji coba tidak akan dijalankan secara otomatis setelah pelatihan model selesai.
Data uji harus berisi fitur dan kolom label.
Jika test_data
ditentukan, parameter target_column_name
juga harus ditentukan.
Default ke Tidak Ada
- test_data_size
- float
Fitur Pengujian Model menggunakan himpunan data pengujian atau pemisahan data pengujian adalah fitur dalam status Pratinjau dan dapat berubah kapan saja. Bilangan pecahan data pelatihan yang harus ditahan untuk data uji agar uji coba dapat secara otomatis dimulai setelah pelatihan model selesai. Uji coba akan mendapatkan prediksi menggunakan model terbaik dan menghitung metrik yang diberikan prediksi ini.
Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.
Jika test_data_size
ditentukan bersamaan dengan validation_data_size
, data uji akan dipisah dari training_data
sebelum data validasi dipisah.
Misalnya, jika validation_data_size=0.1
, test_data_size=0.1
, dan data pelatihan asli memiliki 1000 baris, data uji akan memiliki 100 baris, data validasi akan berisi 90 baris, dan data pelatihan akan memiliki 810 baris.
Untuk tugas berbasis regresi, metode pengambilan sampel acak akan digunakan. Untuk tugas klasifikasi, metode pengambilan sampel bertingkat akan digunakan. Prakiraan saat ini tidak mendukung penentuan himpunan data pengujian menggunakan pembagian latihan/pengujian.
Jika parameter ini atau parameter test_data
tidak ditentukan, uji coba tidak akan dijalankan secara otomatis setelah pelatihan model selesai.
Default ke Tidak Ada
Mengembalikan
Objek pekerjaan yang dapat dikirimkan ke komputasi Azure ML untuk dieksekusi.
Tipe hasil
forecasting
Fungsi untuk membuat pekerjaan Prakiraan.
Tugas prakiraan digunakan untuk memprediksi nilai target untuk periode waktu mendatang berdasarkan data historis. Berbagai model dilatih menggunakan data pelatihan. Model dengan performa terbaik pada data validasi berdasarkan metrik utama dipilih sebagai model akhir.
forecasting(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, forecasting_settings: ForecastingSettings | None = None, **kwargs) -> ForecastingJob
Parameter
- training_data
- Input
Data pelatihan yang akan digunakan dalam eksperimen. Data tersebut harus berisi fitur pelatihan dan kolom label (opsional untuk kolom bobot sampel).
- target_column_name
- str
Nama kolom label.
Parameter ini berlaku untuk training_data
parameter , validation_data
dan test_data
- primary_metric
Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Nilai yang dapat diterima: default r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error ke normalized_root_mean_squared_error
- enable_model_explainability
- bool
Pengaktifan penjelasan model AutoML terbaik di akhir semua perulangan pelatihan AutoML. Default Tidak Ada. Untuk informasi selengkapnya, lihat Interpretabilitas: penjelasan model dalam pembelajaran mesin otomatis.
- weight_column_name
- str
Nama kolom bobot sampel. ML otomatis mendukung kolom yang diberatkan sebagai input, menyebabkan baris dalam data dinaikkan atau diturunkan. Jika data input berasal dari panda.DataFrame yang tidak memiliki nama kolom, indeks kolom dapat digunakan dan dinyatakan sebagai bilangan bulat.
Parameter ini berlaku untuk training_data
parameter dan validation_data
- validation_data
- Input
Data validasi yang digunakan dalam eksperimen. Data tersebut harus berisi fitur pelatihan dan kolom label (opsional untuk kolom bobot sampel).
Default ke Tidak Ada
- validation_data_size
- float
Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.
Tentukan validation_data
untuk menyediakan data validasi, jika tidak, tetapkan n_cross_validations
atau validation_data_size
untuk mengekstrak data validasi dari data pelatihan yang ditentukan.
Untuk lipatan validasi silang kustom, gunakan cv_split_column_names
.
Untuk informasi selengkapnya, lihat Mengonfigurasi pemisahan data dan validasi silang dalam pembelajaran mesin otomatis.
Default ke Tidak Ada
Banyaknya validasi silang yang harus dilakukan ketika data validasi pengguna tidak ditentukan.
Tentukan validation_data
untuk menyediakan data validasi, jika tidak, tetapkan n_cross_validations
atau validation_data_size
untuk mengekstrak data validasi dari data pelatihan yang ditentukan.
Untuk lipatan validasi silang kustom, gunakan cv_split_column_names
.
Untuk informasi selengkapnya, lihat Mengonfigurasi pemisahan data dan validasi silang dalam pembelajaran mesin otomatis.
Default ke Tidak Ada
Daftar nama untuk kolom yang berisi pemisahan validasi silang kustom. Masing-masing kolom pemisahan validasi silang mewakili satu pemisahan validasi silang yang setiap barisnya ditandai 1 untuk pelatihan atau 0 untuk validasi.
Default ke Tidak Ada
- test_data
- Input
Fitur Pengujian Model menggunakan himpunan data pengujian atau pemisahan data pengujian adalah fitur dalam status Pratinjau dan dapat berubah kapan saja. Data uji yang digunakan untuk uji coba yang secara otomatis akan dimulai setelah pelatihan model selesai. Uji coba akan mendapatkan prediksi menggunakan model terbaik dan menghitung metrik yang diberikan prediksi ini.
Jika parameter ini atau parameter test_data_size
tidak ditentukan, uji coba tidak akan dijalankan secara otomatis setelah pelatihan model selesai.
Data uji harus berisi fitur dan kolom label.
Jika test_data
ditentukan, parameter target_column_name
juga harus ditentukan.
Default ke Tidak Ada
- test_data_size
- float
Fitur Pengujian Model menggunakan himpunan data pengujian atau pemisahan data pengujian adalah fitur dalam status Pratinjau dan dapat berubah kapan saja. Bilangan pecahan data pelatihan yang harus ditahan untuk data uji agar uji coba dapat secara otomatis dimulai setelah pelatihan model selesai. Uji coba akan mendapatkan prediksi menggunakan model terbaik dan menghitung metrik yang diberikan prediksi ini.
Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.
Jika test_data_size
ditentukan bersamaan dengan validation_data_size
, data uji akan dipisah dari training_data
sebelum data validasi dipisah.
Misalnya, jika validation_data_size=0.1
, test_data_size=0.1
, dan data pelatihan asli memiliki 1000 baris, data uji akan memiliki 100 baris, data validasi akan berisi 90 baris, dan data pelatihan akan memiliki 810 baris.
Untuk tugas berbasis regresi, metode pengambilan sampel acak akan digunakan. Untuk tugas klasifikasi, metode pengambilan sampel bertingkat akan digunakan. Prakiraan saat ini tidak mendukung penentuan himpunan data pengujian menggunakan pembagian latihan/pengujian.
Jika parameter ini atau parameter test_data
tidak ditentukan, uji coba tidak akan dijalankan secara otomatis setelah pelatihan model selesai.
Default ke Tidak Ada
- forecasting_settings
- ForecastingSettings
Pengaturan untuk tugas prakiraan
Mengembalikan
Objek pekerjaan yang dapat dikirimkan ke komputasi Azure ML untuk dieksekusi.
Tipe hasil
image_classification
Membuat objek untuk pekerjaan Klasifikasi multi-kelas Gambar AutoML.
image_classification(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationJob
Parameter
- training_data
- Input
Data pelatihan yang akan digunakan dalam eksperimen.
- target_column_name
- str
Nama kolom label.
Parameter ini berlaku untuk parameter training_data
dan validation_data
.
- primary_metric
Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Nilai yang dapat diterima: akurasi, AUC_weighted, norm_macro_recall, average_precision_score_weighted, dan precision_score_weighted Default ke akurasi.
- validation_data
- Input
Data validasi yang digunakan dalam eksperimen.
- validation_data_size
- float
Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.
Tentukan validation_data
untuk menyediakan data validasi, jika tidak, atur validation_data_size
untuk mengekstrak data validasi dari data pelatihan yang ditentukan.
Default ke .2
- kwargs
- dict
Kamus parameter konfigurasi tambahan.
Mengembalikan
Objek pekerjaan klasifikasi gambar yang dapat dikirimkan ke komputasi Azure ML untuk dieksekusi.
Tipe hasil
image_classification_multilabel
Membuat objek untuk pekerjaan Klasifikasi multi-label Gambar AutoML.
image_classification_multilabel(*, training_data: Input, target_column_name: str, primary_metric: str | ClassificationMultilabelPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageClassificationMultilabelJob
Parameter
- training_data
- Input
Data pelatihan yang akan digunakan dalam eksperimen.
- target_column_name
- str
Nama kolom label.
Parameter ini berlaku untuk parameter training_data
dan validation_data
.
- primary_metric
Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Nilai yang dapat diterima: akurasi, AUC_weighted, norm_macro_recall, average_precision_score_weighted, precision_score_weighted, dan Default Iou ke Iou.
- validation_data
- Input
Data validasi yang digunakan dalam eksperimen.
- validation_data_size
- float
Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.
Tentukan validation_data
untuk menyediakan data validasi, jika tidak, atur validation_data_size
untuk mengekstrak data validasi dari data pelatihan yang ditentukan.
Default ke .2
- kwargs
- dict
Kamus parameter konfigurasi tambahan.
Mengembalikan
Objek pekerjaan klasifikasi multi-label gambar yang dapat dikirimkan ke komputasi Azure ML untuk dieksekusi.
Tipe hasil
image_instance_segmentation
Membuat objek untuk pekerjaan Segmentasi Instans Gambar AutoML.
image_instance_segmentation(*, training_data: Input, target_column_name: str, primary_metric: str | InstanceSegmentationPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageInstanceSegmentationJob
Parameter
- training_data
- Input
Data pelatihan yang akan digunakan dalam eksperimen.
- target_column_name
- str
Nama kolom label.
Parameter ini berlaku untuk parameter training_data
dan validation_data
.
- primary_metric
Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Nilai yang dapat diterima: MeanAveragePrecision Default ke MeanAveragePrecision.
- validation_data
- Input
Data validasi yang digunakan dalam eksperimen.
- validation_data_size
- float
Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.
Tentukan validation_data
untuk menyediakan data validasi, jika tidak, atur validation_data_size
untuk mengekstrak data validasi dari data pelatihan yang ditentukan.
Default ke .2
- kwargs
- dict
Kamus parameter konfigurasi tambahan.
Mengembalikan
Pekerjaan segmentasi instans gambar
Tipe hasil
image_object_detection
Membuat objek untuk pekerjaan Deteksi Objek Gambar AutoML.
image_object_detection(*, training_data: Input, target_column_name: str, primary_metric: str | ObjectDetectionPrimaryMetrics | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, **kwargs) -> ImageObjectDetectionJob
Parameter
- training_data
- Input
Data pelatihan yang akan digunakan dalam eksperimen.
- target_column_name
- str
Nama kolom label.
Parameter ini berlaku untuk parameter training_data
dan validation_data
.
- primary_metric
Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Nilai yang dapat diterima: MeanAveragePrecision Default ke MeanAveragePrecision.
- validation_data
- Input
Data validasi yang digunakan dalam eksperimen.
- validation_data_size
- float
Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.
Tentukan validation_data
untuk menyediakan data validasi, jika tidak, atur validation_data_size
untuk mengekstrak data validasi dari data pelatihan yang ditentukan.
Default ke .2
- kwargs
- dict
Kamus parameter konfigurasi tambahan.
Mengembalikan
Objek pekerjaan deteksi objek gambar yang dapat dikirimkan ke komputasi Azure ML untuk dieksekusi.
Tipe hasil
regression
Fungsi untuk membuat Pekerjaan Regresi.
Pekerjaan regresi digunakan untuk melatih model untuk memprediksi nilai berkelanjutan variabel target dari himpunan data. Berbagai model dilatih menggunakan data pelatihan. Model dengan performa terbaik pada data validasi berdasarkan metrik utama dipilih sebagai model akhir.
regression(*, training_data: Input, target_column_name: str, primary_metric: str | None = None, enable_model_explainability: bool | None = None, weight_column_name: str | None = None, validation_data: Input | None = None, validation_data_size: float | None = None, n_cross_validations: str | int | None = None, cv_split_column_names: List[str] | None = None, test_data: Input | None = None, test_data_size: float | None = None, **kwargs) -> RegressionJob
Parameter
- training_data
- Input
Data pelatihan yang akan digunakan dalam eksperimen. Data tersebut harus berisi fitur pelatihan dan kolom label (opsional untuk kolom bobot sampel).
- target_column_name
- str
Nama kolom label.
Parameter ini berlaku untuk training_data
parameter , validation_data
dan test_data
- primary_metric
Metrik yang akan dioptimalkan oleh Pembelajaran Mesin Otomatis untuk pemilihan model. Pembelajaran Mesin Otomatis mengumpulkan lebih banyak metrik daripada yang dapat dioptimalkan. Untuk informasi selengkapnya mengenai cara penghitungan metrik, lihat https://docs.microsoft.com/azure/machine-learning/how-to-configure-auto-train#primary-metric.
Nilai yang dapat diterima: spearman_correlation, r2_score, normalized_mean_absolute_error, normalized_root_mean_squared_error. Default ke normalized_root_mean_squared_error
- enable_model_explainability
- bool
Pengaktifan penjelasan model AutoML terbaik di akhir semua perulangan pelatihan AutoML. Default Tidak Ada. Untuk informasi selengkapnya, lihat Interpretabilitas: penjelasan model dalam pembelajaran mesin otomatis.
- weight_column_name
- str
Nama kolom bobot sampel. ML otomatis mendukung kolom yang diberatkan sebagai input, menyebabkan baris dalam data dinaikkan atau diturunkan. Jika data input berasal dari panda.DataFrame yang tidak memiliki nama kolom, indeks kolom dapat digunakan dan dinyatakan sebagai bilangan bulat.
Parameter ini berlaku untuk training_data
parameter dan validation_data
- validation_data
- Input
Data validasi yang digunakan dalam eksperimen. Data tersebut harus berisi fitur pelatihan dan kolom label (opsional untuk kolom bobot sampel).
Default ke Tidak Ada
- validation_data_size
- float
Bilangan pecahan data yang harus ditahan untuk validasi saat data validasi pengguna tidak ditentukan. Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.
Tentukan validation_data
untuk menyediakan data validasi, jika tidak, tetapkan n_cross_validations
atau validation_data_size
untuk mengekstrak data validasi dari data pelatihan yang ditentukan.
Untuk lipatan validasi silang kustom, gunakan cv_split_column_names
.
Untuk informasi selengkapnya, lihat Mengonfigurasi pemisahan data dan validasi silang dalam pembelajaran mesin otomatis.
Default ke Tidak Ada
Banyaknya validasi silang yang harus dilakukan ketika data validasi pengguna tidak ditentukan.
Tentukan validation_data
untuk menyediakan data validasi, jika tidak, tetapkan n_cross_validations
atau validation_data_size
untuk mengekstrak data validasi dari data pelatihan yang ditentukan.
Untuk lipatan validasi silang kustom, gunakan cv_split_column_names
.
Untuk informasi selengkapnya, lihat Mengonfigurasi pemisahan data dan validasi silang dalam pembelajaran mesin otomatis.
Default ke Tidak Ada
Daftar nama untuk kolom yang berisi pemisahan validasi silang kustom. Masing-masing kolom pemisahan validasi silang mewakili satu pemisahan validasi silang yang setiap barisnya ditandai 1 untuk pelatihan atau 0 untuk validasi.
Default ke Tidak Ada
- test_data
- Input
Fitur Pengujian Model menggunakan himpunan data pengujian atau pemisahan data pengujian adalah fitur dalam status Pratinjau dan dapat berubah kapan saja. Data uji yang digunakan untuk uji coba yang secara otomatis akan dimulai setelah pelatihan model selesai. Uji coba akan mendapatkan prediksi menggunakan model terbaik dan menghitung metrik yang diberikan prediksi ini.
Jika parameter ini atau parameter test_data_size
tidak ditentukan, uji coba tidak akan dijalankan secara otomatis setelah pelatihan model selesai.
Data uji harus berisi fitur dan kolom label.
Jika test_data
ditentukan, parameter target_column_name
juga harus ditentukan.
Default ke Tidak Ada
- test_data_size
- float
Fitur Pengujian Model menggunakan himpunan data pengujian atau pemisahan data pengujian adalah fitur dalam status Pratinjau dan dapat berubah kapan saja. Bilangan pecahan data pelatihan yang harus ditahan untuk data uji agar uji coba dapat secara otomatis dimulai setelah pelatihan model selesai. Uji coba akan mendapatkan prediksi menggunakan model terbaik dan menghitung metrik yang diberikan prediksi ini.
Bilangan pecahan ini harus antara 0,0 dan 1,0 non-inklusif.
Jika test_data_size
ditentukan bersamaan dengan validation_data_size
, data uji akan dipisah dari training_data
sebelum data validasi dipisah.
Misalnya, jika validation_data_size=0.1
, test_data_size=0.1
, dan data pelatihan asli memiliki 1000 baris, data uji akan memiliki 100 baris, data validasi akan berisi 90 baris, dan data pelatihan akan memiliki 810 baris.
Untuk tugas berbasis regresi, metode pengambilan sampel acak akan digunakan. Untuk tugas klasifikasi, metode pengambilan sampel bertingkat akan digunakan. Prakiraan saat ini tidak mendukung penentuan himpunan data pengujian menggunakan pembagian latihan/pengujian.
Jika parameter ini atau parameter test_data
tidak ditentukan, uji coba tidak akan dijalankan secara otomatis setelah pelatihan model selesai.
Default ke Tidak Ada
Mengembalikan
Objek pekerjaan yang dapat dikirimkan ke komputasi Azure ML untuk dieksekusi.
Tipe hasil
text_classification
Fungsi untuk membuat TextClassificationJob.
Pekerjaan klasifikasi teks digunakan untuk melatih model yang dapat memprediksi kelas/kategori data teks. Data pelatihan input harus menyertakan kolom target yang mengklasifikasikan teks ke dalam satu kelas.
text_classification(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationJob
Parameter
- training_data
- Input
Data pelatihan yang akan digunakan dalam eksperimen. Ini harus berisi fitur pelatihan dan kolom target.
- target_column_name
- str
Nama kolom target.
- validation_data
- Input
Data validasi yang digunakan dalam eksperimen. Ini harus berisi fitur pelatihan dan kolom target.
- primary_metric
- Union[str, ClassificationPrimaryMetrics]
Metrik utama untuk tugas. Nilai yang dapat diterima: akurasi, AUC_weighted, precision_score_weighted
- log_verbosity
- str
Tingkat verbositas log.
- kwargs
- dict
Kamus parameter konfigurasi tambahan.
Mengembalikan
Objek TextClassificationJob.
Tipe hasil
text_classification_multilabel
Fungsi untuk membuat TextClassificationMultilabelJob.
Pekerjaan multilabel klasifikasi teks digunakan untuk melatih model yang dapat memprediksi kelas/kategori data teks. Data pelatihan input harus menyertakan kolom target yang mengklasifikasikan teks ke dalam kelas. Untuk informasi selengkapnya tentang format data multilabel, lihat: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#multi-label
text_classification_multilabel(*, training_data: Input, target_column_name: str, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextClassificationMultilabelJob
Parameter
- training_data
- Input
Data pelatihan yang akan digunakan dalam eksperimen. Ini harus berisi fitur pelatihan dan kolom target.
- target_column_name
- str
Nama kolom target.
- validation_data
- Input
Data validasi yang digunakan dalam eksperimen. Ini harus berisi fitur pelatihan dan kolom target.
- primary_metric
- str
Metrik utama untuk tugas. Nilai yang dapat diterima: akurasi
- log_verbosity
- str
Tingkat verbositas log.
- kwargs
- dict
Kamus parameter konfigurasi tambahan.
Mengembalikan
Objek TextClassificationMultilabelJob.
Tipe hasil
text_ner
Fungsi untuk membuat TextNerJob.
Teks bernama tugas pengenalan entitas digunakan untuk melatih model yang dapat memprediksi entitas bernama dalam teks. Data pelatihan input harus berupa file teks dalam format CoNLL. Untuk informasi selengkapnya tentang format data NER teks, lihat: https://docs.microsoft.com/en-us/azure/machine-learning/how-to-auto-train-nlp-models#named-entity-recognition-ner
text_ner(*, training_data: Input, validation_data: Input, primary_metric: str | None = None, log_verbosity: str | None = None, **kwargs) -> TextNerJob
Parameter
- training_data
- Input
Data pelatihan yang akan digunakan dalam eksperimen. Ini harus berisi fitur pelatihan dan kolom target.
- validation_data
- Input
Data validasi yang digunakan dalam eksperimen. Ini harus berisi fitur pelatihan dan kolom target.
- primary_metric
- str
Metrik utama untuk tugas. Nilai yang dapat diterima: akurasi
- log_verbosity
- str
Tingkat verbositas log.
- kwargs
- dict
Kamus parameter konfigurasi tambahan.
Mengembalikan
Objek TextNerJob.
Tipe hasil
Azure SDK for Python