Bagikan melalui


FastForestBinaryTrainer Kelas

Definisi

IEstimator<TTransformer> untuk melatih model klasifikasi biner pohon keputusan menggunakan Fast Forest.

public sealed class FastForestBinaryTrainer : Microsoft.ML.Trainers.FastTree.RandomForestTrainerBase<Microsoft.ML.Trainers.FastTree.FastForestBinaryTrainer.Options,Microsoft.ML.Data.BinaryPredictionTransformer<Microsoft.ML.Trainers.FastTree.FastForestBinaryModelParameters>,Microsoft.ML.Trainers.FastTree.FastForestBinaryModelParameters>
type FastForestBinaryTrainer = class
    inherit RandomForestTrainerBase<FastForestBinaryTrainer.Options, BinaryPredictionTransformer<FastForestBinaryModelParameters>, FastForestBinaryModelParameters>
Public NotInheritable Class FastForestBinaryTrainer
Inherits RandomForestTrainerBase(Of FastForestBinaryTrainer.Options, BinaryPredictionTransformer(Of FastForestBinaryModelParameters), FastForestBinaryModelParameters)
Warisan

Keterangan

Untuk membuat pelatih ini, gunakan FastForest atau FastForest(Options).

Kolom Input dan Output

Data kolom label input harus Boolean. Data kolom fitur input harus merupakan vektor berukuran besar yang diketahui dari Single.

Pelatih ini menghasilkan kolom berikut:

Nama Kolom Output Jenis Kolom Deskripsi
Score Single Skor tidak terikat yang dihitung oleh model.
PredictedLabel Boolean Label yang diprediksi, berdasarkan tanda skor. Skor negatif memetakan ke false dan skor positif memetakan ke true.
Probability Single Probabilitas dihitung dengan mengkalibrasi skor memiliki true sebagai label. Nilai probabilitas berada dalam rentang [0, 1].

Karakteristik Pelatih

Tugas pembelajaran mesin Klasifikasi biner
Apakah normalisasi diperlukan? Tidak
Apakah penembolokan diperlukan? Tidak
NuGet yang diperlukan selain Microsoft.ML Microsoft.ML.FastTree
Dapat diekspor ke ONNX Ya

Detail Algoritma Pelatihan

Pohon keputusan adalah model non-parametrik yang melakukan urutan pengujian sederhana pada input. Prosedur keputusan ini memetakannya ke output yang ditemukan dalam himpunan data pelatihan yang inputnya mirip dengan instans yang sedang diproses. Keputusan dibuat pada setiap simpul struktur data pohon biner berdasarkan ukuran kesamaan yang memetakan setiap instans secara rekursif melalui cabang pohon sampai simpul daun yang sesuai tercapai dan keputusan output dikembalikan.

Pohon keputusan memiliki beberapa keuntungan:

  • Pohon keputusan efisien dalam komputasi dan penggunaan memori selama pelatihan dan prediksi.
  • Pohon keputusan dapat mewakili batas keputusan non-linier.
  • Pohon keputusan melakukan pemilihan dan klasifikasi fitur terintegrasi.
  • Pohon keputusan tangguh di hadapan fitur yang ramai.

Hutan cepat adalah implementasi hutan acak. Model ini terdiri dari ansambel pohon keputusan. Setiap pohon di hutan keputusan menghasilkan distribusi Gaussian dengan cara prediksi. Agregasi dilakukan di atas ansambel pohon untuk menemukan distribusi Gaussian yang paling dekat dengan distribusi gabungan untuk semua pohon dalam model. Pengklasifikasi hutan keputusan ini terdiri dari ansambel pohon keputusan.

Secara umum,.model ensambel memberikan cakupan dan akurasi yang lebih baik dibandingkan dengan pohon keputusan tunggal. Setiap pohon di hutan keputusan menghasilkan distribusi Gaussian.

Untuk informasi selengkapnya lihat:

Periksa bagian Lihat Juga untuk tautan ke contoh penggunaan.

Bidang

FeatureColumn

Kolom fitur yang diharapkan pelatih.

(Diperoleh dari TrainerEstimatorBase<TTransformer,TModel>)
GroupIdColumn

Kolom groupID opsional yang diharapkan oleh pelatih peringkat.

(Diperoleh dari TrainerEstimatorBaseWithGroupId<TTransformer,TModel>)
LabelColumn

Kolom label yang diharapkan pelatih. Dapat berupa null, yang menunjukkan bahwa label tidak digunakan untuk pelatihan.

(Diperoleh dari TrainerEstimatorBase<TTransformer,TModel>)
WeightColumn

Kolom berat yang diharapkan pelatih. Dapat berupa null, yang menunjukkan bahwa berat tidak digunakan untuk pelatihan.

(Diperoleh dari TrainerEstimatorBase<TTransformer,TModel>)

Properti

Info

IEstimator<TTransformer> untuk melatih model klasifikasi biner pohon keputusan menggunakan Fast Forest.

(Diperoleh dari FastTreeTrainerBase<TOptions,TTransformer,TModel>)

Metode

Fit(IDataView)

Melatih dan mengembalikan ITransformer.

(Diperoleh dari TrainerEstimatorBase<TTransformer,TModel>)
Fit(IDataView, IDataView)

FastForestBinaryTrainer Melatih menggunakan data pelatihan dan validasi, mengembalikan BinaryPredictionTransformer<TModel>.

GetOutputSchema(SchemaShape)

IEstimator<TTransformer> untuk melatih model klasifikasi biner pohon keputusan menggunakan Fast Forest.

(Diperoleh dari TrainerEstimatorBase<TTransformer,TModel>)

Metode Ekstensi

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Tambahkan 'titik pemeriksaan penembolokan' ke rantai estimator. Ini akan memastikan bahwa estimator hilir akan dilatih terhadap data cache. Sangat membantu untuk memiliki titik pemeriksaan penembolokan sebelum pelatih yang mengambil beberapa data berlalu.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Mengingat estimator, kembalikan objek pembungkus yang akan memanggil delegasi setelah Fit(IDataView) dipanggil. Seringkali penting bagi estimator untuk mengembalikan informasi tentang apa yang cocok, itulah sebabnya Fit(IDataView) metode mengembalikan objek yang ditik secara khusus, bukan hanya umum ITransformer. Namun, pada saat yang sama, IEstimator<TTransformer> sering dibentuk menjadi alur dengan banyak objek, jadi kita mungkin perlu membangun rantai estimator melalui EstimatorChain<TLastTransformer> tempat estimator yang ingin kita dapatkan transformator dikubur di suatu tempat dalam rantai ini. Untuk skenario itu, kita dapat melalui metode ini melampirkan delegasi yang akan dipanggil setelah pas dipanggil.

Berlaku untuk

Lihat juga