SvmLightLoader Kelas
Definisi
Penting
Beberapa informasi terkait produk prarilis yang dapat diubah secara signifikan sebelum dirilis. Microsoft tidak memberikan jaminan, tersirat maupun tersurat, sehubungan dengan informasi yang diberikan di sini.
Upaya ini untuk membaca data dalam format yang dekat dengan format SVM-light, tujuannya adalah bahwa sebagian besar data berformat SVM-light harus dapat ditafsirkan oleh loader ini.
public sealed class SvmLightLoader : Microsoft.ML.IDataLoader<Microsoft.ML.Data.IMultiStreamSource>
type SvmLightLoader = class
interface IDataLoader<IMultiStreamSource>
interface ICanSaveModel
Public NotInheritable Class SvmLightLoader
Implements IDataLoader(Of IMultiStreamSource)
- Warisan
-
SvmLightLoader
- Penerapan
Keterangan
Loader mungkin juga berbeda dari perilaku penguraian SVM-light, dengan cara umum berikut:
- IDataViewSebagai , vektor diharuskan untuk memiliki panjang logis, dan untuk alasan praktis sangat membantu jika output loader ini memiliki jenis vektor panjang tetap, karena beberapa estimator dan tidak ada estimator pelatih dasar yang menerima fitur dari jenis vektor panjang variabel. SVM-light tidak memiliki konsep seperti itu.
- IDataView Idiom memiliki perilaku yang berbeda w.r.t. mengurai kesalahan.
- SVM-light memiliki beberapa batasan dalam formatnya yang tidak wajar untuk mencoba membatasi dalam konsep loader ini.
- Beberapa "ekstensi" umum dari format ini yang telah terjadi selama bertahun-tahun diakomodasi jika masuk akal, sering didukung dengan menentukan beberapa opsi.
Format SVM-light dapat diringkas di sini. File SVM-light dapat mengarah dengan sejumlah baris yang dimulai dengan '#'. Ini dibuang. {label} {key}:{value} {key}:{value} ... {key}:{value}[#{comment}]
Garis tidak dipangkas spasi kosong, meskipun spasi kosong di dalam baris, sebelum karakter # komentar (jika ada) diabaikan. SVM-light sendiri menggunakan fungsi "isspace" C standar, sementara kami hanya menghormati spasi dan tab sebagai spasi kosong. Jadi, spasi dalam baris di atas bisa, katakanlah, tab, dan bahkan mungkin ada beberapa dari mereka secara berurutan. Tidak seperti format pemuat teks, misalnya, tidak ada konsep bidang "kosong" yang memiliki status apa pun.
Vektor fitur ditentukan melalui serangkaian pasangan kunci/nilai. SVM-light mengharuskan kunci positif, meningkatkan bilangan bulat, kecuali untuk tiga kunci khusus: biaya (kami menafsirkan sebagai Berat), qid (kami menafsirkan sebagai GroupId) dan sid (kami mengabaikan ini, tetapi mungkin menyajikannya sebagai kolom di masa depan jika salah satu pelajar kami menerapkan sesuatu yang menyerupai id kendur). Nilai untuk 'biaya' adalah float, 'qid' adalah panjang, dan 'sid' adalah panjang yang harus positif. Jika kunci ini ditentukan beberapa kali, yang terakhir menang.
SVM-light, jika ekor nilai tidak dapat ditafsirkan sebagai angka, akan mengabaikan ekor. Misalnya, "5:3.14hello" akan ditafsirkan sama dengan "5:3.14". Pemuat ini tidak mendukung sintaks ini.
Kami tidak mempertahankan pembatasan kunci yang perlu meningkatkan nilai di loader kami, karena cara kami menyusun vektor fitur kami, tetapi akan paling efisien jika kebijakan ini masih diikuti. Jika diikuti, pengurutan tidak akan diperlukan.
Loader ini memiliki opsi khusus untuk membaca teks mentah untuk kunci dan mengonversi ke indeks fitur, mempertahankan nilai kunci teks sebagai nama fitur untuk vektor fitur yang dihasilkan. Tujuan dari ini adalah untuk memungkinkan kunci string, varian umum format, tetapi satu secara empiris tidak diizinkan oleh format asli.
Metode
GetOutputSchema() |
Upaya ini untuk membaca data dalam format yang dekat dengan format SVM-light, tujuannya adalah bahwa sebagian besar data berformat SVM-light harus dapat ditafsirkan oleh loader ini. |
Load(IMultiStreamSource) |
Upaya ini untuk membaca data dalam format yang dekat dengan format SVM-light, tujuannya adalah bahwa sebagian besar data berformat SVM-light harus dapat ditafsirkan oleh loader ini. |
Implementasi Antarmuka Eksplisit
ICanSaveModel.Save(ModelSaveContext) |
Upaya ini untuk membaca data dalam format yang dekat dengan format SVM-light, tujuannya adalah bahwa sebagian besar data berformat SVM-light harus dapat ditafsirkan oleh loader ini. |
Metode Ekstensi
Preview<TSource>(IDataLoader<TSource>, TSource, Int32) |
Pratinjau efek |
Append<TSource,TTrans>(IDataLoader<TSource>, TTrans) |
Buat pemuat komposit baru, dengan menambahkan transformator ke pemuat data ini. |
Append<TSource,TTrans>(IDataLoader<TSource>, IEstimator<TTrans>) |
Buat estimator pemuat komposit baru, dengan menambahkan estimator ke pemuat data ini. |