Bagikan melalui


Microsoft.ML.Transforms.Text Ruang nama

Namespace yang berisi komponen transformasi data teks.

Kelas

CustomStopWordsRemovingEstimator

IEstimator<TTransformer>CustomStopWordsRemovingTransformeruntuk .

CustomStopWordsRemovingEstimator.Options

Gunakan penghapus kata henti yang dapat menghapus daftar kata berhenti khusus bahasa (kata yang paling umum) yang sudah ditentukan dalam sistem.

CustomStopWordsRemovingTransformer

ITransformer dihasilkan dari pas CustomStopWordsRemovingEstimator.

LatentDirichletAllocationEstimator

Transformasi LDA mengimplementasikan LightLDA, implementasi alokasi Dirichlet Laten yang canggih.

LatentDirichletAllocationTransformer

ITransformer dihasilkan dari pas LatentDirichletAllocationEstimator.

LatentDirichletAllocationTransformer.ModelParameters

Berikan detail tentang topik yang ditemukan oleh LightLDA.

NgramExtractingEstimator

Menghasilkan vektor hitungan n-gram (urutan kata berturut-turut) yang ditemui dalam teks input.

NgramExtractingTransformer

ITransformer dihasilkan dari pas NgramExtractingEstimator.

NgramHashingEstimator

IEstimator<TTransformer>NgramHashingTransformeruntuk .

NgramHashingTransformer

Namespace yang berisi komponen transformasi data teks.

StopWordsRemovingEstimator

IEstimator<TTransformer>CustomStopWordsRemovingTransformeruntuk .

StopWordsRemovingEstimator.Options

Gunakan penghapus kata henti yang dapat menghapus daftar kata berhenti khusus bahasa (kata yang paling umum) yang sudah ditentukan dalam sistem.

StopWordsRemovingTransformer

ITransformer dihasilkan dari pas StopWordsRemovingEstimator.

TextFeaturizingEstimator

Estimator yang mengubah kumpulan dokumen teks menjadi vektor fitur numerik. Vektor fitur adalah jumlah kata dan/atau karakter n-gram yang dinormalisasi (berdasarkan opsi yang disediakan).

TextFeaturizingEstimator.Options

Opsi tingkat lanjut untuk TextFeaturizingEstimator.

TextNormalizingEstimator

IEstimator<TTransformer>TextNormalizingTransformeruntuk .

TextNormalizingTransformer

ITransformer dihasilkan dari pas TextNormalizingEstimator.

TokenizingByCharactersEstimator

IEstimator<TTransformer>TokenizingByCharactersTransformeruntuk .

TokenizingByCharactersTransformer

ITransformer dihasilkan dari pas TokenizingByCharactersEstimator.

WordBagEstimator

IEstimator<TTransformer>ITransformeruntuk .

WordBagEstimator.Options

Opsi untuk bagaimana n-gram diekstrak.

WordEmbeddingEstimator

Featurizer teks yang mengonversi vektor token teks menjadi vektor numerik menggunakan model penyematan yang telah dilatih sebelumnya.

WordEmbeddingTransformer

ITransformer dihasilkan dari pas WordEmbeddingEstimator.

WordHashBagEstimator

IEstimator<TTransformer>ITransformeruntuk .

WordTokenizingEstimator

Tokenisasi teks input menggunakan pemisah tertentu.

WordTokenizingTransformer

ITransformer dihasilkan dari pas WordTokenizingEstimator.

Struct

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

Namespace yang berisi komponen transformasi data teks.

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

Namespace yang berisi komponen transformasi data teks.

Antarmuka

IStopWordsRemoverOptions

Menentukan berbagai jenis penghapus kata henti yang didukung.

Enum

NgramExtractingEstimator.WeightingCriteria

Ukuran statistik yang digunakan untuk mengevaluasi seberapa penting kata untuk dokumen dalam korpus. Enumerasi ini diserialisasikan.

StopWordsRemovingEstimator.Language

Bahasa stopwords. Enumerasi ini diserialisasikan.

TextFeaturizingEstimator.Language

Bahasa teks. Enumerasi ini diserialisasikan.

TextFeaturizingEstimator.NormFunction

Jenis normalizer vektor teks.

TextNormalizingEstimator.CaseMode

Mode normalisasi huruf besar/kecil teks. Enumerasi ini diserialisasikan.

WordEmbeddingEstimator.PretrainedModelKind

Menentukan penyematan kata mana yang akan digunakan.