TransformsCatalog.TextTransforms Kelas
Definisi
Penting
Beberapa informasi terkait produk prarilis yang dapat diubah secara signifikan sebelum dirilis. Microsoft tidak memberikan jaminan, tersirat maupun tersurat, sehubungan dengan informasi yang diberikan di sini.
Kelas yang digunakan oleh MLContext untuk membuat instans komponen transformasi data teks.
public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
- Warisan
-
TransformsCatalog.TextTransforms
Metode Ekstensi
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind) |
WordEmbeddingEstimatorBuat , yang merupakan featurizer teks yang mengonversi vektor teks menjadi vektor numerik menggunakan model penyematan yang telah dilatih sebelumnya. |
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String) |
WordEmbeddingEstimatorBuat , yang merupakan featurizer teks yang mengonversi vektor teks menjadi vektor numerik menggunakan model penyematan yang telah dilatih sebelumnya. |
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[]) |
Buat TextFeaturizingEstimator, yang mengubah kolom teks menjadi vektor Single yang ditampilkan yang mewakili jumlah n-gram dan char-gram yang dinormalisasi. |
FeaturizeText(TransformsCatalog+TextTransforms, String, String) |
Buat TextFeaturizingEstimator, yang mengubah kolom teks menjadi vektor Single yang ditampilkan yang mewakili jumlah n-gram dan char-gram yang dinormalisasi. |
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean) |
LatentDirichletAllocationEstimatorBuat , yang menggunakan LightLDA untuk mengubah teks (direpresentasikan sebagai vektor float) menjadi vektor Single yang menunjukkan kesamaan teks dengan setiap topik yang diidentifikasi. |
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean) |
TextNormalizingEstimatorMembuat , yang menormalkan teks |
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean) |
Buat NgramHashingEstimator, yang menyalin data dari kolom yang ditentukan ke |
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean) |
Buat NgramHashingEstimator, yang mengambil data dari beberapa kolom yang ditentukan ke |
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32) |
Buat WordHashBagEstimator, yang memetakan kolom yang ditentukan |
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32) |
Buat WordHashBagEstimator, yang memetakan beberapa kolom yang ditentukan ke |
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
NgramExtractingEstimator Membuat yang menghasilkan vektor hitungan n-gram (urutan kata berturut-turut) yang ditemui dalam teks input. |
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32) |
Buat WordBagEstimator, yang memetakan kolom yang ditentukan |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Buat WordBagEstimator, yang memetakan kolom yang ditentukan |
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria) |
Buat WordBagEstimator, yang memetakan beberapa kolom yang ditentukan |
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language) |
Buat CustomStopWordsRemovingEstimator, yang menyalin data dari kolom yang ditentukan ke |
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[]) |
Buat CustomStopWordsRemovingEstimator, yang menyalin data dari kolom yang ditentukan ke |
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean) |
Buat TokenizingByCharactersEstimator, yang membuat token dengan memisahkan teks menjadi urutan karakter menggunakan jendela geser. |
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[]) |
Buat WordTokenizingEstimator, yang mentokenisasi teks input menggunakan |