Bagikan melalui


TransformsCatalog.TextTransforms Kelas

Definisi

Kelas yang digunakan oleh MLContext untuk membuat instans komponen transformasi data teks.

public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
Warisan
TransformsCatalog.TextTransforms

Metode Ekstensi

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

WordEmbeddingEstimatorBuat , yang merupakan featurizer teks yang mengonversi vektor teks menjadi vektor numerik menggunakan model penyematan yang telah dilatih sebelumnya.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

WordEmbeddingEstimatorBuat , yang merupakan featurizer teks yang mengonversi vektor teks menjadi vektor numerik menggunakan model penyematan yang telah dilatih sebelumnya.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Buat TextFeaturizingEstimator, yang mengubah kolom teks menjadi vektor Single yang ditampilkan yang mewakili jumlah n-gram dan char-gram yang dinormalisasi.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Buat TextFeaturizingEstimator, yang mengubah kolom teks menjadi vektor Single yang ditampilkan yang mewakili jumlah n-gram dan char-gram yang dinormalisasi.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

LatentDirichletAllocationEstimatorBuat , yang menggunakan LightLDA untuk mengubah teks (direpresentasikan sebagai vektor float) menjadi vektor Single yang menunjukkan kesamaan teks dengan setiap topik yang diidentifikasi.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

TextNormalizingEstimatorMembuat , yang menormalkan teks inputColumnName masuk dengan mengubah huruf besar/kecil secara opsional, menghapus tanda diakritik, tanda baca, angka, dan menghasilkan teks baru sebagai outputColumnName.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Buat NgramHashingEstimator, yang menyalin data dari kolom yang ditentukan ke inputColumnName kolom baru: outputColumnName dan menghasilkan vektor hitungan n-gram yang di-hash.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Buat NgramHashingEstimator, yang mengambil data dari beberapa kolom yang ditentukan ke inputColumnNames kolom baru: outputColumnName dan menghasilkan vektor hitungan n-gram yang di-hash.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Buat WordHashBagEstimator, yang memetakan kolom yang ditentukan inputColumnName ke vektor hitungan n-gram yang di-hash di kolom baru bernama outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Buat WordHashBagEstimator, yang memetakan beberapa kolom yang ditentukan ke inputColumnNames vektor hitungan n-gram yang di-hash di kolom baru bernama outputColumnName.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

NgramExtractingEstimator Membuat yang menghasilkan vektor hitungan n-gram (urutan kata berturut-turut) yang ditemui dalam teks input.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Buat WordBagEstimator, yang memetakan kolom yang ditentukan inputColumnName ke vektor jumlah n-gram dalam kolom baru bernama outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Buat WordBagEstimator, yang memetakan kolom yang ditentukan inputColumnName ke vektor jumlah n-gram dalam kolom baru bernama outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Buat WordBagEstimator, yang memetakan beberapa kolom yang ditentukan inputColumnNames ke vektor jumlah n-gram dalam kolom baru bernama outputColumnName.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Buat CustomStopWordsRemovingEstimator, yang menyalin data dari kolom yang ditentukan ke inputColumnName kolom baru: outputColumnName dan menghapus kumpulan teks yang telah ditentukan sebelumnya khusus untuk language dari kolom tersebut.

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Buat CustomStopWordsRemovingEstimator, yang menyalin data dari kolom yang ditentukan ke inputColumnName kolom baru: outputColumnName dan menghapus teks yang ditentukan dari stopwords kolom tersebut.

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Buat TokenizingByCharactersEstimator, yang membuat token dengan memisahkan teks menjadi urutan karakter menggunakan jendela geser.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Buat WordTokenizingEstimator, yang mentokenisasi teks input menggunakan separators sebagai pemisah.

Berlaku untuk