Aracılığıyla paylaş


TransformsCatalog.TextTransforms Sınıf

Tanım

Metin veri dönüştürme bileşenlerinin örneklerini oluşturmak için tarafından MLContext kullanılan sınıf.

public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
Devralma
TransformsCatalog.TextTransforms

Uzantı Metotları

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

WordEmbeddingEstimatorÖnceden eğitilmiş ekleme modellerini kullanarak metin vektörlerini sayısal vektöre dönüştüren bir metin özellik oluşturucu olan bir oluşturun.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

Önceden eğitilmiş ekleme modellerini kullanarak metin vektörlerini sayısal vektörlere dönüştüren bir metin özellik oluşturucu olan bir WordEmbeddingEstimatoroluşturun.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Bir metin sütununu n-gram ve char-gram normalleştirilmiş sayılarını temsil eden özelliklendirilmiş vektöre Single dönüştüren bir TextFeaturizingEstimatoroluşturun.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Bir TextFeaturizingEstimatormetin sütununu n-gram ve char-gram normalleştirilmiş sayılarını temsil eden bir özelliklendirilmiş vektöre Single dönüştüren bir oluşturun.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

LatentDirichletAllocationEstimatorMetni (kayanların vektörü olarak temsil edilir) metnin tanımlanan her konuyla benzerliğini belirten bir vektöre Single dönüştürmek için LightLDA kullanan bir oluşturun.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

İsteğe bağlı olarak büyük/küçük harf değiştirerek, aksan işaretlerini, noktalama işaretlerini, sayıları kaldırarak ve yeni metni olarak outputColumnNameçıkararak gelen inputColumnName metni normalleştiren bir TextNormalizingEstimatoroluşturur.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

NgramHashingEstimatoriçinde belirtilen inputColumnName sütundaki verileri yeni outputColumnName bir sütuna kopyalayan ve karma n gram sayılarından oluşan bir vektör oluşturan bir oluşturun.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

NgramHashingEstimatoriçinde belirtilen inputColumnNames birden çok sütundaki verileri yeni bir sütuna outputColumnName alan ve karma n gram sayılarından oluşan bir vektör oluşturan bir oluşturun.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimatoriçinde belirtilen sütunu, adlı outputColumnNameyeni bir sütunda inputColumnName karma n gram sayılarının bulunduğu bir vektörle eşleyen bir oluşturun.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

WordHashBagEstimatoriçinde belirtilen birden çok sütunu, adlı outputColumnNameyeni bir sütundaki inputColumnNames karma n gram sayılarının vektörleriyle eşleyen bir oluşturun.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Giriş metninde karşılaşılan n gramlık sayıların (ardışık sözcük dizileri) bir vektör oluşturan bir NgramExtractingEstimator oluşturur.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

WordBagEstimatoriçinde belirtilen sütunu adlı outputColumnNameyeni bir sütundaki inputColumnName n-gram sayılarından oluşan bir vektörle eşleyen bir oluşturun.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimatoriçinde belirtilen sütunu adlı outputColumnNameyeni bir sütundaki inputColumnName n-gram sayılarından oluşan bir vektörle eşleyen bir oluşturun.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

WordBagEstimatoriçinde belirtilen birden çok sütunu, adlı outputColumnNameyeni bir sütundaki inputColumnNames n-gram sayılarından oluşan bir vektörle eşleyen bir oluşturun.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

CustomStopWordsRemovingEstimatoriçinde belirtilen inputColumnName sütundaki verileri yeni bir sütuna kopyalayan ve bu sütuna outputColumnName özgü language önceden tanımlı metin kümesini kaldıran bir oluşturun.

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

CustomStopWordsRemovingEstimatoriçinde belirtilen inputColumnName sütundaki verileri yeni outputColumnName bir sütuna kopyalayan ve içinde belirtilen stopwords metni kaldıran bir oluşturun.

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Kayan pencere TokenizingByCharactersEstimatorkullanarak metni karakter dizilerine bölerek belirteç oluşturan bir oluşturun.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Ayırıcı olarak kullanarak separators giriş metnini belirteç haline dönüştüren bir WordTokenizingEstimatoroluşturun.

Şunlara uygulanır