Aracılığıyla paylaş


Microsoft.ML.Transforms.Text Ad Alanı

Metin veri dönüştürme bileşenlerini içeren ad alanı.

Sınıflar

CustomStopWordsRemovingEstimator

IEstimator<TTransformer> için CustomStopWordsRemovingTransformer.

CustomStopWordsRemovingEstimator.Options

Sistemde önceden tanımlanmış olan durdurma sözcüklerinin (en yaygın sözcükler) dile özgü listesini kaldırabilen durdurma sözcükleri kaldırıcısını kullanın.

CustomStopWordsRemovingTransformer

ITransformer bir sığdırma CustomStopWordsRemovingEstimatorsonucunda elde edilen.

LatentDirichletAllocationEstimator

LDA dönüşümü, Latent Dirichlet Ayırma'nın son teknoloji uygulaması olan LightLDA'yı uygular.

LatentDirichletAllocationTransformer

ITransformer bir sığdırma LatentDirichletAllocationEstimatorsonucunda elde edilen.

LatentDirichletAllocationTransformer.ModelParameters

LightLDA tarafından bulunan konular hakkında ayrıntılı bilgi sağlayın.

NgramExtractingEstimator

Giriş metninde karşılaşılan n gramlık sayıların (ardışık sözcük dizileri) bir vektör oluşturur.

NgramExtractingTransformer

ITransformerbir sığdırma sonucunda elde edilen.NgramExtractingEstimator

NgramHashingEstimator

IEstimator<TTransformer> için NgramHashingTransformer.

NgramHashingTransformer

Metin veri dönüştürme bileşenlerini içeren ad alanı.

StopWordsRemovingEstimator

IEstimator<TTransformer> için CustomStopWordsRemovingTransformer.

StopWordsRemovingEstimator.Options

Sistemde önceden tanımlanmış olan durdurma sözcüklerinin (en yaygın sözcükler) dile özgü listesini kaldırabilen durdurma sözcükleri kaldırıcısını kullanın.

StopWordsRemovingTransformer

ITransformer bir sığdırma StopWordsRemovingEstimatorsonucunda elde edilen.

TextFeaturizingEstimator

Metin belgeleri koleksiyonunu sayısal özellik vektörlerine dönüştüren bir tahmin aracı. Özellik vektörleri, normalleştirilmiş sözcük ve/veya n-gram karakter sayısıdır (sağlanan seçeneklere göre).

TextFeaturizingEstimator.Options

için TextFeaturizingEstimatorgelişmiş seçenekler.

TextNormalizingEstimator

IEstimator<TTransformer> için TextNormalizingTransformer.

TextNormalizingTransformer

ITransformer bir sığdırma TextNormalizingEstimatorsonucunda elde edilen.

TokenizingByCharactersEstimator

IEstimator<TTransformer> için TokenizingByCharactersTransformer.

TokenizingByCharactersTransformer

ITransformer bir sığdırma TokenizingByCharactersEstimatorsonucunda elde edilen.

WordBagEstimator

IEstimator<TTransformer> için ITransformer.

WordBagEstimator.Options

N gramın nasıl ayıklandığına ilişkin seçenekler.

WordEmbeddingEstimator

Önceden eğitilmiş bir ekleme modeli kullanarak metin belirteçlerinin vektörlerini sayısal vektöre dönüştüren metin özellik oluşturucu.

WordEmbeddingTransformer

ITransformerbir sığdırma sonucunda elde edilen.WordEmbeddingEstimator

WordHashBagEstimator

IEstimator<TTransformer> için ITransformer.

WordTokenizingEstimator

Belirtilen sınırlayıcıları kullanarak giriş metnini belirteç haline döndürür.

WordTokenizingTransformer

ITransformerbir sığdırma sonucunda elde edilen.WordTokenizingEstimator

Yapılar

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

Metin veri dönüştürme bileşenlerini içeren ad alanı.

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

Metin veri dönüştürme bileşenlerini içeren ad alanı.

Arabirimler

IStopWordsRemoverOptions

Desteklenen farklı türdeki durdurma sözcüklerini tanımlar.

Numaralandırmalar

NgramExtractingEstimator.WeightingCriteria

Bir sözcüğün bir korpustaki bir belge için ne kadar önemli olduğunu değerlendirmek için kullanılan istatistiksel ölçü. Bu numaralandırma seri hale getirilir.

StopWordsRemovingEstimator.Language

Stopwords dili. Bu numaralandırma seri hale getirilir.

TextFeaturizingEstimator.Language

Metin dili. Bu numaralandırma seri hale getirilir.

TextFeaturizingEstimator.NormFunction

Metin vektör normalleştirici türü.

TextNormalizingEstimator.CaseMode

Metnin büyük/küçük harf normalleştirme modu. Bu numaralandırma seri hale getirilir.

WordEmbeddingEstimator.PretrainedModelKind

Hangi sözcük eklemelerinin kullanılacağını belirtir.