Microsoft.ML.Transforms.Text Obor názvů

Obor názvů obsahující součásti transformace textových dat

Třídy

CustomStopWordsRemovingEstimator

IEstimator<TTransformer>CustomStopWordsRemovingTransformerpro .

CustomStopWordsRemovingEstimator.Options

Použijte nástroj pro odebrání slov stop, který může odebrat seznam slov stop (nejběžnějších slov), která jsou už v systému definovaná.

CustomStopWordsRemovingTransformer

ITransformer vyplývající z montáže CustomStopWordsRemovingEstimator.

LatentDirichletAllocationEstimator

Transformace LDA implementuje LightLDA, nejmodernější implementaci Latent Dirichlet Allocation.

LatentDirichletAllocationTransformer

ITransformer vyplývající z montáže LatentDirichletAllocationEstimator.

LatentDirichletAllocationTransformer.ModelParameters

Uveďte podrobnosti o tématech zjištěných službou LightLDA.

NgramExtractingEstimator

Vytvoří vektor počtu n-gramů (sekvencí po sobě jdoucích slov), ke kterým došlo ve vstupním textu.

NgramExtractingTransformer

ITransformer vyplývající z montáže NgramExtractingEstimator.

NgramHashingEstimator

IEstimator<TTransformer>NgramHashingTransformerpro .

NgramHashingTransformer

Obor názvů obsahující součásti transformace textových dat

StopWordsRemovingEstimator

IEstimator<TTransformer>CustomStopWordsRemovingTransformerpro .

StopWordsRemovingEstimator.Options

Použijte nástroj pro odebrání slov stop, který může odebrat seznam slov stop (nejběžnějších slov) už definovaných v systému.

StopWordsRemovingTransformer

ITransformer vyplývající z montáže StopWordsRemovingEstimator.

TextFeaturizingEstimator

Estimátor, který změní kolekci textových dokumentů na číselné vektory funkcí. Vektory funkcí jsou normalizované počty slov a/nebo znaků n-gramů (na základě zadaných možností).

TextFeaturizingEstimator.Options

Upřesňující možnosti pro TextFeaturizingEstimator.

TextNormalizingEstimator

IEstimator<TTransformer>TextNormalizingTransformerpro .

TextNormalizingTransformer

ITransformer vyplývající z montáže TextNormalizingEstimator.

TokenizingByCharactersEstimator

IEstimator<TTransformer>TokenizingByCharactersTransformerpro .

TokenizingByCharactersTransformer

ITransformer vyplývající z montáže TokenizingByCharactersEstimator.

WordBagEstimator

IEstimator<TTransformer>ITransformerpro .

WordBagEstimator.Options

Možnosti, jak se extrahují n-gramy.

WordEmbeddingEstimator

Textový featurizátor, který převádí vektory textových tokenů na číselný vektor pomocí předem natrénovaného modelu vkládání.

WordEmbeddingTransformer

ITransformer vyplývající z montáže WordEmbeddingEstimator.

WordHashBagEstimator

IEstimator<TTransformer>ITransformerpro .

WordTokenizingEstimator

Tokenizuje vstupní text pomocí zadaných oddělovačů.

WordTokenizingTransformer

ITransformer vyplývající z montáže WordTokenizingEstimator.

Struktury

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

Obor názvů obsahující součásti transformace textových dat

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

Obor názvů obsahující součásti transformace textových dat

Rozhraní

IStopWordsRemoverOptions

Definuje jiný typ podporovaného odebrání slov stop.

Výčty

NgramExtractingEstimator.WeightingCriteria

Statistická míra, která slouží k vyhodnocení toho, jak důležité slovo je pro dokument v korpusu. Tento výčet je serializován.

StopWordsRemovingEstimator.Language

Jazyk stopwords. Tento výčet je serializován.

TextFeaturizingEstimator.Language

Jazyk textu. Tento výčet je serializován.

TextFeaturizingEstimator.NormFunction

Typ normalizátoru vektorů textu

TextNormalizingEstimator.CaseMode

Režim normalizace velkých a velkých písmen textu Tento výčet je serializován.

WordEmbeddingEstimator.PretrainedModelKind

Určuje, které slovo vkládání se má použít.