Microsoft.ML.Transforms.Text Obor názvů

Reference

Důležité

Některé informace platí pro předběžně vydaný produkt, který se může zásadně změnit, než ho výrobce nebo autor vydá. Microsoft neposkytuje žádné záruky, výslovné ani předpokládané, týkající se zde uváděných informací.

Obor názvů obsahující součásti transformace textových dat

Třídy

CustomStopWordsRemovingEstimator	IEstimator<TTransformer>CustomStopWordsRemovingTransformerpro .
CustomStopWordsRemovingEstimator.Options	Použijte nástroj pro odebrání slov stop, který může odebrat seznam slov stop (nejběžnějších slov), která jsou už v systému definovaná.
CustomStopWordsRemovingTransformer	ITransformer vyplývající z montáže CustomStopWordsRemovingEstimator.
LatentDirichletAllocationEstimator	Transformace LDA implementuje LightLDA, nejmodernější implementaci Latent Dirichlet Allocation.
LatentDirichletAllocationTransformer	ITransformer vyplývající z montáže LatentDirichletAllocationEstimator.
LatentDirichletAllocationTransformer.ModelParameters	Uveďte podrobnosti o tématech zjištěných službou LightLDA.
NgramExtractingEstimator	Vytvoří vektor počtu n-gramů (sekvencí po sobě jdoucích slov), ke kterým došlo ve vstupním textu.
NgramExtractingTransformer	ITransformer vyplývající z montáže NgramExtractingEstimator.
NgramHashingEstimator	IEstimator<TTransformer>NgramHashingTransformerpro .
NgramHashingTransformer	Obor názvů obsahující součásti transformace textových dat
StopWordsRemovingEstimator	IEstimator<TTransformer>CustomStopWordsRemovingTransformerpro .
StopWordsRemovingEstimator.Options	Použijte nástroj pro odebrání slov stop, který může odebrat seznam slov stop (nejběžnějších slov) už definovaných v systému.
StopWordsRemovingTransformer	ITransformer vyplývající z montáže StopWordsRemovingEstimator.
TextFeaturizingEstimator	Estimátor, který změní kolekci textových dokumentů na číselné vektory funkcí. Vektory funkcí jsou normalizované počty slov a/nebo znaků n-gramů (na základě zadaných možností).
TextFeaturizingEstimator.Options	Upřesňující možnosti pro TextFeaturizingEstimator.
TextNormalizingEstimator	IEstimator<TTransformer>TextNormalizingTransformerpro .
TextNormalizingTransformer	ITransformer vyplývající z montáže TextNormalizingEstimator.
TokenizingByCharactersEstimator	IEstimator<TTransformer>TokenizingByCharactersTransformerpro .
TokenizingByCharactersTransformer	ITransformer vyplývající z montáže TokenizingByCharactersEstimator.
WordBagEstimator	IEstimator<TTransformer>ITransformerpro .
WordBagEstimator.Options	Možnosti, jak se extrahují n-gramy.
WordEmbeddingEstimator	Textový featurizátor, který převádí vektory textových tokenů na číselný vektor pomocí předem natrénovaného modelu vkládání.
WordEmbeddingTransformer	ITransformer vyplývající z montáže WordEmbeddingEstimator.
WordHashBagEstimator	IEstimator<TTransformer>ITransformerpro .
WordTokenizingEstimator	Tokenizuje vstupní text pomocí zadaných oddělovačů.
WordTokenizingTransformer	ITransformer vyplývající z montáže WordTokenizingEstimator.

Struktury

LatentDirichletAllocationTransformer.ModelParameters.ItemScore	Obor názvů obsahující součásti transformace textových dat
LatentDirichletAllocationTransformer.ModelParameters.WordItemScore	Obor názvů obsahující součásti transformace textových dat

Rozhraní

IStopWordsRemoverOptions

Definuje jiný typ podporovaného odebrání slov stop.

Výčty

NgramExtractingEstimator.WeightingCriteria	Statistická míra, která slouží k vyhodnocení toho, jak důležité slovo je pro dokument v korpusu. Tento výčet je serializován.
StopWordsRemovingEstimator.Language	Jazyk stopwords. Tento výčet je serializován.
TextFeaturizingEstimator.Language	Jazyk textu. Tento výčet je serializován.
TextFeaturizingEstimator.NormFunction	Typ normalizátoru vektorů textu
TextNormalizingEstimator.CaseMode	Režim normalizace velkých a velkých písmen textu Tento výčet je serializován.
WordEmbeddingEstimator.PretrainedModelKind	Určuje, které slovo vkládání se má použít.

Sdílet prostřednictvím

Microsoft.ML.Transforms.Text Obor názvů

Třídy

Struktury

Rozhraní

Výčty

Další materiály