共用方式為


Microsoft.ML.Transforms.Text 命名空間

包含文字資料轉換元件的命名空間。

類別

CustomStopWordsRemovingEstimator

IEstimator<TTransformer>CustomStopWordsRemovingTransformer

CustomStopWordsRemovingEstimator.Options

使用停用字詞移除程式可移除特定語言的停用字詞清單, (系統中已定義的最常見單字) 。

CustomStopWordsRemovingTransformer

ITransformer 產生自調整 CustomStopWordsRemovingEstimator

LatentDirichletAllocationEstimator

LDA 轉換會實作 LightLDA,這是 Latent Dirichlet 配置的最新實作。

LatentDirichletAllocationTransformer

ITransformer 產生自調整 LatentDirichletAllocationEstimator

LatentDirichletAllocationTransformer.ModelParameters

提供LightLDA所探索主題的詳細資料。

NgramExtractingEstimator

產生輸入文字中) 連續單字 (序列的 n-gram 計數向量。

NgramExtractingTransformer

ITransformer 產生自調整 NgramExtractingEstimator

NgramHashingEstimator

IEstimator<TTransformer>NgramHashingTransformer

NgramHashingTransformer

包含文字資料轉換元件的命名空間。

StopWordsRemovingEstimator

IEstimator<TTransformer>CustomStopWordsRemovingTransformer

StopWordsRemovingEstimator.Options

使用停用字詞移除器可移除特定語言的停用字詞清單, (系統中已定義的最常見單字) 。

StopWordsRemovingTransformer

ITransformer 產生自調整 StopWordsRemovingEstimator

TextFeaturizingEstimator

將文字檔的集合轉換成數值特徵向量的估算器。 特徵向量是根據) 提供的選項,將單字和/或字元 n-g (的正規化計數。

TextFeaturizingEstimator.Options

TextFeaturizingEstimator 進階選項。

TextNormalizingEstimator

IEstimator<TTransformer>TextNormalizingTransformer

TextNormalizingTransformer

ITransformer 產生自調整 TextNormalizingEstimator

TokenizingByCharactersEstimator

IEstimator<TTransformer>TokenizingByCharactersTransformer

TokenizingByCharactersTransformer

ITransformer 產生自調整 TokenizingByCharactersEstimator

WordBagEstimator

IEstimator<TTransformer>ITransformer

WordBagEstimator.Options

如何擷取 n-gram 的選項。

WordEmbeddingEstimator

文字特徵化工具,它會使用預先定型的內嵌模型,將文字標記的向量轉換成數值向量。

WordEmbeddingTransformer

ITransformer 產生自調整 WordEmbeddingEstimator

WordHashBagEstimator

IEstimator<TTransformer>ITransformer

WordTokenizingEstimator

使用指定的分隔符號來標記輸入文字。

WordTokenizingTransformer

ITransformer 產生自調整 WordTokenizingEstimator

結構

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

包含文字資料轉換元件的命名空間。

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

包含文字資料轉換元件的命名空間。

介面

IStopWordsRemoverOptions

定義支援的停用字詞移除工具類型。

列舉

NgramExtractingEstimator.WeightingCriteria

統計量值,用來評估字組對檔的重要性。 這個列舉會序列化。

StopWordsRemovingEstimator.Language

停用字詞語言。 這個列舉會序列化。

TextFeaturizingEstimator.Language

文字語言。 這個列舉會序列化。

TextFeaturizingEstimator.NormFunction

文字向量正規化程式種類。

TextNormalizingEstimator.CaseMode

文字的大小寫正規化模式。 這個列舉會序列化。

WordEmbeddingEstimator.PretrainedModelKind

指定要使用哪一個字組內嵌。