Freigeben über


Microsoft.ML.Transforms.Text Namespace

Namespace, der Textdatentransformationskomponenten enthält.

Klassen

CustomStopWordsRemovingEstimator

IEstimator<TTransformer> für die CustomStopWordsRemovingTransformer.

CustomStopWordsRemovingEstimator.Options

Verwenden Sie stop words remover, die sprachspezifische Liste von Stoppwörtern (am häufigsten verwendete Wörter) entfernt, die bereits im System definiert sind.

CustomStopWordsRemovingTransformer

ITransformer aus dem Anpassen eines CustomStopWordsRemovingEstimator.

LatentDirichletAllocationEstimator

Die LDA-Transformation implementiert LightLDA, eine modernste Implementierung der latenten Dirichlet-Zuordnung.

LatentDirichletAllocationTransformer

ITransformer aus dem Anpassen eines LatentDirichletAllocationEstimator.

LatentDirichletAllocationTransformer.ModelParameters

Geben Sie Details zu den Themen an, die von LightLDA entdeckt wurden.

NgramExtractingEstimator

Erzeugt einen Vektor der Anzahl von n-Gramm (Sequenzen von aufeinander folgenden Wörtern), die im Eingabetext aufgetreten sind.

NgramExtractingTransformer

ITransformer aus dem Anpassen einer NgramExtractingEstimator.

NgramHashingEstimator

IEstimator<TTransformer> für die NgramHashingTransformer.

NgramHashingTransformer

Namespace, der Textdatentransformationskomponenten enthält.

StopWordsRemovingEstimator

IEstimator<TTransformer> für die CustomStopWordsRemovingTransformer.

StopWordsRemovingEstimator.Options

Verwenden Sie stop words remover, that can remove language-specific list of stop words (most common words) already defined in the system.

StopWordsRemovingTransformer

ITransformer aus dem Anpassen eines StopWordsRemovingEstimator.

TextFeaturizingEstimator

Eine Schätzung, die eine Sammlung von Textdokumenten in numerische Featurevektoren verwandelt. Die Featurevektoren sind normalisierte Anzahl von Wörtern und/oder Zeichen n-Gramm (basierend auf den bereitgestellten Optionen).

TextFeaturizingEstimator.Options

Erweiterte Optionen für die TextFeaturizingEstimator.

TextNormalizingEstimator

IEstimator<TTransformer> für die TextNormalizingTransformer.

TextNormalizingTransformer

ITransformer aus dem Anpassen eines TextNormalizingEstimator.

TokenizingByCharactersEstimator

IEstimator<TTransformer> für die TokenizingByCharactersTransformer.

TokenizingByCharactersTransformer

ITransformer aus dem Anpassen eines TokenizingByCharactersEstimator.

WordBagEstimator

IEstimator<TTransformer> für die ITransformer.

WordBagEstimator.Options

Optionen, wie die n-Gramm extrahiert werden.

WordEmbeddingEstimator

Text-Featurizer, der Vektoren von Texttoken in einen numerischen Vektor konvertiert, indem ein vorab trainiertes Einbettungsmodell verwendet wird.

WordEmbeddingTransformer

ITransformer aus dem Anpassen einer WordEmbeddingEstimator.

WordHashBagEstimator

IEstimator<TTransformer> für die ITransformer.

WordTokenizingEstimator

Tokenisiert Eingabetext mit angegebenen Trennzeichen.

WordTokenizingTransformer

ITransformer aus dem Anpassen einer WordTokenizingEstimator.

Strukturen

LatentDirichletAllocationTransformer.ModelParameters.ItemScore

Namespace, der Textdatentransformationskomponenten enthält.

LatentDirichletAllocationTransformer.ModelParameters.WordItemScore

Namespace, der Textdatentransformationskomponenten enthält.

Schnittstellen

IStopWordsRemoverOptions

Definiert den unterschiedlichen Typ des unterstützten Entfernens von Stoppwörtern.

Enumerationen

NgramExtractingEstimator.WeightingCriteria

Ein statistisches Maß, das verwendet wird, um zu bewerten, wie wichtig ein Wort für ein Dokument in einem Korpus ist. Diese Enumeration wird serialisiert.

StopWordsRemovingEstimator.Language

Stopwords-Sprache. Diese Enumeration wird serialisiert.

TextFeaturizingEstimator.Language

Textsprache. Diese Enumeration wird serialisiert.

TextFeaturizingEstimator.NormFunction

Textvektor-Normalisiererart.

TextNormalizingEstimator.CaseMode

Normalisierungsmodus für Groß-/Kleinschreibung. Diese Enumeration wird serialisiert.

WordEmbeddingEstimator.PretrainedModelKind

Gibt an, welche Worteinbettungen verwendet werden sollen.