Microsoft.ML.Transforms.Text Namespace
Wichtig
Einige Informationen beziehen sich auf Vorabversionen, die vor dem Release ggf. grundlegend überarbeitet werden. Microsoft übernimmt hinsichtlich der hier bereitgestellten Informationen keine Gewährleistungen, seien sie ausdrücklich oder konkludent.
Namespace, der Textdatentransformationskomponenten enthält.
Klassen
CustomStopWordsRemovingEstimator |
IEstimator<TTransformer> für die CustomStopWordsRemovingTransformer. |
CustomStopWordsRemovingEstimator.Options |
Verwenden Sie stop words remover, die sprachspezifische Liste von Stoppwörtern (am häufigsten verwendete Wörter) entfernt, die bereits im System definiert sind. |
CustomStopWordsRemovingTransformer |
ITransformer aus dem Anpassen eines CustomStopWordsRemovingEstimator. |
LatentDirichletAllocationEstimator |
Die LDA-Transformation implementiert LightLDA, eine modernste Implementierung der latenten Dirichlet-Zuordnung. |
LatentDirichletAllocationTransformer |
ITransformer aus dem Anpassen eines LatentDirichletAllocationEstimator. |
LatentDirichletAllocationTransformer.ModelParameters |
Geben Sie Details zu den Themen an, die von LightLDA entdeckt wurden. |
NgramExtractingEstimator |
Erzeugt einen Vektor der Anzahl von n-Gramm (Sequenzen von aufeinander folgenden Wörtern), die im Eingabetext aufgetreten sind. |
NgramExtractingTransformer |
ITransformer aus dem Anpassen einer NgramExtractingEstimator. |
NgramHashingEstimator | |
NgramHashingTransformer |
Namespace, der Textdatentransformationskomponenten enthält. |
StopWordsRemovingEstimator |
IEstimator<TTransformer> für die CustomStopWordsRemovingTransformer. |
StopWordsRemovingEstimator.Options |
Verwenden Sie stop words remover, that can remove language-specific list of stop words (most common words) already defined in the system. |
StopWordsRemovingTransformer |
ITransformer aus dem Anpassen eines StopWordsRemovingEstimator. |
TextFeaturizingEstimator |
Eine Schätzung, die eine Sammlung von Textdokumenten in numerische Featurevektoren verwandelt. Die Featurevektoren sind normalisierte Anzahl von Wörtern und/oder Zeichen n-Gramm (basierend auf den bereitgestellten Optionen). |
TextFeaturizingEstimator.Options |
Erweiterte Optionen für die TextFeaturizingEstimator. |
TextNormalizingEstimator |
IEstimator<TTransformer> für die TextNormalizingTransformer. |
TextNormalizingTransformer |
ITransformer aus dem Anpassen eines TextNormalizingEstimator. |
TokenizingByCharactersEstimator |
IEstimator<TTransformer> für die TokenizingByCharactersTransformer. |
TokenizingByCharactersTransformer |
ITransformer aus dem Anpassen eines TokenizingByCharactersEstimator. |
WordBagEstimator |
IEstimator<TTransformer> für die ITransformer. |
WordBagEstimator.Options |
Optionen, wie die n-Gramm extrahiert werden. |
WordEmbeddingEstimator |
Text-Featurizer, der Vektoren von Texttoken in einen numerischen Vektor konvertiert, indem ein vorab trainiertes Einbettungsmodell verwendet wird. |
WordEmbeddingTransformer |
ITransformer aus dem Anpassen einer WordEmbeddingEstimator. |
WordHashBagEstimator |
IEstimator<TTransformer> für die ITransformer. |
WordTokenizingEstimator |
Tokenisiert Eingabetext mit angegebenen Trennzeichen. |
WordTokenizingTransformer |
ITransformer aus dem Anpassen einer WordTokenizingEstimator. |
Strukturen
LatentDirichletAllocationTransformer.ModelParameters.ItemScore |
Namespace, der Textdatentransformationskomponenten enthält. |
LatentDirichletAllocationTransformer.ModelParameters.WordItemScore |
Namespace, der Textdatentransformationskomponenten enthält. |
Schnittstellen
IStopWordsRemoverOptions |
Definiert den unterschiedlichen Typ des unterstützten Entfernens von Stoppwörtern. |
Enumerationen
NgramExtractingEstimator.WeightingCriteria |
Ein statistisches Maß, das verwendet wird, um zu bewerten, wie wichtig ein Wort für ein Dokument in einem Korpus ist. Diese Enumeration wird serialisiert. |
StopWordsRemovingEstimator.Language |
Stopwords-Sprache. Diese Enumeration wird serialisiert. |
TextFeaturizingEstimator.Language |
Textsprache. Diese Enumeration wird serialisiert. |
TextFeaturizingEstimator.NormFunction |
Textvektor-Normalisiererart. |
TextNormalizingEstimator.CaseMode |
Normalisierungsmodus für Groß-/Kleinschreibung. Diese Enumeration wird serialisiert. |
WordEmbeddingEstimator.PretrainedModelKind |
Gibt an, welche Worteinbettungen verwendet werden sollen. |