Udostępnij za pośrednictwem


TransformsCatalog.TextTransforms Klasa

Definicja

Klasa używana przez MLContext program do tworzenia wystąpień składników przekształcania danych tekstowych.

public sealed class TransformsCatalog.TextTransforms
type TransformsCatalog.TextTransforms = class
Public NotInheritable Class TransformsCatalog.TextTransforms
Dziedziczenie
TransformsCatalog.TextTransforms

Metody rozszerzania

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

Utwórz obiekt WordEmbeddingEstimator, który jest cechą tekstową, która konwertuje wektor tekstu na wektor liczbowy przy użyciu wstępnie wytrenowanych modeli osadzania.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

Utwórz obiekt WordEmbeddingEstimator, który jest cechą tekstową, która konwertuje wektory tekstu na wektory liczbowe przy użyciu wstępnie wytrenowanych modeli osadzania.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Utwórz obiekt , który przekształca kolumnę TextFeaturizingEstimatortekstową w wektor Single featurized, który reprezentuje znormalizowane liczby ngramów i gramów znaków.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Utwórz obiekt , który przekształca kolumnę TextFeaturizingEstimatortekstową w wektor Single cechowany, który reprezentuje znormalizowane liczby ngramów i gramów char-gramów.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

Utwórz element LatentDirichletAllocationEstimator, który używa metody LightLDA do przekształcania tekstu (reprezentowanego jako wektor zmiennoprzecinkowy) w wektor Single wskazujący podobieństwo tekstu z każdym zidentyfikowanym tematem.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

Tworzy obiekt , który normalizuje tekst przychodzący przez inputColumnName opcjonalnie zmianę TextNormalizingEstimatorwielkości liter, usuwanie znaków diakrytycznych, znaków interpunkcyjnych, liczb i danych wyjściowych nowego tekstu jako outputColumnName.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Utwórz obiekt NgramHashingEstimator, który kopiuje dane z kolumny określonej w inputColumnName do nowej kolumny: outputColumnName i tworzy wektor liczby skrótów n-gramów.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Utwórz obiekt NgramHashingEstimator, który pobiera dane z wielu kolumn określonych w inputColumnNames pliku do nowej kolumny: outputColumnName i tworzy wektor liczby skrótów n-gramów.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Utwórz obiekt , który mapuje kolumnę WordHashBagEstimatorokreśloną na inputColumnName wektor liczby skrótów n-gramów w nowej kolumnie o nazwie outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Utwórz obiekt , który mapuje wiele kolumn określonych w elemecie WordHashBagEstimatorinputColumnNames na wektor liczby skrótów n-gramów w nowej kolumnie o nazwie outputColumnName.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Tworzy element NgramExtractingEstimator , który tworzy wektor liczby n-gramów (sekwencje kolejnych wyrazów) napotkanych w tekście wejściowym.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Utwórz obiekt , który mapuje kolumnę WordBagEstimatorokreśloną na inputColumnName wektor n-gram liczby w nowej kolumnie o nazwie outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Utwórz obiekt , który mapuje kolumnę WordBagEstimatorokreśloną na inputColumnName wektor n-gram liczby w nowej kolumnie o nazwie outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Utwórz obiekt , który mapuje wiele kolumn określonych w elemecie WordBagEstimatorinputColumnNames na wektor n-gram liczby w nowej kolumnie o nazwie outputColumnName.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Utwórz obiekt CustomStopWordsRemovingEstimator, który kopiuje dane z kolumny określonej w inputColumnName kolumnie do nowej kolumny: outputColumnName i usuwa z niej wstępnie zdefiniowany zestaw tekstu language .

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Utwórz obiekt CustomStopWordsRemovingEstimator, który kopiuje dane z kolumny określonej w do inputColumnName nowej kolumny: outputColumnName i usuwa tekst określony z stopwords niej.

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Utwórz obiekt TokenizingByCharactersEstimator, który tokenizuje, dzieląc tekst na sekwencje znaków przy użyciu okna przesuwanego.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Utwórz element WordTokenizingEstimator, który tokenizuje tekst wejściowy przy użyciu separators separatorów.

Dotyczy