Udostępnij za pośrednictwem


TextCatalog Klasa

Definicja

Kolekcja metod rozszerzeń dla klasy TransformsCatalog.

public static class TextCatalog
type TextCatalog = class
Public Module TextCatalog
Dziedziczenie
TextCatalog

Metody

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)

Utwórz element WordEmbeddingEstimator, który jest cechą tekstową, która konwertuje wektory tekstowe na wektory liczbowe przy użyciu wstępnie wytrenowanych modeli osadzania.

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)

Utwórz element WordEmbeddingEstimator, który jest cechą tekstową, która konwertuje wektor tekstu na wektor liczbowy przy użyciu wstępnie wytrenowanych modeli osadzania.

FeaturizeText(TransformsCatalog+TextTransforms, String, String)

Utwórz obiekt TextFeaturizingEstimator, który przekształca kolumnę tekstową w wektor Single cechowany, który reprezentuje znormalizowane liczby n-gramów i gramów znaków.

FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])

Utwórz obiekt , który przekształca kolumnę TextFeaturizingEstimatortekstową w wektor Single cechowy, który reprezentuje znormalizowane liczby n-gramów i gramów znaków.

LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)

Utwórz element LatentDirichletAllocationEstimator, który używa kontrolki LightLDA do przekształcania tekstu (reprezentowanego jako wektor zmiennoprzecinków) w wektor Single wskazujący podobieństwo tekstu z każdym zidentyfikowanym tematem.

NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)

Tworzy obiekt TextNormalizingEstimator, który normalizuje przychodzący tekst w inputColumnName programie, opcjonalnie zmieniając wielkość liter, usuwając znaki diakrytyczne, znaki interpunkcyjne, liczby i wyprowadza nowy tekst jako outputColumnName.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Utwórz obiekt NgramHashingEstimator, który kopiuje dane z kolumny określonej w inputColumnName kolumnie do nowej kolumny: outputColumnName i tworzy wektor liczby skrótów n-gramów.

ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)

Utwórz obiekt NgramHashingEstimator, który pobiera dane z wielu kolumn określonych w inputColumnNames parametrze do nowej kolumny: outputColumnName i tworzy wektor liczby skrótów n-gramów.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Utwórz obiekt , który mapuje kolumnę WordHashBagEstimatorokreśloną w inputColumnName obiekcie na wektor liczby skrótów n-gramów w nowej kolumnie o nazwie outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Utwórz obiekt WordHashBagEstimator, który mapuje wiele kolumn określonych w inputColumnNames elemecie na wektor liczby skrótów n-gramów w nowej kolumnie o nazwie outputColumnName.

ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Tworzy element NgramExtractingEstimator , który tworzy wektor liczby n-gramów (sekwencje kolejnych wyrazów) napotkanych w tekście wejściowym.

ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)

Utwórz obiekt , który mapuje kolumnę WordBagEstimatorokreśloną w inputColumnName obiekcie na wektor n-gram counts w nowej kolumnie o nazwie outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Utwórz obiekt , który mapuje kolumnę WordBagEstimatorokreśloną w inputColumnName obiekcie na wektor n-gram counts w nowej kolumnie o nazwie outputColumnName.

ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)

Utwórz obiekt WordBagEstimator, który mapuje wiele kolumn określonych w inputColumnNames elemecie na wektor n-gram counts w nowej kolumnie o nazwie outputColumnName.

RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)

Utwórz obiekt CustomStopWordsRemovingEstimator, który kopiuje dane z kolumny określonej w inputColumnName kolumnie do nowej kolumny: outputColumnName i usuwa z niej wstępnie zdefiniowany zestaw tekstu language .

RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])

Utwórz obiekt CustomStopWordsRemovingEstimator, który kopiuje dane z kolumny określonej w inputColumnName kolumnie do nowej kolumny: outputColumnName i usuwa z niej tekst określony.stopwords

TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)

Utwórz obiekt TokenizingByCharactersEstimator, który tokenizuje przez podzielenie tekstu na sekwencje znaków przy użyciu okna przewijania.

TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])

Utwórz element WordTokenizingEstimator, który tokenizuje tekst wejściowy przy użyciu separatorów separators .

Dotyczy