TextCatalog Classe

Riferimento

Definizione

Spazio dei nomi:: Microsoft.ML

Assembly:: Microsoft.ML.Transforms.dll

Pacchetto:: Microsoft.ML v3.0.1

Pacchetto:: Microsoft.ML v1.0.0

Pacchetto:: Microsoft.ML v1.1.0

Pacchetto:: Microsoft.ML v1.2.0

Pacchetto:: Microsoft.ML v1.3.1

Pacchetto:: Microsoft.ML v1.4.0

Pacchetto:: Microsoft.ML v1.5.5

Pacchetto:: Microsoft.ML v1.6.0

Pacchetto:: Microsoft.ML v1.7.0

Pacchetto:: Microsoft.ML v2.0.0

Importante

Alcune informazioni sono relative alla release non definitiva del prodotto, che potrebbe subire modifiche significative prima della release definitiva. Microsoft non riconosce alcuna garanzia, espressa o implicita, in merito alle informazioni qui fornite.

Raccolta di metodi di estensione per .TransformsCatalog

public static class TextCatalog

type TextCatalog = class

Public Module TextCatalog

Ereditarietà: Object
TextCatalog

Metodi

ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, String)	Creare un WordEmbeddingEstimatoroggetto , che è un featurizer di testo che converte i vettori di testo in vettori numerici usando modelli di incorporamento pre-sottoposti a training.
ApplyWordEmbedding(TransformsCatalog+TextTransforms, String, String, WordEmbeddingEstimator+PretrainedModelKind)	Creare un WordEmbeddingEstimatoroggetto , che è un featurizer di testo che converte un vettore di testo in un vettore numerico usando modelli di incorporamento pre-training.
FeaturizeText(TransformsCatalog+TextTransforms, String, String)	Creare un TextFeaturizingEstimatoroggetto , che trasforma una colonna di testo in un vettore con caratteristiche di che rappresenta i conteggi normalizzati di Single n-grammi e char-grammi.
FeaturizeText(TransformsCatalog+TextTransforms, String, TextFeaturizingEstimator+Options, String[])	Creare un TextFeaturizingEstimatoroggetto , che trasforma una colonna di testo in vettore con caratteristiche di che rappresenta i conteggi normalizzati di Single n-grammi e char-grammi.
LatentDirichletAllocation(TransformsCatalog+TextTransforms, String, String, Int32, Single, Single, Int32, Int32, Int32, Int32, Int32, Int32, Int32, Boolean)	Creare un LatentDirichletAllocationEstimatoroggetto , che usa LightLDA per trasformare il testo (rappresentato come vettore di float) in un vettore di Single che indica la somiglianza del testo con ogni argomento identificato.
NormalizeText(TransformsCatalog+TextTransforms, String, String, TextNormalizingEstimator+CaseMode, Boolean, Boolean, Boolean)	Crea un TextNormalizingEstimatoroggetto , che normalizza il testo in `inputColumnName` ingresso in, modificando facoltativamente maiuscole e minuscole, rimuovendo segni di punteggiatura, numeri e restituisce nuovo testo come `outputColumnName`.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Creare un NgramHashingEstimatoroggetto , che copia i dati dalla colonna specificata in `inputColumnName` una nuova colonna: `outputColumnName` e produce un vettore di conteggi di n-grammi hash.
ProduceHashedNgrams(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32, Boolean)	Creare un NgramHashingEstimatoroggetto , che accetta i dati dalle più colonne specificate in `inputColumnNames` una nuova colonna: `outputColumnName` e produce un vettore di conteggi di n-grammi hash.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Creare un WordHashBagEstimatoroggetto , che esegue il mapping della colonna specificata in `inputColumnName` a un vettore di conteggi di n-grammi hash in una nuova colonna denominata `outputColumnName`.
ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)	Creare un WordHashBagEstimatoroggetto , che esegue il mapping delle più colonne specificate in `inputColumnNames` a un vettore di conteggi di n-grammi hash in una nuova colonna denominata `outputColumnName`.
ProduceNgrams(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Crea un oggetto NgramExtractingEstimator che produce un vettore di conteggi di n-grammi (sequenze di parole consecutive) rilevate nel testo di input.
ProduceWordBags(TransformsCatalog+TextTransforms, String, Char, Char, String, Int32)	Creare un WordBagEstimatoroggetto , che esegue il mapping della colonna specificata in `inputColumnName` a un vettore di conteggi n-gram in una nuova colonna denominata `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Creare un WordBagEstimatoroggetto , che esegue il mapping della colonna specificata in `inputColumnName` a un vettore di conteggi n-gram in una nuova colonna denominata `outputColumnName`.
ProduceWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Boolean, Int32, NgramExtractingEstimator+WeightingCriteria)	Creare un WordBagEstimatoroggetto , che esegue il mapping delle più colonne specificate in a un vettore di conteggi n-gram in `inputColumnNames` una nuova colonna denominata `outputColumnName`.
RemoveDefaultStopWords(TransformsCatalog+TextTransforms, String, String, StopWordsRemovingEstimator+Language)	Creare un CustomStopWordsRemovingEstimatoroggetto , che copia i dati dalla colonna specificata in `inputColumnName` in una nuova colonna: `outputColumnName` e rimuove un set di testo predefinito specifico per `language` esso.
RemoveStopWords(TransformsCatalog+TextTransforms, String, String, String[])	Creare un CustomStopWordsRemovingEstimatoroggetto , che copia i dati dalla colonna specificata in `inputColumnName` una nuova colonna: `outputColumnName` e rimuove il testo specificato da esso `stopwords` .
TokenizeIntoCharactersAsKeys(TransformsCatalog+TextTransforms, String, String, Boolean)	Creare un TokenizingByCharactersEstimatoroggetto , che tokenizza suddividendo il testo in sequenze di caratteri usando una finestra scorrevole.
TokenizeIntoWords(TransformsCatalog+TextTransforms, String, String, Char[])	Creare un WordTokenizingEstimatoroggetto , che tokenzza il testo di input usando `separators` come separatori.

Si applica a

TextCatalog Classe

Definizione

Metodi

Si applica a

Commenti e suggerimenti

Risorse aggiuntive