Microsoft.ML.Transforms.Text Spazio dei nomi
Importante
Alcune informazioni sono relative alla release non definitiva del prodotto, che potrebbe subire modifiche significative prima della release definitiva. Microsoft non riconosce alcuna garanzia, espressa o implicita, in merito alle informazioni qui fornite.
Spazio dei nomi contenente componenti di trasformazione dati di testo.
Classi
CustomStopWordsRemovingEstimator |
IEstimator<TTransformer>per .CustomStopWordsRemovingTransformer |
CustomStopWordsRemovingEstimator.Options |
Usare l'utilità di rimozione delle parole di arresto che può rimuovere un elenco specifico della lingua delle parole di arresto (parole più comuni) già definite nel sistema. |
CustomStopWordsRemovingTransformer |
ITransformer risultante dall'adattamento di un CustomStopWordsRemovingEstimatoroggetto . |
LatentDirichletAllocationEstimator |
La trasformazione LDA implementa LightLDA, un'implementazione all'avanguardia dell'allocazione di Dirichlet latente. |
LatentDirichletAllocationTransformer |
ITransformer risultante dall'adattamento di un LatentDirichletAllocationEstimatoroggetto . |
LatentDirichletAllocationTransformer.ModelParameters |
Fornire informazioni dettagliate sugli argomenti individuati da LightLDA. |
NgramExtractingEstimator |
Produce un vettore di conteggi di n-grammi (sequenze di parole consecutive) rilevate nel testo di input. |
NgramExtractingTransformer |
ITransformer risultante dall'adattamento di un NgramExtractingEstimatoroggetto . |
NgramHashingEstimator | |
NgramHashingTransformer |
Spazio dei nomi contenente componenti di trasformazione dati di testo. |
StopWordsRemovingEstimator |
IEstimator<TTransformer>per .CustomStopWordsRemovingTransformer |
StopWordsRemovingEstimator.Options |
Usare l'utilità di rimozione delle parole di arresto che possono rimuovere un elenco specifico della lingua delle parole di arresto (parole più comuni) già definite nel sistema. |
StopWordsRemovingTransformer |
ITransformer risultante dall'adattamento di un StopWordsRemovingEstimatoroggetto . |
TextFeaturizingEstimator |
Uno strumento di stima che trasforma una raccolta di documenti di testo in vettori di funzionalità numerici. I vettori di funzionalità sono conteggi normalizzati di parole e/o caratteri n-grammi (in base alle opzioni fornite). |
TextFeaturizingEstimator.Options |
Opzioni avanzate per .TextFeaturizingEstimator |
TextNormalizingEstimator | |
TextNormalizingTransformer |
ITransformer risultante dall'adattamento di un TextNormalizingEstimatoroggetto . |
TokenizingByCharactersEstimator |
IEstimator<TTransformer>per .TokenizingByCharactersTransformer |
TokenizingByCharactersTransformer |
ITransformer risultante dall'adattamento di un TokenizingByCharactersEstimatoroggetto . |
WordBagEstimator | |
WordBagEstimator.Options |
Opzioni per il modo in cui vengono estratti i n-grammi. |
WordEmbeddingEstimator |
Funzionalità di testo che converte i vettori di token di testo in un vettore numerico usando un modello di incorporamento pre-sottoposto a training. |
WordEmbeddingTransformer |
ITransformer risultante dall'adattamento di un WordEmbeddingEstimatoroggetto . |
WordHashBagEstimator | |
WordTokenizingEstimator |
Tokenzza il testo di input usando delimitatori specificati. |
WordTokenizingTransformer |
ITransformer risultante dall'adattamento di un WordTokenizingEstimatoroggetto . |
Struct
LatentDirichletAllocationTransformer.ModelParameters.ItemScore |
Spazio dei nomi contenente componenti di trasformazione dati di testo. |
LatentDirichletAllocationTransformer.ModelParameters.WordItemScore |
Spazio dei nomi contenente componenti di trasformazione dati di testo. |
Interfacce
IStopWordsRemoverOptions |
Definisce il diverso tipo di parole di arresto supportate. |
Enumerazioni
NgramExtractingEstimator.WeightingCriteria |
Misura statistica usata per valutare l'importanza di una parola in un documento in un corpus. Questa enumerazione viene serializzata. |
StopWordsRemovingEstimator.Language |
Lingua di parole non significative. Questa enumerazione viene serializzata. |
TextFeaturizingEstimator.Language |
Lingua di testo. Questa enumerazione viene serializzata. |
TextFeaturizingEstimator.NormFunction |
Tipo normalizzatore del vettore di testo. |
TextNormalizingEstimator.CaseMode |
Modalità di normalizzazione delle maiuscole e minuscole del testo. Questa enumerazione viene serializzata. |
WordEmbeddingEstimator.PretrainedModelKind |
Specifica quali parole incorporano da usare. |