Partager via


TextCatalog.ProduceHashedWordBags Méthode

Définition

Surcharges

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Créez un WordHashBagEstimator, qui mappe les colonnes multiples spécifiées dans inputColumnNames un vecteur de nombres de n-grammes hachés dans une nouvelle colonne nommée outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Créez un WordHashBagEstimator, qui mappe la colonne spécifiée dans inputColumnName un vecteur de nombres de n-grammes hachés dans une nouvelle colonne nommée outputColumnName.

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String[], Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Créez un WordHashBagEstimator, qui mappe les colonnes multiples spécifiées dans inputColumnNames un vecteur de nombres de n-grammes hachés dans une nouvelle colonne nommée outputColumnName.

public static Microsoft.ML.Transforms.Text.WordHashBagEstimator ProduceHashedWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string[] inputColumnNames, int numberOfBits = 16, int ngramLength = 1, int skipLength = 0, bool useAllLengths = true, uint seed = 314489979, bool useOrderedHashing = true, int maximumNumberOfInverts = 0);
static member ProduceHashedWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string[] * int * int * int * bool * uint32 * bool * int -> Microsoft.ML.Transforms.Text.WordHashBagEstimator
<Extension()>
Public Function ProduceHashedWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, inputColumnNames As String(), Optional numberOfBits As Integer = 16, Optional ngramLength As Integer = 1, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional seed As UInteger = 314489979, Optional useOrderedHashing As Boolean = true, Optional maximumNumberOfInverts As Integer = 0) As WordHashBagEstimator

Paramètres

catalog
TransformsCatalog.TextTransforms

Catalogue de la transformation.

outputColumnName
String

Nom de la colonne résultant de la transformation de inputColumnNames. Le type de données de cette colonne sera un vecteur de taille connue de Single.

inputColumnNames
String[]

Noms des plusieurs colonnes à partir des données. Cet estimateur opère sur le vecteur de texte.

numberOfBits
Int32

Nombre de bits à hacher. Doit être compris entre 1 et 30 (inclus).

ngramLength
Int32

Longueur du Ngram.

skipLength
Int32

Nombre maximal de jetons à ignorer lors de la construction d’un n-grammes.

useAllLengths
Boolean

Indique s’il faut inclure toutes les longueurs n-grammes jusqu’à ngramLength ou seulement ngramLength.

seed
UInt32

Seed de hachage.

useOrderedHashing
Boolean

Indique si la position de chaque colonne source doit être incluse dans le hachage (s'il existe plusieurs colonnes sources).

maximumNumberOfInverts
Int32

Lors du hachage, nous construisons des mappages entre les valeurs d’origine et les valeurs de hachage produites. La représentation textuelle des valeurs d’origine est stockée dans les noms d’emplacements des annotations pour la nouvelle colonne. Le hachage, par conséquent, peut mapper de nombreuses valeurs initiales à une. maximumNumberOfInverts spécifie la limite supérieure du nombre de valeurs d’entrée distinctes mappées à un hachage qui doit être conservé. 0 ne conserve aucune valeur d’entrée. -1 conserve tous les mappages de valeurs d’entrée à chaque hachage.

Retours

Remarques

WordHashBagEstimator est différent de NgramHashingEstimator celui dans lequel l’ancien tokenise le texte en interne et celui-ci prend du texte tokenisé comme entrée.

S’applique à

ProduceHashedWordBags(TransformsCatalog+TextTransforms, String, String, Int32, Int32, Int32, Boolean, UInt32, Boolean, Int32)

Créez un WordHashBagEstimator, qui mappe la colonne spécifiée dans inputColumnName un vecteur de nombres de n-grammes hachés dans une nouvelle colonne nommée outputColumnName.

public static Microsoft.ML.Transforms.Text.WordHashBagEstimator ProduceHashedWordBags (this Microsoft.ML.TransformsCatalog.TextTransforms catalog, string outputColumnName, string inputColumnName = default, int numberOfBits = 16, int ngramLength = 1, int skipLength = 0, bool useAllLengths = true, uint seed = 314489979, bool useOrderedHashing = true, int maximumNumberOfInverts = 0);
static member ProduceHashedWordBags : Microsoft.ML.TransformsCatalog.TextTransforms * string * string * int * int * int * bool * uint32 * bool * int -> Microsoft.ML.Transforms.Text.WordHashBagEstimator
<Extension()>
Public Function ProduceHashedWordBags (catalog As TransformsCatalog.TextTransforms, outputColumnName As String, Optional inputColumnName As String = Nothing, Optional numberOfBits As Integer = 16, Optional ngramLength As Integer = 1, Optional skipLength As Integer = 0, Optional useAllLengths As Boolean = true, Optional seed As UInteger = 314489979, Optional useOrderedHashing As Boolean = true, Optional maximumNumberOfInverts As Integer = 0) As WordHashBagEstimator

Paramètres

catalog
TransformsCatalog.TextTransforms

Catalogue de la transformation.

outputColumnName
String

Nom de la colonne résultant de la transformation de inputColumnName. Le type de données de cette colonne sera un vecteur de taille connue de Single.

inputColumnName
String

Nom de la colonne à partir duquel extraire les données. Cet estimateur opère sur le vecteur de texte.

numberOfBits
Int32

Nombre de bits à hacher. Doit être compris entre 1 et 30 (inclus).

ngramLength
Int32

Longueur du Ngram.

skipLength
Int32

Nombre maximal de jetons à ignorer lors de la construction d’un n-grammes.

useAllLengths
Boolean

Indique s’il faut inclure toutes les longueurs n-grammes jusqu’à ngramLength ou seulement ngramLength.

seed
UInt32

Seed de hachage.

useOrderedHashing
Boolean

Indique si la position de chaque colonne source doit être incluse dans le hachage (s'il existe plusieurs colonnes sources).

maximumNumberOfInverts
Int32

Lors du hachage, nous construisons des mappages entre les valeurs d’origine et les valeurs de hachage produites. La représentation textuelle des valeurs d’origine est stockée dans les noms d’emplacements des annotations pour la nouvelle colonne. Le hachage, par conséquent, peut mapper de nombreuses valeurs initiales à une. maximumNumberOfInverts spécifie la limite supérieure du nombre de valeurs d’entrée distinctes mappées à un hachage qui doit être conservé. 0 ne conserve aucune valeur d’entrée. -1 conserve tous les mappages de valeurs d’entrée à chaque hachage.

Retours

Remarques

WordHashBagEstimator est différent de NgramHashingEstimator celui dans lequel l’ancien tokenise le texte en interne et celui-ci prend du texte tokenisé comme entrée.

S’applique à