HashingEstimator.ColumnOptions Construtor
Definição
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Descreve como o transformador lida com um par de colunas.
public ColumnOptions (string name, string inputColumnName = default, int numberOfBits = 31, uint seed = 314489979, bool useOrderedHashing = false, int maximumNumberOfInverts = 0, bool combine = false);
new Microsoft.ML.Transforms.HashingEstimator.ColumnOptions : string * string * int * uint32 * bool * int * bool -> Microsoft.ML.Transforms.HashingEstimator.ColumnOptions
Public Sub New (name As String, Optional inputColumnName As String = Nothing, Optional numberOfBits As Integer = 31, Optional seed As UInteger = 314489979, Optional useOrderedHashing As Boolean = false, Optional maximumNumberOfInverts As Integer = 0, Optional combine As Boolean = false)
Parâmetros
- name
- String
Nome da coluna resultante da transformação de inputColumnName
.
- inputColumnName
- String
Nome da coluna a ser transformada. Se definido como null
, o valor do name
será usado como origem.
- numberOfBits
- Int32
Número de bits para usar com o hash. Deve estar entre 1 e 31, inclusive.
- seed
- UInt32
Semente de hash.
- useOrderedHashing
- Boolean
Se a posição de cada termo deve ser incluída no hash, só se aplica a entradas do tipo vetor.
- maximumNumberOfInverts
- Int32
Durante o hash, criamos mapeamentos entre valores originais e os valores de hash produzidos.
A representação de texto dos valores originais é armazenada nos nomes de slot das anotações da nova coluna. O hash, como tal, pode mapear muitos valores iniciais para um.
maximumNumberOfInverts
especifica o limite superior do número de valores de entrada distintos mapeados para um hash que deve ser retido.
0 não retém nenhum valor de entrada. -1 retém todos os valores de entrada mapeando para cada hash.
- combine
- Boolean
Se os slots de uma coluna de vetor devem ser colocados em hash em um único valor.