OneHotEncodingEstimator Classe

Definição

Converte uma ou mais colunas de entrada de valores categóricos em quantas colunas de saída de vetores codificados de um hot.

public sealed class OneHotEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotEncodingTransformer>
type OneHotEncodingEstimator = class
    interface IEstimator<OneHotEncodingTransformer>
Public NotInheritable Class OneHotEncodingEstimator
Implements IEstimator(Of OneHotEncodingTransformer)
Herança
OneHotEncodingEstimator
Implementações

Comentários

Características do estimador

Esse estimador precisa examinar os dados para treinar seus parâmetros? Sim
Tipo de dados de coluna de entrada Vetor ou escalar de tipo numérico, booliano, DateTimetexto ou chave.
Tipo de dados de coluna de saída Escalar ou vetor de chave ou vetor do Single tipo.
Exportável para ONNX Sim

O OneHotEncodingEstimator cria um dicionário de valores exclusivos que aparecem na coluna de entrada. O resultado OneHotEncodingTransformer converte uma ou mais colunas de entrada em tantas colunas de saída de vetores codificados de um hot.

Geralmente OneHotEncodingEstimator , eles são usados para converter dados categóricos em um formulário que pode ser fornecido a um algoritmo de aprendizado de máquina.

A saída dessa transformação é especificada por OneHotEncodingEstimator.OutputKind:

  • Indicator produz um vetor indicador. Cada slot nesse vetor corresponde a uma categoria no dicionário, portanto, o respectivo comprimento é o tamanho do dicionário criado. Se um valor não for encontrado no dictioray, a saída será o vetor zero.

  • Bag produz um vetor de modo que cada slot armazena o número de ocorrências do valor correspondente no vetor de entrada. Cada slot nesse vetor corresponde a um valor no dicionário, portanto, seu tamanho é o tamanho do dicionário criado. Indicator e Bag diferem simplesmente em como os vetores de bit gerados de slots individuais na coluna de entrada são agregados: para Indicador, eles são concatenados e, para Bag, eles são adicionados. Quando a coluna de origem é escalar, as opções Indicador e Saco são idênticas.

  • Key produz chaves em uma KeyDataViewType coluna. Se a coluna de entrada for um vetor, a saída conterá um tipo de chave de vetor, em que cada slot do vetor corresponde ao respectivo slot do vetor de entrada. Se uma categoria não for encontrada no dicionário bulit, ela será atribuída ao valor zero.

  • Binary produz um vetor codificado binário para representar os valores encontrados no dicionário que estão presentes na coluna de entrada. Se um valor na coluna de entrada não for encontrado no dicionário, a saída será o vetor zero.

O OneHotEncodingTransformer pode ser aplicado a uma ou mais colunas, nesse caso, ele cria e usa um dicionário separado para cada coluna à qual ele é aplicado.

Verifique a seção Consulte Também para obter links para exemplos de uso.

Métodos

Fit(IDataView)

Treina e retorna um OneHotEncodingTransformer.

GetOutputSchema(SchemaShape)

Retorna o SchemaShape esquema que será produzido pelo transformador. Usado para propagação e verificação de esquema em um pipeline.

Métodos de Extensão

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Acrescente um "ponto de verificação de cache" à cadeia de estimativas. Isso garantirá que os estimadores downstream serão treinados em relação aos dados armazenados em cache. É útil ter um ponto de verificação de cache antes dos treinadores que fazem várias passagens de dados.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dado um estimador, retorne um objeto de encapsulamento que chamará um delegado uma vez Fit(IDataView) chamado. Geralmente, é importante que um estimador retorne informações sobre o que estava em forma, e é por isso que o Fit(IDataView) método retorna um objeto especificamente tipado, em vez de apenas um geral ITransformer. No entanto, ao mesmo tempo, IEstimator<TTransformer> muitas vezes são formados em pipelines com muitos objetos, portanto, talvez seja necessário construir uma cadeia de estimadores por meio EstimatorChain<TLastTransformer> de onde o estimador para o qual queremos que o transformador seja enterrado em algum lugar nesta cadeia. Para esse cenário, podemos por meio desse método anexar um delegado que será chamado quando fit for chamado.

Aplica-se a

Confira também