OneHotEncodingEstimator Clase

Definición

Convierte una o varias columnas de entrada de valores categóricos en tantas columnas de salida de vectores codificados con un solo acceso.

public sealed class OneHotEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotEncodingTransformer>
type OneHotEncodingEstimator = class
    interface IEstimator<OneHotEncodingTransformer>
Public NotInheritable Class OneHotEncodingEstimator
Implements IEstimator(Of OneHotEncodingTransformer)
Herencia
OneHotEncodingEstimator
Implementaciones

Comentarios

Características del estimador

¿Este estimador necesita examinar los datos para entrenar sus parámetros?
Tipo de datos de columna de entrada Vector o escalar de tipo numérico, booleano, DateTimede texto o de clave.
Tipo de datos de columna de salida Escalar o vector de clave o vector de Single tipo.
Exportable a ONNX

OneHotEncodingEstimator Compila un diccionario de valores únicos que aparecen en la columna de entrada. El resultado OneHotEncodingTransformer convierte una o varias columnas de entrada en tantas columnas de salida de vectores codificados con un solo acceso.

OneHotEncodingEstimator a menudo se usa para convertir datos categóricos en un formulario que se puede proporcionar a un algoritmo de aprendizaje automático.

La salida de esta transformación se especifica mediante OneHotEncodingEstimator.OutputKind:

  • Indicator genera un vector de indicador. Cada ranura de este vector corresponde a una categoría del diccionario, por lo que su longitud es el tamaño del diccionario que se ha creado. Si no se encuentra un valor en el dictioray, la salida es el vector cero.

  • Bag genera un vector de forma que cada ranura almacena el número de ocurrencias del valor correspondiente en el vector de entrada. Cada ranura de este vector corresponde a un valor del diccionario, por lo que su longitud es el tamaño del diccionario compilado. Indicator y Bag difieren simplemente en cómo se agregan los vectores de bits generados a partir de ranuras individuales de la columna de entrada: para Indicador se concatenan y para Bag se agregan. Cuando la columna de origen es escalar, las opciones Indicador y Bolsa son idénticas.

  • Key genera claves en una KeyDataViewType columna. Si la columna de entrada es un vector, la salida contiene un tipo de clave vectorial, donde cada ranura del vector corresponde a la ranura respectiva del vector de entrada. Si no se encuentra una categoría en el diccionario bulit, se le asigna el valor cero.

  • Binary genera un vector codificado binario para representar los valores que se encuentran en el diccionario que están presentes en la columna de entrada. Si no se encuentra un valor en la columna de entrada en el diccionario, la salida es el vector cero.

OneHotEncodingTransformer se puede aplicar a una o varias columnas, en cuyo caso compila y usa un diccionario independiente para cada columna a la que se aplica.

Consulte la sección Consulte también los vínculos a ejemplos de uso.

Métodos

Fit(IDataView)

Entrena y devuelve un OneHotEncodingTransformer.

GetOutputSchema(SchemaShape)

Devuelve el SchemaShape valor del esquema que generará el transformador. Se usa para la propagación y comprobación de esquemas en una canalización.

Métodos de extensión

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Anexe un "punto de control de almacenamiento en caché" a la cadena del estimador. Esto garantizará que los estimadores de nivel inferior se entrenarán con los datos almacenados en caché. Resulta útil tener un punto de control de almacenamiento en caché antes de que los instructores tomen varios pases de datos.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Dado un estimador, devuelva un objeto de ajuste que llamará a un delegado una vez Fit(IDataView) que se llame. A menudo, es importante que un estimador devuelva información sobre lo que cabe, por lo que el Fit(IDataView) método devuelve un objeto con tipo específico, en lugar de simplemente un general ITransformer. Sin embargo, al mismo tiempo, IEstimator<TTransformer> a menudo se forman en canalizaciones con muchos objetos, por lo que es posible que tengamos que crear una cadena de estimadores a través EstimatorChain<TLastTransformer> de donde el estimador para el que queremos obtener el transformador está enterrado en algún lugar de esta cadena. En ese escenario, podemos a través de este método adjuntar un delegado al que se llamará una vez que se llame a fit.

Se aplica a

Consulte también