CountFeatureSelectingEstimator Clase
Definición
Importante
Parte de la información hace referencia a la versión preliminar del producto, que puede haberse modificado sustancialmente antes de lanzar la versión definitiva. Microsoft no otorga ninguna garantía, explícita o implícita, con respecto a la información proporcionada aquí.
Selecciona las ranuras para las que el recuento de valores no predeterminados es mayor o igual que un umbral.
public sealed class CountFeatureSelectingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.ITransformer>
type CountFeatureSelectingEstimator = class
interface IEstimator<ITransformer>
Public NotInheritable Class CountFeatureSelectingEstimator
Implements IEstimator(Of ITransformer)
- Herencia
-
CountFeatureSelectingEstimator
- Implementaciones
Comentarios
Características del estimador
¿Este estimador necesita examinar los datos para entrenar sus parámetros? | Sí |
Tipo de datos de columna de entrada | Vector o escalar de tipos de datos de SingleDoubletexto o |
Tipo de datos de columna de salida | Igual que la columna de entrada |
Exportable a ONNX | Sí |
Esta transformación usa un conjunto de agregadores para contar el número de valores de cada ranura (elemento vectorial) que no son predeterminados y que no faltan (para las definiciones de valor predeterminado y que faltan, consulte la sección comentarios de DataKind). Si el valor de recuento es menor que el parámetro count proporcionado, se quita esa ranura. Esta transformación es útil cuando se aplica junto con .OneHotHashEncodingTransformer Puede quitar las características generadas por la transformación hash que no tienen datos en los ejemplos.
Por ejemplo, si establecemos el parámetro count en 3 y se ajusta al estimador, aplicamos el transformador a la columna Características siguiente, veríamos la segunda ranura, que contiene: NaN (falta valor), 5, 5, 0 (valor predeterminado) que se quita porque esa ranura tiene solo dos valores no predeterminados y no ausentes, es decir, los dos valores 5. Se mantiene la tercera ranura, porque tiene los valores 6, 6, 6, NaN; por lo tanto, tiene 3 no predeterminados y no faltan.
Características |
---|
4,NaN,6 |
4,5,6 |
4,5,6 |
4,0,NaN |
Este es el aspecto del conjunto de datos anterior, después de la transformación.
Características |
---|
4,6 |
4,6 |
4,6 |
4,NaN |
Consulte la sección Consulte también los vínculos a ejemplos de uso.
Métodos
Fit(IDataView) |
Entrena y devuelve un ITransformer. |
GetOutputSchema(SchemaShape) |
Devuelve el SchemaShape valor del esquema que generará el transformador. Se usa para la propagación y comprobación de esquemas en una canalización. |
Métodos de extensión
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Anexe un "punto de control de almacenamiento en caché" a la cadena del estimador. Esto garantizará que los estimadores de nivel inferior se entrenarán con los datos almacenados en caché. Resulta útil tener un punto de control de almacenamiento en caché antes de que los instructores tomen varios pases de datos. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Dado un estimador, devuelva un objeto de ajuste que llamará a un delegado una vez Fit(IDataView) que se llame. A menudo, es importante que un estimador devuelva información sobre lo que cabe, por lo que el Fit(IDataView) método devuelve un objeto con tipo específico, en lugar de simplemente un general ITransformer. Sin embargo, al mismo tiempo, IEstimator<TTransformer> a menudo se forman en canalizaciones con muchos objetos, por lo que es posible que tengamos que crear una cadena de estimadores a través EstimatorChain<TLastTransformer> de donde el estimador para el que queremos obtener el transformador está enterrado en algún lugar de esta cadena. En ese escenario, podemos a través de este método adjuntar un delegado al que se llamará una vez que se llame a fit. |