Partager via


OneHotHashEncodingEstimator Classe

Définition

Convertit une ou plusieurs colonnes d’entrée de valeurs catégorielles en autant de colonnes de sortie de vecteurs codés à chaud basés sur un hachage.

public sealed class OneHotHashEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotHashEncodingTransformer>
type OneHotHashEncodingEstimator = class
    interface IEstimator<OneHotHashEncodingTransformer>
Public NotInheritable Class OneHotHashEncodingEstimator
Implements IEstimator(Of OneHotHashEncodingTransformer)
Héritage
OneHotHashEncodingEstimator
Implémente

Remarques

Caractéristiques de l’estimateur

Cet estimateur doit-il examiner les données pour entraîner ses paramètres ? Oui
Type de données de colonne d’entrée Scalaire ou vecteur de type numérique, booléen, texte ou clé .
Type de données de colonne de sortie Scalaire ou vecteur de clé ou vecteur de Single type.
Exportable vers ONNX Non

Le résultat OneHotEncodingTransformer convertit une ou plusieurs colonnes d’entrée en autant de colonnes de sortie de vecteurs codés à chaud, où l’indexation est effectuée en hachage de la valeur et en utilisant le hachage comme index.

Il OneHotEncodingEstimator est souvent utilisé pour convertir des données catégorielles en une forme qui peut être fournie à un algorithme De Machine Learning.

La sortie de cette transformation est spécifiée par OneHotEncodingEstimator.OutputKind:

  • Indicator produit un vecteur d’indicateur. Chaque emplacement de ce vecteur correspond à une catégorie du dictionnaire. Sa longueur représente donc la taille du dictionnaire généré. Si une valeur est introuvable dans le dictionnaire, la sortie est le vecteur zéro.

  • Bag produit un vecteur de sorte que chaque emplacement stocke le nombre d’occurrences de la valeur correspondante dans le vecteur d’entrée. Chaque emplacement de ce vecteur correspond à une valeur dans le dictionnaire. Sa longueur est donc la taille du dictionnaire généré. Indicator et Bag diffèrent simplement dans la façon dont les vecteurs binaires générés à partir d’emplacements individuels dans la colonne d’entrée sont agrégés : pour l’indicateur, ils sont concaténés et pour bag, ils sont ajoutés. Lorsque la colonne source est scalaire, les options Indicateur et Conteneur sont identiques.

  • Key produit des clés dans une KeyDataViewType colonne. Si la colonne d’entrée est un vecteur, la sortie contient un type de clé vectorielle, où chaque emplacement du vecteur correspond à l’emplacement respectif du vecteur d’entrée. Si une catégorie est introuvable dans le dictionnaire généré, elle reçoit la valeur zéro.

  • Binary produit un vecteur encodé binaire pour représenter les valeurs trouvées dans le dictionnaire présents dans la colonne d’entrée. Si une valeur dans la colonne d’entrée est introuvable dans le dictionnaire, la sortie est le vecteur zéro.

OneHotEncodingTransformer peut être appliqué à une ou plusieurs colonnes, auquel cas il génère et utilise un dictionnaire distinct pour chaque colonne à laquelle il est appliqué.

Consultez la section Voir aussi pour obtenir des liens vers des exemples d’utilisation.

Méthodes

Fit(IDataView)

Effectue l’apprentissage et retourne un OneHotHashEncodingTransformer.

GetOutputSchema(SchemaShape)

Retourne le SchemaShape schéma qui sera produit par le transformateur. Utilisé pour la propagation et la vérification du schéma dans un pipeline.

Méthodes d’extension

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Ajoutez un « point de contrôle de mise en cache » à la chaîne d’estimateur. Cela garantit que les estimateurs en aval seront entraînés par rapport aux données mises en cache. Il est utile d’avoir un point de contrôle de mise en cache avant les formateurs qui prennent plusieurs passes de données.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Étant donné un estimateur, retournez un objet de création de package de restrictions qui appellera un délégué une fois Fit(IDataView) appelé. Il est souvent important qu’un estimateur retourne des informations sur ce qui était adapté, c’est pourquoi la Fit(IDataView) méthode retourne un objet spécifiquement typé, plutôt que simplement un général ITransformer. Toutefois, en même temps, IEstimator<TTransformer> sont souvent formés en pipelines avec de nombreux objets. Nous pouvons donc avoir besoin de créer une chaîne d’estimateurs par EstimatorChain<TLastTransformer> le biais de laquelle l’estimateur pour lequel nous voulons obtenir le transformateur est enterré quelque part dans cette chaîne. Pour ce scénario, nous pouvons par le biais de cette méthode attacher un délégué qui sera appelé une fois l’ajustement appelé.

S’applique à

Voir aussi