Partager via


OneHotEncodingEstimator Classe

Définition

Convertit une ou plusieurs colonnes d’entrée de valeurs catégorielles en autant de colonnes de sortie de vecteurs codés à chaud.

public sealed class OneHotEncodingEstimator : Microsoft.ML.IEstimator<Microsoft.ML.Transforms.OneHotEncodingTransformer>
type OneHotEncodingEstimator = class
    interface IEstimator<OneHotEncodingTransformer>
Public NotInheritable Class OneHotEncodingEstimator
Implements IEstimator(Of OneHotEncodingTransformer)
Héritage
OneHotEncodingEstimator
Implémente

Remarques

Caractéristiques de l’estimateur

Cet estimateur doit-il examiner les données pour entraîner ses paramètres ? Oui
Type de données de colonne d’entrée Vecteur ou scalaire de type numérique, booléen, texteDateTime ou clé.
Type de données de colonne de sortie Scalaire ou vecteur de clé ou vecteur de Single type.
Exportable vers ONNX Oui

Le OneHotEncodingEstimator dictionnaire de valeurs uniques apparaît dans la colonne d’entrée. Le résultat OneHotEncodingTransformer convertit une ou plusieurs colonnes d’entrée en autant de colonnes de sortie de vecteurs codés à chaud.

Il OneHotEncodingEstimator est souvent utilisé pour convertir des données catégorielles en une forme qui peut être fournie à un algorithme De Machine Learning.

La sortie de cette transformation est spécifiée par OneHotEncodingEstimator.OutputKind:

  • Indicator produit un vecteur d’indicateur. Chaque emplacement de ce vecteur correspond à une catégorie du dictionnaire. Sa longueur représente donc la taille du dictionnaire généré. Si une valeur est introuvable dans le dictioray, la sortie est le vecteur zéro.

  • Bag produit un vecteur de sorte que chaque emplacement stocke le nombre de occurrences de la valeur correspondante dans le vecteur d’entrée. Chaque emplacement de ce vecteur correspond à une valeur dans le dictionnaire. Sa longueur est donc la taille du dictionnaire généré. Indicator et Bag diffèrent simplement dans la façon dont les vecteurs binaires générés à partir d’emplacements individuels dans la colonne d’entrée sont agrégés : pour l’indicateur, ils sont concaténés et pour bag, ils sont ajoutés. Lorsque la colonne source est scalaire, les options Indicateur et Conteneur sont identiques.

  • Key produit des clés dans une KeyDataViewType colonne. Si la colonne d’entrée est un vecteur, la sortie contient un type de clé vectorielle, où chaque emplacement du vecteur correspond à l’emplacement respectif du vecteur d’entrée. Si une catégorie est introuvable dans le dictionnaire bulit, elle reçoit la valeur zéro.

  • Binary produit un vecteur encodé binaire pour représenter les valeurs trouvées dans le dictionnaire présents dans la colonne d’entrée. Si une valeur dans la colonne d’entrée est introuvable dans le dictionnaire, la sortie est le vecteur zéro.

OneHotEncodingTransformer peut être appliqué à une ou plusieurs colonnes, auquel cas il génère et utilise un dictionnaire distinct pour chaque colonne à laquelle il est appliqué.

Consultez la section Voir aussi pour obtenir des liens vers des exemples d’utilisation.

Méthodes

Fit(IDataView)

Effectue l’apprentissage et retourne un OneHotEncodingTransformer.

GetOutputSchema(SchemaShape)

Retourne le SchemaShape schéma qui sera produit par le transformateur. Utilisé pour la propagation et la vérification du schéma dans un pipeline.

Méthodes d’extension

AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment)

Ajoutez un « point de contrôle de mise en cache » à la chaîne d’estimateur. Cela garantit que les estimateurs en aval seront entraînés par rapport aux données mises en cache. Il est utile d’avoir un point de contrôle de mise en cache avant les formateurs qui prennent plusieurs passes de données.

WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>)

Étant donné un estimateur, retournez un objet de création de package de restrictions qui appellera un délégué une fois Fit(IDataView) appelé. Il est souvent important qu’un estimateur retourne des informations sur ce qui était adapté, c’est pourquoi la Fit(IDataView) méthode retourne un objet spécifiquement typé, plutôt que simplement un général ITransformer. Toutefois, en même temps, IEstimator<TTransformer> sont souvent formés en pipelines avec de nombreux objets. Nous pouvons donc avoir besoin de créer une chaîne d’estimateurs par EstimatorChain<TLastTransformer> le biais de laquelle l’estimateur pour lequel nous voulons obtenir le transformateur est enterré quelque part dans cette chaîne. Pour ce scénario, nous pouvons par le biais de cette méthode attacher un délégué qui sera appelé une fois l’ajustement appelé.

S’applique à

Voir aussi