microsoftml.count_select : sélectionne les caractéristiques en fonction du nombre
Usage
microsoftml.count_select(cols: [list, str], count: int = 1, **kargs)
Description
Sélectionne les caractéristiques pour lesquelles le nombre de valeurs autres que les valeurs par défaut est supérieur ou égal à un seuil.
Détails
Lorsque vous utilisez le mode de comptage dans la transformation de sélection de caractéristiques, une caractéristique est sélectionnée si le nombre d’exemples possède au moins le nombre spécifié d’exemples de valeurs explicites (autres que les valeurs par défaut) dans la caractéristique. La transformation de sélection de caractéristiques du mode de comptage est très utile lorsqu’elle est appliquée avec une transformation de hachage catégorique (voir aussi categorical_hash
). La sélection de caractéristiques du mode de comptage peut supprimer les caractéristiques générées par la transformation de hachage n’ayant pas de données dans les exemples.
Arguments
cols
Spécifie la chaîne de caractères ou la liste des noms des variables à sélectionner.
count
Seuil pour la sélection des caractéristiques en fonction de la valeur de comptage. Une caractéristique est sélectionnée si et seulement si elle comporte une valeur autre que la valeur par défaut dans au moins count
des exemples. La valeur par défaut est 1.
kargs
Arguments supplémentaires envoyés au moteur de calcul.
Retours
Objet définissant la transformation.