microsoftml.count_select: Featureauswahl basierend auf Anzahl
Verwendung
microsoftml.count_select(cols: [list, str], count: int = 1, **kargs)
BESCHREIBUNG
Wählt die Features aus, für die die Anzahl der nicht standardmäßigen Werte größer oder gleich einem Schwellenwert ist.
Details
Bei Verwendung des Zählmodus in der Transformation zur Auswahl von Features wird ein Feature ausgewählt, wenn die Anzahl der Beispiele mindestens die angegebene Anzahl von Beispielen mit nicht standardmäßigen Werten im Feature aufweist. Die Transformation zur Auswahl von Features im Zählmodus ist sehr nützlich, wenn sie zusammen mit einer kategorischen Hashtransformation angewendet wird (siehe auch categorical_hash
). Die anzahlbasierte Auswahl von Features kann die von der Hashtransformation generierten Features entfernen, die in den Beispielen keine Daten enthalten.
Argumente
cols
Gibt eine Zeichenfolge oder Liste mit den Namen der auszuwählenden Variablen an.
count
Der Schwellenwert für die anzahlbasierte Featureauswahl. Ein Feature wird unter der Voraussetzung ausgewählt, dass mindestens count
Beispiele einen nicht standardmäßigen Wert für das Feature aufweisen. Der Standardwert ist 1.
kargs
Zusätzliche Argumente, die an die Compute-Engine gesendet werden.
Gibt zurück
Ein Objekt, das die Transformation definiert.