Ändern von Anzahltabellenparametern

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Ändert die Parameter, die zum Erstellen von Features aus Zählungen verwendet werden.

Kategorie: Learning mit Anzahlen

Hinweis

Gilt nur für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Modify Count Table Parameters in Machine Learning Studio (klassisch) verwenden, um die Art und Weise zu ändern, wie Features aus einer Zähltabelle generiert werden.

Um count-basierte Features zu erstellen, verwenden Sie im Allgemeinen Build Counting Transform , um ein Dataset zu verarbeiten und eine Zähltabelle zu erstellen, und aus dieser Zähltabelle wird ein neuer Satz von Features generiert.

Wenn Sie jedoch bereits eine Zähltabelle erstellt haben, können Sie das Modul Modify Count Table Parameters verwenden, um die Definition der Verarbeitung der Zähldaten zu bearbeiten. Auf diese Weise können Sie basierend auf den vorhandenen Daten einen anderen Satz von zahlenbasierten Statistiken erstellen, ohne das Dataset erneut analysieren zu müssen.

Konfigurieren von Parametern zum Ändern der Anzahl

  1. Suchen Sie die Transformation, die Sie ändern möchten, in der Gruppe Transformationen , und fügen Sie sie Ihrem Experiment hinzu.

    Sie sollten zuvor ein Experiment ausgeführt haben, das eine Transformation für die Anzahl erstellt hat.

    • So ändern Sie eine gespeicherte Transformation: Suchen Sie die Transformation in der Gruppe Transformationen , und fügen Sie sie Ihrem Experiment hinzu.

    • So ändern Sie eine Im selben Experiment erstellte Anzahltransformation: Wenn die Transformation nicht gespeichert wurde, aber als Ausgabe im aktuellen Experiment verfügbar ist (überprüfen Sie z. B. die Ausgabe des Moduls Build Counting Transform ), können Sie sie direkt verwenden, indem Sie die Module verbinden.

  2. Fügen Sie das Modul Modify Count Table Parameters hinzu, und verbinden Sie die Transformation als Eingabe.

  3. Geben Sie im Bereich Eigenschaften des Moduls Modify Count Table Parameters (Tabellenparameter ändern) einen Wert ein, der alsGarbage-Bin-Schwellenwert verwendet werden soll.

    Dieser Wert gibt die Mindestanzahl von Vorkommen an, die für jeden Featurewert gefunden werden müssen, damit die Anzahl verwendet werden kann. Wenn die Häufigkeit des Werts kleiner als der Garbage Bin-Schwellenwert ist, wird das Wertbezeichnungspaar nicht als diskretes Element gezählt. Stattdessen werden alle Elemente, deren Anzahl unter dem Schwellenwert liegt, in einem einzelnen "Garbage Bin" platziert.

    Wenn Sie ein kleines Dataset verwenden und die gleichen Daten zählen und trainieren, ist ein guter Anfangswert 1.

  4. Geben Sie für Zusätzliche vorherige Pseudobeispiele eine Zahl ein, die die Anzahl zusätzlicher Pseudobeispiele angibt, die eingeschlossen werden sollen. Sie müssen diese Beispiele nicht angeben. Die Pseudobeispiele werden basierend auf der vorherigen Verteilung generiert.

  5. Geben Sie für laplacsche Rauschskala einen positiven Gleitkommawert ein, der die Skala darstellt, die für die Einführung von Rauschen verwendet wird, das aus einer Laplacian-Verteilung entnommen wird. Wenn Sie einen Skalierungswert festlegen, wird ein akzeptabler Rauschpegel in das Modell integriert, sodass das Modell weniger wahrscheinlich von unbekannten Werten in Den Daten betroffen ist.

  6. Wählen Sie unter Ausgabefeatures einschließen die Methode aus, die beim Erstellen von count-basierten Features für die Einbeziehung in die Transformation verwendet werden soll.

    • CountsOnly: Erstellen Sie Features mithilfe von Zählungen.

    • LogOddsOnly: Erstellen Sie Features mithilfe des Protokolls des Wahrscheinlichkeitsverhältnisses.

    • BothCountsAndLogOdds: Erstellen Sie Features mit sowohl Zähler- als auch Protokollwahrscheinlichkeiten.

  7. Wählen Sie die Option Rückblendspalte ignorieren aus , wenn Sie das IsBackOff Flag in der Ausgabe beim Erstellen von Features überschreiben möchten. Wenn Sie diese Option auswählen, werden count-basierte Features auch dann erstellt, wenn die Spalte keine signifikanten Anzahlwerte aufwies.

  8. Führen Sie das Experiment aus. Anschließend können Sie die Ausgabe von Parameter für Die Anzahl der Tabellen ändern bei Bedarf als neue Transformation speichern.

Beispiele

Beispiele für dieses Modul finden Sie im Azure KI-Katalog:

  • Learning mit Anzahl: Binäre Klassifizierung: Veranschaulicht, wie das Lernen mit Zählungsmodulen verwendet wird, um Features aus Spalten kategorischer Werte für ein binäres Klassifizierungsmodell zu generieren.

  • Learning mit Anzahl: Multiklassenklassifizierung mit NYC-Taxidaten: Beispiel veranschaulicht, wie das Lernen mit Zählmodulen zum Durchführen der Multiklassenklassifizierung für das öffentlich verfügbare NYC-Taxidataset verwendet wird. Im Beispiel wird ein logistisches Regressionslernmodell mit mehreren Klassen verwendet, um dieses Problem zu modellieren.

  • Learning mit Anzahlen: Binäre Klassifizierung mit NYC-Taxidaten: Veranschaulicht, wie das Lernen mit Zählmodulen zum Durchführen der binären Klassifizierung für das öffentlich verfügbare NYC-Taxidataset verwendet wird. Im Beispiel wird ein logistisches Regressionslernmodell mit zwei Klassen verwendet, um dieses Problem zu modellieren.

Technische Hinweise

Dieser Abschnitt enthält Implementierungsdetails, Tipps und Antworten auf häufig gestellte Fragen.

Es ist statistisch gesehen sicher, die Zählung und das Training für dasselbe Dataset durchzuführen, wenn Sie den Laplace-Rauschskalaparameter festlegen.

Erwartete Eingaben

Name Type Beschreibung
Zählen der Transformation ITransform-Schnittstelle Die zu übernehmende Zähltransformation

Modulparameter

Name Typ Range Optional Standard Beschreibung
Garbage bin threshold Float >=0,0f Erforderlich 10.0f Der Schwellenwert, unter dem ein Spaltenwert für den Garbage Bin angegeben wird
Additional prior pseudo examples Float >=0,0f Erforderlich 42.0f Die zusätzlichen Pseudobeispiele nach vorherigen Distributionen, die eingeschlossen werden sollen
Laplacian noise scale Float >=0,0f Erforderlich 0.0f Die Skalierung der Laplacian-Verteilung, aus der Rauschen entnommen wird
Output features include OutputFeatureType Erforderlich BothCountsAndLogOdds Die funktionen, die ausgegeben werden sollen
Ignore back off column Boolean Erforderlich false Gibt an, ob die IsBackOff-Spalte in der Ausgabe ignoriert werden soll.

Ausgaben

Name Type Beschreibung
Geänderte Transformation ITransform-Schnittstelle Die geänderte Transformation

Ausnahmen

Ausnahme Beschreibung
Fehler 0003 Eine Ausnahme tritt auf, wenn mindestens eine Eingabe NULL oder leer ist.
Fehler 0086 Eine Ausnahme tritt auf, wenn eine Zähltransformation ungültig ist.

Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.

Eine Liste der API-Ausnahmen finden Sie unter Machine Learning REST-API-Fehlercodes.

Siehe auch

Lernen mit Zählungen