Share via


Anwenden eines Filters

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Wendet ein Filter auf angegebene Spalten eines Datasets an

Kategorie: Datentransformation/Filter

Hinweis

Gilt für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul Filter anwenden in Machine Learning Studio (klassisch) verwenden, um eine Spalte mit Werten durch Anwenden eines zuvor definierten Filters zu transformieren. Filter werden bei der Verarbeitung digitaler Signale verwendet, um Rauschen zu reduzieren oder ein Muster hervorzuheben. Daher sind die Werte, die Sie transformieren, immer numerisch und stellen in der Regel eine Art audio- oder visuelles Signal dar.

Tipp

Suchen Sie nach einem anderen Filtertyp? Studio (klassisch) bietet diese Module zum Sampling von Daten, zum Abrufen einer Teilmenge von Daten, zum Entfernen fehlerhafter Werte oder zum Erstellen von Test- und Trainingssätzen: Split Data, Clean Missing Data, Partition and Sample, Apply SQL Transformation, Clip Values. Wenn Sie Daten filtern müssen, während Sie sie aus einer Quelle lesen, finden Sie weitere Informationen unter Importieren von Daten. Die Optionen hängen vom Quelltyp ab.

Nachdem Sie bestimmt haben, welcher Filtertyp für Ihre Datenquelle am besten ist, geben Sie die Parameter an und verwenden Filter anwenden , um das Dataset zu transformieren. Da Filter unabhängig vom Prozess ihrer Anwendung konzipiert werden, können sie mehrmals verwendet werden. Wenn Sie z. B. häufig mit Daten arbeiten, die für die Planung verwendet werden, können Sie verschiedene Filter mit gleitendem Durchschnitt zum Trainieren und Vergleichen mehrerer Modelle entwerfen. Sie können den Filter auch speichern, um ihn auf andere Experimente oder andere Datasets anzuwenden.

Konfigurieren von Filter anwenden

  1. Fügen Sie Ihrem Experiment das Modul Filter anwenden hinzu. Sie finden das IIR-Filtermodul unter Datentransformation in der Kategorie Filter.

  2. Verbinden Sie mit der rechten Eingabe ein Dataset, das numerische Werte enthält, mit einer Eingabe.

  3. Verbinden Sie mit der linken Eingabe einen vorhandenen Filter. Sie können einen gespeicherten Filter erneut verwenden oder einen Filter mithilfe eines der folgenden Filtermodule konfigurieren: Schwellenwertfilter, Filter für den gleitender Durchschnitt, Medianfilter, IIR-Filter, FIR-Filter, benutzerdefinierter Filter.

  4. Klicken Sie im Bereich Eigenschaften von Filter anwenden auf Spaltenauswahl starten , und wählen Sie die Spalten aus, auf die der Filter angewendet werden soll.

  5. Führen Sie das Experiment aus, oder klicken Sie mit der rechten Maustaste auf Filter anwenden , und klicken Sie auf Ausgewählte ausführen.

Ergebnisse

Die Ausgabe enthält nur die Daten in den ausgewählten Spalten, die durch Anwenden der angegebenen vordefinierten mathematischen Transformation transformiert werden.

Wenn Sie andere Spalten im Dataset sehen möchten, können Sie das Modul Spalten hinzufügen verwenden, um die ursprünglichen und gefilterten Datasets zusammen zu führen.

Hinweis

Die Werte in der ursprünglichen Spalte wurden nicht gelöscht oder überschrieben und stehen im Experiment weiterhin als Referenz zur Verfügung. Die Ausgabe des Filters ist jedoch in der Regel nützlicher für die Modellierung.

Beispiele

Beispiele für die Verwendung von Filtern beim maschinellen Lernen finden Sie im Azure KI-Katalog:

  • Filter: Veranschaulicht alle Filtertypen mithilfe eines entwickelten Waveform-Datasets.

Technische Hinweise

Dieser Abschnitt enthält Implementierungsdetails, Tipps und Antworten auf häufig gestellte Fragen.

  • Das Modul Filter anwenden bindet den angegebenen Filtertyp an die ausgewählten Spalten. Wenn Sie verschiedene Filtertypen auf verschiedene Spalten anwenden müssen, sollten Sie Spalten im Dataset auswählen verwenden, um die Spalten zu isolieren und verschiedene Filtertypen in separaten Workflows anzuwenden. Weitere Informationen finden Sie unter Auswählen von Spalten im Dataset.

  • Die Filter werden nicht auf Datenspalten angewendet, die nicht von ihnen betroffen sind. Das heißt, die Ausgabe von Apply Filter enthält nur die transformierten numerischen Werte. Sie können jedoch das Modul Spalten hinzufügen verwenden, um transformierte Werte mit dem Quell-Dataset zu verbinden.

Filtern von Zeiträumen

Der Filterzeitraum wird teilweise wie folgt durch den Filtertyp bestimmt:

  • Für FIR (Finite Impulse Response)-Filter, einfache Filter mit gleitendem Durchschnitt und dreieckige Filter mit gleitendem Durchschnitt ist die Filterlänge begrenzt.

  • Für FIR (Finite Impulse Response)-Filter, exponentielle Filter mit gleitendem Durchschnitt und kumulative Filter mit gleitendem Durchschnitt ist die Filterlänge unbegrenzt.

  • Bei Schwellenwertfiltern ist die Filterlänge immer 1.

  • Bei Medianfiltern erzeugen NaNs und fehlende Werte im Eingangssignal unabhängig von der Filterlänge in der Ausgabe keine neuen NaN-Werte.

Fehlende Werte

In diesem Abschnitt wird das Verhalten bei fehlenden Werten nach Filtertyp beschrieben. Wenn ein Filter im Eingabe-Dataset auf einen NaN oder einen fehlenden Wert trifft, wird das Ausgabe-Dataset in der Regel mit NaNs für einige nächste Anzahl von Stichproben gekautet, je nach Filterzeitraum. Das hat folgende Konsequenzen:

  • FIR, einfache gleitender Durchschnitt oder dreieckige Filter für den gleitender Durchschnitt haben einen begrenzten Zeitraum. Daher folgt auf alle fehlenden Werte eine Anzahl von NaNs, die der Filter reihenfolge minus eins entspricht.

  • IIR,exponentieller gleitender Durchschnitt oder kumulative Filter für den gleitenden Durchschnitt haben einen unendlichen Zeitraum. Nachdem der erste fehlende Wert gefunden wurde, werden NaNs daher weiterhin unbegrenzt weitervererbbar.

  • In einem Schwellenwertfilter beträgt der Zeitraum eines Schwellenwertfilters 1. Daher werden fehlende Werte und NaNs nicht mehr angegeben.

  • Bei Medianfiltern erzeugen NaNs und fehlende Werte, die im Eingangssignal festgestellt werden, unabhängig von der Filterlänge in der Ausgabe keine neuen NaNs.

Erwartete Eingaben

Name Type BESCHREIBUNG
Filtern IFilter-Schnittstelle Filterimplementierung
Dataset Datentabelle Eingabedataset

Eine Liste der Fehler, die für Studio-Module (klassisch) spezifisch sind, finden Sie unter Machine Learning Fehlercodes.

Eine Liste der API-Ausnahmen finden Sie unter Machine Learning REST-API-Fehlercodes.

Modulparameter

Name Range type Standard Beschreibung
Spaltensatz Any ColumnSelection NumericAll Wählen Sie die zu filternden Spalten aus.

Output

Name Type Beschreibung
Ergebnisdataset Datentabelle Ausgabedataset

Siehe auch

Filter
Modulliste von A bis Z