Share via


Moving Average Filter

Wichtig

Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.

Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.

Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.

Erstellt einen gleitenden Durchschnittsfilter zum Glätten von Daten für Trendanalysen

Kategorie: Datentransformation / Filter

Hinweis

Giltnur für: Machine Learning Studio (klassisch)

Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.

Modulübersicht

In diesem Artikel wird beschrieben, wie Sie das Modul "Gleitender Mittelwertfilter" in Machine Learning Studio (klassisch) verwenden, um eine Reihe von einseitigen oder zweiseitigen Mittelwerten über ein Dataset zu berechnen, indem Sie eine von Ihnen angegebene Fensterlänge verwenden.

Nachdem Sie einen Filter definiert haben, der Ihren Anforderungen entspricht, können Sie ihn auf ausgewählte Spalten in einem Dataset anwenden, indem Sie ihn mit dem Modul "Filter anwenden" verbinden. Das Modul führt alle Berechnungen aus und ersetzt Werte in numerischen Spalten durch entsprechende gleitende Mittelwerte.

Sie können den daraus resultierenden gleitenden Durchschnitt für Grafiken und Visualisierung, als neue Glättungsgrundlage für die Modellierung, für die Berechnung von Abweichungen von den Berechnungen für ähnliche Zeiträume usw. verwenden.

Tipp

Müssen Sie Daten aus einem Dataset filtern oder fehlende Werte entfernen? Verwenden Sie stattdessen diese Module:

  • Fehlende Daten bereinigen: Verwenden Sie dieses Modul, um fehlende Werte zu entfernen oder fehlende Werte durch Platzhalter zu ersetzen.
  • Partition und Beispiel: Verwenden Sie dieses Modul, um Ihr Dataset nach Kriterien wie einem Datumsbereich, einem bestimmten Wert oder regulären Ausdrücken zu dividieren oder zu filtern.
  • Clip Values: Verwenden Sie dieses Modul, um einen Bereich festzulegen und nur die Werte innerhalb dieses Bereichs beizubehalten.

Grundlegendes und Verwenden von gleitenden Mittelwerten

Dieser Typ des Durchschnittswerts hilft Ihnen, hilfreiche Zeitmuster für Retrospektive und Echtzeitdaten zu entwickeln und zu prognostizieren. Die einfachste Art des gleitenden Durchschnitts beginnt bei der Stichprobe von Reihen und verwendet den Durchschnittswert dieser Position sowie die vorherigen n Positionen anstelle des tatsächlichen Werts. (Sie können n so definieren, wie Sie möchten.) Je länger der Zeitraum n ist, über den der Mittelwert berechnet wird, desto weniger Varianz haben Sie zwischen Werten. Wenn Sie die Anzahl der verwendeten Werte erhöhen, wirkt sich der einzelne Wert weniger stark auf den resultierenden Durchschnittswert aus.

Ein gleitender Durchschnitt kann einseitig oder zweiseitig sein. Bei einem einseitigen Durchschnitt werden nur die Werte vor dem Indexwert verwendet. Bei einem zweiseitigen Durchschnitt werden Werte aus der Vergangenheit und der Zukunft verwendet.

Für Szenarien, in denen Streamingdaten gelesen werden, sind kumulative und gewichtete gleitende Durchschnittswerte besonders nützlich. Ein kumulativer gleitender Durchschnittswert berücksichtigt die Punkte, die vor dem aktuellen Zeitraum liegen.

Sie können bei der Berechnung des Durchschnitts eine gleichmäßige Gewichtung für alle Datenpunkte festlegen, oder festlegen, dass Werte, die näher an dem aktuellen Datenpunkt liegen, stärker gewichtet werden. In einem gewichteten gleitenden Durchschnitt muss die Summe aller Gewichtungen 1 betragen.

In einem exponentiellen gleitenden Durchschnitt müssen die Durchschnittswerte aus einem Anfangs- und Endwert bestehen, die gewichtet werden können Ein leicht gewichteter Endwert bedeutet, dass der Endwert nah am Anfangswert liegt, sodass der Durchschnittswert ein ähnliches Verhalten wie ein gleitender Durchschnitt mit einem kurzen Gewichtungszeitraum aufweist. Bei stärkeren Endwertgewichtungen verhält sich der Durchschnittswert eher wie ein längerer einfacher gleitender Durchschnitt.

Konfigurieren des gleitenden Mittelwertfilters

  1. Fügen Sie dem Experiment das Modul "Gleitender Mittelwertfilter " hinzu. Dieses Modul finden Sie unter "Datentransformation" in der Kategorie "Filter ".

  2. Geben Sie für "Länge" einen positiven Gesamtzahlenwert ein, der die Gesamtgröße des Fensters definiert, über das der Filter angewendet wird. Dies wird auch als Filtermaske bezeichnet. Bei einem gleitenden Mittelwert bestimmt die Länge des Filters, wie viele Werte im Gleitfenster durchschnittliche Werte werden.

    Längere Filter werden auch als Filter mit höherer Reihenfolge bezeichnet und bieten ein größeres Berechnungsfenster und eine engere Annäherung der Trendlinie.

    Kürzere oder niedrigere Filter verwenden ein kleineres Berechnungsfenster und ähneln den ursprünglichen Daten genauer.

  3. Wählen Sie für "Typ" den Typ des zu übernehmenden gleitenden Mittelwerts aus.

    Machine Learning Studio (klassisch) unterstützt die folgenden Arten von gleitenden Durchschnittsberechnungen:

    Einfach: Ein einfacher gleitender Mittelwert (SMA) wird als ungewichtetes Rollmittel berechnet.

    Triangular: Triangular gleitende Mittelwerte (TMA) werden zweimal für eine glattere Trendlinie durchschnittliche. Das Wort triangular wird von der Form der Gewichtungen abgeleitet, die auf die Daten angewendet werden, wodurch zentrale Werte hervorgehoben werden.

    Exponentielles Einfaches: Ein exponentieller gleitender Durchschnitt (EMA) gibt den neuesten Daten mehr Gewicht. Die Gewichtung fällt exponentiell ab.

    Exponentiell: Ein geänderter exponentieller gleitender Durchschnitt berechnet einen laufenden gleitenden Durchschnitt, wobei die Berechnung des gleitenden Mittelwerts an jedem Punkt den zuvor berechneten gleitenden Durchschnitt an allen vorherigen Punkten betrachtet. Diese Methode führt zu einer reibungsloseren Trendlinie.

    Kumuliert: Angesichts eines einzelnen Punkts und eines aktuellen gleitenden Mittelwerts berechnet der kumulierte gleitende Mittelwert (CMA) am aktuellen Punkt.

  4. Fügen Sie das Dataset mit den Werten hinzu, für die Sie einen gleitenden Mittelwert berechnen möchten, und fügen Sie das Modul "Filter anwenden" hinzu.

    Verbinden den gleitenden Mittelwertfilter an die linke Eingabe des Apply Filters, und verbinden Sie das Dataset mit der rechten Eingabe.

  5. Verwenden Sie im Modul "Filter anwenden " die Spaltenauswahl, um anzugeben, auf welche Spalten der Filter angewendet werden soll. Standardmäßig wird die Filtertransformation auf alle numerischen Spalten angewendet, daher sollten Sie alle Spalten ausschließen, die keine geeigneten Daten besitzen.

  6. Führen Sie das Experiment aus.

    Für jede Gruppe von Werten, die durch den Filterlängenparameter definiert sind, wird der aktuelle (oder index) Wert durch den gleitenden Mittelwert ersetzt.

Beispiele

Beispiele für die Verwendung von Filtern im Maschinellen Lernen finden Sie in diesem Experiment im Azure AI-Katalog:

  • Filter: In diesem Experiment werden alle Filtertypen mit einem technischen Waveform-Dataset veranschaulicht.

Modulparameter

Name Range type Standard BESCHREIBUNG
Länge >=1 Integer 5 Legen Sie die Länge des Fensters für den gleitenden Durchschnitt fest.
Typ Any MovingAverageType Geben Sie den Typ des gleitenden Durchschnitts an, der erstellt werden soll.

Ausgaben

Name Typ BESCHREIBUNG
Filtern IFilter-Schnittstelle Filterimplementierung

Weitere Informationen

Filter
Anwenden eines Filters
Modulliste von A bis Z
Weitere Filterbeispiele