Datentransformation – Filtern
Wichtig
Der Support für Machine Learning Studio (klassisch) endet am 31. August 2024. Es wird empfohlen, bis zu diesem Datum auf Azure Machine Learning umzustellen.
Ab dem 1. Dezember 2021 können Sie keine neuen Ressourcen in Machine Learning Studio (klassisch) mehr erstellen. Bis zum 31. August 2024 können Sie die vorhandenen Ressourcen in Machine Learning Studio (klassisch) weiterhin verwenden.
- Siehe Migrieren zu Azure Machine Learning
- Weitere Informationen zu Azure Machine Learning.
Die Dokumentation zu ML Studio (klassisch) wird nicht mehr fortgeführt und kann künftig nicht mehr aktualisiert werden.
In diesem Artikel wird beschrieben, wie Sie die Filtermodule in Machine Learning Studio (klassisch) verwenden können, um digitale Daten zu transformieren. Die Module in dieser Gruppe von Tools für Machine Learning Studio (klassisch) basieren auf Filtern, die für digitale Signalverarbeitungstechnologie entwickelt wurden.
Hinweis
Giltnur für: Machine Learning Studio (klassisch)
Ähnliche Drag & Drop-Module sind im Azure Machine Learning-Designer verfügbar.
Filter werden in der Regel auf Daten in der Datenverarbeitungsphase oder in der Vorverarbeitungsstufe angewendet. Filter verbessern die Klarheit des Signals, das für maschinelles Lernen verwendet wird. Sie können beispielsweise die Filtermodule in Machine Learning Studio (klassisch) für diese Verarbeitungsaufgaben verwenden:
- Bereinigen Sie Wellenformen, die für die Spracherkennung verwendet werden.
- Erkennen von Trends oder Beseitigen von saisonalen Auswirkungen in verrauschten Verkaufs- oder Wirtschaftsdaten.
- Analysieren Von Mustern oder Artefakten in Telemetriesignalen.
Diese Module bieten eine einfache Konfiguration von Filtern mithilfe von gut recherchierten Algorithmen zum mathematischen Transformieren von Wellenformdaten. Sie können auch einen benutzerdefinierten Filter erstellen, wenn Sie bereits die richtigen Koeffizienten zur Anwendung auf Ihre Daten ermittelt haben.
Zugehörige Aufgaben
Wenn Sie Aufgaben ausführen müssen, z. B. Daten aus einem Dataset auf Zeilenbasis auszuschließen, fehlende Werte zu entfernen oder die Größe eines Datasets zu verringern, verwenden Sie stattdessen diese Module:
- Fehlende Daten bereinigen: Entfernen Sie fehlende Werte, oder ersetzen Sie fehlende Werte durch Platzhalter.
- Partition und Beispiel: Dividieren oder Filtern Des Datasets mithilfe von Kriterien wie einem Datumsbereich, einem bestimmten Wert oder regulären Ausdrücken.
- Clip Values: Legen Sie einen Wertebereich fest, und behalten Sie nur die Werte innerhalb dieses Bereichs bei.
Filter in der digitalen Signalverarbeitung
Genauso wie Sie einen Filter an eine Kamera anfügen können, um Beleuchtung zu kompensieren oder Spezialeffekte zu erstellen, können Sie einen Filter auf die Daten anwenden, die Sie für maschinelles Lernen verwenden. Filter können dazu beitragen, die Klarheit eines Signals zu verbessern, interessante Merkmale zu erfassen oder Rauschen zu reduzieren.
Der ideale Filter würde alle Rauschen beseitigen und eine einheitliche Empfindlichkeit für das gewünschte Signal haben. Aber das Entwerfen eines ziemlich guten Filters kann viele Iterationen oder Kombinationen von Techniken dauern. Wenn Sie erfolgreich einen effektiven Filter entwerfen, sollten Sie den Filter speichern, damit Sie ihn wiederverwenden können, wenn Sie neue Daten transformieren.
Im Allgemeinen basiert eine Filterung auf den Grundsätzen der Wellenformanalyse. Wenn Sie einen Filter entwerfen, suchen Sie nach Möglichkeiten, Teile des Signals zu unterdrücken oder zu verstärken, zugrunde liegende Trends verfügbar zu machen, Rauschen und Störungen zu reduzieren oder Datenwerte zu identifizieren, die sonst möglicherweise nicht wahrgenommen werden.
Verschiedene Techniken werden angewendet, um einzelne Trends oder Wellenformkomponenten zu zersetzen, die tatsächliche Datenwerte erstellen. Die Wertereihe kann mithilfe von trigonometrischen Funktionen analysiert werden, um einzelne Wellenformen zu identifizieren und zu isolieren. (Dies gilt, ob es sich um eine ökonometrische Serie oder um die zusammengesetzten Frequenzen von Audiosignalen handelt.) Filter können dann auf diese Wellenform angewendet werden, um Rauschen zu beseitigen, einige Wellen zu verstärken oder gezielte Komponenten zu entfernen.
Wenn Filter auf eine verrauschte Reihe angewendet werden, um verschiedene Komponenten zu isolieren, können Sie angeben, welche Frequenzen entfernt oder verstärkt werden sollen, indem Sie das Frequenzband angeben, mit dem gearbeitet werden soll:
Digitale Filter in Machine Learning Studio (klassisch)
Die folgenden Filtertypen werden in Machine Learning Studio (klassisch) unterstützt:
- Filter basierend auf der Abkomposition von Wellenform. Beispiele sind endliche Impulsantwort (FIR) und unendliche Impulsreaktionsfilter (IIR). Diese Filter funktionieren, indem bestimmte Komponenten aus einer Gesamtreihe entfernt werden. Anschließend können Sie die vereinfachte Wellenform anzeigen und untersuchen.
- Filter auf Basis gleitender Mittelwerte oder Medianwerte. Diese Filter glätten Variationen in einer Datenreihe, indem sie über Zeitfenster mitteln. Die Zeitfenster können fest oder gleitend sein, außerdem kann Ihre Form variieren. Ein dreieckiges Fenster hat z. B. ein Maximum beim aktuellen Datenpunkt (gewichtet den aktuellen Wert stärker) und schwächt sich vor und nach dem Datenpunkt ab (gewichtet vorausgehende und folgende Werte geringer).
- Benutzerdefinierte oder angepasste Filter. Wenn Sie bereits die Transformationen kennen, die auf eine Datenreihe angewendet werden sollen, können Sie einen benutzerdefinierten Filter erstellen. Sie stellen die numerischen Koeffizienten bereit, die angewendet werden, um die Datenreihe zu transformieren. Ein benutzerdefinierter Filter kann einen FIR- oder IIR-Filter emulieren. Mit einem benutzerdefinierten Filter haben Sie jedoch mehr Kontrolle über die Werte, die an jedem Punkt in der Datenreihe angewendet werden sollen.
Filterterminologie
Die folgende Liste enthält einfache Definitionen von Begriffen, die in den Parametern und Eigenschaften von Filtern verwendet werden:
- Passband: Der Bereich der Frequenzen, die durch einen Filter übergeben werden können, ohne abgeschwächt oder abgeschwächt zu werden.
- Stopband: Ein Bereich von Frequenzen zwischen angegebenen Grenzwerten, durch die Signale nicht übergeben werden. Sie definieren ein Sperrband, indem Sie Grenzfrequenzen festlegen.
- Hoher Pass: Lassen Sie nur hohe Frequenzen durch.
- Low Pass: Akzeptieren Sie nur Frequenzen unter einem angegebenen Ausschnittwert.
- Ecke: Definiert die Grenze zwischen der Stoppband- und Passbandfrequenz. In der Regel können Sie entscheiden, ob die Eckfrequenz in das Band ein- oder davon ausgeschlossen ist. Ein Erstreihenfolgenfilter bewirkt eine graduelle Dämpfung bis zur Eckenfrequenz. Danach verursacht der Filter die exponentielle Dämpfung. Höhergeordnete Filter (z. B. Butterworth- und Chebyshev-Filter) haben steilere Pisten nach der Eckenhäufigkeit. Höhergeordnete Filter hindern die Werte im Stoppband viel schneller und vollständiger an.
- Bandtop-Filter (auch als Band ablehnen filter oder Notchfilter bezeichnet): Hat nur einen Stoppband. Sie definieren das Stoppband, indem Sie zwei Frequenzen angeben: die hohe Cut-Off-Frequenz und die abgeschnittene Frequenz. Ein Bandpassfilter verfügt in der Regel über zwei Stoppbänder: eine auf einer seite der gewünschten Komponente.
- Wellen: Eine kleine, unerwünschte Variation, die regelmäßig auftritt. In Machine Learning können Sie die Menge an Wellen angeben, die als Teil der Parameter im IIR-Filterentwurf toleriert werden sollen.
Tipp
Benötigen Sie weitere Informationen? Wenn Sie neu bei der digitalen Signalverarbeitung sind, lesen Sie eine Einführung in die digitale Signalverarbeitung. Die Website bietet Definitionen und hilfreiche visuelle Hilfen, die grundlegende Terminologie und Konzepte erläutern.
Liste der Module
Die folgenden Module sind in der Kategorie "Datentransformation - Filter " enthalten:
- Filter anwenden: Wendet einen Filter auf angegebene Spalten eines Datasets an.
- FIR-Filter: Erstellt einen FIR-Filter für die Signalverarbeitung.
- IIR-Filter: Erstellt einen IIR-Filter für die Signalverarbeitung.
- Medianfilter: Erstellt einen Medianfilter, der verwendet wird, um Daten für die Trendanalyse zu glätten.
- Gleitender Mittelwertfilter: Erstellt einen gleitenden Mittelwertfilter, der Daten für die Trendanalyse glättet.
- Schwellenwertfilter: Erstellt einen Schwellenwertfilter, der Werte einschränkt.
- Benutzerdefinierter Filter: Erstellt einen benutzerdefinierten FIR- oder IIR-Filter.