Share via


Gegevenstransformatie - Filteren

Belangrijk

De ondersteuning voor Azure Machine Learning-studio (klassiek) eindigt op 31 augustus 2024. U wordt aangeraden om vóór die datum over te stappen naar Azure Machine Learning.

Vanaf 1 december 2021 kunt u geen nieuwe resources voor Azure Machine Learning-studio (klassiek) meer maken. Tot en met 31 augustus 2024 kunt u de bestaande resources van Azure Machine Learning-studio (klassiek) blijven gebruiken.

De documentatie van ML-studio (klassiek) wordt buiten gebruik gesteld en wordt in de toekomst mogelijk niet meer bijgewerkt.

In dit artikel wordt beschreven hoe u de filtermodules in Machine Learning Studio (klassiek) kunt gebruiken om digitale gegevens te transformeren. De modules in deze groep hulpprogramma's voor Machine Learning Studio (klassiek) zijn gebaseerd op filters die zijn ontwikkeld voor digitale signaalverwerkingstechnologie.

Notitie

Van toepassing op: alleen Machine Learning Studio (klassiek)

Vergelijkbare modules voor slepen en neerzetten zijn beschikbaar in Azure Machine Learning designer.

Filters worden doorgaans toegepast op gegevens in de gegevensverwerkingsfase of de voorverwerkingsfase. Filters verbeteren de helderheid van het signaal dat wordt gebruikt voor machine learning. U kunt bijvoorbeeld de filtermodules in Machine Learning Studio (klassiek) gebruiken voor deze verwerkingstaken:

  • Golfvormen opschonen die worden gebruikt voor spraakherkenning.
  • Trends detecteren of seizoensgebonden effecten verwijderen in lawaaierige verkoop- of economische gegevens.
  • Analyseer patronen of artefacten in telemetriesignalen.

Deze modules bieden eenvoudige configuratie van filters met behulp van goed onderzochte algoritmen om golfvormgegevens wiskundig te transformeren. U kunt ook een aangepast filter maken als u al de juiste coëfficiënten hebt bepaald die u op uw gegevens wilt toepassen.

Als u taken wilt uitvoeren, zoals het uitsluiten van gegevens uit een gegevensset op rijbasis, het verwijderen van ontbrekende waarden of het verkleinen van de grootte van een gegevensset, gebruikt u deze modules:

  • Ontbrekende gegevens opschonen: ontbrekende waarden verwijderen of ontbrekende waarden vervangen door tijdelijke aanduidingen.
  • Partitie en voorbeeld: uw gegevensset delen of filteren met behulp van criteria zoals een datumbereik, een specifieke waarde of reguliere expressies.
  • Clipwaarden: Stel een bereik met waarden in en bewaar alleen de waarden binnen dat bereik.

Filters in digitale signaalverwerking

Net zoals u een filter aan een camera kunt koppelen om verlichting te compenseren of speciale effecten te creëren, kunt u een filter toepassen op de gegevens die u gebruikt voor machine learning. Filters kunnen helpen de helderheid van een signaal te verbeteren, interessante kenmerken vast te leggen of ruis te verminderen.

Het ideale filter elimineert alle ruis en heeft een uniforme gevoeligheid voor het gewenste signaal. Maar het ontwerpen van zelfs een behoorlijk goed filter kan veel iteraties of combinaties van technieken duren. Als u een effectief filter kunt ontwerpen, kunt u overwegen het filter op te slaan, zodat u het opnieuw kunt gebruiken wanneer u nieuwe gegevens transformeert.

Over het algemeen is filteren gebaseerd op de principes van waveform-analyse. Wanneer u een filter ontwerpt, zoekt u naar manieren om delen van het signaal te onderdrukken of te versterken, onderliggende trends bloot te stellen, ruis en interferentie te verminderen of gegevenswaarden te identificeren die anders mogelijk niet worden waargenomen.

Verschillende technieken worden toegepast op afzonderlijke trends of waveform-onderdelen die werkelijke gegevenswaarden maken. De reeks waarden kan worden geanalyseerd met behulp van trigonometrische functies om afzonderlijke golfvormen te identificeren en te isoleren. (Dit is waar, of het nu gaat om een econometrische serie of de samengestelde frequenties van audiosignalen.) Filters kunnen vervolgens worden toegepast op deze golfvormen om ruis te elimineren, sommige golven te versterken of gerichte onderdelen te verwijderen.

Wanneer filteren wordt toegepast op een ruisreeks om verschillende onderdelen te isoleren, kunt u opgeven welke frequenties moeten worden verwijderd of versterkt door de band met frequenties op te geven waarmee moet worden gewerkt.

Digitale filters in Machine Learning Studio (klassiek)

De volgende typen filters worden ondersteund in Machine Learning Studio (klassiek):

  • Filters op basis van golfvormdecompositie. Voorbeelden hiervan zijn FIR-filters (eindige impulsrespons) en oneindige impulsrespons (IIR). Deze filters werken door specifieke onderdelen uit een algemene reeks te verwijderen. Vervolgens kunt u de vereenvoudigde golfvorm bekijken en onderzoeken.
  • Filters op basis van zwevende gemiddelden of mediaanwaarden. Met deze filters worden variaties in een gegevensreeks gladgestreken door gemiddeld te berekenen tussen tijdvensters. De vensters kunnen worden vastgezet of geschoven en kunnen verschillende vormen hebben. Een driehoekig venster piekt bijvoorbeeld op het huidige gegevenspunt (weegt de huidige waarde sterker) en staart voor en na het gegevenspunt (gewichten vóór en na de waarden minder sterk).
  • Door de gebruiker gedefinieerde of aangepaste filters. Als u al weet welke transformaties moeten worden toegepast op een gegevensreeks, kunt u een door de gebruiker gedefinieerd filter maken. U geeft de numerieke coëfficiënten op die worden toegepast om de gegevensreeks te transformeren. Een aangepast filter kan een FIR- of IIR-filter emuleren. Met een aangepast filter hebt u echter meer controle over de waarden die u op elk punt in de reeks wilt toepassen.

Terminologie filteren

De volgende lijst bevat eenvoudige definities van termen die worden gebruikt in de parameters en eigenschappen van filters:

  • Passband: het bereik van frequenties dat door een filter kan lopen zonder te worden gedempt of verzwakt.
  • Stopband: Een bereik van frequenties tussen de opgegeven limieten waarmee signalen niet worden doorgegeven. U definieert de stopband door cut-off frequenties in te stellen.
  • Hoge doorvoer: Laat alleen hoge frequenties door.
  • Lage pass: Accepteer alleen frequenties onder een opgegeven cut-off-waarde.
  • Hoek: Definieert de grens tussen de frequenties van de stopband en de wachtwoordband. Normaal gesproken hebt u de mogelijkheid om te bepalen of de hoek is opgenomen in of uitgesloten van de band. Een eerstevolgordefilter veroorzaakt geleidelijke verzwaring tot de hoekfrequentie. Daarna veroorzaakt het filter exponentieel demping. Filters met een hogere volgorde (zoals Butterworth- en Chebyshev-filters) hebben steilere hellingen na de hoekfrequentie. Filters met een hogere volgorde verzwaeien de waarden in de stopband veel sneller en volledig.
  • Bandstopfilter (ook wel een bandkeuringsfilter of een notchfilter genoemd): heeft slechts één stopband. U definieert de stopband door twee frequenties op te geven: de hoge cut-offfrequentie en de lage cut-offfrequentie. Een bandpassfilter heeft doorgaans twee stopbands: één aan beide zijden van het gewenste onderdeel.
  • Rimpel: Een kleine, ongewenste variatie die periodiek optreedt. In Machine Learning kunt u de hoeveelheid rimpeling opgeven die moet worden getolereerd als onderdeel van de parameters in het IIR-filterontwerp.

Tip

Meer informatie nodig? Als u niet bekend bent met digitale signaalverwerking, raadpleegt u Een inleiding tot digitale signaalverwerking. De website biedt definities en nuttige visuele hulpmiddelen die basisterminologie en concepten uitleggen.

Lijst met modules

De volgende modules zijn opgenomen in de categorie Gegevenstransformatie - Filter :

Zie ook