Sdílet prostřednictvím


Použít filtr

Důležité

Podpora studia Machine Learning (Classic) skončí 31. srpna 2024. Doporučujeme do tohoto data přejít na službu Azure Machine Learning.

Od 1. prosince 2021 nebude možné vytvářet nové prostředky studia Machine Learning (Classic). Do 31. srpna 2024 můžete pokračovat v používání stávajících prostředků studia Machine Learning (Classic).

Dokumentace ke studiu ML (Classic) se vyřazuje z provozu a v budoucnu se nemusí aktualizovat.

Použije filtr na zadané sloupce datové sady.

Kategorie: Transformace a filtrování dat

Poznámka

Platí pro: Machine Learning Studio (classic)

Podobné moduly s přetahováním jsou k dispozici v Azure Machine Learning návrháři.

Přehled modulu

Tento článek popisuje, jak pomocí modulu Použít filtr v Machine Learning Studiu (klasickém) transformovat sloupec hodnot použitím dříve definovaného filtru. Filtry se používají při zpracování digitálních signálů ke snížení šumu nebo zvýraznění vzoru. Proto hodnoty, které transformujete, jsou vždy číselné a obvykle představují nějaký druh zvukového nebo vizuálního signálu.

Tip

Hledáte jiný typ filtru? Studio (klasické) poskytuje tyto moduly pro vzorkování dat, získání podmnožiny dat, odebrání chybných hodnot nebo vytvoření testovacích a trénovacích sad: Rozdělenídat, Vyčištění chybějících dat, Oddíl a ukázka, Použití SQL transformace, Oříznutí hodnot. Pokud potřebujete filtrovat data při čtení ze zdroje, přečtěte si o importu dat. Možnosti závisí na typu zdroje.

Jakmile určíte, který typ filtru je pro váš zdroj dat nejlepší, zadáte parametry a k transformaci datové sady použijete použít filtr. Vzhledem k tomu, že návrh filtrů je oddělený od procesu použití filtru, jsou filtry znovu použitelné. Pokud například často pracujete s daty používanými pro prognózování, můžete navrhnout několik typů klouzavých průměrů filtrů pro trénování a porovnání více modelů. Filtr můžete také uložit, aby se mohl použít pro jiné experimenty nebo pro různé datové sady.

Jak nakonfigurovat použití filtru

  1. Přidejte do experimentu modul Použít filtr. Modul filtru IIR najdete v části Transformace dat v kategorii Filtry .

  2. Ke vstupu na pravé straně připojte datovou sadu, která obsahuje číselné hodnoty, k jednomu vstupu.

  3. K levému vstupu připojte existující filtr. Uložený filtr můžete znovu použít nebo můžete nakonfigurovat filtr pomocí jednoho z následujících modulů filtru: Filtr prahových hodnot, Filtr klouzavý průměr, Filtr mediánu, Filtr IIR, Filtr FIR, Uživatelem definovaný filtr.

  4. V podokně Vlastnosti v části Použít filtr klikněte na Spustit selektor sloupců a zvolte sloupce, na které se má filtr použít.

  5. Spusťte experiment nebo klikněte pravým tlačítkem na Použít filtr a klikněte na Spustit vybrané.

Výsledky

Výstup obsahuje pouze data ve vybraných sloupcích transformovaná použitím zadané předdefinované matematické transformace.

Pokud chcete v datové sadě zobrazit další sloupce, můžete původní a filtrované datové sady sloučit pomocí modulu Přidat sloupce.

Poznámka

Hodnoty v původním sloupci nebyly odstraněny ani přepsány a jsou stále k dispozici v experimentu pro referenci. Výstup filtru je ale obvykle užitečnější pro modelování.

Příklady

Příklady použití filtrů ve strojové učení najdete v Azure AI Gallery:

  • Filtry: Demonstruje všechny typy filtrů pomocí inženýrované datové sady waveform.

Technické poznámky

Tato část obsahuje podrobnosti o implementaci, tipy a odpovědi na nejčastější dotazy.

  • Modul Použít filtr váže zadaný typ filtru na vybrané sloupce. Pokud potřebujete použít různé typy filtrů na různé sloupce, měli byste sloupce izolovat pomocí možnosti Vybrat sloupce v datové sadě a použít různé typy filtrů v samostatných pracovních postupech. Další informace najdete v tématu Výběr sloupců v datové sadě.

  • Filtry neprocházejí datovými sloupci, které nejsou filtrem ovlivněny. To znamená, že výstup funkce Použít filtr obsahuje pouze transformované číselné hodnoty. K spojení transformovaných hodnot se zdrojovou datovou sadou ale můžete použít modul Přidat sloupce.

Období filtru

Období filtru je určeno částečně typem filtru následujícím způsobem:

  • U konečných filtrů citlivostní odpovědi (FIR), jednoduchého klouzavýho průměru a trojúhelníkového klouzavýho průměru je období filtru konečné.

  • Pro nekonečné impulzy (IIR), exponenciální klouzavý průměr a filtry kumulativního klouzavýho průměru je období filtru nekonečné.

  • U filtrů prahových hodnot je období filtru vždy 1.

  • U mediánových filtrů, bez ohledu na období filtru, hodnoty NaN a chybějící hodnoty ve vstupním signálu nevytvářejí ve výstupu nové hodnoty NaN.

Chybějící hodnoty

Tato část popisuje chování při zobrazení chybějících hodnot podle typu filtru. Obecně platí, že pokud filtr narazí na NaN nebo chybějící hodnotu ve vstupní datové sadě, výstupní datová sada se v závislosti na období filtru nasytá s naN pro nějaký další počet vzorků. To má následující důsledky:

  • Filtry FIR, jednoduchý klouzavý průměr nebo trojúhelníkový klouzavý průměr mají konečné období. Za každou chybějící hodnotou tak bude následovat počet naN, který se rovná pořadí filtru minus jedna.

  • Filtry IIR, exponenciální klouzavý průměr nebo kumulativní klouzavý průměr mají nekonečné období. Výsledkem je, že po tom, co se zjistí první chybějící hodnota, se naN budou dál šířovat po neomezenou dobu.

  • Ve filtru prahových hodnot je období filtru prahových hodnot 1. V důsledku toho se chybějící hodnoty a naN nešířují.

  • U mediánových filtrů nevytvářejí hodnoty NaN a chybějící hodnoty ve vstupní datové sadě ve výstupu nové hodnoty NaN bez ohledu na období filtru.

Očekávané vstupy

Název Typ Description
Filtrovat IFilter – rozhraní Implementace filtru
Datová sada Tabulka dat Vstupní datová sada

Seznam chyb specifických pro moduly sady Studio (classic) najdete v Machine Learning kódy chyb.

Seznam výjimek rozhraní API najdete v tématu Machine Learning REST API kódy chyb.

Parametry modulu

Name Rozsah Typ Výchozí Description
Sada sloupců Všechny Výběr sloupce NumericAll Výběr sloupců k filtrování

Výstup

Název Typ Description
Datová sada výsledků Tabulka dat Výstupní datová sada

Viz také

Filtr
Seznam modulů A až Z