Szűrő alkalmazása
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Szűrő alkalmazása egy adatkészlet megadott oszlopaira
Kategória: Adatátalakítás / szűrő
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk bemutatja, hogyan használhatja a Machine Learning Studio Szűrő alkalmazása modulját egy értékoszlop egy korábban definiált szűrő alkalmazásával való átalakítására. A szűrők a digitális jelfeldolgozásban a zaj csökkentésére vagy egy mintázat kiemelésére használhatók. Így az átalakított értékek mindig numerikusak, és általában valamilyen hang- vagy vizuális jelet képviselnek.
Tipp
Más típusú szűrőt keres? A Studio (klasszikus) a következő modulokat biztosítja az adatok mintavételezéséhez, az adatok egy részhalmazának lekért létrehozásához, a hibás értékek eltávolításához, vagy tesztelési és betanító készletek létrehozásához: Adatok felosztása, Hiányzó adatok törlése, Partíció és minta, Átalakítás SQL alkalmazása, Clip Values. Ha szűrni kell az adatokat egy forrásból való beolvasás során, tekintse meg az Adatok importálása adatokat. A beállítások a forrás típusától függnek.
Miután meghatározta, hogy melyik szűrőtípus a legmegfelelőbb az adatforrás számára, meg kell adnia a paramétereket, és a Szűrő alkalmazása használatával kell átalakítania az adatkészletet. Mivel a szűrők kialakítása elkülönül a szűrők alkalmazásának folyamatán, a szűrők újrahasználhatók. Ha például gyakran dolgozik előrejelzéshez használt adatokkal, több típusú mozgóátlagos szűrőt is tervezhet több modell betanítása és összehasonlítása érdekében. A szűrőt mentheti is, ha más kísérletekre vagy különböző adatkészletekre is alkalmaznia kell.
Szűrő alkalmazása beállítás konfigurálása
Adja hozzá a Szűrő alkalmazása modult a kísérlethez. Az IIR szűrőmodul az Adatátalakítás alatt, a Szűrők kategóriában található .
A jobb oldali bemenethez kösse össze a numerikus értékeket tartalmazó adatkészletet egy bemenettel.
A bal oldali bemenethez kössen össze egy meglévő szűrőt. Használhat újra egy mentett szűrőt, vagy konfigurálhat egy szűrőt a következő szűrőmodulok egyikével: Küszöbértékszűrő, Mozgóátlagszűrő, Középértékszűrő, IIR-szűrő, FIR-szűrő, Felhasználó által definiált szűrő.
A Szűrő alkalmazása panel Tulajdonságok panelen kattintson az Oszlopválasztó indítása elemre, és válassza ki azokat az oszlopokat, amelyekre a szűrőt alkalmazni kell.
Futtassa a kísérletet, vagy kattintson a jobb gombbal a Szűrő alkalmazása elemre , és kattintson a Futtatás kiválasztva lehetőségre.
Results (Eredmények)
A kimenet csak a kiválasztott oszlopokban lévő adatokat tartalmazza, és a megadott előre definiált matematikai átalakítás alkalmazásával lesz átalakítva.
Ha az adatkészlet többi oszlopát szeretné látni, az Oszlopok hozzáadása modullal egyesítheti az eredeti és a szűrt adatkészleteket.
Megjegyzés
Az eredeti oszlop értékeit nem törölték vagy írják felül, és továbbra is elérhetők a kísérletben referenciaként. A szűrő kimenete azonban általában jobban használható modellezéshez.
Példák
Példák a szűrők gépi tanulásban való használatára: Azure AI Gallery:
- Szűrők: Az összes szűrőtípust bemutatja egy tervezett hullámforma adatkészlet használatával.
Technikai megjegyzések
Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.
A Szűrő alkalmazása modul a megadott szűrőtípust a kijelölt oszlopokhoz köti. Ha különböző típusú szűrőket kell alkalmaznia a különböző oszlopokra, az Adatkészlet oszlopainak kijelölése használatával különítse el az oszlopokat, és alkalmazza a különböző szűrőtípusokat külön munkafolyamatokban. További információ: Select Columns in Dataset (Adatkészlet oszlopainak kijelölése).
A szűrők nem haladnak át a szűrő által nem érintett adatoszlopon. Ez azt jelenti, hogy a Szűrő alkalmazása kimenete csak az átalakított numerikus értékeket tartalmazza. Az Oszlopok hozzáadása modullal azonban össze is illesztheti az átalakított értékeket a forrásadatkészlethez.
Szűrési időszakok
A szűrési időszakot részben a szűrő típusa határozza meg, az alábbiak szerint:
Véges válasz (FIR), egyszerű mozgóátlag és triangular mozgóátlagos szűrők használatakor a szűrési időszak véges.
Végtelen válaszidő (IIR), exponenciális mozgóátlag és összesített mozgóátlag-szűrőknél a szűrési időszak végtelen.
Küszöbérték-szűrők esetén a szűrési időszak mindig 1.
A középértékszűrők esetén a szűrőidőszaktól függetlenül a bemeneti jel NaN-ekkel és hiányzó értékekkel nem hoz létre új NaN-eket a kimenetben.
Hiányzó értékek
Ez a szakasz azt ismerteti, hogy hogyan viselkedik a rendszer hiányzó értékek esetén, szűrőtípus szerint. Ha egy szűrő általában Egy NaN vagy egy hiányzó értékkel találkozik a bemeneti adatkészletben, a kimeneti adatkészlet néhány további minta esetében NaN-ekkel lesz megrongált, a szűrési időszaktól függően. Ez a következő következményekkel jár:
Az FIR, az egyszerű mozgóátlag vagy a triangular mozgóátlag szűrő véges időszakra van beszűkülve. Ennek eredményeképpen a hiányzó értékeket a szűrési sorrend 1-ével egyenlő NaN érték követi.
Az IIR-, exponenciális mozgóátlag- vagy halmozott mozgóátlag-szűrők végtelen időszakra vannak felsülve. Ennek eredményeképpen az első hiányzó érték beátlálása után a NaN-eket a végtelenségig propagálják.
A küszöbérték-szűrőben a küszöbérték-szűrő időszaka 1. Ennek eredményeképpen a hiányzó értékek és a NaN értékek nem propagálnak.
A középértékszűrők esetén a bemeneti adatkészletben észlelt NaN-értékek és hiányzó értékek nem hoznak létre új NaN-eket a kimenetben, a szűrési időszaktól függetlenül.
Várt bemenetek
Név | Típus | Description |
---|---|---|
Szűrő | IFilter interfész | Szűrő implementációja |
Adathalmaz | Adattábla | Bemeneti adatkészlet |
A Studio (klasszikus) moduljaival kapcsolatos hibák listájáért tekintse meg a Machine Learning hibakódokat.
Az API-kivételek listáját a hibakódok Machine Learning REST API.
Modulparaméterek
Name | Tartomány | Típus | Alapértelmezett | Description |
---|---|---|---|---|
Oszlopkészlet | Bármelyik | ColumnSelection (Oszlopválasztás) | NumericAll | Válassza ki a szűrni kívánt oszlopokat |
Kimenet
Név | Típus | Description |
---|---|---|
Eredményadatkészlet | Adattábla | Kimeneti adatkészlet |