Megosztás a következőn keresztül:


Értékek levágása

Ez a cikk az Azure Machine Learning Designer egy összetevőjét ismerteti.

Az Értékek kivágása összetevővel azonosíthatja és igény szerint lecserélheti a megadott küszöbérték feletti vagy alatti adatértékeket középértékre, állandóra vagy más helyettesítő értékre.

Az összetevőt egy olyan adatkészlethez csatlakoztatja, amely tartalmazza a kivágni kívánt számokat, kiválasztja a használni kívánt oszlopokat, majd beállít egy küszöbértéket vagy értéktartományt, valamint egy helyettesítő módszert. Az összetevő csak az eredményeket, vagy az eredeti adatkészlethez hozzáfűzött módosított értékeket tudja kimenetként kiadni.

Klipértékek konfigurálása

Mielőtt hozzákezdene, azonosítsa a kivágni kívánt oszlopokat és a használni kívánt metódust. Javasoljuk, hogy először az adatok egy kis részhalmazán tesztelje a kivágási módszereket.

Az összetevő ugyanazokat a feltételeket és cseremetódusokat alkalmazza a kijelölésben szereplő összes oszlopra. Ezért mindenképpen zárja ki azokat az oszlopokat, amelyeket nem szeretne módosítani.

Ha kivágási módszereket vagy más feltételeket kell alkalmaznia egyes oszlopokra, minden hasonló oszlopkészlethez új Clip Values-példányt kell használnia.

  1. Adja hozzá a Clip Values összetevőt a folyamathoz, és csatlakoztassa a módosítani kívánt adatkészlethez. Ezt az összetevőt az Adatátalakítás területen, a Skálázás és csökkentés kategóriában találja.

  2. Az Oszlopok listájában az Oszlopkijelölő használatával válassza ki azokat az oszlopokat, amelyekre a clip values értéket alkalmazni szeretné.

  3. A Küszöbértékek halmaza beállításnál válasszon az alábbi lehetőségek közül a legördülő listából. Ezek a beállítások határozzák meg az elfogadható értékek és a levágandó értékek felső és alsó határainak beállítását.

    • ClipPeaks: Ha csúcsok szerint vágja ki az értékeket, csak a felső határt adja meg. Az ennél a határértéknél nagyobb értékek lecserélődnek.

    • ClipSubpeaks: Ha az értékeket altevékenységek szerint vágja ki, csak egy alsó határt ad meg. A határértéknél kisebb értékeket a rendszer lecseréli.

    • ClipPeaksAndSubpeaks: Ha csúcsok és alrészek szerint vágja ki az értékeket, megadhatja a felső és az alsó határt is. Az adott tartományon kívüli értékek lecserélődnek. A határértékekkel egyező értékek nem változnak.

  4. Az előző lépésben kiválasztott értéktől függően a következő küszöbértékeket állíthatja be:

    • Alsó küszöbérték: Csak akkor jelenik meg, ha a ClipSubPeaks lehetőséget választja
    • Felső küszöbérték: Csak akkor jelenik meg, ha a ClipPeaks lehetőséget választja
    • Küszöbérték: Csak akkor jelenik meg, ha a ClipPeaksAndSubPeaks lehetőséget választja

    Minden küszöbértéktípushoz válassza a Constant (Állandó ) vagy a Percentilis (Percentilis) lehetőséget.

  5. Ha az Állandó lehetőséget választja, írja be a maximális vagy minimális értéket a szövegmezőbe. Tegyük fel például, hogy tudja, hogy a 999 értéket helyőrző értékként használták. A felső küszöbértékhez a Konstans lehetőséget választhatja, a felső küszöbértékhez pedig a 999 értéket.

  6. Ha a Percentilis lehetőséget választja, az oszlopértékeket percentilistartományra korlátozza.

    Tegyük fel például, hogy csak a 10–80 percentilistartomány értékeit szeretné megtartani, és az összes többit lecserélni. Válassza a Percentilis lehetőséget, majd írja be a 10 értéket az alsó küszöbérték percentilisértékeként, a percentilisértéket pedig a 80 értéket a felső küszöbértékhez.

    A percentilistartományok használatának néhány példáját a percentilisek szakaszában találja.

  7. Adjon meg egy helyettesítő értéket.

    A megadott határokkal pontosan egyező számok az engedélyezett értéktartományon belülre kerülnek, így nem lesznek lecserélve. A megadott tartományon kívül eső összes szám lecserélődik a helyettesítő értékre.

    • Csúcsérték helyettesítése: A megadott küszöbértéknél nagyobb összes oszlopérték helyettesítésére szolgáló értéket határozza meg.
    • Altevékenységek helyettesítési értéke: A megadott küszöbértéknél kisebb összes oszlopérték helyettesítőjeként használandó értéket határozza meg.
    • Ha a ClipPeaksAndSubpeaks beállítást használja, külön helyettesítő értékeket adhat meg a felső és az alsó levágott értékekhez.

    A következő helyettesítő értékek támogatottak:

    • Küszöbérték: A levágott értékeket a megadott küszöbértékre cseréli.

    • Középérték: A levágott értékeket az oszlopértékek középértékére cseréli. A középérték kiszámítása az értékek levágása előtt történik.

    • Medián: A levágott értékeket az oszlopértékek mediánjára cseréli. A medián kiszámítása az értékek kivágása előtt történik.

    • Hiányzik. A levágott értékeket a hiányzó (üres) értékre cseréli.

  8. Mutatóoszlopok hozzáadása: Válassza ezt a lehetőséget, ha olyan új oszlopot szeretne létrehozni, amely közli, hogy a megadott kivágási művelet alkalmazva van-e az adott sor adataira. Ez a lehetőség akkor hasznos, ha új kivágási és helyettesítési értékkészletet tesztel.

  9. Felülírás jelző: Adja meg, hogyan szeretné létrehozni az új értékeket. Alapértelmezés szerint az Értékek kivágása egy új oszlopot hoz létre, amely a csúcsértékeket a kívánt küszöbértékre vágja. Az új értékek felülírják az eredeti oszlopot.

    Ha meg szeretné tartani az eredeti oszlopot, és új oszlopot szeretne hozzáadni a levágott értékekkel, törölje a jelölést.

  10. Küldje el a folyamatot.

    Kattintson a jobb gombbal az Értékek kivágása összetevőre, válassza az Összetevő megjelenítése vagy kijelölése lehetőséget, és váltson a jobb oldali panel Kimenetek lapjára, kattintson a portkimenetek hisztogram ikonjára az értékek áttekintéséhez, és győződjön meg arról, hogy a kivágási művelet megfelel az elvárásoknak.

Példák a percentilisekkel végzett kivágáshoz

A percentilisek szerinti kivágás működésének megértéséhez fontolja meg egy 10 sorból álló adatkészletet, amelynek mindegyik értéke 1–10.

  • Ha a percentilist használja felső küszöbértékként, a 90. percentilis értékénél az adathalmaz összes értékének 90%-ának ennél az értéknél kisebbnek kell lennie.

  • Ha a percentilist használja alsó küszöbértékként, a 10. percentilis értékénél az adathalmaz összes értékének 10 százalékának ennél az értéknél kisebbnek kell lennie.

  1. A Küszöbértékek halmaza beállításnál válassza a ClipPeaksAndSubPeaks lehetőséget.

  2. A Felső küszöbérték mezőben válassza a Percentilis lehetőséget, a Percentilisszám mezőben pedig írja be a 90 értéket.

  3. A Felső helyettesítő érték beállításnál válassza a Hiányzó érték lehetőséget.

  4. Az Alsó küszöbérték beállításnál válassza a Percentilis lehetőséget, és a Percentilisszám mezőbe írja be a 10 értéket.

  5. Az Alsó helyettesítő érték mezőben válassza a Hiányzó érték lehetőséget.

  6. Törölje a Jelölés felülírása jelölőnégyzet jelölését, és válassza a Mutatóoszlop hozzáadása lehetőséget.

Most próbálja meg ugyanazt a folyamatot, amely a felső percentilis küszöbértékének 60-asát, az alsó percentilis küszöbértékét pedig 30-at használ, és használja a küszöbértéket helyettesítő értékként. Az alábbi táblázat az alábbi két eredményt hasonlítja össze:

  1. Cserélje le a elemet hiányzóra; Felső küszöbérték = 90; Alsó küszöbérték = 20

  2. Cserélje le a elemet küszöbértékre; Felső percentilis = 60; Alsó percentilis = 40

Eredeti adatok Csere hiányzóra Csere küszöbértékre
1

2

3

4

5

6

7

8

9

10
IGAZ

IGAZ

3, HAMIS

4, HAMIS

5, HAMIS

6, HAMIS

7, HAMIS

8, HAMIS

9, HAMIS

IGAZ
4, IGAZ

4, IGAZ

4, IGAZ

4, IGAZ

5, HAMIS

6, HAMIS

7, IGAZ

7, IGAZ

7, IGAZ

7, IGAZ

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .