Megosztás a következőn keresztül:


Átalakítás mutatóértékekké

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Kategorikus értékeket alakít át az oszlopokban jelző értékekké

Kategória: Adatátalakítás /-manipuláció

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk bemutatja, hogyan használható a Convert to Indicator Values (Jelzőértékek konvertálása) modul a Machine Learning Studióban (klasszikus). Ennek a modulnak az a célja, hogy kategorikus értékeket tartalmazó oszlopokat bináris jelzőoszlopokká alakítsunk, amelyek könnyebben használhatók jellemzőkként egy gépi tanulási modellben.

A jelzőértékekké konvertálás konfigurálása

  1. Adja hozzá a Convert to Indicator Values (Állapotjelző értékekké) modult a Machine Learning-kísérlethez, és csatlakoztassa a konvertálni kívánt oszlopokat tartalmazó adatkészlethez. Ezt a modult az Adatátalakítások alatt, a Manipuláció kategóriában találja .

  2. Az Oszlopválasztóval válasszon ki egy vagy több kategorikus oszlopot.

    Ha biztosítani szeretné, hogy a kiválasztott oszlopok kategorikusak, használja a Metaadatok szerkesztése a konvertálás előtt Mutatóértékekké beállítás előtt lehetőséget, hogy kategorikusként jelölje meg a céloszlopot.

  3. Válassza a Kategorikus oszlopok felülírása lehetőséget, ha csak az új logikai oszlopokat szeretné kiírni.

    Ez a beállítás alapértelmezés szerint ki van kapcsolva, így a kapcsolódó jelzőoszlopokkal együtt láthatja a forrást tartalmazó kategorikus oszlopot.

    Tipp

    Ha a felülírás lehetőséget választja, a forrásoszlop ténylegesen nem törlődik vagy módosul. Ehelyett az új oszlopok létrejönnek és jelennek meg a kimeneti adatkészletben, és a forrásoszlop elérhető marad a munkaterületen. Ha látnia kell az eredeti adatokat, bármikor használhatja az Oszlopok hozzáadása modult, hogy újra hozzáadja a forrásoszlopot.

  4. Futtassa a kísérletet.

Results (Eredmények)

Tegyük fel például, hogy van egy pontszámokat tartalmazó oszlopa, amely azt jelzi, hogy egy kiszolgáló meghibásodásának nagy, közepes vagy alacsony a valószínűsége.

Kiszolgálóazonosító Hibapontszám
10301 Alacsony
10302 Közepes
10303 Magas

A Konvertálás jelzőértékekké alkalmazásakor a címkék egyetlen oszlopa több oszlopra lesz konvertálva, amelyek logikai értékeket tartalmaznak:

Kiszolgálóazonosító Hibapontszám – Alacsony Hibapontszám – Közepes Hibapontszám – Magas
10301 1 0 0
10302 0 1 0
10303 0 0 1

Az átalakítás működése a következő:

  • A kockázatokat leíró Hibapontszám oszlopban csak három lehetséges érték van (Magas, Közepes és Alacsony), és nincs hiányzó érték. Ezért pontosan három új oszlop jön létre.

  • Az új jelzőoszlopok a forrásoszlop oszlopfejlécei és értékei alapján vannak elnevezve a következő mintával: <forrásoszlop>- <adatérték>.

  • Egy 1-nek kell lennie pontosan egy jelzőoszlopban, és 0-nak az összes többi jelzőoszlopban. Ennek az az oka, hogy minden kiszolgáló csak egy kockázati minősítéssel rendelkezik.

Most már használhatja a három jelzőoszlopot jellemzőként, és elemezheti a korrelációjukat a különböző kockázati szinthez társított más tulajdonságokkal.

Példák

A modul használatára az alábbi Azure AI Gallery:

  • Mellrák észlelése: A betegeket a betegek azonosítószáma alapján csoportosítják, majd a Indicator Values (Mutatóértékek) segítségével megjelöli, hogy a páciens melyik csoporthoz tartozik. Később a csoportmutatókat a modellek pontozásakor használjuk.

  • Közvetlen marketing: A valószínűségeket egy konstanssal hasonlítjuk össze a Matematikai műveletek alkalmazása művelettel , és az Igen/Nem értékeket, amelyek jelzik, hogy a pontszám a konstans felett vagy alatt volt-e, új jelzőoszlopokként lesz beforgatva.

  • Hálózati behatolásészlelés: A naplóadatok az Azure Storage-ból töltődnek be. A osztályváltozót (amely leírja például, hogy egy támadás rootkészlet vagy puffertúlcsordulás-e) kategorikus oszlopká lesz konvertálva, majd több jelzőértékre lesz kibontva.

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, tippeket és válaszokat tartalmazza a gyakori kérdésekre.

Használati tippek

  • Csak a kategorikusként megjelölt oszlopok konvertálhatók jelzőoszlopokká. Ha ezt a hibát látja, valószínű, hogy az egyik kiválasztott oszlop nem kategorikus:

    0056-os hiba: A névvel <> oszlopnévvel jelzett oszlop nem tartozik egy engedélyezett kategóriába.

    Alapértelmezés szerint a legtöbb sztringoszlopot sztring jellemzőkként kezeli a rendszer, ezért azokat kategorikusként kell megjelölnie a Metaadatok szerkesztése funkcióval.

  • Ha nem jelöl ki legalább egy kategorikus oszlopot, hibaüzenet jelenik meg.

  • A jelzőoszlopokká konvertálható oszlopok száma nincs korlátozva. Mivel azonban az értékek minden oszlopa több jelzőoszlopot is eredményez, érdemes lehet egyszerre csak néhány oszlopot konvertálni és áttekintetni.

  • Ha az oszlop hiányzó értékeket tartalmaz, egy külön jelzőoszlop jön létre a hiányzó kategóriához, a következő névvel: <source column>- Missing

  • Ha a jelzőértékekké konvertált oszlop számokat tartalmaz, azokat kategorikusként kell megjelölni, mint bármely más jellemzőoszlopot. Ezt követően a számok diszkrét értékekként vannak kezelve. Ha például egy 25 és 30 közötti MPG-értékeket tartalmazó numerikus oszloppal van, minden különálló értékhez új jelzőoszlop jön létre:

    Gyártó Highway mpg -25 Highway mpg -26 Highway mpg -27 Highway mpg -28 Highway mpg -29 Highway mpg -30
    Alfa Ekkor 0 0 0 0 0 1

    A jelzőoszlopok nagy számának elkerülése érdekében javasoljuk, hogy először ellenőrizze az oszlopban lévő értékek számát, és jelölje ki vagy számszerűsítse megfelelően az adatokat.

Várt bemenetek

Név Típus Description
Adathalmaz Adattábla Adatkészlet kategorikus oszlopokkal

Modulparaméterek

Name Tartomány Típus Alapértelmezett Description
Átalakítható kategorikus oszlopok Bármelyik ColumnSelection (Oszlopválasztás) Jelöljön ki kategorikus oszlopokat a mutatómátikákká való átalakításhoz.
Kategorikus oszlopok felülírása Bármelyik Logikai hamis Ha igaz, írja felül a kijelölt kategorikus oszlopokat; Ellenkező esetben fűzheti hozzá az eredményül kapott jelző mátrixokat az adatkészlethez.

Kimenet

Név Típus Description
Eredményadatkészlet Adattábla Jelzőmát mátrixokká konvertált kategorikus oszlopokat tartalmazó adatkészlet.

Lásd még

Manipuláció
Adatátalakítás
A-Z modullista