Átalakítás mutatóértékekké
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Kategorikus értékeket alakít át az oszlopokban jelző értékekké
Kategória: Adatátalakítás /-manipuláció
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk bemutatja, hogyan használható a Convert to Indicator Values (Jelzőértékek konvertálása) modul a Machine Learning Studióban (klasszikus). Ennek a modulnak az a célja, hogy kategorikus értékeket tartalmazó oszlopokat bináris jelzőoszlopokká alakítsunk, amelyek könnyebben használhatók jellemzőkként egy gépi tanulási modellben.
A jelzőértékekké konvertálás konfigurálása
Adja hozzá a Convert to Indicator Values (Állapotjelző értékekké) modult a Machine Learning-kísérlethez, és csatlakoztassa a konvertálni kívánt oszlopokat tartalmazó adatkészlethez. Ezt a modult az Adatátalakítások alatt, a Manipuláció kategóriában találja .
Az Oszlopválasztóval válasszon ki egy vagy több kategorikus oszlopot.
Ha biztosítani szeretné, hogy a kiválasztott oszlopok kategorikusak, használja a Metaadatok szerkesztése a konvertálás előtt Mutatóértékekké beállítás előtt lehetőséget, hogy kategorikusként jelölje meg a céloszlopot.
Válassza a Kategorikus oszlopok felülírása lehetőséget, ha csak az új logikai oszlopokat szeretné kiírni.
Ez a beállítás alapértelmezés szerint ki van kapcsolva, így a kapcsolódó jelzőoszlopokkal együtt láthatja a forrást tartalmazó kategorikus oszlopot.
Tipp
Ha a felülírás lehetőséget választja, a forrásoszlop ténylegesen nem törlődik vagy módosul. Ehelyett az új oszlopok létrejönnek és jelennek meg a kimeneti adatkészletben, és a forrásoszlop elérhető marad a munkaterületen. Ha látnia kell az eredeti adatokat, bármikor használhatja az Oszlopok hozzáadása modult, hogy újra hozzáadja a forrásoszlopot.
Futtassa a kísérletet.
Results (Eredmények)
Tegyük fel például, hogy van egy pontszámokat tartalmazó oszlopa, amely azt jelzi, hogy egy kiszolgáló meghibásodásának nagy, közepes vagy alacsony a valószínűsége.
Kiszolgálóazonosító | Hibapontszám |
---|---|
10301 | Alacsony |
10302 | Közepes |
10303 | Magas |
A Konvertálás jelzőértékekké alkalmazásakor a címkék egyetlen oszlopa több oszlopra lesz konvertálva, amelyek logikai értékeket tartalmaznak:
Kiszolgálóazonosító | Hibapontszám – Alacsony | Hibapontszám – Közepes | Hibapontszám – Magas |
---|---|---|---|
10301 | 1 | 0 | 0 |
10302 | 0 | 1 | 0 |
10303 | 0 | 0 | 1 |
Az átalakítás működése a következő:
A kockázatokat leíró Hibapontszám oszlopban csak három lehetséges érték van (Magas, Közepes és Alacsony), és nincs hiányzó érték. Ezért pontosan három új oszlop jön létre.
Az új jelzőoszlopok a forrásoszlop oszlopfejlécei és értékei alapján vannak elnevezve a következő mintával: <forrásoszlop>- <adatérték>.
Egy 1-nek kell lennie pontosan egy jelzőoszlopban, és 0-nak az összes többi jelzőoszlopban. Ennek az az oka, hogy minden kiszolgáló csak egy kockázati minősítéssel rendelkezik.
Most már használhatja a három jelzőoszlopot jellemzőként, és elemezheti a korrelációjukat a különböző kockázati szinthez társított más tulajdonságokkal.
Példák
A modul használatára az alábbi Azure AI Gallery:
Mellrák észlelése: A betegeket a betegek azonosítószáma alapján csoportosítják, majd a Indicator Values (Mutatóértékek) segítségével megjelöli, hogy a páciens melyik csoporthoz tartozik. Később a csoportmutatókat a modellek pontozásakor használjuk.
Közvetlen marketing: A valószínűségeket egy konstanssal hasonlítjuk össze a Matematikai műveletek alkalmazása művelettel , és az Igen/Nem értékeket, amelyek jelzik, hogy a pontszám a konstans felett vagy alatt volt-e, új jelzőoszlopokként lesz beforgatva.
Hálózati behatolásészlelés: A naplóadatok az Azure Storage-ból töltődnek be. A osztályváltozót (amely leírja például, hogy egy támadás rootkészlet vagy puffertúlcsordulás-e) kategorikus oszlopká lesz konvertálva, majd több jelzőértékre lesz kibontva.
Technikai megjegyzések
Ez a szakasz az implementáció részleteit, tippeket és válaszokat tartalmazza a gyakori kérdésekre.
Használati tippek
Csak a kategorikusként megjelölt oszlopok konvertálhatók jelzőoszlopokká. Ha ezt a hibát látja, valószínű, hogy az egyik kiválasztott oszlop nem kategorikus:
0056-os hiba: A névvel <> oszlopnévvel jelzett oszlop nem tartozik egy engedélyezett kategóriába.
Alapértelmezés szerint a legtöbb sztringoszlopot sztring jellemzőkként kezeli a rendszer, ezért azokat kategorikusként kell megjelölnie a Metaadatok szerkesztése funkcióval.
Ha nem jelöl ki legalább egy kategorikus oszlopot, hibaüzenet jelenik meg.
A jelzőoszlopokká konvertálható oszlopok száma nincs korlátozva. Mivel azonban az értékek minden oszlopa több jelzőoszlopot is eredményez, érdemes lehet egyszerre csak néhány oszlopot konvertálni és áttekintetni.
Ha az oszlop hiányzó értékeket tartalmaz, egy külön jelzőoszlop jön létre a hiányzó kategóriához, a következő névvel: <source column>- Missing
Ha a jelzőértékekké konvertált oszlop számokat tartalmaz, azokat kategorikusként kell megjelölni, mint bármely más jellemzőoszlopot. Ezt követően a számok diszkrét értékekként vannak kezelve. Ha például egy 25 és 30 közötti MPG-értékeket tartalmazó numerikus oszloppal van, minden különálló értékhez új jelzőoszlop jön létre:
Gyártó Highway mpg -25 Highway mpg -26 Highway mpg -27 Highway mpg -28 Highway mpg -29 Highway mpg -30 Alfa Ekkor 0 0 0 0 0 1 A jelzőoszlopok nagy számának elkerülése érdekében javasoljuk, hogy először ellenőrizze az oszlopban lévő értékek számát, és jelölje ki vagy számszerűsítse megfelelően az adatokat.
Várt bemenetek
Név | Típus | Description |
---|---|---|
Adathalmaz | Adattábla | Adatkészlet kategorikus oszlopokkal |
Modulparaméterek
Name | Tartomány | Típus | Alapértelmezett | Description |
---|---|---|---|---|
Átalakítható kategorikus oszlopok | Bármelyik | ColumnSelection (Oszlopválasztás) | Jelöljön ki kategorikus oszlopokat a mutatómátikákká való átalakításhoz. | |
Kategorikus oszlopok felülírása | Bármelyik | Logikai | hamis | Ha igaz, írja felül a kijelölt kategorikus oszlopokat; Ellenkező esetben fűzheti hozzá az eredményül kapott jelző mátrixokat az adatkészlethez. |
Kimenet
Név | Típus | Description |
---|---|---|
Eredményadatkészlet | Adattábla | Jelzőmát mátrixokká konvertált kategorikus oszlopokat tartalmazó adatkészlet. |