Átalakítás mutatóértékekké
Ez a cikk az Azure Machine Learning designer egy összetevőjét ismerteti.
Az Azure Machine Learning Designer Konvertálás mutatóértékekká alakítása összetevőjével kategorikus értékeket tartalmazó oszlopokat bináris jelzőoszlopok sorozatává alakíthat.
A Konvertálás mutatóértékekké művelet lehetővé teszi a kategorikus adatok konvertálását bináris vagy több érték által képviselt mutatóértékekké. Ez a folyamat a besorolási modellekhez gyakran használt adatelőfeldolgozási lépések egyike.
Ez az összetevő a mutatóértékekké való átalakításhoz használt átalakítás definícióját is kiadja. Ezt az átalakítást újra felhasználhatja más, azonos sémával rendelkező adathalmazokon az Átalakítás alkalmazása összetevő használatával.
A Konvertálás mutatóértékekké alakítás konfigurálása
Keresse meg a Konvertálás mutatóértékekké , és húzza a folyamat piszkozatára. Ezt az összetevőt az Adatátalakítás kategóriában találja.
Feljegyzés
A Metaadatok szerkesztése összetevőt a Konvertálás indikátorértékek összetevő előtt használhatja a céloszlop(ok) kategorikusként való megjelöléséhez.
Csatlakoztassa a Konvertálás mutatóértékekké összetevőt az átalakítani kívánt oszlopokat tartalmazó adatkészlethez.
Válassza a Szerkesztés oszlopot egy vagy több kategorikus oszlop kiválasztásához.
Válassza a Kategorikus oszlopok felülírása lehetőséget, ha csak az új logikai oszlopokat szeretné megjeleníteni. Alapértelmezés szerint ez a beállítás ki van kapcsolva.
Tipp.
Ha a felülírás lehetőségét választja, a forrásoszlop valójában nem lesz törölve vagy módosítva. Ehelyett az új oszlopok jönnek létre és jelennek meg a kimeneti adatkészletben, és a forrásoszlop továbbra is elérhető marad a munkaterületen. Ha meg kell tekintenie az eredeti adatokat, bármikor használhatja az Oszlopok hozzáadása összetevőt a forrásoszlop visszaadásához.
Küldje el a folyamatot.
Results (Eredmények)
Tegyük fel, hogy van egy olyan oszlopa, amely pontszámokkal jelzi, hogy egy kiszolgálónak magas, közepes vagy alacsony a meghibásodási valószínűsége.
Kiszolgálóazonosító | Hibapontszám |
---|---|
10301 | Alacsony |
10302 | Közepes |
10303 | Magas |
Az Átalakítás mutatóértékekké alkalmazásakor a tervező egyetlen címkeoszlopot több, logikai értékeket tartalmazó oszlopmá alakít át:
Kiszolgálóazonosító | Hibapontszám – Alacsony | Hibapontszám – Közepes | Hibapontszám – Magas |
---|---|---|---|
10301 | 0 | 0 | 0 |
10302 | 0 | 0 | 0 |
10303 | 0 | 0 | 0 |
Az átalakítás a következőképpen működik:
A kockázatokat leíró Hibapont oszlopban csak három lehetséges érték van (Magas, Közepes és Alacsony), és nincs hiányzó érték. Tehát pontosan három új oszlop jön létre.
Az új jelzőoszlopok neve a forrásoszlop oszlopfejlécei és értékei alapján történik, a következő mintával: <forrásoszlop>- <adatérték>.
1-nek kell lennie pontosan egy mutatóoszlopban, és 0-nak az összes többi mutatóoszlopban, mivel minden kiszolgáló csak egy kockázati minősítéssel rendelkezhet.
Mostantól a három mutatóoszlopot is használhatja a gépi tanulási modell funkcióiként.
Az összetevő két kimenetet ad vissza:
- Eredményadatkészlet: Konvertált mutatóértékeket tartalmazó adatkészlet. A tisztításhoz nem kijelölt oszlopok szintén "át lettek adva".
- Mutatóértékek átalakítása: A mutatóértékekké való átalakításhoz használt adatátalakítás, amely menthető a munkaterületen, és később alkalmazható az új adatokra.
Mentett mutatóértékek alkalmazása új adatokra
Ha gyakran kell ismételnie a mutatóértékeket, az adatmanipulációs lépéseket átalakítóként mentheti, hogy ugyanazzal az adatkészlettel újra felhasználhassa őket. Ez akkor hasznos, ha gyakran újra kell importálnia, majd törölnie kell az azonos sémával rendelkező adatokat.
Adja hozzá az Átalakítás alkalmazása összetevőt a folyamathoz.
Adja hozzá a törölni kívánt adathalmazt, és csatlakoztassa az adathalmazt a jobb oldali bemeneti porthoz.
Bontsa ki az Adatátalakítás csoportot a tervező bal oldali paneljén. Keresse meg a mentett átalakítást, és húzza a folyamatba.
Csatlakoztassa a mentett átalakítást az Átalakítás alkalmazása bal oldali bemeneti portjához.
Mentett átalakítás alkalmazásakor nem választhatja ki az átalakítandó oszlopokat. Ennek az az oka, hogy az átalakítás definiálva lett, és automatikusan érvényes az eredeti műveletben megadott adattípusokra.
Küldje el a folyamatot.
Technikai megjegyzések
Ez a szakasz a megvalósítás részleteit, tippeket és válaszokat tartalmaz a gyakori kérdésekre.
Használati tippek
Csak kategorikusként megjelölt oszlopok konvertálhatók mutatóoszlopokká. Ha a következő hibaüzenet jelenik meg, valószínű, hogy a kijelölt oszlopok egyike nem kategorikus:
0056-os hiba: A névoszlop <nevét> tartalmazó oszlop nem szerepel az engedélyezett kategóriában.
Alapértelmezés szerint a sztringoszlopok többsége sztringfunkcióként van kezelve, ezért a Metaadatok szerkesztése funkcióval explicit módon kategorikusként kell megjelölnie őket.
A mutatóoszlopokká alakítható oszlopok száma nincs korlátozva. Mivel azonban minden értékoszlop több mutatóoszlopot is tartalmazhat, érdemes lehet egyszerre csak néhány oszlopot átalakítani és áttekinteni.
Ha az oszlop hiányzó értékeket tartalmaz, a rendszer külön mutatóoszlopot hoz létre a hiányzó kategóriához a következő névvel: <forrásoszlop>– Hiányzó
Ha a mutatóértékekké konvertált oszlop számokat tartalmaz, azokat kategorikusként kell megjelölni, mint bármely más funkcióoszlopot. Ezt követően a számok különálló értékekként lesznek kezelve. Ha például egy 25 és 30 közötti MPG-értékeket tartalmazó numerikus oszlop van, minden különálló értékhez létrejön egy új mutatóoszlop:
Gyártó Autópálya mpg -25 Autópálya mpg -26 Autópálya mpg -27 Autópálya mpg -28 Autópálya mpg -29 Autópálya mpg -30 Contoso Cars 0 0 0 0 0 0 Annak elkerülése érdekében, hogy túl sok dimenziót adjon hozzá az adathalmazhoz. Javasoljuk, hogy először ellenőrizze az oszlopban lévő értékek számát, és az adatokat a megfelelő tárolóba vagy kvantálásba.
Következő lépések
Tekintse meg az Azure Machine Learning számára elérhető összetevőket.