Megosztás a következőn keresztül:


Átalakítás mutatóértékekké

Ez a cikk az Azure Machine Tanulás tervezőjének egy összetevőjét ismerteti.

Az Azure Machine Tanulás DesignerBen a Konvertálás mutatóértékekké összetevővel kategorikus értékeket tartalmazó oszlopokat bináris jelzőoszlopok sorozatává alakíthat.

A Konvertálás mutatóértékekké művelet lehetővé teszi a kategorikus adatok konvertálását bináris vagy több érték által képviselt mutatóértékekké. Ez a folyamat a besorolási modellekhez gyakran használt adatelőfeldolgozási lépések egyike.

Ez az összetevő a mutatóértékekké való átalakításhoz használt átalakítás definícióját is kiadja. Ezt az átalakítást újra felhasználhatja más, azonos sémával rendelkező adathalmazokon az Átalakítás alkalmazása összetevő használatával.

A Konvertálás mutatóértékekké alakítás konfigurálása

  1. Keresse meg a Konvertálás mutatóértékekké , és húzza a folyamat piszkozatára. Ezt az összetevőt az Adatátalakítás kategóriában találja.

    Feljegyzés

    A Metaadatok szerkesztése összetevőt a Konvertálás indikátorértékek összetevő előtt használhatja a céloszlop(ok) kategorikusként való megjelöléséhez.

  2. CsatlakozásKonvertálja a Mutatóértékek összetevőt az átalakítani kívánt oszlopokat tartalmazó adatkészletre.

  3. Válassza a Szerkesztés oszlopot egy vagy több kategorikus oszlop kiválasztásához.

  4. Válassza a Kategorikus oszlopok felülírása lehetőséget, ha csak az új logikai oszlopokat szeretné megjeleníteni. Alapértelmezés szerint ez a beállítás ki van kapcsolva.

    Tipp.

    Ha a felülírás lehetőségét választja, a forrásoszlop valójában nem lesz törölve vagy módosítva. Ehelyett az új oszlopok jönnek létre és jelennek meg a kimeneti adatkészletben, és a forrásoszlop továbbra is elérhető marad a munkaterületen. Ha meg kell tekintenie az eredeti adatokat, bármikor használhatja az Oszlopok hozzáadása összetevőt a forrásoszlop visszaadásához.

  5. Küldje el a folyamatot.

Results (Eredmények)

Tegyük fel, hogy van egy olyan oszlopa, amely pontszámokkal jelzi, hogy egy kiszolgálónak magas, közepes vagy alacsony a meghibásodási valószínűsége.

Kiszolgálóazonosító Hibapontszám
10301 Alacsony
10302 Közepes
10303 Magas

Az Átalakítás mutatóértékekké alkalmazásakor a tervező egyetlen címkeoszlopot több, logikai értékeket tartalmazó oszlopmá alakít át:

Kiszolgálóazonosító Hibapontszám – Alacsony Hibapontszám – Közepes Hibapontszám – Magas
10301 0 0 0
10302 0 0 0
10303 0 0 0

Az átalakítás a következőképpen működik:

  • A kockázatokat leíró Hibapont oszlopban csak három lehetséges érték van (Magas, Közepes és Alacsony), és nincs hiányzó érték. Tehát pontosan három új oszlop jön létre.

  • Az új jelzőoszlopok neve a forrásoszlop oszlopfejlécei és értékei alapján történik, a következő mintával: <forrásoszlop>- <adatérték>.

  • 1-nek kell lennie pontosan egy mutatóoszlopban, és 0-nak az összes többi mutatóoszlopban, mivel minden kiszolgáló csak egy kockázati minősítéssel rendelkezhet.

Mostantól a három mutatóoszlopot is használhatja a gépi tanulási modell funkcióiként.

Az összetevő két kimenetet ad vissza:

  • Eredményadatkészlet: Konvertált mutatóértékeket tartalmazó adatkészlet. A tisztításhoz nem kijelölt oszlopok szintén "át lettek adva".
  • Mutatóértékek átalakítása: A mutatóértékekké való átalakításhoz használt adatátalakítás, amely menthető a munkaterületen, és később alkalmazható az új adatokra.

Mentett mutatóértékek alkalmazása új adatokra

Ha gyakran kell ismételnie a mutatóértékeket, az adatmanipulációs lépéseket átalakítóként mentheti, hogy ugyanazzal az adatkészlettel újra felhasználhassa őket. Ez akkor hasznos, ha gyakran újra kell importálnia, majd törölnie kell az azonos sémával rendelkező adatokat.

  1. Adja hozzá az Átalakítás alkalmazása összetevőt a folyamathoz.

  2. Adja hozzá a törölni kívánt adathalmazt, és csatlakoztassa az adathalmazt a jobb oldali bemeneti porthoz.

  3. Bontsa ki az Adatátalakítás csoportot a tervező bal oldali paneljén. Keresse meg a mentett átalakítást, és húzza a folyamatba.

  4. Csatlakozás a mentett átalakítást a következő bal oldali bemeneti portra:Átalakítás alkalmazása.

    Mentett átalakítás alkalmazásakor nem választhatja ki az átalakítandó oszlopokat. Ennek az az oka, hogy az átalakítás definiálva lett, és automatikusan érvényes az eredeti műveletben megadott adattípusokra.

  5. Küldje el a folyamatot.

Technikai megjegyzések

Ez a szakasz a megvalósítás részleteit, tippeket és válaszokat tartalmaz a gyakori kérdésekre.

Használati tippek

  • Csak kategorikusként megjelölt oszlopok konvertálhatók mutatóoszlopokká. Ha a következő hibaüzenet jelenik meg, valószínű, hogy a kijelölt oszlopok egyike nem kategorikus:

    0056-os hiba: A névoszlop <nevét> tartalmazó oszlop nem szerepel az engedélyezett kategóriában.

    Alapértelmezés szerint a sztringoszlopok többsége sztringfunkcióként van kezelve, ezért a Metaadatok szerkesztése funkcióval explicit módon kategorikusként kell megjelölnie őket.

  • A mutatóoszlopokká alakítható oszlopok száma nincs korlátozva. Mivel azonban minden értékoszlop több mutatóoszlopot is tartalmazhat, érdemes lehet egyszerre csak néhány oszlopot átalakítani és áttekinteni.

  • Ha az oszlop hiányzó értékeket tartalmaz, a rendszer külön mutatóoszlopot hoz létre a hiányzó kategóriához a következő névvel: <forrásoszlop>– Hiányzó

  • Ha a mutatóértékekké konvertált oszlop számokat tartalmaz, azokat kategorikusként kell megjelölni, mint bármely más funkcióoszlopot. Ezt követően a számok különálló értékekként lesznek kezelve. Ha például egy 25 és 30 közötti MPG-értékeket tartalmazó numerikus oszlop van, minden különálló értékhez létrejön egy új mutatóoszlop:

    Gyártó Autópálya mpg -25 Autópálya mpg -26 Autópálya mpg -27 Autópálya mpg -28 Autópálya mpg -29 Autópálya mpg -30
    Contoso Cars 0 0 0 0 0 0
  • Annak elkerülése érdekében, hogy túl sok dimenziót adjon hozzá az adathalmazhoz. Javasoljuk, hogy először ellenőrizze az oszlopban lévő értékek számát, és az adatokat a megfelelő tárolóba vagy kvantálásba.

Következő lépések

Tekintse meg az Azure Machine Tanulás számára elérhető összetevőket.