Megosztás a következőn keresztül:


Metaadatok szerkesztése összetevő

Ez a cikk az Azure Machine Learning Designer egyik összetevőjét ismerteti.

A Metaadatok szerkesztése összetevővel módosíthatja az adathalmaz oszlopaihoz társított metaadatokat. Az adathalmaz értéke és adattípusa a Metaadatok szerkesztése összetevő használata után megváltozik.

A metaadatok tipikus változásai a következők lehetnek:

  • Logikai vagy numerikus oszlopok kategorikus értékekként való kezelése.

  • Annak jelzése, hogy melyik oszlop tartalmazza az osztálycímkét , vagy tartalmazza a kategorizálni vagy előrejelezni kívánt értékeket.

  • Oszlopok megjelölése funkcióként.

  • Dátum-/időértékek módosítása numerikus értékekre vagy fordítva.

  • Oszlopok átnevezése.

A Metaadatok szerkesztése parancsot bármikor használhatja, amikor módosítania kell egy oszlop definícióját, általában az alsóbb rétegbeli összetevőkre vonatkozó követelményeknek való megfelelés érdekében. Egyes összetevők például csak adott adattípusokkal működnek, vagy az oszlopokon jelölőket igényelnek, például IsFeature vagy IsCategorical.

A szükséges művelet elvégzése után visszaállíthatja a metaadatokat az eredeti állapotára.

Metaadatok szerkesztése konfigurálása

  1. Az Azure Machine Learning Designerben adja hozzá a Metaadatok szerkesztése összetevőt a folyamathoz, és csatlakoztassa a frissíteni kívánt adathalmazt. Az összetevő az Adatátalakítás kategóriában található.

  2. Kattintson az összetevő jobb oldali panelén az Oszlop szerkesztése elemre, és válassza ki a kívánt oszlopot vagy oszlopkészletet. Az oszlopokat külön-külön választhatja ki név vagy index alapján, de típus szerint is választhat oszlopcsoportot.

  3. Ha más adattípust szeretne hozzárendelni a kijelölt oszlopokhoz, válassza az Adattípus lehetőséget. Előfordulhat, hogy módosítania kell bizonyos műveletek adattípusát. Ha például a forrásadatkészletben szövegként számokat kezelnek, matematikai műveletek használata előtt numerikus adattípusra kell őket módosítani.

    • A támogatott adattípusok a sztring, az egész szám, a dupla, a logikai és a DateTime.

    • Ha több oszlopot jelöl ki, a metaadatok módosításait az összes kijelölt oszlopra alkalmaznia kell. Tegyük fel például, hogy két vagy három numerikus oszlopot választ. Az összes adattípust módosíthatja egy sztring adattípusra, és átnevezheti őket egy műveletben. Az egyik oszlopot azonban nem módosíthatja sztring adattípusra, egy másik oszlopot pedig lebegőpontosról egész számra.

    • Ha nem ad meg új adattípust, az oszlop metaadatai változatlanok maradnak.

    • Az oszloptípus és az értékek a Metaadatok szerkesztése művelet végrehajtása után változnak. Az eredeti adattípust bármikor helyreállíthatja a Metaadatok szerkesztése paranccsal az oszlop adattípusának alaphelyzetbe állításához.

    Feljegyzés

    A DateTime Formátum a Python beépített datetime formátumát követi.
    Ha bármilyen típusú számot a DateTime típusra módosít, hagyja üresen a DateTime Formátum mezőt. Jelenleg nem lehet megadni a céladat-formátumot.

  4. A Kategorikus beállítás kiválasztásával megadhatja, hogy a kijelölt oszlopok értékei kategóriákként legyenek kezelve.

    Előfordulhat például, hogy van egy oszlopa, amely a 0, az 1 és a 2 számot tartalmazza, de tudja, hogy a számok valójában azt jelentik, hogy "Dohányos", "Nemdohányzó" és "Ismeretlen". Ebben az esetben az oszlop kategorikusként való megjelölésével biztosíthatja, hogy az értékek csak az adatok csoportosítására szolgálnak, numerikus számításokban nem.

  5. Ha módosítani szeretné, hogy az Azure Machine Learning hogyan használja a modellben szereplő adatokat, használja a Mezők lehetőséget.

    • Funkció: Ezzel a beállítással jelölhet meg egy oszlopot funkcióként az olyan összetevőkben, amelyek csak funkcióoszlopokon működnek. Alapértelmezés szerint az összes oszlop kezdetben funkciókként lesz kezelve.

    • Címke: Ezzel a beállítással megjelölheti a címkét, amelyet kiszámítható attribútumnak vagy célváltozónak is neveznek. Számos összetevő megköveteli, hogy pontosan egy címkeoszlop legyen jelen az adathalmazban.

      Az Azure Machine Learning sok esetben arra következtethet, hogy egy oszlop osztálycímkét tartalmaz. A metaadatok beállításával meggyőződhet arról, hogy az oszlop helyesen van azonosítva. A beállítás beállítása nem módosítja az adatértékeket. Csak úgy változik, ahogyan egyes gépi tanulási algoritmusok kezelik az adatokat.

    Tipp.

    Vannak olyan adatai, amelyek nem illenek ezekbe a kategóriákba? Előfordulhat például, hogy az adathalmaz olyan értékeket tartalmaz, mint például az egyedi azonosítók, amelyek nem hasznosak változóként. Néha az ilyen azonosítók problémákat okozhatnak, ha egy modellben használják.

    Szerencsére az Azure Machine Learning megtartja az összes adatot, így nem kell törölnie ezeket az oszlopokat az adathalmazból. Ha valamilyen speciális oszlopkészleten kell műveleteket végeznie, csak ideiglenesen távolítsa el az összes többi oszlopot az Adathalmaz oszlopainak kijelölése összetevő használatával. Később az Oszlopok hozzáadása összetevővel újra egyesítheti az oszlopokat az adatkészletben.

  6. Az alábbi beállításokkal törölheti a korábbi kijelöléseket, és visszaállíthatja a metaadatokat az alapértelmezett értékekre.

    • Funkció törlése: Ezzel a beállítással eltávolíthatja a funkciójelzőt.

      A rendszer kezdetben minden oszlopot funkciókként kezel. A matematikai műveleteket végző összetevők esetében előfordulhat, hogy ezt a beállítást kell használnia annak érdekében, hogy a numerikus oszlopok ne legyenek változókként kezelve.

    • Címke törlése: Ezzel a beállítással eltávolíthatja a címke metaadatait a megadott oszlopból.

    • Pontszám törlése: Ezzel a beállítással eltávolíthatja a pontszám metaadatait a megadott oszlopból.

      Az Azure Machine Learningben jelenleg nem jelölhet meg explicit módon egy oszlopot pontszámként. Egyes műveletek azonban azt eredményezik, hogy egy oszlop belső pontszámként van megjelölve. Emellett az egyéni R-összetevők pontszámértékeket is kihozhatnak.

  7. Új oszlopnevek esetén adja meg a kijelölt oszlop vagy oszlopok új nevét.

    • Az oszlopnevek csak az UTF-8 kódolás által támogatott karaktereket használhatják. A teljes szóközökből álló üres sztringek, null értékek vagy nevek nem engedélyezettek.

    • Több oszlop átnevezéséhez írja be a neveket vesszővel tagolt listaként az oszlopindexek sorrendjében.

    • Minden kijelölt oszlopot át kell nevezni. Nem hagyhat ki és nem hagyhat ki oszlopokat.

  8. Küldje el a folyamatot.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket.