Megosztás a következőn keresztül:


Metaadat-összetevő szerkesztése

Ez a cikk az Azure Machine Learning Designer egyik összetevőjét ismerteti.

A Metaadatok szerkesztése összetevővel módosíthatja az adathalmaz oszlopaihoz társított metaadatokat. Az adathalmaz értéke és adattípusa a Metaadatok szerkesztése összetevő használata után megváltozik.

A metaadatok tipikus változásai a következők lehetnek:

  • Logikai vagy numerikus oszlopok kategorikus értékekként való kezelése.

  • Annak jelzése, hogy melyik oszlop tartalmazza az osztálycímkét, vagy tartalmazza a kategorizálni vagy előrejelezni kívánt értékeket.

  • Oszlopok megjelölése funkcióként.

  • Dátum-/időértékek módosítása numerikus értékekre vagy fordítva.

  • Oszlopok átnevezése.

A Metaadatok szerkesztése parancsot bármikor használhatja, amikor módosítania kell egy oszlop definícióját, általában az alsóbb rétegbeli összetevőkre vonatkozó követelményeknek való megfelelés érdekében. Egyes összetevők például csak bizonyos adattípusokkal működnek, vagy az oszlopokon jelzőket igényelnek, például IsFeature vagy IsCategorical.

A szükséges művelet végrehajtása után visszaállíthatja a metaadatokat az eredeti állapotára.

Metaadatok szerkesztése konfigurálása

  1. Az Azure Machine Learning Designerben adja hozzá a Metaadatok szerkesztése összetevőt a folyamathoz, és csatlakoztassa a frissíteni kívánt adathalmazt. Az összetevőt az Adatátalakítás kategóriában találja.

  2. Kattintson az Oszlop szerkesztése elemre az összetevő jobb oldali paneljén, és válassza ki azt az oszlopot vagy oszlopkészletet, amellyel dolgozni szeretne. Választhatja az oszlopokat egyenként név vagy index alapján, vagy választhat oszlopcsoportot típus szerint.

  3. Ha más adattípust szeretne hozzárendelni a kijelölt oszlopokhoz, válassza az Adattípus lehetőséget. Előfordulhat, hogy módosítania kell bizonyos műveletek adattípusát. Ha például a forrásadatkészletben a számok szövegként vannak kezelve, matematikai műveletek használata előtt numerikus adattípusra kell módosítani őket.

    • A támogatott adattípusok a következők: Sztring, Egész szám, Dupla, Logikai és DateTime.

    • Ha több oszlopot jelöl ki, a metaadatok módosításait az összes kijelölt oszlopra alkalmaznia kell. Tegyük fel például, hogy két vagy három numerikus oszlopot választ. Az összeset módosíthatja egy sztring adattípusra, és átnevezheti őket egy műveletben. Az egyik oszlopot azonban nem módosíthatja sztring adattípusra, egy másik oszlopot pedig lebegőpontosról egész számra.

    • Ha nem ad meg új adattípust, az oszlop metaadatai változatlanok maradnak.

    • Az oszloptípus és az értékek a Metaadatok szerkesztése művelet végrehajtása után módosulnak. Az eredeti adattípust bármikor helyreállíthatja a Metaadatok szerkesztése paranccsal az oszlop adattípusának alaphelyzetbe állításához.

    Megjegyzés

    A DateTime formátum a Python beépített datetime formátumát követi.
    Ha bármilyen típusú számot DateTime típusra módosít, hagyja üresen a DateTime Formátum mezőt. Jelenleg nem lehet megadni a céladat-formátumot.

  4. Válassza a Kategorikus beállítást annak megadásához, hogy a kijelölt oszlopokban lévő értékeket kategóriákként kell kezelni.

    Lehet például, hogy van egy oszlopa, amely a 0, 1 és 2 számokat tartalmazza, de tudja, hogy a számok valójában a "Dohányos", a "Nem dohányzó" és az "Ismeretlen" értéket jelentik. Ebben az esetben az oszlop kategorikusként való megjelölésével biztosíthatja, hogy az értékek csak az adatok csoportosítására szolgálnak, a numerikus számításokban nem.

  5. Ha módosítani szeretné, hogy az Azure Machine Learning hogyan használja a modellben szereplő adatokat, használja a Mezők lehetőséget.

    • Funkció: Ezzel a beállítással funkcióként jelölhet meg egy oszlopot olyan összetevőkben, amelyek csak funkcióoszlopokon működnek. Alapértelmezés szerint az összes oszlopot kezdetben funkciókként kezeli a rendszer.

    • Címke: Ezzel a beállítással megjelölheti a címkét, amelyet kiszámítható attribútumnak vagy célváltozónak is neveznek. Számos összetevő megköveteli, hogy pontosan egy címkeoszlop legyen jelen az adathalmazban.

      Az Azure Machine Learning sok esetben arra következtethet, hogy egy oszlop osztálycímkét tartalmaz. A metaadatok beállításával meggyőződhet arról, hogy az oszlop helyesen van azonosítva. A beállítás beállítása nem módosítja az adatértékeket. Csak úgy változik, ahogyan egyes gépi tanulási algoritmusok kezelik az adatokat.

    Tipp

    Vannak olyan adatai, amelyek nem felelnek meg ezeknek a kategóriáknak? Az adathalmaz például tartalmazhat olyan értékeket, például egyedi azonosítókat, amelyek nem hasznosak változóként. Néha az ilyen azonosítók problémákat okozhatnak, ha egy modellben használják.

    Szerencsére az Azure Machine Learning megtartja az összes adatot, így nem kell törölnie ezeket az oszlopokat az adathalmazból. Ha speciális oszlopkészleten kell műveleteket végeznie, csak ideiglenesen távolítsa el az összes többi oszlopot az Adathalmaz oszlopainak kijelölése összetevővel. Később az Oszlopok hozzáadása összetevővel újra egyesítheti az oszlopokat az adatkészletben.

  6. Az alábbi beállításokkal törölheti a korábbi kijelöléseket, és visszaállíthatja a metaadatokat az alapértelmezett értékekre.

    • Funkció törlése: Ezzel a beállítással eltávolíthatja a funkciójelölőt.

      A rendszer kezdetben minden oszlopot funkcióként kezel. A matematikai műveleteket végző összetevők esetében előfordulhat, hogy ezt a beállítást kell használnia annak érdekében, hogy a numerikus oszlopok ne legyenek változókként kezelve.

    • Címke törlése: Ezzel a beállítással eltávolíthatja a címke metaadatait a megadott oszlopból.

    • Pontszám törlése: Ezzel a beállítással eltávolíthatja a pontszám metaadatait a megadott oszlopból.

      Az Azure Machine Learningben jelenleg nem jelölhet meg explicit módon egy oszlopot pontszámként. Egyes műveletek azonban azt eredményezik, hogy egy oszlop belső pontszámként van megjelölve. Emellett egy egyéni R-összetevő pontértékeket is kihozhat.

  7. Az Új oszlopnevek mezőben adja meg a kijelölt oszlop vagy oszlopok új nevét.

    • Az oszlopnevek csak az UTF-8 kódolás által támogatott karaktereket használhatják. Üres sztringek, nullok vagy teljes szóközökből álló nevek nem engedélyezettek.

    • Több oszlop átnevezéséhez adja meg a neveket vesszővel tagolt listaként az oszlopindexek sorrendjében.

    • Minden kijelölt oszlopot át kell nevezni. Nem hagyhatja ki és nem hagyhatja ki az oszlopokat.

  8. Küldje el a folyamatot.

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket .