Megosztás a következőn keresztül:


Oszlopok kijelölése az Adathalmaz összetevőben

Ez a cikk az Azure Machine Learning designer egy összetevőjét ismerteti.

Ezzel az összetevővel kiválaszthatja az alsóbb rétegbeli műveletekben használandó oszlopok egy részhalmazát. Az összetevő fizikailag nem távolítja el az oszlopokat a forrásadatkészletből; ehelyett az oszlopok egy részhalmazát hozza létre, hasonlóan az adatbázis nézetéhez vagy vetületéhez.

Ez az összetevő akkor hasznos, ha korlátoznia kell az alsóbb rétegbeli műveletekhez elérhető oszlopokat, vagy ha csökkenteni szeretné az adathalmaz méretét a szükségtelen oszlopok eltávolításával.

Az adathalmaz oszlopai ugyanolyan sorrendben jelennek meg, mint az eredeti adatokban, még akkor is, ha más sorrendben adja meg őket.

A használat módja

Ennek az összetevőnek nincsenek paraméterei. Az oszlopválasztóval kiválaszthatja a belefoglalni vagy kizárni kívánt oszlopokat.

Oszlopok kiválasztása név szerint

Az összetevőben több lehetőség is van az oszlopok név szerinti kiválasztására:

  • Szűrés és keresés

    Kattintson a BY NAME (NÉV ) lehetőségre.

    Ha már feltöltött adathalmazt kapcsolt össze, meg kell jelennie az elérhető oszlopok listájának. Ha nem jelennek meg oszlopok, előfordulhat, hogy az oszloplista megtekintéséhez felsőbb rétegbeli összetevőket kell futtatnia.

    A lista szűréséhez írja be a keresőmezőbe. Ha például beírja a betűt w a keresőmezőbe, a lista szűrve jelenik meg azokat az oszlopneveket, amelyek a betűt wtartalmazzák.

    Jelölje ki az oszlopokat, és a jobb oldali nyíl gombra kattintva helyezze át a kijelölt oszlopokat a jobb oldali panelen lévő listára.

    • Ha folytonos oszlopnevek tartományát szeretné kijelölni, nyomja le a Shift + Kattintás billentyűkombinációt.
    • Ha egyéni oszlopokat szeretne hozzáadni a kijelöléshez, nyomja le a Ctrl + Kattintás billentyűkombinációt.

    Kattintson a pipa gombra a mentéshez és a bezáráshoz.

  • Nevek használata más szabályokkal kombinálva

    Kattintson a WITH RULES (SZABÁLYOKKAL ) lehetőségre.

    Válasszon ki egy szabályt, például egy adott adattípus oszlopait.

    Ezután kattintson a típus egyes oszlopaira név szerint, és vegye fel őket a kijelölési listára.

  • Írja be vagy illessze be az oszlopnevek vesszővel tagolt listáját

    Ha az adathalmaz széles, egyszerűbb lehet az indexek vagy a létrehozott névlisták használata az oszlopok egyenkénti kijelölése helyett. Feltéve, hogy előre elkészítette a listát:

    1. Kattintson a WITH RULES (SZABÁLYOKKAL ) lehetőségre.
    2. Válassza a Nincs oszlop lehetőséget, válassza a Belefoglalás lehetőséget, majd kattintson a szövegmezőbe a piros felkiáltójellel.
    3. Illessze be vagy írja be a korábban érvényesített oszlopnevek vesszővel tagolt listáját. Nem mentheti az összetevőt, ha bármelyik oszlop neve érvénytelen, ezért mindenképpen ellenőrizze a neveket.

    Ezzel a módszerrel az oszlopok listáját is megadhatja az indexértékek használatával.

Választás típus szerint

Ha a WITH RULES lehetőséget használja, több feltételt is alkalmazhat az oszlopkijelölésekre. Előfordulhat például, hogy csak numerikus adattípusú funkcióoszlopokat kell lekérnie.

A BEGIN WITH beállítás határozza meg a kiindulási pontot, és fontos az eredmények megértéséhez.

  • Ha a MINDEN OSZLOP lehetőséget választja, a rendszer minden oszlopot hozzáad a listához. Ezután a Kizárás beállítással el kell távolítania azokat az oszlopokat, amelyek megfelelnek bizonyos feltételeknek.

    Előfordulhat például, hogy az összes oszlopot elkezdi, majd név vagy típus szerint eltávolítja az oszlopokat.

  • Ha a NO COLUMNS lehetőséget választja, az oszlopok listája üresen indul. Ezután feltételeket kell megadnia, hogy oszlopokat vegyen fel a listára.

    Ha több szabályt alkalmaz, minden feltétel additív. Tegyük fel például, hogy oszlop nélkül kezd, majd hozzáad egy szabályt az összes numerikus oszlop lekéréséhez. Az Automobile price datasetben ez 16 oszlopot eredményez. Ezután a + jelre kattintva új feltételt vehet fel, és válassza az Összes funkció belefoglalása lehetőséget. Az eredményül kapott adathalmaz tartalmazza az összes numerikus oszlopot, valamint az összes funkcióoszlopot, beleértve néhány sztringfunkció-oszlopot is.

Választás oszlopindex alapján

Az oszlopindex az eredeti adatkészleten belüli oszlop sorrendjére hivatkozik.

  • Az oszlopok számozása sorrendben 1-től kezdődik.
  • Egy oszloptartomány lekéréséhez használjon kötőjelet.
  • Nyílt végű specifikációk, például 1- nem engedélyezettek vagy -3 nem engedélyezettek.
  • Az ismétlődő indexértékek (vagy oszlopnevek) nem engedélyezettek, és hibát okozhatnak.

Ha például az adathalmaz legalább nyolc oszlopból áll, az alábbi példák bármelyikébe beillesztheti, hogy több nem összefüggő oszlopot ad vissza:

  • 8,1-4,6
  • 1,3-8
  • 1,3-6,4

az utolsó példa nem eredményez hibát; azonban egyetlen oszloppéldányt 4ad vissza.

Oszlopok sorrendjének módosítása

Az Ismétlődések engedélyezése és az oszlopsorrend megőrzése a kijelölésben üres listával kezdődik, és név vagy index alapján megadott oszlopokat ad hozzá. A többi beállítástól eltérően, amelyek mindig a "természetes sorrendben" adják vissza az oszlopokat, ez a beállítás a név vagy lista szerinti sorrendben adja ki az oszlopokat.

Egy Col1, Col2, Col3 és Col4 oszlopot tartalmazó adathalmazban például megfordíthatja az oszlopok sorrendjét, és kihagyhatja a 2. oszlopot az alábbi listák egyikének megadásával:

  • Col4, Col3, Col1
  • 4,3,1

Következő lépések

Tekintse meg az Azure Machine Learning számára elérhető összetevőket.