Megosztás a következőn keresztül:


Adatátalakítás – Manipuláció

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Ez a cikk a Machine Learning Studio (klasszikus) alapszintű adatkezeléshez használható moduljait ismerteti.

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

Machine Learning Studio (klasszikus) támogatja a gépi tanulásra jellemző feladatokat, például a normalizálást vagy a funkciók kiválasztását. Az ebben a kategóriában a modulok általánosabb feladatokhoz valók.

Adatkezelési feladatok

Az ebbe a kategóriába tartozó modulok olyan alapvető adatkezelési feladatok támogatására szolgálnak, amelyeket a Machine Learning Studióban kell elvégezni. Az alábbi feladatok az alapvető adatkezelési feladatokra mutatnak példákat:

  • Két adathalmaz kombinálása illesztésekkel vagy oszlopok vagy sorok egyesítésével.
  • Hozzon létre új kategóriákat az adatok csoportosítására.
  • Módosíthatja az oszlopfejléceket, módosíthatja az oszlop adattípusait, vagy megjelölheti az oszlopokat jellemzőként vagy címkeként.
  • Ellenőrizze, hogy vannak-e hiányzó értékek, majd cserélje le őket a megfelelő értékekre.
  • Mintavételezés végrehajtása vagy adathalmaz felosztása betanítás és tesztelési készletekre: Adatátalakítás – Minta- és felosztási modulok használata.
  • Számok skálázása, adatok normalizálása vagy numerikus értékek tárolókba való méretezése: Használja az Adatátalakítás – Skálázás és Csökkentés modult .
  • Számítások végrehajtása numerikus adatmezőkön vagy általánosan használt statisztikák létrehozása: A statisztikai függvények eszközeinek használata.

Példák

Az összetett adatok gépi tanulási kísérletekben való használatára vonatkozó példákért tekintse meg az alábbi mintákat a Azure AI Gallery:

  • Adatfeldolgozás és -elemzés: A legfontosabb eszközöket és folyamatokat mutatja be.
  • Mellrák észlelése: Azt mutatja be, hogyan particionálhatóak az adatkészletek, majd hogyan lehet speciális feldolgozást alkalmazni az egyes partíciókra.

Modulok ebben a kategóriában

Az Adatátalakítás – Manipuláció kategória a következő modulokat tartalmazza:

  • Oszlopok hozzáadása: Oszlopokat ad hozzá egy adatkészletből egy másikba.
  • Sorok hozzáadása: Sorok egy készletét fűzi hozzá egy bemeneti adatkészletből egy másik adatkészlet végéhez.
  • Transzformáció SQL: SQLite-lekérdezést futtat a bemeneti adatkészleten az adatok átalakításához.
  • Clean Missing Data (Hiányzó adatok megtisztítása): Meghatározza, hogyan kezelhetők az adatkészletből hiányzó értékek. Ez a modul lecseréli a Missing Values Scrubber (Hiányzó értékek) leírót, amely elavult.
  • Átalakítás Jelzőértékekké: Az oszlopok kategorikus értékeit jelző értékekké alakítja.
  • Metaadatok szerkesztése: Egy adatkészlet oszlopainak metaadatait szerkeszti.
  • Csoportkategorikus értékek: Több kategória adatait egy új kategóriába csoportosítja.
  • Adatok illesztés: Két adatkészletet egyes ad.
  • Ismétlődő sorok eltávolítása: Eltávolítja a duplikált sorokat egy adatkészletből.
  • Select Columns in Dataset (Adatkészlet oszlopainak kijelölése): Kiválasztja azokat az oszlopokat, amelyek egy adatkészletbe bele vannak foglalva, vagy amelyek egy műveletből kizárnak egy adatkészletet.
  • Oszlopok kiválasztása Átalakítás: Olyan átalakítást hoz létre, amely ugyanazt az oszlopkészletet választja ki, mint a megadott adatkészletben.
  • SMOTE: A szintetikus kisebbség arányú túlszabadolás használatával növeli az adatkészletben az alacsony incidensek példáinak számát.

Lásd még