Adatátalakítás – Manipuláció
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Ez a cikk a Machine Learning Studio (klasszikus) alapszintű adatkezeléshez használható moduljait ismerteti.
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
Machine Learning Studio (klasszikus) támogatja a gépi tanulásra jellemző feladatokat, például a normalizálást vagy a funkciók kiválasztását. Az ebben a kategóriában a modulok általánosabb feladatokhoz valók.
Adatkezelési feladatok
Az ebbe a kategóriába tartozó modulok olyan alapvető adatkezelési feladatok támogatására szolgálnak, amelyeket a Machine Learning Studióban kell elvégezni. Az alábbi feladatok az alapvető adatkezelési feladatokra mutatnak példákat:
- Két adathalmaz kombinálása illesztésekkel vagy oszlopok vagy sorok egyesítésével.
- Hozzon létre új kategóriákat az adatok csoportosítására.
- Módosíthatja az oszlopfejléceket, módosíthatja az oszlop adattípusait, vagy megjelölheti az oszlopokat jellemzőként vagy címkeként.
- Ellenőrizze, hogy vannak-e hiányzó értékek, majd cserélje le őket a megfelelő értékekre.
Kapcsolódó feladatok
- Mintavételezés végrehajtása vagy adathalmaz felosztása betanítás és tesztelési készletekre: Adatátalakítás – Minta- és felosztási modulok használata.
- Számok skálázása, adatok normalizálása vagy numerikus értékek tárolókba való méretezése: Használja az Adatátalakítás – Skálázás és Csökkentés modult .
- Számítások végrehajtása numerikus adatmezőkön vagy általánosan használt statisztikák létrehozása: A statisztikai függvények eszközeinek használata.
Példák
Az összetett adatok gépi tanulási kísérletekben való használatára vonatkozó példákért tekintse meg az alábbi mintákat a Azure AI Gallery:
- Adatfeldolgozás és -elemzés: A legfontosabb eszközöket és folyamatokat mutatja be.
- Mellrák észlelése: Azt mutatja be, hogyan particionálhatóak az adatkészletek, majd hogyan lehet speciális feldolgozást alkalmazni az egyes partíciókra.
Modulok ebben a kategóriában
Az Adatátalakítás – Manipuláció kategória a következő modulokat tartalmazza:
- Oszlopok hozzáadása: Oszlopokat ad hozzá egy adatkészletből egy másikba.
- Sorok hozzáadása: Sorok egy készletét fűzi hozzá egy bemeneti adatkészletből egy másik adatkészlet végéhez.
- Transzformáció SQL: SQLite-lekérdezést futtat a bemeneti adatkészleten az adatok átalakításához.
- Clean Missing Data (Hiányzó adatok megtisztítása): Meghatározza, hogyan kezelhetők az adatkészletből hiányzó értékek. Ez a modul lecseréli a Missing Values Scrubber (Hiányzó értékek) leírót, amely elavult.
- Átalakítás Jelzőértékekké: Az oszlopok kategorikus értékeit jelző értékekké alakítja.
- Metaadatok szerkesztése: Egy adatkészlet oszlopainak metaadatait szerkeszti.
- Csoportkategorikus értékek: Több kategória adatait egy új kategóriába csoportosítja.
- Adatok illesztés: Két adatkészletet egyes ad.
- Ismétlődő sorok eltávolítása: Eltávolítja a duplikált sorokat egy adatkészletből.
- Select Columns in Dataset (Adatkészlet oszlopainak kijelölése): Kiválasztja azokat az oszlopokat, amelyek egy adatkészletbe bele vannak foglalva, vagy amelyek egy műveletből kizárnak egy adatkészletet.
- Oszlopok kiválasztása Átalakítás: Olyan átalakítást hoz létre, amely ugyanazt az oszlopkészletet választja ki, mint a megadott adatkészletben.
- SMOTE: A szintetikus kisebbség arányú túlszabadolás használatával növeli az adatkészletben az alacsony incidensek példáinak számát.