Adatformátum-átalakítások
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
Ez a cikk felsorolja a Machine Learning Studio (klasszikus) moduljait az adatok a gépi tanulásban használt különböző fájlformátumok közötti átalakításához.
A támogatott formátumok a következők:
- A teljes adattitkok által használt Machine Learning.
- A Weka által használt ARFF-formátum. A Weka gépi tanulási algoritmusok nyílt forráskódú Java-alapú készlete.
- Az SVMLight formátum. Az SVMLight formátumot az SVMlight gépi tanulási keretrendszerhez fejlesztették ki. A Vowpal Wabbit is használhatja.
- A legtöbb relációs adatbázis által támogatott tabulátott (TSV) és vesszővel elválasztott (CSV) fájlformátumok. Ezeket a formátumokat az R és a Python is széles körben támogatja.
Amikor ilyen formátumba konvertálja az adatokat, könnyebben áthelyezheti az eredményeket és az adatokat a különböző gépi tanulási keretrendszerek vagy tárolási mechanizmusok között.
Megjegyzés
Ezek az adatkonverziós modulok csak a teljes adatkészletet alakítják át egy megadott formátumra. Ha bármilyen konverziót, csonkítást, dátum- és időformátumok átalakítását vagy az értékek más módon történő manipulálását kell elvégeznie, használja az adatátalakítás moduljait , vagy tekintse meg a kapcsolódó feladatok listáját.
Gyakori adatkonverziós forgatókönyvek
Az adatkonverziós modulokat általában akkor használja, ha adatokat kell áthelyezni egy Machine Learning egy másik gépi tanulási eszközre vagy platformra. A modulokkal adatokat exportálhat a Machine Learning egy adatbázis vagy más eszközök által használható formátumban. Például:
Feladat | Használja ezt a |
---|---|
Mentenie kell egy köztes adatkészletet, hogy a Excel vagy adatbázisba importálni tudja. | A CSV modul vagy a TSV modul használatával készítse elő az adatokat a megfelelő formátumban. Ezután töltse le az adatokat, vagy mentse őket az Azure Storage. |
R- vagy Python-kódban szeretné újra felhasználni a kísérletből származó adatokat. | Az adatok előkészítéséhez használja a CSV-modult vagy a TSV-modult . Ezután kattintson a jobb gombbal a konvertált adatkészletre az adatkészlet eléréséhez szükséges Python-kód lekértéhez. |
A kísérletet és az adatokat a Weka és a Machine Learning. | Az ARFF modullal készítse elő az adatokat. Ezután töltse le az eredményeket. |
Elő kell készítenie az adatokat az SVMlight keretrendszerben. | Az adatok előkészítéséhez használja a Convert to SVMLight (Átalakítás SVMLightká ) modult. Ezután töltse le az eredményül kapott adatokat. |
Hozzon létre adatokat a Vowpal Wabbithez. | Használja az SVMLight formátumot . Ezután módosítsa a fájlokat a cikkben leírtak szerint. Mentse a fájlt az Azure Blob Storage-ba, hogy az a Vowpal Wabbit modullal használva Machine Learning. |
Az adatok nem táblázatos formátumúak. | A Convert to Dataset (Adatkészlet konvertálása) modullal alakítsa át adatkészlet-formátumra . |
Kapcsolódó feladatok
Ha adatokat kell importálni a Machine Learning vagy egyes oszlopokban kell átalakítania az adatokat, az adatkonverzió végrehajtása előtt használja ezeket a modulokat:
Feladat | Használja ezt a |
---|---|
Importálja az adatokat a számítógépemből a Machine Learning. | Töltse fel az adatkészleteket CSV formátumban a betanítás adatainak importálása a Machine Learning Studióba (klasszikus). |
Adatok importálása felhőbeli adatforrásból, beleértve a Hadoopot vagy az Azure-t. | Használja az Adatok importálása modult . |
Gépi tanulási adatkészletek mentése Azure Blob Storage-ba, Hadoop-fürtbe vagy más felhőalapú tárolóba. | Használja az Adatok exportálása modult . |
Az oszlopok adattípusának módosítása vagy oszlopok átváltása más formátumra vagy típusra. | A Machine Learning használja a Metaadatok szerkesztése vagy az Átalakítás SQL modulokat. Ha jártas az R vagy a Python nyelvben, próbálja ki a Python-szkript végrehajtása vagy az R-szkript végrehajtása modulokat . |
Numerikus adatok kerekítése, csoportosítása vagy normalizálása. | Használhatja a Matematikai műveletek alkalmazása, az Adatok csoportosítása lomtárba vagy az Adatok normalizálása modult . |
Modulok listája
Az Adatformátum-átalakítások kategória a következő modulokat tartalmazza:
- Konvertálás ARFF-re: Átalakítja az adatbevitelt a Weka eszközkészlet által használt attribútumrelációs fájlformátumra.
- Konvertálás CSV formátumba: Vesszővel elválasztott formátumba konvertálja az adatkészletet.
- Konvertálás adatkészletre: Az adatbevitelt a rendszer által használt belső adatkészletformátumra Machine Learning.
- Átalakítás SVMLightra: Átalakítja az adatbevitelt az SVMlight keretrendszer által használt formátumra.
- Konvertálás TSV formátumba: Az adatbevitelt tabulátorral tagolt formátumba konvertálja.