Konvertálás ARFF-gé
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Átalakítja az adatbevitelt a Weka eszközkészlet által használt attribútumrelációs fájlformátumra
Kategória: Adatformátum-átalakítások
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk azt ismerteti, hogyan használható a Convert to ARFF (Átalakítás ARFF-re) modul a Machine Learning Studio (klasszikus) eszközkészletében az adatkészletek konvertálására és a Weka eszközkészlet által használt attribútumrelációs fájlformátum eredményére. Ezt a formátumot ARFF-nek nevezik.
A Weka ARFF-adatspecifikációja több gépi tanulási feladatot támogat, beleértve az adat-előfeldolgozást, a besorolást és a jellemzők kiválasztását. Ebben a formátumban az adatok entites (entites) és attribútumaik szerint vannak rendszerezve, és egyetlen szövegfájlban adatokat tartalmaznak. A Weka-fájlformátum részleteit a Műszaki megjegyzések szakaszban találja .
A Weka-fájlformátumra való átalakítás általában csak akkor szükséges, ha a Machine Learning-t és a Wekát is használni szeretné, és a betanítási adatokat oda-vissza szeretné áthelyezni közöttük.
A Weka-eszközkészletről további információt ebben a Wikipedia-cikkben talál: Weka (gépi tanulás)
Figyelmeztetés
Az Azure-beli meglévő ARFF-fájlok nem írhatóak felül Storage.
A Convert to ARFF használata
Adja hozzá a kísérlethez a Convert to ARFF (Átalakítás ARFF-gé ) modult. Ezt a modult a (klasszikus) Machine Learning Data Format Conversions (Adatformátum-konverziók) kategóriában találja.
Csatlakozás egy adatkészletet kiküldő modulhoz.
Futtassa a kísérletet, vagy kattintson a Convert to ARFF (Konvertálás ARFF-gé) modulra , majd kattintson a Run selected (Futtatás kiválasztva) gombra.
Results (Eredmények)
Egy helyi mappában lévő adatok másolatának létrehozásához kattintson duplán a Convert to ARFF (Átalakítás ARFF-gé) kimenetre, és válassza a Download (Letöltés) lehetőséget.
Ha nem ad meg mappát, a rendszer egy alapértelmezett fájlnevet alkalmaz, és a fájlt a helyi Letöltések könyvtárba menti .
Megjegyzés
Ez a modul nem támogatja az exportálást Python- vagy R-kódba.
Példák
Nincsenek erre a formátumra vonatkozó példák a Azure AI Gallery. Ezek a kísérletek azonban más típusú formátumkonverziókat is bemutatnak:
Színalapú képtömörítés: Exportálja az elemzés egyes részeihez használt adatkészleteket fájlokba a reprodukálás és a más elemzési platformokon való használat érdekében.
Keresztellenőrzés bináris besorolási mintához: Exportálja a keresztellenőrzés eredményeit fájlokba, hogy több modell eredményeit össze tudja hasonlítani egy olyan eszközzel, mint Excel.
Technikai megjegyzések
Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.
Példa ARFF formátumra
Ez a szakasz egy példát mutat be arra, hogyan nézne ki egy tipikus adatkészlet az ARFF-be való konvertáláskor.
Az ARFF-adatfájl általában két szakaszból áll: egy fejlécből, amely meghatározza az adatforrást és a sémát, valamint az adatszakaszból, amely a tényleges entitásokat és azok attribútumát tartalmazza.
ARFF-fejléc
Az ARFF-fájl fejléce határozza meg az attribútumok listáját (oszlopokban) és azok adattípusait. A fejléc több megjegyzéssort is tartalmazhat, amelyek leírják az adatforrást vagy bármilyen más megjegyzést.
% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}
Tipp
Ha a konvertálni használt adatkészlet nem rendelkezik oszlopnevekkel, a Metaadatok szerkesztése modullal adhat hozzá oszlopneveket az ARFF-gé konvertálás előtt.
ARFF-adatok
Az adatszakasz vesszővel elválasztott értékekből áll, és nagyon hasonlít egy oszlopfejléc nélküli CSV-fájlra.
@DATA 5.1,3.5,1.4,0.2,0
További információ erről a fájlformátumról: Weka Wiki oldal: ARFF (fejlesztői verzió).
Az ARFF aktuális verziója
Machine Learning Studio (klasszikus) ARFF-fájlokat ment az ARFF 3.0 formátum használatával.
Várt bemenetek
Név | Típus | Description |
---|---|---|
Adathalmaz | Adattábla | Bemeneti adatkészlet |
Kimenetek
Név | Típus | Description |
---|---|---|
Eredményadatkészlet | Arff | Kimeneti adatkészlet |