Megosztás a következőn keresztül:


Konvertálás ARFF-gé

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Átalakítja az adatbevitelt a Weka eszközkészlet által használt attribútumrelációs fájlformátumra

Kategória: Adatformátum-átalakítások

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan használható a Convert to ARFF (Átalakítás ARFF-re) modul a Machine Learning Studio (klasszikus) eszközkészletében az adatkészletek konvertálására és a Weka eszközkészlet által használt attribútumrelációs fájlformátum eredményére. Ezt a formátumot ARFF-nek nevezik.

A Weka ARFF-adatspecifikációja több gépi tanulási feladatot támogat, beleértve az adat-előfeldolgozást, a besorolást és a jellemzők kiválasztását. Ebben a formátumban az adatok entites (entites) és attribútumaik szerint vannak rendszerezve, és egyetlen szövegfájlban adatokat tartalmaznak. A Weka-fájlformátum részleteit a Műszaki megjegyzések szakaszban találja .

A Weka-fájlformátumra való átalakítás általában csak akkor szükséges, ha a Machine Learning-t és a Wekát is használni szeretné, és a betanítási adatokat oda-vissza szeretné áthelyezni közöttük.

A Weka-eszközkészletről további információt ebben a Wikipedia-cikkben talál: Weka (gépi tanulás)

Figyelmeztetés

Az Azure-beli meglévő ARFF-fájlok nem írhatóak felül Storage.

A Convert to ARFF használata

  1. Adja hozzá a kísérlethez a Convert to ARFF (Átalakítás ARFF-gé ) modult. Ezt a modult a (klasszikus) Machine Learning Data Format Conversions (Adatformátum-konverziók) kategóriában találja.

  2. Csatlakozás egy adatkészletet kiküldő modulhoz.

  3. Futtassa a kísérletet, vagy kattintson a Convert to ARFF (Konvertálás ARFF-gé) modulra , majd kattintson a Run selected (Futtatás kiválasztva) gombra.

Results (Eredmények)

  • Egy helyi mappában lévő adatok másolatának létrehozásához kattintson duplán a Convert to ARFF (Átalakítás ARFF-gé) kimenetre, és válassza a Download (Letöltés) lehetőséget.

    Ha nem ad meg mappát, a rendszer egy alapértelmezett fájlnevet alkalmaz, és a fájlt a helyi Letöltések könyvtárba menti .

Megjegyzés

Ez a modul nem támogatja az exportálást Python- vagy R-kódba.

Példák

Nincsenek erre a formátumra vonatkozó példák a Azure AI Gallery. Ezek a kísérletek azonban más típusú formátumkonverziókat is bemutatnak:

  • Színalapú képtömörítés: Exportálja az elemzés egyes részeihez használt adatkészleteket fájlokba a reprodukálás és a más elemzési platformokon való használat érdekében.

  • Keresztellenőrzés bináris besorolási mintához: Exportálja a keresztellenőrzés eredményeit fájlokba, hogy több modell eredményeit össze tudja hasonlítani egy olyan eszközzel, mint Excel.

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.

Példa ARFF formátumra

Ez a szakasz egy példát mutat be arra, hogyan nézne ki egy tipikus adatkészlet az ARFF-be való konvertáláskor.

Az ARFF-adatfájl általában két szakaszból áll: egy fejlécből, amely meghatározza az adatforrást és a sémát, valamint az adatszakaszból, amely a tényleges entitásokat és azok attribútumát tartalmazza.

ARFF-fejléc

Az ARFF-fájl fejléce határozza meg az attribútumok listáját (oszlopokban) és azok adattípusait. A fejléc több megjegyzéssort is tartalmazhat, amelyek leírják az adatforrást vagy bármilyen más megjegyzést.

% Source: Iris dataset, UCI % 0 = Iris-setosa, 1= Iris-virginica @RELATION iris @ATTRIBUTE sepal_length NUMERIC @ATTRIBUTE sepal_width NUMERIC @ATTRIBUTE petal_length NUMERIC @ATTRIBUTE petal_width NUMERIC @ATTRIBUTE class {0, 1}

Tipp

Ha a konvertálni használt adatkészlet nem rendelkezik oszlopnevekkel, a Metaadatok szerkesztése modullal adhat hozzá oszlopneveket az ARFF-gé konvertálás előtt.

ARFF-adatok

Az adatszakasz vesszővel elválasztott értékekből áll, és nagyon hasonlít egy oszlopfejléc nélküli CSV-fájlra.

@DATA 5.1,3.5,1.4,0.2,0

További információ erről a fájlformátumról: Weka Wiki oldal: ARFF (fejlesztői verzió).

Az ARFF aktuális verziója

Machine Learning Studio (klasszikus) ARFF-fájlokat ment az ARFF 3.0 formátum használatával.

Várt bemenetek

Név Típus Description
Adathalmaz Adattábla Bemeneti adatkészlet

Kimenetek

Név Típus Description
Eredményadatkészlet Arff Kimeneti adatkészlet

Lásd még

Adatformátum-átalakítások
A-Z modullista