Megosztás a következőn keresztül:


Átalakítás SVMLightra

Fontos

A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.

2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.

A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.

Átalakítja az adatbevitelt a SVM-Light-keretrendszer által használt formátumra

Kategória: Adatformátum-átalakítások

Megjegyzés

A következőkre vonatkozik: Machine Learning Studio (klasszikus)

Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.

A modul áttekintése

Ez a cikk azt ismerteti, hogyan konvertálhatja az adatkészleteket az SVMLight által használt formátumra a Machine Learning Studio (klasszikus) Convert to SVMLight (SvMLight átalakítás) modulja segítségével.

Az SVM-Light keretrendszert a Cornell University kutatói fejlesztették ki. A SVM-Light kódtár implementálja a Vapnik támogatóvektor-gépét, de a formátum máshol lett alkalmazva, és számos gépi tanulási feladathoz használható, beleértve a besorolást és a regressziót.

További információ: SVMLight támogatóvektor-gép.

A Convert to SVMLight konfigurálása

Az SVMLight formátumra konvertálás azt jelenti, hogy minden esetet egy címkével kezdődik adatsorra konvertálunk, amelyet kettősponttal elválasztott számokkal jelölt funkció-érték párok követnek. Az átalakítási folyamat nem azonosítja automatikusan a megfelelő oszlopokat, ezért fontos, hogy az átalakítás megkísérlése előtt készítse elő az adatkészlet oszlopait. További információ: Az adatok előkészítése átalakításra.

  1. Adja hozzá a kísérlethez a Convert to SVMLight (Átalakítás SVMLightká ) modult. Ezt a modult a (klasszikus) Machine Learning Data Format Conversions (Adatformátum-konverziók) kategóriában találja.

  2. Csatlakozás SVMLight formátumra konvertálni kívánt adatkészletet vagy kimenetet.

  3. Futtassa a kísérletet.

  4. Kattintson a jobb gombbal a modul kimenetére, válassza a Letöltés lehetőséget, és mentse az adatokat egy helyi fájlba módosítás vagy az SVMLightot támogató programokkal való újbóli felhasználás céljából.

Adatok előkészítése átalakításhoz

A konverziós folyamat szemléltetésére ez a példa a Studióban (klasszikus) a Vörösvért adatkészletet használja.

Ez a mintaadatkészlet táblázatos formában a következő formátumú.

Helyesség Gyakoriság Monetáris Idő Osztály
2 50 12500 98 1
0 13 3250 28 1
1 1 4000 35 1
2 20 5000 45 1
1 24 6000 77 0

Vegye figyelembe, hogy az adatkészlet [Class] nevű címkeoszlopa a tábla utolsó oszlopa. Ha azonban svMLightra konvertálja az adatkészletet anélkül, hogy először jelezve lenne, hogy melyik oszlop tartalmazza a címkét, a rendszer az első [Recency] oszlopot használja címkeként, és a [Class] oszlopot jellemzőként kezeli:

2 1:50 2:12500 3:98 4:1
0 1:13 2:3250 3:28 4:1
1 1:16 2:4000 3:35 4:1

Annak érdekében, hogy a címkék megfelelően jönnek létre a sor elején minden esethez, hozzá kell adni a Metaadatok szerkesztése modul két példányát .

  1. A Metaadatok szerkesztése első példányában válassza ki a címkeoszlopot ([Osztály]), majd a Mezők területen válassza a Címke lehetőséget.

  2. A Metaadatok szerkesztése második példányban jelölje ki a konvertált fájlban szükséges összes funkcióoszlopot ([Recency], [Frequency], [Pénzügyi], [Idő]), és a Mezők területen válassza a Szolgáltatások lehetőséget.

Az oszlopok helyes azonosítása után futtathatja a Convert to SVMLight modult . Az átalakítás után a Vörösvért adathalmaz első néhány sorának formátuma a következő:

  • A címke értéke megelőzi az egyes beviteleket, majd az 1., 2., 3. és 4. jellemzőként azonosított [Frequency], [Frequency], [Monetary] és [Time] értékeket.

  • Az ötödik sorban a 0 címkeérték -1-re lett konvertálva. Ennek az az oka, hogy az SVMLight csak a bináris besorolási címkéket támogatja.

1 1:2 2:50 3:12500 4:98
1 1:0 2:13 3:3250 4:28
1 1:1 2:16 3:4000 4:35
1 1:2 2:20 3:5000 4:45
-1 1:1 2:24 3:6000 4:77

Ezeket a szöveges adatokat nem használhatja közvetlenül az Azure-beli modellekhez, ML vizualizálhatja őket. Azonban letöltheti egy helyi megosztásra.

Amíg a fájl meg van nyitva, javasoljuk, hogy adjon hozzá egy megjegyzéssort a előtagja előtt, hogy megjegyzéseket fűzhet a #forráshoz vagy az eredeti szolgáltatásoszlop-nevekhez.

SVMLight-fájl használata a Vowpal Wabbitben, és további módosítások az itt leírtak szerint: Conversion to Vowpal Wabbit Format. Ha a fájl elkészült, töltse fel az Azure Blob Storage-ba, és hívja meg közvetlenül a Vowpal Wabbit modulok egyikében.

Példák

A táblázatban nincsenek Azure AI Gallery erre a formátumra vonatkozó példák.

Technikai megjegyzések

Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.

Használati tippek

A SVM-Light keretrendszerben megadott végrehajtható fájlokhoz egy példafájlra és egy modellfájlra is szükség van. Ez a modul azonban csak a példafájlt hozza létre. A modellfájlt külön kell létrehoznia az SVMLight-kódtárak használatával.

A példafájl a betanítás példáját tartalmazó fájl.

  • Nem kötelező fejléc

    Az első sorok tartalmazhatnak megjegyzéseket. A megjegyzések előtagja a számjel (#).

    A Convert to SVMLight fájlformátum kimenete nem hoz létre fejléceket. A fájl szerkesztéséhez hozzáadhat megjegyzéseket, oszlopnevek listáját stb.

  • Betanítási adatok

    Minden eset a saját sorában van. Az eset egy célértékből, majd egy indexsorozatból és a kapcsolódó jellemzőértékekből áll.

    A válasz értékének besoroláshoz 1-nek vagy -1-nek, vagy regressziós számnak kell lennie.

    A célértéket és az egyes index-érték párokat szóköz választja el egymástól.

Példa betanítás adataira

Az alábbi táblázat bemutatja, hogyan alakulnak át az Two-Class Iris-adatkészlet oszlopainak értékei olyan ábrázoláská, amelyben minden oszlopot egy index, egy kettőspont követ, majd az oszlopban lévő érték:

Iris-adatkészlet SVMLightra konvertált Iris-adatkészlet
1 6.3 2.9 5.6 1.8 1 1:6.3 2:2.9 3:5.6 4:1.8
0 4.8 3.4 1.6 0.2 -1 1:4.8 2:3.4 3:1.6 4:0.2
1 7.2 3.2 6 1.8 1 1:7.2 2:3.2 3:6 4:1.8

Vegye figyelembe, hogy az átalakítás során elvesznek a jellemzőoszlopok nevei.

A Vowpal Wabbit fájl előkészítése az SVMLight használatával

Az SVMLight formátum hasonló a Vowpal Wabbit által használt formátumhoz. Ha az SVMLight kimeneti fájlt a Vowpal Wabbit modell betanítási formátumára szeretne módosítani, egyszerűen vegyen fel egy pipa szimbólumot a címke és a jellemzők listája közé.

Hasonlítsa össze például az alábbi bemeneti sorokat:

Vowpal Wabbit formátum, opcionális megjegyzésekkel együtt

# features are [Recency], [Frequency], [Monetary], [Time]
1 | 1:2 2:50 3:12500 4:98
1 | 1:0 2:13 3:3250 4:28

SVMLight formátum, opcionális megjegyzésekkel együtt

# features are [Recency], [Frequency], [Monetary], [Time]
1 1:2 2:50 3:12500 4:98
1 1:0 2:13 3:3250 4:28

Várt bemenetek

Név Típus Description
Adathalmaz Adattábla Bemeneti adatkészlet

Kimenet

Név Típus Description
Eredményadatkészlet SvmLight Kimeneti adatkészlet

Lásd még

Adatformátum-átalakítások
A–Z modullista