Átalakítás SVMLightra
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Átalakítja az adatbevitelt a SVM-Light-keretrendszer által használt formátumra
Kategória: Adatformátum-átalakítások
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk azt ismerteti, hogyan konvertálhatja az adatkészleteket az SVMLight által használt formátumra a Machine Learning Studio (klasszikus) Convert to SVMLight (SvMLight átalakítás) modulja segítségével.
Az SVM-Light keretrendszert a Cornell University kutatói fejlesztették ki. A SVM-Light kódtár implementálja a Vapnik támogatóvektor-gépét, de a formátum máshol lett alkalmazva, és számos gépi tanulási feladathoz használható, beleértve a besorolást és a regressziót.
További információ: SVMLight támogatóvektor-gép.
A Convert to SVMLight konfigurálása
Az SVMLight formátumra konvertálás azt jelenti, hogy minden esetet egy címkével kezdődik adatsorra konvertálunk, amelyet kettősponttal elválasztott számokkal jelölt funkció-érték párok követnek. Az átalakítási folyamat nem azonosítja automatikusan a megfelelő oszlopokat, ezért fontos, hogy az átalakítás megkísérlése előtt készítse elő az adatkészlet oszlopait. További információ: Az adatok előkészítése átalakításra.
Adja hozzá a kísérlethez a Convert to SVMLight (Átalakítás SVMLightká ) modult. Ezt a modult a (klasszikus) Machine Learning Data Format Conversions (Adatformátum-konverziók) kategóriában találja.
Csatlakozás SVMLight formátumra konvertálni kívánt adatkészletet vagy kimenetet.
Futtassa a kísérletet.
Kattintson a jobb gombbal a modul kimenetére, válassza a Letöltés lehetőséget, és mentse az adatokat egy helyi fájlba módosítás vagy az SVMLightot támogató programokkal való újbóli felhasználás céljából.
Adatok előkészítése átalakításhoz
A konverziós folyamat szemléltetésére ez a példa a Studióban (klasszikus) a Vörösvért adatkészletet használja.
Ez a mintaadatkészlet táblázatos formában a következő formátumú.
Helyesség | Gyakoriság | Monetáris | Idő | Osztály |
---|---|---|---|---|
2 | 50 | 12500 | 98 | 1 |
0 | 13 | 3250 | 28 | 1 |
1 | 1 | 4000 | 35 | 1 |
2 | 20 | 5000 | 45 | 1 |
1 | 24 | 6000 | 77 | 0 |
Vegye figyelembe, hogy az adatkészlet [Class] nevű címkeoszlopa a tábla utolsó oszlopa. Ha azonban svMLightra konvertálja az adatkészletet anélkül, hogy először jelezve lenne, hogy melyik oszlop tartalmazza a címkét, a rendszer az első [Recency] oszlopot használja címkeként, és a [Class] oszlopot jellemzőként kezeli:
2 1:50 2:12500 3:98 4:1
0 1:13 2:3250 3:28 4:1
1 1:16 2:4000 3:35 4:1
Annak érdekében, hogy a címkék megfelelően jönnek létre a sor elején minden esethez, hozzá kell adni a Metaadatok szerkesztése modul két példányát .
A Metaadatok szerkesztése első példányában válassza ki a címkeoszlopot ([Osztály]), majd a Mezők területen válassza a Címke lehetőséget.
A Metaadatok szerkesztése második példányban jelölje ki a konvertált fájlban szükséges összes funkcióoszlopot ([Recency], [Frequency], [Pénzügyi], [Idő]), és a Mezők területen válassza a Szolgáltatások lehetőséget.
Az oszlopok helyes azonosítása után futtathatja a Convert to SVMLight modult . Az átalakítás után a Vörösvért adathalmaz első néhány sorának formátuma a következő:
A címke értéke megelőzi az egyes beviteleket, majd az 1., 2., 3. és 4. jellemzőként azonosított [Frequency], [Frequency], [Monetary] és [Time] értékeket.
Az ötödik sorban a 0 címkeérték -1-re lett konvertálva. Ennek az az oka, hogy az SVMLight csak a bináris besorolási címkéket támogatja.
1 1:2 2:50 3:12500 4:98
1 1:0 2:13 3:3250 4:28
1 1:1 2:16 3:4000 4:35
1 1:2 2:20 3:5000 4:45
-1 1:1 2:24 3:6000 4:77
Ezeket a szöveges adatokat nem használhatja közvetlenül az Azure-beli modellekhez, ML vizualizálhatja őket. Azonban letöltheti egy helyi megosztásra.
Amíg a fájl meg van nyitva, javasoljuk, hogy adjon hozzá egy megjegyzéssort a előtagja előtt, hogy megjegyzéseket fűzhet a #
forráshoz vagy az eredeti szolgáltatásoszlop-nevekhez.
SVMLight-fájl használata a Vowpal Wabbitben, és további módosítások az itt leírtak szerint: Conversion to Vowpal Wabbit Format. Ha a fájl elkészült, töltse fel az Azure Blob Storage-ba, és hívja meg közvetlenül a Vowpal Wabbit modulok egyikében.
Példák
A táblázatban nincsenek Azure AI Gallery erre a formátumra vonatkozó példák.
Technikai megjegyzések
Ez a szakasz az implementáció részleteit, a tippeket és a gyakori kérdésekre adott válaszokat tartalmazza.
Használati tippek
A SVM-Light keretrendszerben megadott végrehajtható fájlokhoz egy példafájlra és egy modellfájlra is szükség van. Ez a modul azonban csak a példafájlt hozza létre. A modellfájlt külön kell létrehoznia az SVMLight-kódtárak használatával.
A példafájl a betanítás példáját tartalmazó fájl.
Nem kötelező fejléc
Az első sorok tartalmazhatnak megjegyzéseket. A megjegyzések előtagja a számjel (#).
A Convert to SVMLight fájlformátum kimenete nem hoz létre fejléceket. A fájl szerkesztéséhez hozzáadhat megjegyzéseket, oszlopnevek listáját stb.
Betanítási adatok
Minden eset a saját sorában van. Az eset egy célértékből, majd egy indexsorozatból és a kapcsolódó jellemzőértékekből áll.
A válasz értékének besoroláshoz 1-nek vagy -1-nek, vagy regressziós számnak kell lennie.
A célértéket és az egyes index-érték párokat szóköz választja el egymástól.
Példa betanítás adataira
Az alábbi táblázat bemutatja, hogyan alakulnak át az Two-Class Iris-adatkészlet oszlopainak értékei olyan ábrázoláská, amelyben minden oszlopot egy index, egy kettőspont követ, majd az oszlopban lévő érték:
Iris-adatkészlet | SVMLightra konvertált Iris-adatkészlet |
---|---|
1 6.3 2.9 5.6 1.8 | 1 1:6.3 2:2.9 3:5.6 4:1.8 |
0 4.8 3.4 1.6 0.2 | -1 1:4.8 2:3.4 3:1.6 4:0.2 |
1 7.2 3.2 6 1.8 | 1 1:7.2 2:3.2 3:6 4:1.8 |
Vegye figyelembe, hogy az átalakítás során elvesznek a jellemzőoszlopok nevei.
A Vowpal Wabbit fájl előkészítése az SVMLight használatával
Az SVMLight formátum hasonló a Vowpal Wabbit által használt formátumhoz. Ha az SVMLight kimeneti fájlt a Vowpal Wabbit modell betanítási formátumára szeretne módosítani, egyszerűen vegyen fel egy pipa szimbólumot a címke és a jellemzők listája közé.
Hasonlítsa össze például az alábbi bemeneti sorokat:
Vowpal Wabbit formátum, opcionális megjegyzésekkel együtt
# features are [Recency], [Frequency], [Monetary], [Time]
1 | 1:2 2:50 3:12500 4:98
1 | 1:0 2:13 3:3250 4:28
SVMLight formátum, opcionális megjegyzésekkel együtt
# features are [Recency], [Frequency], [Monetary], [Time]
1 1:2 2:50 3:12500 4:98
1 1:0 2:13 3:3250 4:28
Várt bemenetek
Név | Típus | Description |
---|---|---|
Adathalmaz | Adattábla | Bemeneti adatkészlet |
Kimenet
Név | Típus | Description |
---|---|---|
Eredményadatkészlet | SvmLight | Kimeneti adatkészlet |