Egyesítési szám átalakítása
Fontos
A (klasszikus) Machine Learning Studio támogatása 2024. augusztus 31-én megszűnik. Javasoljuk, hogy addig térjen át az Azure Machine Learning használatára.
2021. december 1-től kezdve nem fog tudni létrehozni új (klasszikus) Machine Learning Studio-erőforrásokat. 2024. augusztus 31-ig továbbra is használhatja a meglévő (klasszikus) Machine Learning Studio-erőforrásokat.
- További információ a gépi tanulási projektek a ML Studióból a klasszikusból a Azure Machine Learning.
- További információ a Azure Machine Learning.
A (klasszikus) ML Studio dokumentációjának kivezetése folyamatban van, és a jövőben nem várható a frissítése.
Szolgáltatáskészletet hoz létre a counts tábla alapján
Kategória: Tanulás számokkal
Megjegyzés
A következőkre vonatkozik: Machine Learning Studio (klasszikus)
Hasonló húzással használható modulok érhetők el Azure Machine Learning tervezőben.
A modul áttekintése
Ez a cikk azt ismerteti, hogyan kombinálható két darabszámalapú funkció a Machine Learning Studio (klasszikus) Merge Count Transform (Egyesítési szám átalakítása) modulja segítségével. Két kapcsolódó szám és funkció egyesítésével javíthatja a funkciók lefedettségét és terjesztését.
Tanulás nagy számosságú jellemzőket is tartalmaznak, különösen a nagy méretű adatkészletek számlálása. Az a képesség, hogy több adatkészletet számalapú szolgáltatáskészletekbe kombinálhat anélkül, hogy újra fel kell feldolgoznia az adathalmazokat, megkönnyíti a nagyon nagy adathalmazokkal kapcsolatos statisztikák gyűjtése és új adatkészletekre való alkalmazása. A darabszámtáblák segítségével például több terabájtnyi adatot gyűjthet. Ezeket a statisztikákat újra felhasználhatja a kis adatkészletek prediktív modelljeinek pontosságának javításához.
Két darabszámalapú funkciókészlet egyesítéséhez a funkciókat ugyanazokkal a sémával tartalmazó táblákkal kell létrehozni: azaz mindkét készletnek ugyanazt az oszlopot kell használnia, és ugyanazokkal a nevekkel és adattípusokkal kell rendelkezik.
Az Egyesítések száma átalakítás konfigurálása
Az Egyesítési szám átalakítása csak akkor használható, ha létrehozott legalább egy darabszámalapú átalakítást, és ennek az átalakításnak jelen kell lennie a munkaterületen. Ha egy számalapú átalakítást mentett egy másik kísérletből, keresse meg az Átalakítások csoportot . Ha az átalakítást az aktuális kísérletben hozta létre, csatlakoztassa a következő modulok kimenetét:
Számláló átalakítása. Új számalapú átalakítást hoz létre a forrásadatokból.
Módosítsa a Count Table Parameters (Tábla paramétereinek száma) paramétert. Bemenetként egy meglévő darabszám-átalakítást vesz fel, és frissített átalakítást ad vissza.
Importálja a Count Table táblát. Ez a modul támogatja a visszamenőleges kompatibilitást a számalapú tanulást használt régebbi kísérletekkel. Ha a Count Table importálása funkcióval elemezte egy adatkészlet értékeinek eloszlását, majd az értékeket funkciókká konvertálta az elavult Count Featurizer modullal, használja az Import Count Table (Darabszámtábla importálása) modult az eredmények átalakításra konvertálásához.
Adja hozzá a Merge Count Transform (Egyesítési szám átalakítása) modult a kísérlethez, és kösse össze az átalakítást minden bemenettel.
Tipp
A második átalakítás egy opcionális bemenet – ugyanazt az átalakítást kétszer is csatlakoztathatja, vagy semmit sem csatlakoztathat a második bemeneti porton.
Ha nem szeretné, hogy a második adatkészlet az elsővel egyenlően legyen súlyozással, adjon meg egy értéket a Factor factor (Csökkenési tényező ) mezőben. A beírt érték azt jelzi, hogyan kell súlyozást beállítani a második átalakítás funkcióinak készletével.
Az alapértelmezett 1 érték például egyenlően súlyozást állít be mindkét jellemzőkészlethez. A 0,5 érték azt jelenti, hogy a második készlet jellemzői az első készletben találhatóak súlyának felét tartalmazná.
Igény szerint hozzáadhatja az Átalakítás alkalmazása modul egy példányát, és alkalmazhatja az átalakítást egy adatkészletre.
Példák
A modul használatára vonatkozó példákért tekintse meg a következő Azure AI Gallery:
Tanulás a Counts: Binary Classification (Darabszámok: Bináris besorolás) használatával: Bemutatja, hogyan hozhat létre funkciókat a bináris besorolási modell kategorikus értékeinek oszlopaiból a tanulási és a counts modulokkal.
Tanulás counts: Multiclass classification with NYC taxi data (Többosztályos besorolás NYC taxiadatokkal): Bemutatja, hogyan használható a tanulás a counts modulokkal a nyilvánosan elérhető NYC taxiadatkészleten a többosztályos besorolás végrehajtásához. A minta egy többosztályos logisztikai regressziós tanulót használ a probléma modellezése érdekében.
Tanulás a Counts: Binary classification with NYC taxi data (Bináris besorolás NYC taxiadatokkal): Bemutatja, hogyan használható a tanulás a counts modulokkal a nyilvánosan elérhető NYC taxiadatkészlet bináris besorolásának végrehajtásához. A minta egy kétosztályos logisztikai regressziós tanulót használ a probléma modellezése érdekében.
Várt bemenetek
Név | Típus | Description |
---|---|---|
Korábbi számláló-átalakítás | ITransform interfész | A szerkesztésre kijelölt számláló-átalakítás |
Új számláló átalakítása | ITransform interfész | A hozzáadható számláló-átalakítás (nem kötelező) |
Modulparaméterek
Név | Típus | Tartomány | Választható | Description | Alapértelmezett |
---|---|---|---|---|---|
Az elhalmzó tényező | Float | Kötelező | 1.0f | A számlálási transzformációval megszorozni a jobb bemeneti porton |
Kimenetek
Név | Típus | Description |
---|---|---|
Egyesített számláló átalakítása | ITransform interfész | Az egyesített átalakítás |
Kivételek
Kivétel | Description |
---|---|
0003-as hiba | Kivétel akkor fordul elő, ha egy vagy több bemenet null vagy üres. |
0086-os hiba | Kivétel akkor fordul elő, ha egy számláló-átalakítás érvénytelen. |