A funkció fontosságának kiértékelése
Az előzménynapló-adatok funkcióértékelésével felmérheti, hogy az egyes funkciók mennyire fontosak a Personalizer gépi tanulási modelljében. A funkcióértékelések a következőkben hasznosak:
- A modell szempontjából legfontosabb vagy legkevésbé fontos funkciók megismerése.
- Ötletgyűjtés olyan további funkciókkal, amelyek hasznosak lehetnek a tanulásban azáltal, hogy ihletet merítenek a modellben jelenleg fontos funkciókból.
- Azonosíthatja azokat a potenciálisan nem lényeges vagy nem hasznos funkciókat, amelyeket további elemzés vagy eltávolítás céljából figyelembe kell venni.
- A funkciók tervezésekor és a Personalizernek való elküldésekor előforduló gyakori problémák és hibák elhárítása. Problémás lehet például a GUID-azonosítók, időbélyegek vagy más, általában ritkán használt funkciók használata. További információ a funkciók fejlesztéséről.
Mi az a funkcióértékelés?
A funkcióértékelések az aktuális modellkonfiguráció betanításával és futtatásával zajlanak a korábban gyűjtött naplóadatokon egy adott időszakban. A funkciók figyelmen kívül lesznek hagyva egyenként, hogy az egyes funkciókkal és azok nélkül mérje a modell teljesítménybeli különbségét. Mivel a funkcióértékelések előzményadatokon vannak végrehajtva, nem garantálható, hogy ezek a minták a jövőbeni adatokban is megfigyelhetők lesznek. Ezek az elemzések azonban továbbra is relevánsak lehetnek a jövőbeli adatok szempontjából, ha a naplózott adatok megfelelő variabilitást vagy nem helyhez kötött tulajdonságokat rögzítettek az adatokhoz. A jelenlegi modell teljesítményét nem befolyásolja a funkcióértékelés futtatása.
A funkció fontossági pontszáma annak mértéke, hogy a funkció milyen relatív hatással van a jutalomra az értékelési időszakban. A funkció fontossági pontszámai 0 (legkevésbé fontos) és 100 (legfontosabb) közötti szám, és a funkcióértékelésben láthatók. Mivel a kiértékelés egy adott időszakon keresztül történik, a funkció fontossága megváltozhat, mivel a rendszer további adatokat küld a Personalizernek, és ahogy a felhasználók, a forgatókönyvek és az adatok idővel változnak.
Funkcióértékelés létrehozása
A funkció-fontossági pontszámok beszerzéséhez létre kell hoznia egy funkcióértékelést a naplózott adatok egy időszakában, hogy létrehozzon egy jelentést, amely tartalmazza a funkció fontossági pontszámait. Ez a jelentés megtekinthető a Azure Portal. Funkcióértékelés létrehozása:
- Nyissa meg a Azure Portal webhelyet
- A Personalizer-erőforrás kiválasztása
- Válassza a Monitor szakaszt az oldalsó navigációs panelen
- Válassza a Szolgáltatások lapot
- Válassza a "Jelentés létrehozása" lehetőséget, és meg kell jelennie egy új képernyőnek
- A jelentés nevének kiválasztása
- A próbaidőszak kezdési és befejezési időpontjainak kiválasztása
- Válassza a "Jelentés létrehozása" lehetőséget
Ezután a jelentés nevének meg kell jelennie az alábbi jelentéstáblában. A funkcióértékelés létrehozása egy hosszú ideig futó folyamat, amelyben a befejezésig eltelt idő a Personalizernek a kiértékelési időszakban küldött adatok mennyiségétől függ. A jelentés létrehozása közben az Állapot oszlop a "Futtatás" értéket jelzi a kiértékeléshez, és a befejezés után a "Sikeres" értékre frissül. Ellenőrizze, hogy a kiértékelés befejeződött-e.
Több funkcióértékelést is futtathat különböző időszakokban, amikor a Personalizer-erőforrás naplóadatokkal rendelkezik. Győződjön meg arról, hogy az adatmegőrzési időszak megfelelően hosszú ahhoz, hogy a régebbi adatokon végzett kiértékelések elvégezhetők legyenek.
Funkció-fontossági pontszámok értelmezése
Magas fontossági pontszámmal rendelkező funkciók
A nagyobb fontosságú pontszámokkal rendelkező funkciók a többi funkcióhoz képest nagyobb hatással voltak a modellre a kiértékelési időszakban. A fontos funkciók ihletet adhatnak a modellben szereplő további funkciók tervezéséhez. Ha például az "IsWeekend" vagy az "IsWeekday" környezeti funkciók nagy jelentőséggel bírnak a bevásárláshoz, előfordulhat, hogy az ünnepnapok vagy a hosszú hétvégék is fontos tényezők lehetnek, ezért érdemes lehet olyan funkciókat hozzáadni, amelyek rögzítik ezeket az információkat.
Alacsony fontossági pontszámmal rendelkező funkciók
Az alacsony fontosságú pontszámokkal rendelkező funkciók jó jelöltek további elemzésre. Nem minden alacsony pontozási funkció feltétlenül rossz vagy nem hasznos, mivel az alacsony pontszámok több okból is előfordulhatnak. Az alábbi lista segítséget nyújt annak elemzéséhez, hogy miért lehetnek alacsony pontszámok a funkciókban:
A funkciót ritkán figyelték meg az adatokban a kiértékelési időszakban.
- Ha a szolgáltatás előfordulásainak száma alacsony a többi funkcióhoz képest, ez azt jelezheti, hogy a funkció nem volt elég gyakran jelen ahhoz, hogy a modell megállapítsa, értékes-e vagy sem.
A funkcióértékek nem sok különbözőséggel vagy variációval rendelkeztek.
- Ha a funkció egyedi értékeinek száma a vártnál alacsonyabb, az azt jelezheti, hogy a funkció nem sokat változik az értékelési időszakban, és nem nyújt jelentős betekintést.
A funkcióértékek túl zajosak (véletlenszerűek), vagy túl eltérőek voltak, és kevés értéket adtak meg.
- Ellenőrizze az Egyedi értékek száma a funkcióértékelésben című témakört. Ha a szolgáltatás egyedi értékeinek száma a vártnál magasabb, vagy más funkciókhoz képest magas, az azt jelezheti, hogy a funkció túl zajos volt a próbaidőszak során.
Adat- vagy formázási probléma merült fel.
- Ellenőrizze, hogy a funkciók a várt módon vannak-e formázva és elküldve a Personalizernek.
Előfordulhat, hogy a funkció nem hasznos a modelltanulás és a teljesítmény modellezése során, ha a funkció pontszáma alacsony, és a fenti okok nem érvényesek.
- Fontolja meg a funkció eltávolítását, mivel ez nem segít a modellnek az átlagos jutalom maximalizálásában.
Az alacsony fontosságú pontszámokkal rendelkező funkciók eltávolítása felgyorsíthatja a modell betanítását a tanuláshoz szükséges adatok mennyiségének csökkentésével. Emellett javíthatja a modell teljesítményét is. Ez azonban nem garantált, és további elemzésre lehet szükség. További információ a környezet- és műveletfunkciók tervezéséről.
Gyakori problémák és a funkciók fejlesztésének lépései
Szolgáltatások küldése nagy számossággal. A magas számosságú funkciók azok, amelyek számos különböző értékkel rendelkeznek, amelyek valószínűleg nem ismétlődnek meg sok esemény során. Például az egy személyre vonatkozó személyes adatokat (például név, telefonszám, hitelkártyaszám, IP-cím) nem szabad használni a Personalizerrel.
Felhasználói azonosítók küldése Nagy számú felhasználó esetén nem valószínű, hogy ezek az információk relevánsak a Personalizer-tanulás szempontjából az átlagos jutalompontszám maximalizálása érdekében. A felhasználói azonosítók küldése (még ha nem is személyes adatok) valószínűleg nagyobb zajt ad a modellnek, és nem ajánlott.
A funkciók túl ritkák. Az értékek eltérőek, és ritkán fordulnak elő többször. A pontos időbélyegek a másodpercig nagyon ritkák lehetnek. Sűrűbbé (és ezáltal hatékonyabbá) teheti az időpontok "reggel", "dél" vagy "délután" szerinti csoportosításával, például.
A helyinformációk általában előnyösek a szélesebb körű besorolások létrehozásához is. Például egy szélességi és hosszúsági koordináták( például Lat: 47,67402° N, Hosszú: 122,12154° W) túl pontosak, és a modellt arra kényszerítik, hogy különböző dimenziókként tanulják meg a szélességet és a hosszúságot. Ha helyadatok alapján próbál személyre szabni, az segít a helyadatok nagyobb szektorokban történő csoportosításában. Ennek egy egyszerű módja, ha kiválasztja a megfelelő kerekítési pontosságot a lat-long számokhoz, és a szélességet és a hosszúságot egy sztringgel kombinálja a "területekre". Például egy jó módszer a Lat ábrázolására: 47.67402° N, Hosszú: 122.12154° W a néhány kilométer széles régiókban a "hely":"34.3 , 12.1".
- Funkciókészletek kibontása extrapolált információkkal További funkciókat is kaphat, ha olyan ismeretlen attribútumokra gondol, amelyek a már meglévő információkból származtathatók. Egy fiktív filmlistában például lehetséges, hogy a hétvége és a hétköznap eltérő viselkedést vált ki a felhasználóktól? Az idő kibontható úgy, hogy "hétvége" vagy "hétköznap" attribútummal rendelkezzen. A nemzeti/regionális kulturális ünnepek bizonyos filmtípusokra irányítják a figyelmet? A "Halloween" attribútum például olyan helyeken hasznos, ahol releváns. Lehetséges, hogy az esős időjárás jelentős hatással van a film kiválasztására sok ember számára? Az idő és a hely alapján egy időjárási szolgáltatás szolgáltathatja ezeket az információkat, és további funkcióként is hozzáadhatja.
Következő lépések
Szabályzatteljesítmények elemzése offline kiértékeléssel a Personalizerrel.