Az adathalmazok ismertetése
A gépi tanulási modellek "tanulnak" a betanítási adatokban rögzített korábbi döntésekből és műveletekből. Ennek eredményeképpen a valós forgatókönyvekben való teljesítményüket nagyban befolyásolják a betanított adatok. Ha az adathalmazok funkcióterjesztése el van varrva, a modell helytelenül jelezheti előre az alulreprezentált csoporthoz tartozó adatpontokat, vagy nem megfelelő metrikák mentén optimalizálható.
Míg például egy modell betanít egy AI-rendszert a lakásárak előrejelzésére, a betanítási csoport az újabb házak 75 százalékát tette ki, amelyek mediánnál alacsonyabb árakkal rendelkeztek. Ennek eredményeképpen sokkal kevésbé volt pontos a drágább történelmi házak sikeres azonosításában. A javítás az volt, hogy régebbi és drága házakat ad hozzá a betanítási adatokhoz, és kibővíti a funkciókat, hogy betekintést nyerjen az előzményértékbe. Ez az adatnagyobbítás javította az eredményeket.
A Felelős AI-irányítópult adatelemzési összetevője segít az adathalmazok előrejelzésen és tényleges eredményeken, hibacsoportokon és adott funkciókon alapuló vizualizációban. Segít azonosítani a túlreprezentálással és az alulreprezentálással kapcsolatos problémákat, valamint az adathalmazban az adatok fürtözésének módját. Az adatvizualizációk összesített diagramokból vagy egyéni adatpontokból állnak.
Mikor érdemes adatelemzést használni?
Adatelemzést akkor használjon, ha a következőkre van szüksége:
- Az adathalmaz statisztikáinak megismeréséhez különböző szűrőket választva különböző dimenziókba (más néven kohorszokba) szeletelheti az adatokat.
- Ismerje meg az adathalmaz különböző kohorszok és szolgáltatáscsoportok közötti elosztását.
- Annak meghatározása, hogy a méltányossággal, a hibaelemzéssel és az okozatisággal kapcsolatos (más irányítópult-összetevőkből származó) megállapítások az adathalmaz eloszlásának eredményei-e.
- Döntse el, hogy mely területeken gyűjtsön több adatot a reprezentációs problémákból, a címkezajból, a funkciózajból, a címkék torzításából és hasonló tényezőkből eredő hibák elhárításához.
Következő lépések
- Megtudhatja, hogyan hozhatja létre a Felelős AI-irányítópultot a parancssori felület és az SDK vagy az Azure Machine Learning Studio felhasználói felületén keresztül.
- Ismerje meg a Felelős AI-irányítópult támogatott adatelemzési vizualizációit .
- Megtudhatja, hogyan hozhat létre felelős AI scorecardot a Felelős AI-irányítópulton megfigyelt megállapítások alapján.