Megosztás a következőn keresztül:


Az adathalmazok ismertetése

A gépi tanulási modellek "tanulnak" a betanítási adatokban rögzített korábbi döntésekből és műveletekből. Ennek eredményeképpen a valós forgatókönyvekben való teljesítményüket nagyban befolyásolják a betanított adatok. Ha az adathalmazok funkcióterjesztése el van varrva, a modell helytelenül jelezheti előre az alulreprezentált csoporthoz tartozó adatpontokat, vagy nem megfelelő metrikák mentén optimalizálható.

Míg például egy modell betanít egy AI-rendszert a lakásárak előrejelzésére, a betanítási csoport az újabb házak 75 százalékát tette ki, amelyek mediánnál alacsonyabb árakkal rendelkeztek. Ennek eredményeképpen sokkal kevésbé volt pontos a drágább történelmi házak sikeres azonosításában. A javítás az volt, hogy régebbi és drága házakat ad hozzá a betanítási adatokhoz, és kibővíti a funkciókat, hogy betekintést nyerjen az előzményértékbe. Ez az adatnagyobbítás javította az eredményeket.

A Felelős AI-irányítópult adatelemzési összetevője segít az adathalmazok előrejelzésen és tényleges eredményeken, hibacsoportokon és adott funkciókon alapuló vizualizációban. Segít azonosítani a túlreprezentálással és az alulreprezentálással kapcsolatos problémákat, valamint az adathalmazban az adatok fürtözésének módját. Az adatvizualizációk összesített diagramokból vagy egyéni adatpontokból állnak.

Mikor érdemes adatelemzést használni?

Adatelemzést akkor használjon, ha a következőkre van szüksége:

  • Az adathalmaz statisztikáinak megismeréséhez különböző szűrőket választva különböző dimenziókba (más néven kohorszokba) szeletelheti az adatokat.
  • Ismerje meg az adathalmaz különböző kohorszok és szolgáltatáscsoportok közötti elosztását.
  • Annak meghatározása, hogy a méltányossággal, a hibaelemzéssel és az okozatisággal kapcsolatos (más irányítópult-összetevőkből származó) megállapítások az adathalmaz eloszlásának eredményei-e.
  • Döntse el, hogy mely területeken gyűjtsön több adatot a reprezentációs problémákból, a címkezajból, a funkciózajból, a címkék torzításából és hasonló tényezőkből eredő hibák elhárításához.

Következő lépések