Episode
Interpretierbare Verteilungsfeatures mit maximaler Testleistung
durch Wittawat Jitkrittum
Es werden zwei Semimetriken für Wahrscheinlichkeitsverteilungen vorgeschlagen, da die Summe der Erwartungen an analysetechnische Funktionen, die an räumlichen oder Frequenzstandorten ausgewertet werden (d. h. Features). Die Features werden ausgewählt, um die Unterscheidungsfähigkeit der Verteilungen zu maximieren, indem sie eine untere Grenze für Testleistung für einen statistischen Test mithilfe dieser Features optimieren. Das Ergebnis ist ein parsimonischer und interpretierbarer Hinweis darauf, wie und wo sich zwei Verteilungen lokal unterscheiden. Eine empirische Schätzung des Testleistungskriteriums konvergiert mit zunehmender Stichprobengröße und stellt die Qualität der zurückgegebenen Features sicher. In realen Benchmarks für hochdimensionale Text- und Bilddaten erzielen lineare Zeittests unter Verwendung der vorgeschlagenen Semimetrik eine vergleichbare Leistung mit dem modernsten quadratischen Höchstwertabweichungstest, während die von Menschen interpretierten Features zurückgegeben werden, die die Testergebnisse erläutern.
Es werden zwei Semimetriken für Wahrscheinlichkeitsverteilungen vorgeschlagen, da die Summe der Erwartungen an analysetechnische Funktionen, die an räumlichen oder Frequenzstandorten ausgewertet werden (d. h. Features). Die Features werden ausgewählt, um die Unterscheidungsfähigkeit der Verteilungen zu maximieren, indem sie eine untere Grenze für Testleistung für einen statistischen Test mithilfe dieser Features optimieren. Das Ergebnis ist ein parsimonischer und interpretierbarer Hinweis darauf, wie und wo sich zwei Verteilungen lokal unterscheiden. Eine empirische Schätzung des Testleistungskriteriums konvergiert mit zunehmender Stichprobengröße und stellt die Qualität der zurückgegebenen Features sicher. In realen Benchmarks für hochdimensionale Text- und Bilddaten erzielen lineare Zeittests unter Verwendung der vorgeschlagenen Semimetrik eine vergleichbare Leistung mit dem modernsten quadratischen Höchstwertabweichungstest, während die von Menschen interpretierten Features zurückgegeben werden, die die Testergebnisse erläutern.
Feedback? Melden Sie hier ein Problem.