Episode
Stochastische Online AUC Maximierung
durch Yiming Ying
Die Fläche unter ROC (AUC) ist eine Metrik, die häufig zur Messung der Klassifizierungsleistung für ungleichgewichtige Daten verwendet wird. Es ist theoretisch und praktisch interessant, Online-Lernalgorithmen zu entwickeln, die AUC für umfangreiche Daten maximieren. Eine besondere Herausforderung bei der Entwicklung des Online-AUC-Maximierungsalgorithmus besteht darin, dass die Lernzielfunktion in der Regel über ein Paar von Schulungsbeispielen entgegengesetzter Klassen definiert wird, und vorhandene Methoden erreichen die Onlineverarbeitung mit höherer Raum- und Zeitkomplexität. In dieser Arbeit schlagen wir einen neuen stochastischen Online-Algorithmus für die AUC-Maximierung vor. Insbesondere zeigen wir, dass die AUC-Optimierung gleichwertig als Konvex-Concave-Sattelpunktproblem formuliert werden kann. Aus dieser Satteldarstellung wird ein stochastischer Onlinealgorithmus (SOLAM) vorgeschlagen, der zeit- und raumkomplexität eines Datums hat. Wir etablieren theoretische Konvergenz von SOLAM mit hoher Wahrscheinlichkeit und demonstrieren ihre Wirksamkeit und Effizienz bei Standard-Benchmark-Datasets.
Die Fläche unter ROC (AUC) ist eine Metrik, die häufig zur Messung der Klassifizierungsleistung für ungleichgewichtige Daten verwendet wird. Es ist theoretisch und praktisch interessant, Online-Lernalgorithmen zu entwickeln, die AUC für umfangreiche Daten maximieren. Eine besondere Herausforderung bei der Entwicklung des Online-AUC-Maximierungsalgorithmus besteht darin, dass die Lernzielfunktion in der Regel über ein Paar von Schulungsbeispielen entgegengesetzter Klassen definiert wird, und vorhandene Methoden erreichen die Onlineverarbeitung mit höherer Raum- und Zeitkomplexität. In dieser Arbeit schlagen wir einen neuen stochastischen Online-Algorithmus für die AUC-Maximierung vor. Insbesondere zeigen wir, dass die AUC-Optimierung gleichwertig als Konvex-Concave-Sattelpunktproblem formuliert werden kann. Aus dieser Satteldarstellung wird ein stochastischer Onlinealgorithmus (SOLAM) vorgeschlagen, der zeit- und raumkomplexität eines Datums hat. Wir etablieren theoretische Konvergenz von SOLAM mit hoher Wahrscheinlichkeit und demonstrieren ihre Wirksamkeit und Effizienz bei Standard-Benchmark-Datasets.
Feedback? Melden Sie hier ein Problem.