Серия

Стохастик Онлайн Максимизация AUC

на Yiming Ying

Область под ROC (AUC) — это метрика, которая широко используется для измерения производительности классификации для несбалансированных данных. Это теоретический и практический интерес для разработки алгоритмов онлайн-обучения, которые максимизирует AUC для крупномасштабных данных. Конкретная проблема в разработке алгоритма максимизации AUC в Интернете заключается в том, что целевая функция обучения обычно определяется по паре примеров обучения противоположных классов, а существующие методы обеспечивают встроенную обработку с более высокой сложностью пространства и времени. В этой работе мы предлагаем новый стохастический онлайн-алгоритм для максимизации AUC. В частности, мы показываем, что оптимизация AUC может быть эквивалентно сформулирована как проблема с заглушки седла. Из этого седлового представления предлагается стохастический онлайн-алгоритм (SOLAM), который имеет время и пространство сложности одного datum. Мы устанавливаем теоретические конвергенции SOLAM с высокой вероятностью и демонстрируем ее эффективность в стандартных наборах данных теста.