Создание моделей классификации по нескольким классам

Завершено

Кроме того, можно создать модели многоклассовой классификации, в которых существует более двух возможных классов. Например, клиника может расширить модель для диабета для следующий классификации пациентов:

  • диабета нет;
  • диабет 1-го типа;
  • диабет 2-го типа.

Значения вероятности отдельных классов все равно будут в сумме равны 1 (пациент определенно находится только в одном из трех классов), а наиболее вероятный класс будет прогнозироваться моделью.

Использование моделей классификации по нескольким классам

Классификацию по нескольким классам можно рассматривать как сочетание нескольких двоичных классификаторов. Существует два подхода.

  • Один против всех (OVR), где создается классификатор для каждого возможного значения класса: положительный результат для случаев, когда предсказание относится к этому классу, и отрицательный для случаев, когда предсказание относится к любому другому классу. Например, проблема классификации с четырьмя возможными классами фигур (квадрат, круг, треугольник, шестнадцатеричная) потребует четырех классификаторов, которые прогнозируют:
    • квадрат или нет;
    • круг или нет;
    • треугольник или нет
    • шестиугольник или нет.
  • Один и Один (OVO), в котором создается классификатор для каждой возможной пары классов. Для задачи классификации с четырьмя классами фигур потребуется следующее двоичное классификаторы:
    • квадрат или круг;
    • квадрат или треугольник;
    • квадрат или шестиугольник;
    • круг или треугольник;
    • круг или шестиугольник;
    • треугольник или шестиугольник

В обоих подходах общая модель должна учитывать все эти прогнозы, чтобы определить, к какой категории принадлежит элемент.

К счастью, в большинстве платформ машинного обучения, включая Scikit-Learn, реализация модели многоклассовой классификации не является значительно более сложной, чем двоичная классификация, и в большинстве случаев средства оценки, используемые для двоичной классификации, неявно поддерживают многоклассовую классификацию путем абстрагирования алгоритма OVR, алгоритма OVO или путем предоставления выбора.