Criar modelos de classificação multiclasse

Concluído

Também é possível criar modelos de classificação multiclasse , nos quais há mais de duas classes possíveis. Por exemplo, a clínica de saúde pode expandir o modelo de diabetes para classificar os pacientes como:

  • não-diabéticos
  • Diabético tipo 1
  • Diabético tipo 2

Os valores de probabilidade da classe individual ainda somariam um total de 1, pois o paciente está definitivamente em apenas uma das três classes, e a classe mais provável seria prevista pelo modelo.

Usando modelos de classificação multiclasse

A classificação multiclasse pode ser pensada como uma combinação de vários classificadores binários. Há duas maneiras de abordar o problema:

  • One vs Rest (OVR), no qual um classificador é criado para cada valor de classe possível, com um resultado positivo para casos em que a previsão é essa classe, e previsões negativas para casos em que a previsão é qualquer outra classe. Por exemplo, um problema de classificação com quatro classes de forma possíveis (quadrado, círculo, triângulo, hexágono) exigiria quatro classificadores que prevejam:
    • quadrado ou não
    • círculo ou não
    • triângulo ou não
    • hexágono ou não
  • One vs One (OVO), no qual um classificador para cada par possível de classes é criado. O problema de classificação com quatro classes de forma exigiria os seguintes classificadores binários:
    • quadrado ou círculo
    • quadrado ou triângulo
    • quadrado ou hexágono
    • círculo ou triângulo
    • círculo ou hexágono
    • triângulo ou hexágono

Em ambas as abordagens, o modelo geral deve levar em conta todas essas previsões para determinar a qual categoria única o item pertence.

Felizmente, na maioria das estruturas de aprendizado de máquina, incluindo o Scikit-Learn, a implementação de um modelo de classificação multiclasse não é significativamente mais complexa do que a classificação binária - e, na maioria dos casos, os estimadores usados para classificação binária suportam implicitamente a classificação multiclasse abstraindo um algoritmo OVR, um algoritmo OVO ou permitindo uma escolha de ambos.