componente de Máquina de Vetor de Suporte Two-Class

Este artigo descreve um componente no estruturador do Azure Machine Learning.

Utilize este componente para criar um modelo baseado no algoritmo de máquina de vetor de suporte.

As máquinas de vetor de suporte (SVMs) são uma classe bem pesquisada de métodos de aprendizagem supervisionados. Esta implementação específica é adequada para a predição de dois resultados possíveis, com base em variáveis contínuas ou categóricas.

Depois de definir os parâmetros do modelo, prepare o modelo com os componentes de preparação e forneça um conjunto de dados etiquetado que inclua uma etiqueta ou coluna de resultado.

Acerca das máquinas de vetor de suporte

As máquinas de vetor de suporte estão entre os primeiros algoritmos de machine learning e os modelos SVM têm sido utilizados em muitas aplicações, desde a obtenção de informações até à classificação de texto e imagem. As SVMs podem ser utilizadas para tarefas de classificação e regressão.

Este modelo SVM é um modelo de aprendizagem supervisionado que requer dados etiquetados. No processo de preparação, o algoritmo analisa os dados de entrada e reconhece padrões num espaço de funcionalidades multidimensional chamado hiperplano. Todos os exemplos de entrada são representados como pontos neste espaço e são mapeados para categorias de saída de forma a que as categorias sejam divididas por uma diferença o mais ampla e clara possível.

Para predição, o algoritmo SVM atribui novos exemplos numa categoria ou noutra, mapeando-os para esse mesmo espaço.

Como configurar

Para este tipo de modelo, recomenda-se que normalize o conjunto de dados antes de o utilizar para preparar o classificador.

  1. Adicione o componente máquina vetor de suporte de duas classes ao pipeline.

  2. Especifique como pretende que o modelo seja preparado ao definir a opção Criar modo de formador .

    • Parâmetro Único: se souber como pretende configurar o modelo, pode fornecer um conjunto específico de valores como argumentos.

    • Intervalo de Parâmetros: se não tiver a certeza dos melhores parâmetros, pode encontrar os parâmetros ideais com o componente Otimizar Hiperparâmetros do Modelo . Fornece algum intervalo de valores e o treinador itera várias combinações das definições para determinar a combinação de valores que produz o melhor resultado.

  3. Em Número de iterações, escreva um número que denota o número de iterações utilizadas ao criar o modelo.

    Este parâmetro pode ser utilizado para controlar a compensação entre a velocidade de preparação e a precisão.

  4. Para Lambda, escreva um valor a utilizar como peso para a regularização L1.

    Este coeficiente de regularização pode ser utilizado para otimizar o modelo. Os valores maiores penalizam modelos mais complexos.

  5. Selecione a opção Normalizar funcionalidades, se quiser normalizar as funcionalidades antes da preparação.

    Se aplicar a normalização, antes da preparação, os pontos de dados são centrados na média e dimensionados para terem uma unidade de desvio padrão.

  6. Selecione a opção Project to the unit sphere (Projetar para a esfera unitário) para normalizar os coeficientes.

    Projetar valores para espaço unitário significa que, antes da preparação, os pontos de dados são centrados em 0 e dimensionados para ter uma unidade de desvio padrão.

  7. Em Semente de número aleatório, escreva um valor inteiro para utilizar como semente, se quiser garantir a reprodutibilidade entre execuções. Caso contrário, um valor de relógio do sistema é utilizado como uma semente, o que pode resultar em resultados ligeiramente diferentes em execuções.

  8. Ligue um conjunto de dados etiquetado e prepare o modelo:

    • Se definir Criar modo de formador como Parâmetro Único, ligue um conjunto de dados etiquetado e o componente Preparar Modelo .

    • Se definir Criar modo de formador como Intervalo de Parâmetros, ligue um conjunto de dados etiquetado e prepare o modelo com Os Hiperparâmetros do Modelo de Otimização.

    Nota

    Se passar um intervalo de parâmetros para Preparar Modelo, este utiliza apenas o valor predefinido na lista de parâmetros únicos.

    Se transmitir um único conjunto de valores de parâmetros para o componente Tune Model Hyperparameters , quando espera um intervalo de definições para cada parâmetro, ignora os valores e utiliza os valores predefinidos para o formando.

    Se selecionar a opção Intervalo de Parâmetros e introduzir um único valor para qualquer parâmetro, esse valor único que especificou é utilizado ao longo da pesquisa, mesmo que outros parâmetros sejam alterados num intervalo de valores.

  9. Submeta o pipeline.

Resultados

Após a conclusão da preparação:

  • Para guardar um instantâneo do modelo preparado, selecione o separador Saídas no painel direito do componente Preparar modelo . Selecione o ícone Registar conjunto de dados para guardar o modelo como um componente reutilizável.

  • Para utilizar o modelo para classificação, adicione o componente Score Model a um pipeline.

Passos seguintes

Veja o conjunto de componentes disponíveis para o Azure Machine Learning.