Score Vowpal Wabbit Model

Este artigo descreve como utilizar o componente Score Vowpal Wabbit Model no estruturador do Azure Machine Learning para gerar pontuações para um conjunto de dados de entrada, utilizando um modelo Vowpal Wabbit preparado existente.

Este componente fornece a versão mais recente da arquitetura Vowpal Wabbit, versão 8.8.1. Utilize este componente para classificar dados com um modelo preparado guardado no formato VW versão 8.

Como configurar o Modelo de Wabbit Vowpal de Classificação

  1. Adicione o componente Score Vowpal Wabbit Model à sua experimentação.

  2. Adicione um modelo Vowpal Wabbit preparado e ligue-o à porta de entrada esquerda. Pode utilizar um modelo preparado criado na mesma experimentação ou localizar um modelo guardado na categoria Conjuntos de dados do painel de navegação esquerdo do estruturador. No entanto, o modelo tem de estar disponível no Estruturador do Azure Machine Learning.

    Nota

    Apenas são suportados os modelos Vowpal Wabbit 8.8.1; não pode ligar modelos guardados preparados com outros algoritmos.

  3. Adicione o conjunto de dados de teste e ligue-o à porta de entrada à direita. Se o conjunto de dados de teste for um diretório, que contém o ficheiro de dados de teste, especifique o nome do ficheiro de dados de teste com o Nome do ficheiro de dados de teste. Se o conjunto de dados de teste for um único ficheiro, deixe o Nome do ficheiro de dados de teste vazio.

  4. Na caixa de texto argumentos VW , escreva um conjunto de argumentos de linha de comandos válidos para o executável Vowpal Wabbit.

    Para obter informações sobre os argumentos Vowpal Wabbit suportados e não suportados no Azure Machine Learning, consulte a secção Notas Técnicas .

  5. Nome do ficheiro de dados de teste: escreva o nome do ficheiro que contém os dados de entrada. Este argumento só é utilizado quando o conjunto de dados de teste é um diretório.

  6. Especifique o tipo de ficheiro: indique o formato que os seus dados de preparação utilizam. O Vowpal Wabbit suporta estes dois formatos de ficheiro de entrada:

    • A VW representa o formato interno utilizado pelo Vowpal Wabbit. Veja a página wiki Vowpal Wabbit para obter detalhes.
    • O SVMLight é um formato utilizado por outras ferramentas de machine learning.
  7. Selecione a opção Incluir uma coluna extra que contenha etiquetas, se quiser exportar etiquetas juntamente com as pontuações.

    Normalmente, ao processar dados de texto, o Vowpal Wabbit não necessita de etiquetas e devolverá apenas as pontuações de cada linha de dados.

  8. Selecione a opção Incluir uma coluna extra que contenha pontuações não processadas, se quiser produzir pontuações não processadas juntamente com os resultados.

  9. Submeta o pipeline.

Resultados

Após a conclusão da preparação:

  • Para visualizar os resultados, clique com o botão direito do rato na saída do componente Score Vowpal Wabbit Model . O resultado indica uma classificação de predição normalizada de 0 a 1.

  • Para avaliar os resultados, o conjunto de dados de saída deve conter nomes de colunas de classificação específicos, que cumprem os requisitos de componente Avaliar Modelo.

    • Para a tarefa de regressão, o conjunto de dados a avaliar tem de ter uma coluna, denominada Regression Scored Labels, que representa etiquetas com classificação.
    • Para a tarefa de classificação binária, o conjunto de dados a avaliar tem de ter duas colunas, denominadas Binary Class Scored Labels,Binary Class Scored Probabilities, que representam etiquetas classificadas e probabilidades, respetivamente.
    • Para a tarefa de classificação múltipla, o conjunto de dados a avaliar tem de ter uma coluna, denominada Multi Class Scored Labels, que representa etiquetas com classificação.

    Tenha em atenção que os resultados do componente Score Vowpal Wabbit Model não podem ser avaliados diretamente. Antes de avaliar, o conjunto de dados deve ser modificado de acordo com os requisitos acima.

Notas técnicas

Esta secção contém detalhes de implementação, sugestões e respostas a perguntas mais frequentes.

Parâmetros

O Vowpal Wabbit tem muitas opções de linha de comandos para escolher e otimizar algoritmos. Não é possível debater todas estas opções aqui; recomendamos que veja a página wiki Vowpal Wabbit.

Os seguintes parâmetros não são suportados no Azure Machine Learning Studio (clássico).

  • As opções de entrada/saída especificadas em https://github.com/JohnLangford/vowpal_wabbit/wiki/Command-line-arguments

    Estas propriedades já estão configuradas automaticamente pelo componente.

  • Além disso, qualquer opção que gere múltiplas saídas ou utiliza múltiplas entradas não é permitida. Estes incluem --cbt, --ldae --wap.

  • Só são suportados algoritmos de aprendizagem supervisionados. Isto não permite estas opções: –active, , --rank--search etc.

Todos os argumentos que não os descritos acima são permitidos.

Passos seguintes

Veja o conjunto de componentes disponíveis para o Azure Machine Learning.