Árvore de Decisões Elevada Multiclasse

Este artigo descreve um componente no estruturador do Azure Machine Learning.

Utilize este componente para criar um modelo de machine learning baseado no algoritmo de árvores de decisões impulsionado.

Uma árvore de decisões elevada é um método de aprendizagem conjunto no qual a segunda árvore corrige para os erros da primeira árvore, a terceira árvore corrige para os erros da primeira e segunda árvores, etc. As predições baseiam-se no conjunto de árvores em conjunto.

Como configurar

Este componente cria um modelo de classificação não preparado. Uma vez que a classificação é um método de aprendizagem supervisionado, precisa de um conjunto de dados etiquetado que inclua uma coluna de etiqueta com um valor para todas as linhas.

Pode preparar este tipo de modelo com o Modelo de Preparação.

  1. Adicione o componente Árvore de Decisões Aumentada de Multiclasse ao pipeline.

  2. Especifique como pretende que o modelo seja preparado ao definir a opção Criar modo de formador .

    • Parâmetro Único: se souber como pretende configurar o modelo, pode fornecer um conjunto específico de valores como argumentos.

    • Intervalo de Parâmetros: selecione esta opção se não tiver a certeza dos melhores parâmetros e quiser executar uma varrimento de parâmetros. Selecione um intervalo de valores para iterar e os Hiperparâmetros do Modelo de Otimização iteram todas as combinações possíveis das definições que forneceu para determinar os hiperparâmetros que produzem os resultados ideais.

  3. O número máximo de folhas por árvore limita o número máximo de nós terminais (folhas) que podem ser criados em qualquer árvore.

    Ao aumentar este valor, pode aumentar potencialmente o tamanho da árvore e obter uma maior precisão, correndo o risco de sobreajuste e tempo de preparação mais longo.

  4. O número mínimo de amostras por nó de folha indica o número de casos necessários para criar qualquer nó terminal (folha) numa árvore.

    Ao aumentar este valor, aumenta o limiar para criar novas regras. Por exemplo, com o valor predefinido de 1, mesmo um único caso pode fazer com que seja criada uma nova regra. Se aumentar o valor para 5, os dados de preparação terão de conter, pelo menos, cinco casos que cumpram as mesmas condições.

  5. A taxa de aprendizagem define o tamanho do passo durante a aprendizagem. Introduza um número entre 0 e 1.

    A taxa de aprendizagem determina a rapidez ou a lentidão com que o formando converge numa solução ideal. Se o tamanho do passo for demasiado grande, poderá ultrapassar a solução ideal. Se o tamanho do passo for demasiado pequeno, a preparação demora mais tempo a convergir para a melhor solução.

  6. O número de árvores construídas indica o número total de árvores de decisão a criar no conjunto. Ao criar mais árvores de decisões, pode potencialmente obter uma melhor cobertura, mas o tempo de preparação aumentará.

  7. Opcionalmente, a semente de número aleatório define um número inteiro não negativo para utilizar como o valor de seed aleatório. Especificar uma semente garante a reprodutibilidade entre execuções que têm os mesmos dados e parâmetros.

    A semente aleatória é definida por predefinição como 42. As execuções sucessivas com diferentes sementes aleatórias podem ter resultados diferentes.

  8. Preparar o modelo:

    • Se definir Criar modo de formador como Parâmetro Único, ligue um conjunto de dados etiquetado e o componente Preparar Modelo .

    • Se definir Criar modo de formador como Intervalo de Parâmetros, ligue um conjunto de dados etiquetado e prepare o modelo com Os Hiperparâmetros do Modelo de Otimização.

    Nota

    Se transmitir um intervalo de parâmetros para Preparar Modelo, este utiliza apenas o valor predefinido na lista de parâmetros únicos.

    Se transmitir um único conjunto de valores de parâmetros para o componente Otimizar Hiperparâmetros do Modelo , quando espera um intervalo de definições para cada parâmetro, ignora os valores e utiliza os valores predefinidos para o formando.

    Se selecionar a opção Intervalo de Parâmetros e introduzir um valor único para qualquer parâmetro, esse valor único que especificou é utilizado ao longo da operação de varrimento, mesmo que outros parâmetros sejam alterados num intervalo de valores.

Passos seguintes

Veja o conjunto de componentes disponíveis para o Azure Machine Learning.