Componente de Regressão da Árvore de Decisões Aumentado

Este artigo descreve um componente no estruturador do Azure Machine Learning.

Utilize este componente para criar um conjunto de árvores de regressão através do reforço. Impulsionar significa que cada árvore depende de árvores anteriores. O algoritmo aprende ao ajustar o residual das árvores que o precederam. Assim, impulsionar um conjunto de árvore de decisões tende a melhorar a precisão com algum pequeno risco de menos cobertura.

Este componente baseia-se no algoritmo LightGBM.

Este método de regressão é um método de aprendizagem supervisionado e, portanto, requer um conjunto de dados etiquetado. A coluna de etiqueta tem de conter valores numéricos.

Nota

Utilize este componente apenas com conjuntos de dados que utilizem variáveis numéricas.

Depois de definir o modelo, prepare-o com o Modelo de Preparação.

Mais sobre árvores de regressão reforçadas

O reforço é um dos vários métodos clássicos para criar modelos de conjunto, juntamente com o empacotamento, florestas aleatórias, etc. No Azure Machine Learning, as árvores de decisões avançadas utilizam uma implementação eficiente do algoritmo de aumento de gradação mart. O aumento de gradação é uma técnica de machine learning para problemas de regressão. Cria cada árvore de regressão de forma passo a passo, utilizando uma função de perda predefinida para medir o erro em cada passo e corrigir o mesmo no próximo. Assim, o modelo de predição é, na verdade, um conjunto de modelos de predição mais fracos.

Em problemas de regressão, impulsionar cria uma série de árvores de uma forma em termos de passo e, em seguida, seleciona a árvore ideal com uma função de perda diferencial arbitrária.

Para obter informações adicionais, veja estes artigos:

O método de aumento de gradação também pode ser utilizado para problemas de classificação ao reduzi-los à regressão com uma função de perda adequada. Para obter mais informações sobre a implementação de árvores aumentadas para tarefas de classificação, veja Árvore de Decisões Aumentada de Duas Classes.

Como configurar a Regressão da Árvore de Decisões Aumentada

  1. Adicione o componente Árvore de Decisões Aumentada ao pipeline. Pode encontrar este componente em Machine Learning, Inicializar, na categoria Regressão .

  2. Especifique como pretende que o modelo seja preparado ao definir a opção Criar modo de formador .

    • Parâmetro Único: selecione esta opção se souber como pretende configurar o modelo e fornecer um conjunto específico de valores como argumentos.

    • Intervalo de Parâmetros: selecione esta opção se não tiver a certeza dos melhores parâmetros e quiser executar uma varrimento de parâmetros. Selecione um intervalo de valores para iterar e os Hiperparâmetros do Modelo de Otimização iteram todas as combinações possíveis das definições que forneceu para determinar os hiperparâmetros que produzem os resultados ideais.

  3. Número máximo de folhas por árvore: indique o número máximo de nós terminais (folhas) que podem ser criados em qualquer árvore.

    Ao aumentar este valor, pode aumentar potencialmente o tamanho da árvore e obter uma maior precisão, correndo o risco de sobreajuste e tempo de preparação mais longo.

  4. Número mínimo de amostras por nó de folha: indique o número mínimo de casos necessários para criar qualquer nó terminal (folha) numa árvore.

    Ao aumentar este valor, aumenta o limiar para criar novas regras. Por exemplo, com o valor predefinido de 1, mesmo um único caso pode fazer com que seja criada uma nova regra. Se aumentar o valor para 5, os dados de preparação terão de conter, pelo menos, 5 casos que cumpram as mesmas condições.

  5. Taxa de aprendizagem: escreva um número entre 0 e 1 que defina o tamanho do passo durante a aprendizagem. A taxa de aprendizagem determina a rapidez ou a lentidão com que o formando converge na solução ideal. Se o tamanho do passo for demasiado grande, poderá ultrapassar a solução ideal. Se o tamanho do passo for demasiado pequeno, a preparação demora mais tempo a convergir para a melhor solução.

  6. Número de árvores construídas: indique o número total de árvores de decisões a criar no conjunto. Ao criar mais árvores de decisões, pode potencialmente obter uma melhor cobertura, mas o tempo de preparação aumenta.

    Se definir o valor como 1; no entanto, só é produzida uma árvore (a árvore com o conjunto inicial de parâmetros) e não são efetuadas mais iterações.

  7. Semente de número aleatório: escreva um número inteiro opcional não negativo para utilizar como o valor de seed aleatório. Especificar uma semente garante a reprodutibilidade entre execuções que têm os mesmos dados e parâmetros.

    Por predefinição, a semente aleatória está definida como 0, o que significa que o valor de seed inicial é obtido a partir do relógio do sistema.

  8. Preparar o modelo:

    • Se definir Criar modo de formador como Parâmetro Único, ligue um conjunto de dados etiquetado e o componente Preparar Modelo .

    • Se definir Criar modo de formador como Intervalo de Parâmetros, ligue um conjunto de dados etiquetado e prepare o modelo com Os Hiperparâmetros do Modelo de Otimização.

    Nota

    Se transmitir um intervalo de parâmetros para Preparar Modelo, este utiliza apenas o valor predefinido na lista de parâmetros únicos.

    Se transmitir um único conjunto de valores de parâmetros para o componente Otimizar Hiperparâmetros do Modelo , quando espera um intervalo de definições para cada parâmetro, ignora os valores e utiliza os valores predefinidos para o formando.

    Se selecionar a opção Intervalo de Parâmetros e introduzir um valor único para qualquer parâmetro, esse valor único que especificou é utilizado ao longo da operação de varrimento, mesmo que outros parâmetros sejam alterados num intervalo de valores.

  9. Submeta o pipeline.

Resultados

Após a conclusão da preparação:

  • Para utilizar o modelo para classificação, ligue Preparar Modelo a Modelo de Classificação para prever valores para novos exemplos de entrada.

  • Para guardar um instantâneo do modelo preparado, selecione o separador Saídas no painel direito do modelo Preparado e clique em Registar ícone do conjunto de dados . A cópia do modelo preparado será guardada como um componente na árvore de componentes e não será atualizada em execuções sucessivas do pipeline.

Passos seguintes

Veja o conjunto de componentes disponíveis para o Azure Machine Learning.