Componente de Regressão da Floresta de Decisão

Este artigo descreve um componente no estruturador do Azure Machine Learning.

Utilize este componente para criar um modelo de regressão com base num conjunto de árvores de decisões.

Depois de configurar o modelo, tem de preparar o modelo com um conjunto de dados etiquetado e o componente Preparar Modelo . Em seguida, o modelo preparado pode ser utilizado para fazer predições.

Como funciona

As árvores de decisões são modelos não paramétricos que executam uma sequência de testes simples para cada instância, atravessando uma estrutura de dados de árvore binária até que um nó de folha (decisão) seja alcançado.

As árvores de decisões têm estas vantagens:

  • São eficientes na utilização de computação e memória durante a preparação e a predição.

  • Podem representar limites de decisão não lineares.

  • Executam a seleção e classificação de funcionalidades integradas e são resilientes na presença de funcionalidades ruidosas.

Este modelo de regressão consiste num conjunto de árvores de decisões. Cada árvore numa floresta de decisão de regressão produz uma distribuição gaussiana como uma predição. É efetuada uma agregação sobre o conjunto de árvores para encontrar uma distribuição gaussiana mais próxima da distribuição combinada para todas as árvores no modelo.

Para obter mais informações sobre a arquitetura teórica para este algoritmo e a sua implementação, veja este artigo: Decision Forests: A Unified Framework for Classification, Regression, Density Estimation, Manifold Learning and Semi-Supervised Learning

Como configurar o Modelo de Regressão da Floresta de Decisão

  1. Adicione o componente Regressão da Floresta de Decisão ao pipeline. Pode encontrar o componente no estruturador em Machine Learning, Inicializar Modelo e Regressão.

  2. Abra as propriedades do componente e, para o método Resampling, escolha o método utilizado para criar as árvores individuais. Pode escolher entre Empacotar ou Replicar.

  3. Especifique como pretende que o modelo seja preparado ao definir a opção Criar modo de formador .

    • Parâmetro Único

      Se souber como pretende configurar o modelo, pode fornecer um conjunto específico de valores como argumentos. Poderá ter aprendido estes valores através da experimentação ou recebido como orientação.

    • Intervalo de Parâmetros: selecione esta opção se não tiver a certeza dos melhores parâmetros e quiser executar uma varrimento de parâmetros. Selecione um intervalo de valores para iterar e os Hiperparâmetros do Modelo de Otimização iteram todas as combinações possíveis das definições que forneceu para determinar os hiperparâmetros que produzem os resultados ideais.

  4. Em Número de árvores de decisões, indique o número total de árvores de decisões a criar no conjunto. Ao criar mais árvores de decisões, pode potencialmente obter uma melhor cobertura, mas o tempo de preparação aumentará.

    Dica

    Se definir o valor como 1; no entanto, isto significa que apenas será produzida uma árvore (a árvore com o conjunto inicial de parâmetros) e não serão efetuadas mais iterações.

  5. Para Profundidade máxima das árvores de decisões, escreva um número para limitar a profundidade máxima de qualquer árvore de decisões. Aumentar a profundidade da árvore pode aumentar a precisão, correndo o risco de algum sobreajuste e aumento do tempo de preparação.

  6. Em Número de divisões aleatórias por nó, escreva o número de divisões a utilizar ao criar cada nó da árvore. Uma divisão significa que as funcionalidades em cada nível da árvore (nó) são divididas aleatoriamente.

  7. Para o Número mínimo de amostras por nó de folha, indique o número mínimo de casos necessários para criar qualquer nó terminal (folha) numa árvore.

    Ao aumentar este valor, aumenta o limiar para criar novas regras. Por exemplo, com o valor predefinido de 1, mesmo um único caso pode fazer com que seja criada uma nova regra. Se aumentar o valor para 5, os dados de preparação terão de conter, pelo menos, cinco casos que cumpram as mesmas condições.

  8. Preparar o modelo:

    • Se definir Criar modo de formador como Parâmetro Único, ligue um conjunto de dados etiquetado e o componente Preparar Modelo .

    • Se definir Criar modo de formador como Intervalo de Parâmetros, ligue um conjunto de dados etiquetado e prepare o modelo com Os Hiperparâmetros do Modelo de Otimização.

    Nota

    Se transmitir um intervalo de parâmetros para Preparar Modelo, este utiliza apenas o valor predefinido na lista de parâmetros únicos.

    Se transmitir um único conjunto de valores de parâmetros para o componente Otimizar Hiperparâmetros do Modelo , quando espera um intervalo de definições para cada parâmetro, ignora os valores e utiliza os valores predefinidos para o formando.

    Se selecionar a opção Intervalo de Parâmetros e introduzir um valor único para qualquer parâmetro, esse valor único que especificou é utilizado ao longo da operação de varrimento, mesmo que outros parâmetros sejam alterados num intervalo de valores.

  9. Submeta o pipeline.

Resultados

Após a conclusão da preparação:

  • Para guardar um instantâneo do modelo preparado, selecione o componente de preparação e, em seguida, mude para o separador Saídas no painel direito. Clique no ícone Registar modelo. Pode encontrar o modelo guardado como um componente na árvore de componentes.

Passos seguintes

Veja o conjunto de componentes disponíveis para o Azure Machine Learning.