FastTreeRankingFeaturizationEstimator Classe
Definição
Importante
Algumas informações se referem a produtos de pré-lançamento que podem ser substancialmente modificados antes do lançamento. A Microsoft não oferece garantias, expressas ou implícitas, das informações aqui fornecidas.
Um IEstimator<TTransformer> para transformar o vetor de recursos de entrada em recursos baseados em árvore.
public sealed class FastTreeRankingFeaturizationEstimator : Microsoft.ML.Trainers.FastTree.TreeEnsembleFeaturizationEstimatorBase
type FastTreeRankingFeaturizationEstimator = class
inherit TreeEnsembleFeaturizationEstimatorBase
Public NotInheritable Class FastTreeRankingFeaturizationEstimator
Inherits TreeEnsembleFeaturizationEstimatorBase
- Herança
Comentários
Colunas de entrada e saída
O tipo de dados de rótulo de entrada deve ser do tipo chave ou Single. O valor do rótulo determina a relevância, em que valores mais altos indicam maior relevância. Se o rótulo for um tipo chave, o índice de chave será o valor de relevância, em que o menor índice é o menos relevante. Se o rótulo for um Single, valores maiores indicarão maior relevância. A coluna de recurso deve ser um vetor de tamanho conhecido de e a coluna do Single grupo de linhas de entrada deve ser do tipo de chave .
Esse avaliador gera as seguintes colunas:
Nome da Coluna de Saída | Tipo de coluna | Descrição |
---|---|---|
Trees |
Vetor de tamanho conhecido de Single | Os valores de saída de todas as árvores. Seu tamanho é idêntico ao número total de árvores no modelo de conjunto de árvores. |
Leaves |
Vetor de tamanho conhecido de Single | Representação de vetor de 0 a 1 para as IDs de todas as folhas em que o vetor de recurso de entrada se enquadra. Seu tamanho é o número total de folhas no modelo de conjunto de árvores. |
Paths |
Vetor de tamanho conhecido de Single | 0-1 representação de vetor para os caminhos que o vetor de recurso de entrada passou para alcançar as folhas. Seu tamanho é o número de nós que não são folhas no modelo de conjunto de árvores. |
Essas colunas de saída são opcionais e o usuário pode alterar seus nomes. Defina os nomes das colunas ignoradas como nulos para que elas não sejam produzidas.
Detalhes da previsão
Esse avaliador produz várias colunas de saída de um modelo de conjunto de árvores. Suponha que o modelo contenha apenas uma árvore de decisão:
Node 0
/ \
/ \
/ \
/ \
Node 1 Node 2
/ \ / \
/ \ / \
/ \ Leaf -3 Node 3
Leaf -1 Leaf -2 / \
/ \
Leaf -4 Leaf -5
Suponha que o vetor do recurso de entrada se enquadra em Leaf -1
. A saída Trees
pode ser um vetor de 1 elemento em que o único valor é o valor de decisão transportado por Leaf -1
. A saída Leaves
é um vetor 0-1. Se a folha atingida for a folha $i$-th (indexada por $-(i+1)$ para que a primeira folha seja Leaf -1
) folha na árvore, o valor $i$-th em Leaves
seria 1 e todos os outros valores seriam 0. A saída Paths
é uma representação 0-1 dos nós passados antes de atingir a folha. O elemento $i$-th em Paths
indica se o nó $i$-th (indexado por $i$) é tocado.
Por exemplo, atingir Leaf -1
o valor de $[1, 1, 0, 0]$ como o Paths
. Se houver várias árvores, esse avaliador concatena Trees
Leaves
Paths
apenas as de todas as árvores (as informações da primeira árvore vêm primeiro nos vetores concatenados).
Verifique a seção Consulte Também para obter links para exemplos de uso.
Métodos
Fit(IDataView) |
Produza um TreeEnsembleModelParameters que mapeia a coluna chamada InputColumnName em |
GetOutputSchema(SchemaShape) |
PretrainedTreeFeaturizationEstimator adiciona três colunas de vetor float em |
Métodos de Extensão
AppendCacheCheckpoint<TTrans>(IEstimator<TTrans>, IHostEnvironment) |
Acrescente um 'ponto de verificação de cache' à cadeia de avaliadores. Isso garantirá que os avaliadores downstream sejam treinados em relação aos dados armazenados em cache. É útil ter um ponto de verificação de cache antes dos treinadores que fazem várias passagens de dados. |
WithOnFitDelegate<TTransformer>(IEstimator<TTransformer>, Action<TTransformer>) |
Dado um avaliador, retorne um objeto de encapsulamento que chamará um delegado uma vez Fit(IDataView) chamado. Geralmente, é importante que um avaliador retorne informações sobre o que era adequado, e é por isso que o Fit(IDataView) método retorna um objeto especificamente tipado, em vez de apenas um geral ITransformer. No entanto, ao mesmo tempo, IEstimator<TTransformer> muitas vezes são formados em pipelines com muitos objetos, portanto, talvez seja necessário criar uma cadeia de avaliadores por meio EstimatorChain<TLastTransformer> de onde o avaliador para o qual queremos obter o transformador está enterrado em algum lugar nesta cadeia. Para esse cenário, podemos por meio desse método anexar um delegado que será chamado assim que fit for chamado. |