Compartilhar via


Melhorar seu modelo de ML.NET

Saiba como melhorar seu modelo de ML.NET.

Reenquadrar o problema

Às vezes, melhorar um modelo pode não ter nada a ver com os dados ou técnicas usadas para treinar o modelo. Em vez disso, pode ser apenas que a pergunta errada está sendo feita. Considere examinar o problema de diferentes ângulos e aproveitar os dados para extrair indicadores latentes e relações ocultas para refinar a questão.

Fornecer mais exemplos de dados

Assim como os humanos, quanto mais os algoritmos são treinados, maior é a probabilidade de um melhor desempenho. Uma maneira de melhorar o desempenho do modelo é fornecer mais exemplos de dados de treinamento para os algoritmos. Quanto mais dados ele aprender, mais casos poderá identificar corretamente.

Adicionar contexto aos dados

O significado de um único ponto de dados pode ser difícil de interpretar. Criar contexto em torno dos pontos de dados ajuda algoritmos e especialistas no assunto a tomar melhor decisões. Por exemplo, o fato de uma casa ter três quartos não dá uma boa indicação de seu preço. No entanto, se você adicionar contexto e agora saber que está em um bairro suburbano fora de uma grande área metropolitana onde a idade média é 38, a renda média familiar é de US $ 80.000 e as escolas estão no 20º percentil superior, então o algoritmo tem mais informações para basear suas decisões. Todo esse contexto pode ser adicionado como entrada para o modelo de machine learning como recursos.

Usar dados e recursos significativos

Embora mais exemplos de dados e recursos possam ajudar a melhorar a precisão do modelo, eles também podem introduzir ruído, já que nem todos os dados e recursos são significativos. Portanto, é importante entender quais recursos são os que mais afetam as decisões tomadas pelo algoritmo. O uso de técnicas como a PFI (Permutation Feature Importance) pode ajudar a identificar esses recursos importantes e não apenas ajudar a explicar o modelo, mas também usar a saída como um método de seleção de recursos para reduzir a quantidade de recursos barulhentos que entram no processo de treinamento.

Para obter mais informações sobre como usar o PFI, consulte Explicar as previsões do modelo usando a importância do recurso de permutação.

Validação cruzada

A validação cruzada é uma técnica de avaliação de modelo e treinamento que divide os dados em várias partições e treina vários algoritmos nessas partições. Essa técnica melhora a robustez do modelo mantendo os dados do processo de treinamento. Além de melhorar o desempenho em observações não vistas, em ambientes restritos a dados, ele pode ser uma ferramenta eficaz para modelos de treinamento com um conjunto de dados menor.

Para obter mais informações, consulte Como usar a validação cruzada no ML.NET.

Ajuste de hiperparâmetros

Treinar modelos de machine learning é um processo iterativo e exploratório. Por exemplo, qual é o número ideal de clusters ao treinar um modelo usando o algoritmo K-Means? A resposta depende de muitos fatores, como a estrutura dos dados. Encontrar esse número exigiria experimentar valores diferentes para k e, em seguida, avaliar o desempenho para determinar qual valor é o melhor. A prática de ajustar os parâmetros que orientam o processo de treinamento para localizar um modelo ideal é conhecida como ajuste de hiperparâmetro.

Escolher um algoritmo diferente

Tarefas de aprendizado de máquina, como regressão e classificação, contêm várias implementações de algoritmo. Pode ser o caso de que o problema que você está tentando resolver e a forma como seus dados são estruturados não se encaixa bem no algoritmo atual. Nesse caso, considere usar um algoritmo diferente para sua tarefa para ver se ela aprende melhor com seus dados.

O link a seguir fornece mais orientações sobre qual algoritmo escolher.