Introdução

1 minuto

No aprendizado de máquina, os modelos são treinados para prever resultados desconhecidos por meio de padrões de aprendizagem a partir de dados de treinamento rotulados. A maneira como um modelo aprende é influenciada não apenas pelos dados em si, mas também por hiperparâmetros — configurações que controlam o processo de treinamento. Estes não são aprendidos com os dados, mas são definidos manualmente antes do início do treinamento, por exemplo:

Na regressão logística, a taxa de regularização ajuda a evitar o overfitting, penalizando modelos excessivamente complexos.
Nas redes neurais, a taxa de aprendizagem determina a rapidez com que o modelo atualiza seus pesos, afetando tanto a velocidade quanto a precisão.

Observação

Na terminologia do aprendizado de máquina, os valores aprendidos com os dados são chamados de parâmetros. Para distingui-los dos valores que configuram o processo de treinamento, usamos o termo hiperparâmetros.

Escolher os hiperparâmetros certos é crucial. Más escolhas podem levar a modelos com desempenho inferior ou que não conseguem generalizar para novos dados. Por outro lado, hiperparâmetros bem ajustados podem melhorar significativamente a precisão, robustez e eficiência de um modelo.

É aí que entra o ajuste de hiperparâmetros — um processo de testar sistematicamente diferentes combinações de valores de hiperparâmetros para encontrar a configuração de melhor desempenho para seus dados e tarefas específicos.

No Azure Databricks, você pode usar a biblioteca do Optuna para automatizar esse processo. O Optuna explora de forma inteligente o espaço de hiperparâmetros, treinando e avaliando modelos repetidamente até identificar a configuração mais eficaz. Isso ajuda você a criar modelos que não apenas têm um bom desempenho, mas também generalizam melhor para dados invisíveis.

No Azure Databricks, você pode usar bibliotecas como Optuna ou Ray Tune para otimização de hiperparâmetros. Embora ambos sejam ferramentas poderosas, neste módulo focamo-nos no Optuna. O Optuna explora de forma inteligente o espaço de hiperparâmetros, treinando e avaliando modelos repetidamente até identificar a configuração mais eficaz. Isso ajuda você a criar modelos que não apenas têm um bom desempenho, mas também generalizam melhor para dados invisíveis.

Comentários

Esta página foi útil?