Introdução
No aprendizado de máquina, algoritmos são usados para treinar modelos que preveem rótulos desconhecidos para novos dados com base em correlações entre rótulos e recursos conhecidos encontrados nos dados de treinamento. Dependendo do algoritmo usado, talvez seja necessário especificar hiperparâmetros para configurar como o modelo é treinado. Por exemplo, o algoritmo de regressão logística usa um hiperparâmetro de taxa de regularização para combater a sobreajuste; e modelos de rede neural de aprendizado profundo usam hiperparâmetros, como taxa de aprendizado , para controlar como os pesos são ajustados durante o treinamento.
Observação
Machine Learning é um campo acadêmico com sua própria terminologia específica. Os cientistas de dados referem-se aos valores determinados dos recursos de treinamento como parâmetros, portanto, um termo diferente é necessário para valores que são usados para configurar o comportamento de treinamento, mas que não são derivados dos dados de treinamento - daí o termo hiperparâmetro.
Os valores de hiperparâmetro selecionados para um determinado algoritmo podem ter um efeito significativo no modelo que ele treina; portanto, escolher os valores corretos do hiperparâmetro pode fazer a diferença entre um modelo que prevê bem quando usado com novos dados e um modelo que não o faz.
No Azure Databricks, você pode usar a biblioteca Hyperopt para automatizar o ajuste do hiperparâmetro; um processo no qual você treina e avalia modelos repetidamente usando combinações diferentes de hiperparâmetros até encontrar os valores que funcionam melhor para seus dados.