Política e configurações de aprendizagem
Importante
A partir de 20 de setembro de 2023, você não poderá criar novos recursos do Personalizador. O serviço de Personalizador será aposentado no dia 1º de outubro de 2026.
As configurações de aprendizagem determinam os hiperparâmetros do modelo de treinamento. Dois modelos dos mesmos dados que são treinados em diferentes configurações de aprendizagem acabarão sendo diferentes.
A política e as configurações de aprendizagem são definidas no recurso Personalizador no portal do Azure.
Políticas de aprendizagem de importação e exportação
Você pode importar e exportar arquivos de política de aprendizagem do portal do Azure. Use esse método para salvar políticas existentes, testá-las, substituí-las e arquivá-las em seu controle de código-fonte como artefatos para referência e auditoria futuras.
Saiba como importar e exportar uma política de aprendizagem no portal do Azure para o seu recurso Personalizador.
Compreender as configurações da política de aprendizagem
As configurações na política de aprendizagem não devem ser alteradas. Altere as configurações somente se entender como elas afetam o Personalizador. Sem esse conhecimento, você pode causar problemas, incluindo invalidar modelos do Personalizador.
Personalizer usa vowpalwabbit para treinar e pontuar os eventos. Consulte a documentação do vowpalwabbit sobre como editar as configurações de aprendizagem usando o vowpalwabbit. Depois de ter os argumentos de linha de comando corretos, salve o comando em um arquivo com o seguinte formato (substitua o valor da propriedade arguments pelo comando desejado) e carregue o arquivo para importar configurações de aprendizagem no painel Modelo e Configurações de Aprendizagem no portal do Azure para seu recurso Personalizador.
Segue-se .json
um exemplo de uma política de aprendizagem.
{
"name": "new learning settings",
"arguments": " --cb_explore_adf --epsilon 0.2 --power_t 0 -l 0.001 --cb_type mtr -q ::"
}
Comparar políticas de aprendizagem
Você pode comparar o desempenho de diferentes políticas de aprendizagem em relação a dados anteriores nos logs do Personalizer fazendo avaliações offline.
Carregue as suas próprias políticas de aprendizagem para as comparar com a política de aprendizagem atual.
Otimizar as políticas de aprendizagem
O personalizador pode criar uma política de aprendizagem otimizada em uma avaliação offline. Uma política de aprendizagem otimizada que tenha melhores recompensas em uma avaliação off-line produzirá melhores resultados quando for usada on-line no Personalizador.
Depois de otimizar uma política de aprendizagem, você pode aplicá-la diretamente ao Personalizador para que ela substitua imediatamente a política atual. Ou você pode salvar a política otimizada para avaliação adicional e, posteriormente, decidir se deseja descartá-la, salvá-la ou aplicá-la.
Próximos passos
- Aprenda eventos ativos e inativos.