Conceitos de ajuste do modelo
O ajuste é um processo que utiliza um modelo pré-treinado e o ajusta para melhor se adequar aos seus dados. Esse processo pode ajudá-lo a obter o máximo de seus dados e melhorar o desempenho do seu modelo. Neste artigo, você aprenderá os conceitos básicos do ajuste e quando é apropriado ajustar um modelo de IA.
O ajuste é uma técnica poderosa que pode ajudá-lo a obter mais de seus dados. Para entender o ajuste, é importante entender o conceito de transferência de aprendizado. A transferência de aprendizado é uma técnica de aprendizado de máquina em que um modelo treinado em uma tarefa é redirecionado para uma segunda tarefa relacionada. Isso é feito pegando um modelo pré-treinado e ajustando-o para melhor se adequar aos novos dados. O ajuste é uma forma de transferência de aprendizado em que o modelo pré-treinado é ajustado para melhor se adequar aos novos dados.
Há várias etapas envolvidas no ajuste de um modelo. Primeiro, você precisa selecionar um modelo pré-treinado que seja adequado à sua tarefa. Em seguida, você precisa preparar seus dados de exemplo e ajustar o modelo nesses dados. Finalmente, você precisa iterar em seu modelo para melhorar seu desempenho.
O ajuste é adequado para momentos em que você tem uma pequena quantidade de dados e deseja melhorar o desempenho do seu modelo. Ao começar com um modelo pré-treinado, você pode aproveitar o conhecimento que o modelo já aprendeu e ajustá-lo para melhor se adequar aos seus dados. Isso pode ajudá-lo a melhorar o desempenho do seu modelo e reduzir a quantidade de dados necessários para treiná-lo.
Normalmente, não é necessário ajustar seu modelo quando você tem uma grande quantidade de dados. Nesse caso, você pode treinar seu modelo do zero e alcançar um bom desempenho sem ajustes. No entanto, o ajuste ainda pode ser útil nesse caso se você quiser melhorar ainda mais o desempenho do seu modelo. Você também pode ajustar seu modelo se tiver uma tarefa específica diferente da tarefa na qual o modelo pré-treinado foi originalmente treinado.
Você pode evitar o dispendioso ajuste de um modelo usando engenharia de prompt ou encadeamento de prompt. Essas técnicas podem ajudá-lo a gerar texto de alta qualidade sem a necessidade de ajustes.
Você deve selecionar um modelo pré-treinado que seja adequado aos requisitos da sua tarefa. Existem muitos modelos pré-treinados disponíveis que foram treinados em uma ampla gama de tarefas. Você deve escolher um modelo que tenha sido treinado em uma tarefa semelhante àquela em que você está trabalhando. Isso ajudará você a aproveitar o conhecimento que o modelo já aprendeu e ajustá-lo para melhor se adequar aos seus dados.
Os modelos do HuggingFace são um bom ponto de partida quando se procura modelos pré-treinados. Os modelos do HuggingFace são agrupados em categorias com base na tarefa em que foram treinados, tornando mais fácil encontrar um modelo que seja adequado à sua tarefa.
Essas categorias incluem:
- Multimodal
- Pesquisa Visual Computacional
- Processamento de linguagem natural
- Áudio
- Tabular
- Aprendizado de reforço
Verifique a compatibilidade do modelo com o seu ambiente e as ferramentas que você está usando. Por exemplo, se estiver utilizando o Visual Studio Code, poderá usar a extensão do Azure Machine Learning no Visual Studio Code para ajustar o modelo.
Verifique o status e a licença do modelo. Alguns modelos pré-treinados podem estar disponíveis sob uma licença de código aberto, enquanto outros podem exigir uma licença comercial ou pessoal para uso. Todos os modelos no HuggingFace incluem informações de licença. Verifique se você tem as permissões necessárias para usar o modelo antes de ajustá-lo.
Preparar seus dados de exemplo envolve limpar e pré-processar seus dados para torná-los adequados para treinamento. Você também deve dividir seus dados em conjuntos de treinamento e validação para avaliar o desempenho do seu modelo. O formato dos dados deve corresponder ao formato esperado pelo modelo pré-treinado que você está usando. Essas informações podem ser encontradas com os modelos no HuggingFace na seção Formato de instruções do cartão do modelo. A maioria dos cartões de modelo incluirá um modelo para criar um prompt para o modelo e algum pseudocódigo para ajudá-lo a começar.
Depois de ajustar seu modelo, você deve avaliar o desempenho do modelo no conjunto de validação. Você pode usar métricas como precisão, recall e medida f para avaliar o desempenho do seu modelo. Se o desempenho do modelo não for satisfatório, você poderá iterar no modelo ajustando os hiperparâmetros, alterando a arquitetura ou ajustando o modelo em mais dados. Você também pode examinar a qualidade e a diversidade de seus dados para ver se há algum problema que precise ser resolvido. Como regra geral, um conjunto menor de dados de alta qualidade é mais valioso do que um conjunto maior de dados de baixa qualidade.
Para saber mais sobre o ajuste de modelos de IA, confira os seguintes recursos: