Compreender o ciclo de vida de desenvolvimento de um aplicativo LLM (modelo de linguagem grande)

Concluído

Antes de entender como trabalhar com o fluxo de prompts, vamos explorar o ciclo de vida de desenvolvimento de um aplicativo de Modelo de Linguagem de Grande Escala (LLM).

O ciclo de vida consiste nas seguintes etapas:

Diagrama dos quatro estágios do ciclo de vida do desenvolvimento.

  1. Inicialização: Defina o caso de uso e projete a solução.
  2. Experimentação: Desenvolver um fluxo e testar com um pequeno conjunto de dados.
  3. Avaliação e refinamento: Avalie o fluxo com um conjunto de dados maior.
  4. Produção: Implantar e monitorar o fluxo e a aplicação.

Durante a avaliação, o refinamento e a produção, você pode achar que sua solução precisa ser melhorada. Você pode voltar para a experimentação durante a qual você desenvolve seu fluxo continuamente, até que você esteja satisfeito com os resultados.

Vamos explorar cada uma dessas fases com mais detalhes.

Inicialização

Imagine que você deseja projetar e desenvolver um aplicativo LLM para classificar artigos de notícias. Antes de começar a criar qualquer coisa, você precisa definir quais categorias deseja como saída. Você precisa entender como é um artigo de notícias típico, como você apresenta o artigo como entrada para seu aplicativo e como o aplicativo gera a saída desejada.

Em outras palavras, durante a inicialização , você:

Diagrama das quatro etapas durante a inicialização.

  1. Definir o objetivo
  2. Coletar um conjunto de dados de exemplo
  3. Criar um prompt básico
  4. Projetar o fluxo

Para projetar, desenvolver e testar um aplicativo LLM, você precisa de um conjunto de dados de exemplo que sirva como entrada. Um conjunto de dados de exemplo é um pequeno subconjunto representativo dos dados que você eventualmente espera analisar como entrada para seu aplicativo LLM.

Ao coletar ou criar o conjunto de dados de exemplo, deve-se garantir diversidade nos dados para cobrir vários cenários e casos extremos. Você também deve remover qualquer informação confidencial de privacidade do conjunto de dados para evitar vulnerabilidades.

Experimentação

Você coletou um conjunto de dados de amostra de artigos de notícias e decidiu em quais categorias deseja que os artigos sejam classificados. Você projetou um fluxo que usa um artigo de notícias como entrada e usa um LLM para classificar o artigo. Para testar se o fluxo gera a saída esperada, execute-o no conjunto de dados de exemplo.

Diagrama dos quatro passos durante a experimentação.

A fase de experimentação é um processo iterativo durante o qual você (1) executa o fluxo em relação a um conjunto de dados de exemplo. Em seguida, você (2) avalia o desempenho do prompt. Se você estiver (3) satisfeito com o resultado, você pode passar para a avaliação e refinamento. Se você acha que há espaço para melhorias, você pode (4) modificar o fluxo alterando o prompt ou o próprio fluxo.

Avaliação e aperfeiçoamento

Quando estiver satisfeito com a saída do fluxo que classifica artigos de notícias, com base no conjunto de dados de exemplo, você poderá avaliar o desempenho do fluxo em relação a um conjunto de dados maior.

Ao testar o fluxo em um conjunto de dados maior, você pode avaliar o quão bem o aplicativo LLM generaliza para novos dados. Durante a avaliação, você pode identificar possíveis gargalos ou áreas para otimização ou refinamento.

Ao editar seu fluxo, você deve primeiro executá-lo em um conjunto de dados menor antes de executá-lo novamente em um conjunto de dados maior. Testar seu fluxo com um conjunto de dados menor permite que você responda mais rapidamente a quaisquer problemas.

Quando seu aplicativo LLM parecer robusto e confiável ao lidar com vários cenários, você poderá decidir mover o aplicativo LLM para produção.

Produção

Finalmente, seu aplicativo de classificação de artigos de notícias está pronto para produção.

Diagrama das três etapas durante a produção.

Durante a produção, você:

  1. Otimize o fluxo que classifica os artigos recebidos para eficiência e eficácia.
  2. Desdobra o teu fluxo num endpoint. Ao aceder ao endpoint, o fluxo é ativado para ser executado e o resultado desejado é gerado.
  3. Monitore o desempenho de sua solução coletando dados de uso e feedback do usuário final. Ao entender como o aplicativo funciona, você pode melhorar o fluxo sempre que necessário.

Explore o ciclo de vida completo do desenvolvimento

Agora que você entende cada estágio do ciclo de vida de desenvolvimento de um aplicativo LLM, pode explorar a visão geral completa:

Diagrama de todas as fases, incluindo suas etapas, do ciclo de vida do desenvolvimento.