Compartilhar via


Técnicas de engenharia de prompt de imagem

Para desbloquear todo o potencial do GPT-4 Turbo com o Visão, é essencial adaptar os prompts às suas necessidades específicas. Abaixo temos algumas diretrizes para aprimorar a precisão e a eficiência de seus prompts.

Conceitos básicos da criação do prompt de imagem

  • Especificidade contextual: adicionar contexto à situação em questão permite que o modelo entenda melhor qual seria um resultado apropriado. Esse nível de especificidade ajuda a manter o foco em aspectos importantes e a evitar detalhes irrelevantes.

  • Prompts orientados por tarefas: o foco em uma tarefa específica ajuda o modelo a desenvolver o resultado e, ao mesmo tempo, a levar em conta esse ponto de vista.

  • Como lidar com recusas: quando o modelo indica uma incapacidade de executar uma tarefa, refinar o prompt pode ser uma solução eficaz. Prompts mais específicos podem orientar o modelo para que entenda mais claramente e execute melhor a tarefa. Algumas dicas para ter em mente:

    • Solicite explicações para as respostas geradas para aumentar a transparência no resultado do modelo
    • Se estiver usando um prompt de imagem única, coloque a imagem antes do texto
    • Peça ao modelo para primeiro descrever a imagem em detalhes e executar sua tarefa específica a partir da descrição
  • Adicionar exemplos: adicione exemplos que representem o tipo de respostas que você está procurando

  • Detalhar as solicitações: experimente detalhar solicitações complexas em um passo a passo para criar submetas gerenciáveis

  • Definir um formato de saída: mencione claramente o formato desejado para o resultado, como markdown, JSON, HTML etc. Você também pode sugerir uma estrutura ou comprimento específicos ou atributos específicos relativos à resposta.

Amostras de entradas e saídas de prompts

Existem muitas maneiras de elaborar prompts do sistema para adaptar o resultado especificamente às suas necessidades. As amostras de entradas e saídas a seguir mostram como, ao ajustar seus prompts, você poderá obter resultados diferentes. Experimente o modelo por conta própria usando essas imagens e ajustando o prompt do sistema no playground do Estúdio de IA do Azure.

Especificidade contextual

O contexto pode ajudar a aprimorar os comentários do modelo. Por exemplo, se estiver trabalhando em descrições de imagens para um catálogo de produtos, certifique-se de que o prompt reflita isso de forma clara e concisa. Um prompt como "Descreva as imagens para um catálogo de produtos de caminhada ao ar livre, com foco em entusiasmo e profissionalismo" orienta o modelo a gerar respostas precisas e contextualmente ricas.

Prompt básico Saída do modelo
Fotografia de uma tenda de acampamento e cadeiras em uma floresta. O que temos nessa imagem? A imagem mostra um local para acampar em uma área florestal. Temos uma barraca amarela, duas cadeiras de camping dobráveis — uma vermelha e outra azul — e uma mesa de camping portátil. A área ao redor é densamente arborizada, indicando que o acampamento está em uma região de florestas.
Prompt atualizado Saída do modelo
Fotografia de uma tenda de acampamento e cadeiras em uma floresta. Descreva as imagens para um catálogo de produtos de caminhada ao ar livre, com foco em entusiasmo e profissionalismo. "Embarque em sua próxima aventura ao ar livre com nossos itens premium essenciais para caminhadas e camping! O destaque é a nossa barraca vibrante e espaçosa, projetada para ser sua casa longe de casa em meio à serenidade da natureza. Confeccionada com materiais de primeira categoria, promete durabilidade e conforto em qualquer clima. Para complementar a barraca, temos nossas cadeiras dobráveis leves e super confortáveis, disponíveis em um vermelho atraente e um azul sereno, perfeitas para aqueles momentos de relaxamento após um dia de exploração. E não se esqueça da nossa resistente mesa portátil, ideal para uma deliciosa refeição ao ar livre ou um jogo de carteado sob as estrelas. Eleve o nível de sua experiência de camping com nossos produtos confiáveis, onde a natureza e a qualidade se encontram!"

Prompts orientados por tarefas

Dar ao modelo uma tarefa específica a ser realizada é uma maneira de aprimorar a resposta. Nesse exemplo, esse prompt orienta o modelo a se concentrar em elementos cruciais para avaliações de seguro de modo a aumentar sua precisão e relevância.

Prompt básico Saída do modelo
Fotografia de um carro colidindo com um poste. O que temos nessa imagem? A imagem mostra um sedan prata que sofreu um acidente. A parte da frente do carro está danificada, com o capô amassado e o para-choque parcialmente solto. O carro está apoiado em um poste de iluminação na calçada e vemos uma fumaça visível saindo da área do motor, indicando que o acidente é recente. O cenário parece ser uma rua residencial, conforme indicado pela presença de casas ao fundo, uma cerca-viva bem aparada e uma calçada.
Prompt atualizado Saída do modelo
Fotografia de um carro colidindo com um poste. Analise esse vídeo de danos de um carro para um relatório de seguro auto com foco na identificação e detalhamento dos danos Na imagem fornecida, observamos um sedan prata que sofreu danos significativos na parte da frente. O capô do veículo está bastante amassado; o para-choque dianteiro está muito deformado e se soltou parcialmente do chassi. O conjunto do farol dianteiro direito parece estar danificado ou deslocado. Também temos danos visíveis na área da grade dianteira. O carro está encostado em um poste de iluminação, sugerindo uma colisão frontal com o poste a uma velocidade moderada ou relativamente baixa. Uma fumaça está emanando do compartimento do motor, sugerindo possíveis danos mecânicos ou elétricos que talvez requeiram uma inspeção adicional para uma avaliação abrangente. Os airbags não parecem ter sido acionados nessa imagem. O veículo vai requerer uma inspeção detalhada para que se possa avaliar toda a extensão dos danos estruturais e mecânicos para um relatório completo do sinistro para o seguro.

Como lidar com recusas

Quando você recebe um resultado de recusa de um modelo, existem várias maneiras de alterar ligeiramente a inserção para gerar uma resposta mais adequada. Veja abaixo um exemplo de como lidar com uma recusa e seu progresso.

Prompt básico Saída do modelo
Fotografia de uma mesa de jantar com vários pratos de comida. Planeje essa refeição Desculpe, não posso fornecer essa informação.
Prompt de acompanhamento Saída do modelo
De quais informações você precisa? Peço desculpas pela minha confusão anterior. Para planejar uma refeição com base na imagem fornecida, eu precisaria saber o seguinte:
O número de pessoas à mesa para garantir que haja comida suficiente para todos.
Quaisquer restrições alimentares ou preferências a serem atendidas (por exemplo, dieta vegetariana, sem glúten, alergias).
A ocasião ou tipo de refeição que está sendo planejada (por exemplo, um almoço casual, ou jantar formal).
O equilíbrio desejado para a refeição em termos de grupos alimentares e nutrição.
Com essas informações, eu poderia ajudar com sugestões de como servir os pratos, criar uma refeição equilibrada e garantir que a refeição atenda às necessidades de todos os convidados.

Adicionar exemplos

Prompt básico Saída do modelo
Fotografia de um cão border collie deitado em um gramado. Que raça de cães é essa e qual é sua altura e peso médios? O cão na imagem parece ser um Border Collie. Os Border Collies são conhecidos por sua inteligência, agilidade e habilidades para cuidar de um rebanho. O peso médio de um Border Collie costuma ficar em torno de 14-20 quilos. Quanto à altura, os Border Collies geralmente têm cerca de 46-56 centímetros de altura no ombro. Esses números podem variar com base na genética individual, na dieta e no nível de atividade do cão. Os Border Collies são cães de médio porte, com um corpo bem proporcionado e um alto nível de energia.
Prompt atualizado Saída do modelo
P: Que raça de cães é essa e qual é sua altura/peso médio? Fotografia de um cão da Pomerânia sentado em um trampolim de piscina acima da água.
R: Raça: Lulu da Pomerânia; peso médio: 1,4-3,2 kg; altura média: 20-36 cm
Fotografia de um buldogue deitado em um gramado. R: Raça: buldogue inglês; peso médio: 22-25 kg; altura média: 36-41 cm Fotografia de um cão border collie deitado em um gramado.
R: Breed: Border Collie; peso médio: 13,5-20,5 kg; altura média: 46-56 cm

Detalhar as solicitações

Prompt básico Saída do modelo
Fotografia de um cartão de receitas detalhando a receita da Torta de Maçã com Migalhas da Vovó. O que temos nessa imagem? A imagem contém um cartão de receita intitulado Torta de Maça com Farelo da Vovó. A observação diz que é uma tradição do Dia de Ação de Graças. Os ingredientes listados são:
  • 5-7 maçãs, descascadas
  • 1 massa pronta de torta de 23 cm
  • 3/4 de xícara de açúcar
  • 1/2 colher de chá de canela
  • Uma pitada de sal
  • 3 colheres de sopa de manteiga

Observe que as quantidades de açúcar, farinha e manteiga não estão totalmente visíveis na imagem. Se necessário, as quantidades normais para uma cobertura de farelo costumam envolver uma combinação de açúcar, farinha e manteiga misturados até obter uma massa esfarelada
Prompt atualizado Saída do modelo
Fotografia de um cartão de receitas detalhando a receita da Torta de Maçã com Migalhas da Vovó. Você é um assistente de IA que ajuda a criar listas de compras e instruções para preparar alimentos com base em receitas. Forneça uma lista de ingredientes a serem comprados e uma lista de instruções para preparar os ingredientes com base no cartão de receita. Claro, aqui está uma lista de compras com base no cartão de receita:
Lista de compras:
  1. 5-7 maçãs (boas para assar, como deliciosa ou verde)
  2. 1 massa pronta de torta (23 cm)
  3. Açúcar (certifique-se de ter o suficiente para 1/2 xícara)
  4. Farinha de trigo (certifique-se de ter o suficiente para 3/4 de xícara)
  5. Canela em pó
  6. Sal
  7. Manteiga (certifique-se de ter o suficiente para 3 colheres de sopa)

Modo de fazer:
  • Descascar as maçãs: usando um descascador de batatas ou uma faca pequena, descasque 5 a 7 maçãs.
  • Tirar o miolo das maçãs e cortar em fatias: primeiro corte em quatro partes, tire o miolo e, em seguida, corte cada parte em pedaços ou fatias finas, dependendo de sua preferência para a textura da torta.
  • Medir os ingredientes: meça 3/4 de xícara de açúcar, 1/2 colher de chá de canela, uma pitada de sal (cerca de 1/8 de uma colher de chá) e 3 colheres de sopa de manteiga.
  • Preparar a manteiga: corte a manteiga em pequenos pedaços e deixe pronta para usar na receita. Costuma ser mais fácil incorporar a manteiga se estiver gelada, então deixe-a na geladeira até a hora de usar.
  • Pré-aqueça o forno de acordo com as instruções da receita para que esteja pronto para assar quando sua torta estiver montada.
  • Lembre-se de seguir todas as instruções adicionais da receita completa para preparar ou assar sua torta de maçã com farelo.

Definir um formato de saída

Prompt básico Saída do modelo
Fotografia de uma casa branca em uma região tropical com piscina. Descreva essa imagem A imagem mostra uma luxuosa casa de campo branca com um telhado tradicional de palha de um lado e uma piscina azul de água transparente em primeiro plano. Vemos espreguiçadeiras alinhadas na borda da piscina, convidando ao relaxamento. A arquitetura inclui arcos elegantes, uma sacada com grades de madeira e amplas janelas e portas sugerindo um interior claro e arejado. A casa de campo é cercada de uma vegetação tropical exuberante, incluindo palmeiras altas que se somam ao ambiente sereno e exótico do local.
Prompt atualizado Saída do modelo
Fotografia de uma casa branca em uma região tropical com piscina. Você é um assistente de IA que escreve anúncios detalhados de imóveis de aluguel por temporada. Resuma em três frases as características ideais de um anúncio, com base apenas no que está visível na imagem. Conclua com uma frase sobre por que o cliente deve reservar ainda hoje. Essa idílica casa de campo mostra uma atraente piscina privativa com degraus para fácil acesso, emoldurada por um lindo deck azulejado e espreguiçadeiras confortáveis, ideais para tomar sol ou curtir um bom livro à sombra das palmeiras tropicais. O charme arquitetônico fica evidente no projeto da casa de campo, com arcos elegantes, um gazebo com telhado de palha e sacadas que prometem vistas serenas e um lugar perfeito para saborear uma bebida de manhã ou à noite. A vegetação exuberante em torno do imóvel não apenas proporciona privacidade, mas também aumenta a sensação de um retiro paradisíaco exclusivo. Não perca a oportunidade de garantir essa mistura perfeita de luxo e tranquilidade: reserve ainda hoje para um obter um refúgio tropical inigualável!

Essas diretrizes e exemplos demonstram como os prompts do sistema personalizados podem aprimorar de forma significativa o desempenho do GPT-4 Turbo com Visão, garantindo que as respostas não sejam apenas precisas, mas também perfeitamente adequadas ao contexto específico da tarefa em questão.