Ler em inglês

Partilhar via


Técnicas de engenharia de prompt de imagem

Para desbloquear todo o potencial dos modelos de chat habilitados para visão, como GPT-4 Turbo com Visão e GPT-4o, é essencial adaptar os prompts às suas necessidades específicas. Aqui estão algumas diretrizes para melhorar a precisão e a eficiência de seus prompts.

Fundamentos da escrita de um prompt de imagem

  • Especificidade contextual: Adicionar contexto ao cenário em questão dá ao modelo uma melhor compreensão de uma saída apropriada. Este nível de especificidade ajuda a concentrar-se em aspetos relevantes e a evitar pormenores estranhos.
  • Prompts orientados a tarefas: Concentrar-se em uma tarefa específica ajuda o modelo a desenvolver a saída, levando essa perspetiva em consideração.
  • Lidar com recusas: quando o modelo indica uma incapacidade de executar uma tarefa, refinar o prompt pode ser uma solução eficaz. Prompts mais específicos podem orientar o modelo para uma compreensão mais clara e melhor execução da tarefa. Tenha estas dicas em mente:
    • Solicitar explicações para as respostas geradas para aumentar a transparência na saída do modelo
    • Se estiver usando um prompt de imagem única, coloque a imagem antes do texto
    • Peça ao modelo para descrever a imagem em detalhes primeiro e conclua sua tarefa específica a partir da descrição
  • Adicionar exemplos: adicione exemplos que representem o tipo de respostas que você está procurando
  • Detalhar solicitações: tente dividir solicitações complexas passo a passo para criar submetas gerenciáveis
  • Definir formato de saída: mencione claramente o formato desejado para a saída, como markdown, JSON, HTML, etc. Você também pode sugerir uma estrutura, comprimento ou atributos específicos sobre a resposta.

Exemplo de entradas e saídas de prompt

Há muitas maneiras de criar prompts do sistema para adaptar a saída especificamente às suas necessidades. Os exemplos de entradas e saídas a seguir mostram como o ajuste de seus prompts pode fornecer resultados diferentes. Experimente o modelo por si mesmo usando essas imagens e ajustando o prompt do sistema no playground do Azure AI Foundry.

Especificidade contextual

O contexto pode ajudar a melhorar o feedback do modelo. Por exemplo, se você estiver trabalhando em descrições de imagens para um catálogo de produtos, certifique-se de que seu prompt reflita isso de forma clara e concisa. Um aviso como "Descreva imagens para um catálogo de produtos de caminhadas ao ar livre, com foco no entusiasmo e profissionalismo" orienta o modelo a gerar respostas precisas e contextualmente ricas.

Prompt básico Saída do modelo
Fotografia de uma tenda de campismo e cadeiras numa floresta. O que há nesta imagem? The image shows a camping setup in a forest area. There is a yellow tent, two folding camping chairs—one red and one blue—and a portable camping table. The surrounding area is densely populated with trees, indicating that the campsite is in a wooded region.
Prompt atualizado Saída do modelo
Fotografia de uma tenda de campismo e cadeiras numa floresta. Descreva imagens para um catálogo de produtos de caminhadas ao ar livre, com foco no entusiasmo e profissionalismo. "Embark on your next outdoor adventure with our premium hiking and camping essentials! Featured here is our vibrant, spacious tent, designed to be your home away from home amidst the serenity of nature. Crafted with top-notch materials, it promises durability and comfort in any weather. Complementing the tent are our ultra-comfortable, lightweight folding chairs, available in eye-catching red and serene blue, perfect for those moments of relaxation after a day of exploration. Don't forget our sturdy, portable table, ideal for a delightful outdoor meal or a game of cards under the stars. Elevate your camping experience with our reliable products, where quality meets the great outdoors!"

Prompts orientados a tarefas

Dar ao modelo uma tarefa específica a seguir é uma maneira de afiar a resposta. Neste exemplo, este aviso orienta o modelo a concentrar-se em elementos cruciais para as avaliações de seguros, melhorando assim a precisão e a relevância.

Prompt básico Saída do modelo
Fotografia de um carro embateu num poste. O que há nesta imagem? The image shows a silver sedan that has been in an accident. The front end of the car is damaged, with the hood crumpled, and the bumper partially detached. The car is resting against a utility pole on the sidewalk, and there is visible smoke coming from the engine area, indicating a recent crash. The setting appears to be a residential street, as indicated by the presence of houses in the background, a neatly trimmed hedge, and a sidewalk.
Prompt atualizado Saída do modelo
Fotografia de um carro embateu num poste. Analise este vídeo de danos de carro para um relatório de seguro auto, com foco na identificação e detalhamento de danos In the image provided, we observe a silver sedan that has sustained significant front-end damage. The vehicle's hood is notably crumpled, and the front bumper has suffered substantial deformation, partially detaching from the chassis. The right headlamp assembly appears to be damaged or dislodged. There is also visible damage to the front grille area. The car is in contact with a utility pole, suggesting a frontal collision with the pole at a relatively low or moderate speed. Smoke is emanating from the engine compartment, suggesting potential mechanical or electrical damage that may need further inspection for a comprehensive assessment. The airbags do not appear to be deployed in this image. The vehicle will require a detailed inspection to evaluate the full extent of structural and mechanical damage for a complete insurance report.

Tratamento de recusas

Quando você recebe uma saída de recusa de um modelo, há várias maneiras de ajustar a entrada para gerar uma resposta mais apropriada. Abaixo está um exemplo de como lidar com uma recusa e progresso.

Prompt básico Saída do modelo
Fotografia de uma mesa de jantar com vários pratos de comida. Planeie esta refeição Sorry, I can't provide that information.
Prompt de acompanhamento Saída do modelo
De que informações precisa? I apologize for the confusion earlier. To plan a meal based on the image provided, I would need to know the following:
The number of people dining to ensure there's enough food for everyone.
Any dietary restrictions or preferences to accommodate (e.g., vegetarian, gluten-free, allergies).
The occasion or type of meal being planned (e.g., casual lunch, dinner party).
Desired balance of the meal in terms of food groups and nutrition.
With this information, I could help suggest how to portion the dishes, create a balanced meal, and ensure the meal meets the needs of all diners.

Adicionando exemplos

Prompt básico Saída do modelo
Fotografia de um cão border collie deitado num campo de relva. O que é esta raça de cão e qual o seu peso e altura médios? The dog in the image appears to be a Border Collie. Border Collies are known for their intelligence, agility, and herding abilities.The average weight for a Border Collie is typically around 30-45 pounds (14-20 kilograms). As for height, Border Collies generally stand about 18-22 inches (46-56 centimeters) tall at the shoulder. These figures can vary based on the individual dog's genetics, diet, and level of activity. Border Collies are medium-sized dogs with a well-proportioned body and a high level of energy.
Prompt atualizado Saída do modelo
P: O que é esta raça de cão e qual o seu peso médio e altura? Fotografia de um cão da pomerânia sentado em uma prancha de mergulho de piscina acima da água.
A: Raça: pomerânia; peso médio: 3-7 lbs; Altura média: 8-14 polegadas
Fotografia de um buldogue deitado num campo de relva. A: Raça: Bulldog Inglês; peso médio: 50-55 lbs; Altura média: 14-16 polegadas Fotografia de um cão border collie deitado num campo de relva.
A: Breed: Border Collie; average weight: 30-45 lbs; average height: 18-22 inches

Detalhamento de solicitações

Prompt básico Saída do modelo
Fotografia de um cartão de receita detalhando uma receita para a torta de migalha de maçã da vovó. O que contém esta imagem? The image contains a recipe card titled Grandma's Apple Crumb Pie. It is noted as a Thanksgiving tradition. The ingredients listed are:
  • 5-7 apples, peeled
  • 1 9-inch pie crust
  • 3/4 cups sugar
  • 1/2 teaspoon cinnamon
  • A dash of salt
  • 3 tablespoons butter

Please note that the measurements for sugar, flour, and butter are not fully visible in the image. If needed, the standard measures for a crumb topping typically involve a combination of sugar, flour, and butter mixed together until crumbly
Prompt atualizado Saída do modelo
Fotografia de um cartão de receita detalhando uma receita para a torta de migalha de maçã da vovó. Você é um assistente de IA que ajuda a criar listas de compras e instruções para preparar alimentos com base em receitas. Por favor, forneça uma lista de ingredientes para comprar e, em seguida, forneça uma lista de instruções para preparar os ingredientes com base no cartão de receita. Sure, here's a shopping list based on the recipe card:
Shopping List:
  1. 5-7 apples (suitable for baking, such as Granny Smith or Honeycrisp)
  2. 1 ready-made pie crust (9-inch)
  3. Sugar (ensure you have enough for 1/2 cup)
  4. All-purpose flour (ensure you have enough for 3/4 cup)
  5. Ground cinnamon
  6. Salt
  7. Butter (ensure you have enough for 3 tablespoons)

Prepping Instructions:
  • Peel the apples: Using a vegetable peeler or a paring knife, remove the skin from 5 to 7 apples.
  • Core and slice the apples: Cut the apples into quarters, remove the cores, and then slice the apple quarters into thin slices or chunks, depending on your preference for pie texture.
  • Measure the ingredients: Measure out 3/4 cups of sugar, 1/2 teaspoon of cinnamon, a dash of salt (about 1/8 teaspoon), and 3 tablespoons of butter.
  • Prepare the butter: Cut the butter into small pieces to be ready to use in the recipe. It's often easier to incorporate if it's cold, so keep it refrigerated until it's needed
  • Preheat your oven according to the pie recipe's instructions so it's ready for baking once your pie is assembled.
  • Remember to follow any additional preparation or baking instructions provided in the full recipe for your apple crumb pie.

Definição do formato de saída

Prompt básico Saída do modelo
Fotografia de uma villa branca em uma região tropical com piscina. Descreva esta imagem The image shows a luxurious white villa with a traditional thatched roof on one section and a clear blue swimming pool in the foreground. There are sun loungers lined up along the poolside, inviting relaxation. The architecture includes elegant archways, a balcony with wooden railings, and large windows and doors that suggest a bright and airy interior. The villa is surrounded by lush tropical vegetation, including tall palm trees, which adds to the serene and exotic ambiance of the setting.
Prompt atualizado Saída do modelo
Fotografia de uma villa branca em uma região tropical com piscina. Você é um assistente de IA que escreve anúncios detalhados para propriedades de aluguel de temporada. Resuma em três frases as características ideais da listagem, com base apenas no que é visível na imagem. Conclua com uma frase sobre por que o cliente deve reservar hoje. This idyllic villa showcases an inviting private pool with steps for easy access, framed by a beautifully tiled sun deck and comfortable loungers ideal for soaking up the sun or enjoying a good book under the shade of tropical palms. Architectural charm is evident in the villa's design, featuring elegant archways, a thatched-roof gazebo, and balconies that promise serene views and a perfect spot to savor your morning or evening beverages. The lush greenery surrounding the property not only provides privacy but also enhances the sense of an exclusive paradise retreat. Don't miss the opportunity to secure this perfect blend of luxury and tranquility – book today for a tropical escape like no other!

Estas diretrizes e exemplos demonstram como os prompts personalizados do sistema podem melhorar significativamente o desempenho de modelos habilitados para visão, garantindo que as respostas sejam não apenas precisas, mas também perfeitamente adequadas ao contexto específico da tarefa em questão.