OpenAI GPT-4V (versão prévia)

2024-09-01

A ferramenta OpenAI GPT-4V permite que você use o GPT-4 da OpenAI com visão, também conhecido como GPT-4V ou gpt-4-vision-preview na API, para obter imagens como entrada e responder a perguntas sobre elas.

Importante

A ferramenta OpenAI GPT-4V está atualmente em visualização pública. Essa versão prévia é fornecida sem um contrato de nível de serviço e não é recomendada para cargas de trabalho de produção. Alguns recursos podem não ter suporte ou podem ter restrição de recursos. Para obter mais informações, consulte Termos de Uso Complementares de Versões Prévias do Microsoft Azure.

Pré-requisitos

Crie recursos OpenAI
- Crie uma conta no site da OpenAI
- Faça login e encontre a chave de API pessoal.
Obtenha acesso à API GPT-4

Para usar o GPT-4 com visão, você precisa acessar a API GPT-4. Para saber mais, veja como obter acesso à API GPT-4

Conexão

Configure conexões para recursos provisionados no prompt flow.

Tipo	Nome	CHAVE DE API
OpenAI	Obrigatório	Obrigatório

Entradas

Nome	Tipo	Descrição	Obrigatório
connection	OpenAI	A conexão OpenAI a ser usada na ferramenta.	Sim
modelo	string	O modelo de linguagem a ser usado atualmente suporta apenas gpt-4-vision-preview.	Sim
prompt	string	O prompt de texto que o modelo de linguagem usa para gerar sua resposta. O modelo Jinja para compor prompts nesta ferramenta segue uma estrutura semelhante à API de chat na ferramenta LLM. Para representar uma entrada de imagem no prompt, você pode usar a sintaxe `![image]({{INPUT NAME}})`. A entrada da imagem pode ser passada nas mensagens `user`, `system` e `assistant`.	Sim
max_tokens	inteiro	O número máximo de tokens a serem gerados na resposta. O padrão é um valor baixo decidido pela API OpenAI.	Não
temperatura	FLOAT	A aleatoriedade do texto gerado. O padrão é UTF-1.	No
parar	list	A sequência de interrupção do texto gerado. O padrão é nulo.	No
top_p	FLOAT	A probabilidade de usar a melhor opção dos tokens gerados. O padrão é UTF-1.	No
presence_penalty	float	Valor que controla o comportamento do modelo em relação a frases repetidas. O padrão é 0.	No
frequency_penalty	float	Valor que controla o comportamento do modelo em relação à geração de frases incomuns. O padrão é 0.	Não

Saídas

Tipo de retorno	Descrição
string	O texto de uma resposta da conversa

Próxima etapa

Saiba mais sobre como processar imagens no prompt flow.