OpenAI GPT-4V (pré-visualização)

2024-09-01

A ferramenta OpenAI GPT-4V permite que você use o GPT-4 da OpenAI com visão, também conhecido como GPT-4V ou gpt-4-vision-preview na API, para tirar imagens como entrada e responder a perguntas sobre elas.

Importante

A ferramenta OpenAI GPT-4V está atualmente em pré-visualização pública. Essa visualização é fornecida sem um contrato de nível de serviço e não é recomendada para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para obter mais informações, veja Termos Suplementares de Utilização para Pré-visualizações do Microsoft Azure.

Pré-requisitos

Criar recursos OpenAI
- Faça uma conta no site da OpenAI
- Inicie sessão e encontre uma chave de API pessoal.
Obtenha acesso à API GPT-4

Para usar o GPT-4 com visão, você precisa acessar a API GPT-4. Para saber mais, veja como obter acesso à API GPT-4

Connection

Configure conexões com recursos provisionados no fluxo de prompt.

Type	Nome	CHAVE DE API
OpenAI	Obrigatório	Obrigatório

Entradas

Nome	Tipo	Descrição	Obrigatório
ligação	OpenAI	A conexão OpenAI a ser usada na ferramenta.	Sim
modelo	string	O modelo de linguagem a ser usado, atualmente suporta apenas gpt-4-vision-preview.	Sim
Prompt	string	Prompt de texto que o modelo de idioma usa para gerar sua resposta. O modelo Jinja para compor prompts nesta ferramenta segue uma estrutura semelhante à API de chat na ferramenta LLM. Para representar uma entrada de imagem em seu prompt, você pode usar a sintaxe `![image]({{INPUT NAME}})`. A entrada de imagem pode ser passada no `user`, `system` e `assistant` mensagens.	Sim
max_tokens	integer	O número máximo de tokens a gerar na resposta. O padrão é um valor baixo decidido pela API OpenAI.	Não
temperatura	flutuante	A aleatoriedade do texto gerado. A predefinição é 1.	Não
parar	list	A sequência de parada para o texto gerado. O padrão é null.	Não
top_p	flutuante	A probabilidade de usar a escolha superior dos tokens gerados. A predefinição é 1.	Não
presence_penalty	flutuante	Valor que controla o comportamento do modelo em relação à repetição de frases. O padrão é 0.	Não
frequency_penalty	flutuante	Valor que controla o comportamento do modelo em relação à geração de frases raras. O padrão é 0.	Não

Saídas

Tipo de Retorno	Description
string	O texto de uma resposta de conversa

Próximo passo

Saiba mais sobre como processar imagens no fluxo de prompt.