Nota
O acesso a esta página requer autorização. Pode tentar iniciar sessão ou alterar os diretórios.
O acesso a esta página requer autorização. Pode tentar alterar os diretórios.
A ferramenta OpenAI GPT-4V permite que você use o GPT-4 da OpenAI com visão, também conhecido como GPT-4V ou gpt-4-vision-preview na API, para tirar imagens como entrada e responder a perguntas sobre elas.
Importante
A ferramenta OpenAI GPT-4V está atualmente em pré-visualização pública. Essa visualização é fornecida sem um contrato de nível de serviço e não é recomendada para cargas de trabalho de produção. Algumas funcionalidades poderão não ser suportadas ou poderão ter capacidades limitadas. Para obter mais informações, veja Termos Suplementares de Utilização para Pré-visualizações do Microsoft Azure.
Pré-requisitos
Criar recursos OpenAI
- Faça uma conta no site da OpenAI
- Inicie sessão e encontre uma chave de API pessoal.
Obtenha acesso à API GPT-4
Para usar o GPT-4 com visão, você precisa acessar a API GPT-4. Para saber mais, veja como obter acesso à API GPT-4
Connection
Configure conexões com recursos provisionados no fluxo de prompt.
Type | Nome | CHAVE DE API |
---|---|---|
OpenAI | Obrigatório | Obrigatório |
Entradas
Nome | Tipo | Descrição | Obrigatório |
---|---|---|---|
ligação | OpenAI | A conexão OpenAI a ser usada na ferramenta. | Sim |
modelo | string | O modelo de linguagem a ser usado, atualmente suporta apenas gpt-4-vision-preview. | Sim |
Prompt | string | Prompt de texto que o modelo de idioma usa para gerar sua resposta. O modelo Jinja para compor prompts nesta ferramenta segue uma estrutura semelhante à API de chat na ferramenta LLM. Para representar uma entrada de imagem em seu prompt, você pode usar a sintaxe  . A entrada de imagem pode ser passada no user , system e assistant mensagens. |
Sim |
max_tokens | integer | O número máximo de tokens a gerar na resposta. O padrão é um valor baixo decidido pela API OpenAI. | Não |
temperatura | flutuante | A aleatoriedade do texto gerado. A predefinição é 1. | Não |
parar | list | A sequência de parada para o texto gerado. O padrão é null. | Não |
top_p | flutuante | A probabilidade de usar a escolha superior dos tokens gerados. A predefinição é 1. | Não |
presence_penalty | flutuante | Valor que controla o comportamento do modelo em relação à repetição de frases. O padrão é 0. | Não |
frequency_penalty | flutuante | Valor que controla o comportamento do modelo em relação à geração de frases raras. O padrão é 0. | Não |
Saídas
Tipo de Retorno | Description |
---|---|
string | O texto de uma resposta de conversa |
Próximo passo
Saiba mais sobre como processar imagens no fluxo de prompt.