Observação
O acesso a essa página exige autorização. Você pode tentar entrar ou alterar diretórios.
O acesso a essa página exige autorização. Você pode tentar alterar os diretórios.
A ferramenta OpenAI GPT-4V permite que você use o GPT-4 da OpenAI com visão, também conhecido como GPT-4V ou gpt-4-vision-preview na API, para obter imagens como entrada e responder a perguntas sobre elas.
Importante
A ferramenta OpenAI GPT-4V está atualmente em visualização pública. Essa versão prévia é fornecida sem um contrato de nível de serviço e não é recomendada para cargas de trabalho de produção. Alguns recursos podem não ter suporte ou podem ter restrição de recursos. Para obter mais informações, consulte Termos de Uso Complementares de Versões Prévias do Microsoft Azure.
Pré-requisitos
Crie recursos OpenAI
- Crie uma conta no site da OpenAI
- Faça login e encontre a chave de API pessoal.
Obtenha acesso à API GPT-4
Para usar o GPT-4 com visão, você precisa acessar a API GPT-4. Para saber mais, veja como obter acesso à API GPT-4
Conexão
Configure conexões para recursos provisionados no prompt flow.
Tipo | Nome | CHAVE DE API |
---|---|---|
OpenAI | Obrigatório | Obrigatório |
Entradas
Nome | Tipo | Descrição | Obrigatório |
---|---|---|---|
connection | OpenAI | A conexão OpenAI a ser usada na ferramenta. | Sim |
modelo | string | O modelo de linguagem a ser usado atualmente suporta apenas gpt-4-vision-preview. | Sim |
prompt | string | O prompt de texto que o modelo de linguagem usa para gerar sua resposta. O modelo Jinja para compor prompts nesta ferramenta segue uma estrutura semelhante à API de chat na ferramenta LLM. Para representar uma entrada de imagem no prompt, você pode usar a sintaxe  . A entrada da imagem pode ser passada nas mensagens user , system e assistant . |
Sim |
max_tokens | inteiro | O número máximo de tokens a serem gerados na resposta. O padrão é um valor baixo decidido pela API OpenAI. | Não |
temperatura | FLOAT | A aleatoriedade do texto gerado. O padrão é UTF-1. | No |
parar | list | A sequência de interrupção do texto gerado. O padrão é nulo. | No |
top_p | FLOAT | A probabilidade de usar a melhor opção dos tokens gerados. O padrão é UTF-1. | No |
presence_penalty | float | Valor que controla o comportamento do modelo em relação a frases repetidas. O padrão é 0. | No |
frequency_penalty | float | Valor que controla o comportamento do modelo em relação à geração de frases incomuns. O padrão é 0. | Não |
Saídas
Tipo de retorno | Descrição |
---|---|
string | O texto de uma resposta da conversa |
Próxima etapa
Saiba mais sobre como processar imagens no prompt flow.