Nota
El acceso a esta página requiere autorización. Puede intentar iniciar sesión o cambiar directorios.
El acceso a esta página requiere autorización. Puede intentar cambiar los directorios.
La herramienta GPT-4V de OpenAI le permite usar GPT-4 de OpenAI con visión, también denominada GPT-4V o gpt-4-vision-preview en la API, para tomar imágenes como entrada y responder preguntas sobre ellas.
Importante
La herramienta OpenAI GPT-4V está actualmente en versión preliminar pública. Esta versión preliminar se ofrece sin contrato de nivel de servicio y no es aconsejable usarla para cargas de trabajo de producción. Es posible que algunas características no sean compatibles o que tengan sus funcionalidades limitadas. Para más información, consulte Términos de uso complementarios de las Versiones Preliminares de Microsoft Azure.
Requisitos previos
Creación de recursos de OpenAI
- Creación de una cuenta en el sitio web de OpenAI
- Inicie sesión y busque la clave de API personal.
Obtener acceso a la API GPT-4
Para usar GPT-4 con visión, necesita acceso a la API GPT-4. Para más información, consulte cómo obtener acceso a gpT-4 API.
Connection
Configure las conexiones a los recursos aprovisionados en el flujo de avisos.
Tipo | Nombre | CLAVE DE API |
---|---|---|
OpenAI | Obligatorio | Obligatorio |
Entradas
Nombre | Escribir | Descripción | Obligatorio |
---|---|---|---|
connection | OpenAI | La conexión de OpenAI que se va a usar en la herramienta. | Sí |
modelo | string | El modelo de lenguaje que se va a usar, actualmente solo admite gpt-4-vision-preview. | Sí |
símbolo del sistema | string | Mensaje de texto que usa el modelo de lenguaje para generar su respuesta. La plantilla Jinja para redactar avisos en esta herramienta sigue una estructura similar a la API de chat de la herramienta LLM. Para representar una entrada de imagen en el símbolo del sistema, puede usar la sintaxis  . La entrada de imagen se puede pasar en los mensajes user , system y assistant . |
Sí |
max_tokens | integer | El número máximo de tokens a generar en la respuesta. El valor predeterminado es un valor bajo decidido por openAI API. | No |
temperatura | FLOAT | La aleatoriedad del texto generado. El valor predeterminado es 1. | No |
stop | list | La secuencia de detención para el texto generado. El valor predeterminado es null. | No |
top_p | FLOAT | La probabilidad de usar la opción superior de los tokens generados. El valor predeterminado es 1. | No |
presence_penalty | FLOAT | Valor que controla el comportamiento del modelo con respecto a las frases repetidas. El valor predeterminado es 0. | No |
frequency_penalty | FLOAT | Valor que controla el comportamiento del modelo con respecto a la generación de frases poco frecuentes. El valor predeterminado es 0. | No |
Salidas
Tipo devuelto | Descripción |
---|---|
string | Texto de una respuesta de conversación |
Paso siguiente
Obtenga más información sobre cómo procesar imágenes en un flujo de avisos.