Compartir a través de


OpenAI GPT-4V (versión preliminar)

La herramienta GPT-4V de OpenAI le permite usar GPT-4 de OpenAI con visión, también denominada GPT-4V o gpt-4-vision-preview en la API, para tomar imágenes como entrada y responder preguntas sobre ellas.

Importante

La herramienta OpenAI GPT-4V está actualmente en versión preliminar pública. Esta versión preliminar se ofrece sin contrato de nivel de servicio y no es aconsejable usarla para cargas de trabajo de producción. Es posible que algunas características no sean compatibles o que tengan sus funcionalidades limitadas. Para más información, consulte Términos de uso complementarios de las Versiones Preliminares de Microsoft Azure.

Requisitos previos

  • Creación de recursos de OpenAI

  • Obtener acceso a la API GPT-4

    Para usar GPT-4 con visión, necesita acceso a la API GPT-4. Para más información, consulte cómo obtener acceso a gpT-4 API.

Connection

Configure las conexiones a los recursos aprovisionados en el flujo de avisos.

Tipo Nombre CLAVE DE API
OpenAI Obligatorio Obligatorio

Entradas

Nombre Escribir Descripción Obligatorio
connection OpenAI La conexión de OpenAI que se va a usar en la herramienta.
modelo string El modelo de lenguaje que se va a usar, actualmente solo admite gpt-4-vision-preview.
símbolo del sistema string Mensaje de texto que usa el modelo de lenguaje para generar su respuesta. La plantilla Jinja para redactar avisos en esta herramienta sigue una estructura similar a la API de chat de la herramienta LLM. Para representar una entrada de imagen en el símbolo del sistema, puede usar la sintaxis ![image]({{INPUT NAME}}). La entrada de imagen se puede pasar en los mensajes user, system y assistant.
max_tokens integer El número máximo de tokens a generar en la respuesta. El valor predeterminado es un valor bajo decidido por openAI API. No
temperatura FLOAT La aleatoriedad del texto generado. El valor predeterminado es 1. No
stop list La secuencia de detención para el texto generado. El valor predeterminado es null. No
top_p FLOAT La probabilidad de usar la opción superior de los tokens generados. El valor predeterminado es 1. No
presence_penalty FLOAT Valor que controla el comportamiento del modelo con respecto a las frases repetidas. El valor predeterminado es 0. No
frequency_penalty FLOAT Valor que controla el comportamiento del modelo con respecto a la generación de frases poco frecuentes. El valor predeterminado es 0. No

Salidas

Tipo devuelto Descripción
string Texto de una respuesta de conversación

Paso siguiente

Obtenga más información sobre cómo procesar imágenes en un flujo de avisos.