Referencia de la API REST de los servicios de Azure OpenAI
Artículo
En este artículo se proporcionan detalles sobre los puntos de conexión de la API de REST de inferencia de Azure OpenAI.
Especificaciones de API
La administración e interacción con los modelos y recursos de Azure OpenAI se divide en tres superficies de API principales:
Plano de control
Plano de datos: creación
Plano de datos: inferencia
Cada superficie o especificación de API encapsula un conjunto diferente de funcionalidades de Azure OpenAI. Cada API tiene su propio conjunto único de versiones preliminares y estables o disponibles con carácter general (GA). Las versiones preliminares tienden actualmente a seguir una cadencia mensual.
Azure OpenAI comparte un plano de control común con todos los demás servicios de Azure AI. La API del plano de control se usa para cosas como crear recursos de Azure OpenAI, implementación de modelos y otras tareas de administración de recursos de nivel superior. El plano de control también rige lo que es posible hacer con funcionalidades como Azure Resource Manager, Bicep, Terraform y la CLI de Azure.
La API de inferencia del plano de datos proporciona las funcionalidades o puntos de conexión de inferencia para características como finalizaciones, finalizaciones de chat, incrustaciones, voz o susurro, en los datos, Dall-e, asistentes, etc.
Autenticación
Azure OpenAI proporciona dos métodos de autenticación. Puede usar claves de API o Microsoft Entra ID.
Autenticación con claves de API:: para este tipo de autenticación, todas las solicitudes de API deben incluir la clave de API en el encabezado HTTP api-key. El inicio rápido proporciona una guía sobre cómo realizar llamadas con este tipo de autenticación.
Autenticación de Microsoft Entra ID: puede autenticar una llamada a la API usando un token de Microsoft Entra. Los tokens de autenticación se incluyen en una solicitud como encabezado Authorization. El token proporcionado debe ir precedido de Bearer, por ejemplo Bearer YOUR_AUTH_TOKEN. Puede leer nuestra guía sobre la autenticación con Microsoft Entra ID.
Control de versiones de la API REST
Las API de servicio se versionan mediante el parámetro de consulta api-version. Todas las versiones siguen la estructura de fecha AAAA-MM-DD. Por ejemplo:
POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01
Inferencia del plano de datos
El resto del artículo cubre la última versión de GA de la especificación de inferencia del plano de datos de Azure OpenAI, 2024-10-21.
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21
Crea una finalización para el símbolo del sistema, los parámetros y el modelo elegido proporcionados.
Parámetros de identificador URI
Nombre
En
Obligatorio
Type
Descripción
endpoint
path
Sí
string dirección URL
Puntos de conexión de Azure OpenAI admitidos (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com. Reemplace "aoairesource" por el nombre del recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id
path
Sí
string
Identificador de implementación del modelo que se implementó.
api-version
consulta
Sí
string
Versión de API
Encabezado de solicitud
Nombre
Obligatorio
Type
Descripción
api-key
True
string
Proporcione la clave de API de Azure OpenAI aquí
Cuerpo de la solicitud
Content-Type: application/json
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
símbolo del sistema
cadena o matriz
Las indicaciones para generar finalizaciones de codificaciones como una cadena, matriz de cadenas, matriz de tokens o matriz de matrices de tokens.
Tenga en cuenta que <|endoftext|> es el separador de documentos que el modelo ve durante el entrenamiento, por lo que si no se especifica una indicación el modelo generará como si fuera desde el principio de un nuevo documento.
Sí
best_of
integer
Genera finalizaciones best_of del lado del servidor y devuelve la "mejor" (la que tiene la menor probabilidad logarítmica por token). Los resultados no se pueden transmitir.
Cuando se usa con n, best_of controla el número de finalizaciones candidatas y n especifica cuántas devolver: best_of debe ser mayor que n.
Nota: Dado que este parámetro genera muchas finalizaciones, puede consumir rápidamente la cuota de tokens. Úselo cuidadosamente y asegúrese de tener una configuración razonable para max_tokens y stop.
No
1
echo
boolean
Devuelve la solicitud además de la finalización
No
False
frequency_penalty
number
Número entre 2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de su frecuencia existente en el texto hasta el momento, disminuyendo la probabilidad del modelo de repetir la misma línea textualmente.
No
0
logit_bias
objeto
Modifica la probabilidad de que los tokens especificados aparezcan en la finalización.
Acepta un objeto JSON que asigna tokens (especificados por el ID de token en el tokenizador de GPT) a un valor de sesgo asociado de -100 a 100. Matemáticamente, el sesgo se agrega a los logits generados por el modelo antes del muestreo. El efecto exacto variará según el modelo, pero los valores entre -1 y 1 deberían disminuir o aumentar la probabilidad de selección; valores como -100 o 100 deberían dar lugar a una prohibición o selección exclusiva del token correspondiente.
Como ejemplo, puede pasar {"50256": -100} para evitar que se genere el token <|endoftext|>.
No
Ninguno
logprobs
integer
Incluye las probabilidades logarítmicas en los tokens más probables de logprobs, así como los tokens elegidos. Por ejemplo, si logprobs es 5, la API devolverá una lista de los cinco tokens más probables. La API siempre devolverá el valor logprob del token muestreado, por lo que puede haber hasta logprobs+1 elementos en la respuesta.
El valor máximo de logprobs es 5.
No
Ninguno
max_tokens
integer
Número máximo de tokens que se pueden generar en la finalización.
El número de tokens de su pregunta más max_tokens no puede exceder la longitud del contexto del modelo.
No
16
n
integer
Cuántas terminaciones generar para cada pregunta.
Nota: Dado que este parámetro genera muchas finalizaciones, puede consumir rápidamente la cuota de tokens. Úselo cuidadosamente y asegúrese de tener una configuración razonable para max_tokens y stop.
No
1
presence_penalty
number
Número entre 2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de su aparición en el texto hasta el momento, aumentando la probabilidad de que el modelo hable de nuevos temas.
No
0
seed
integer
Si se especifica, el sistema realizará un mejor esfuerzo para muestrear de forma determinista, de modo que las solicitudes repetidas con un mismo seed y parámetros deben devolver el mismo resultado.
No se garantiza el determinismo y debe hacer referencia al parámetro de respuesta system_fingerprint para supervisar los cambios en el back-end.
No
stop
cadena o matriz
Hasta cuatro secuencias en las que la API dejará de generar más tokens. El texto devuelto no contendrá la secuencia de detención.
No
flujo
boolean
Si se transmite el progreso parcial. Si se establece, los tokens se enviarán como eventos enviados servidor a medida que estén disponibles, con la secuencia terminada por un mensaje data: [DONE].
No
False
sufijo
string
Sufijo que viene después de completar el texto insertado.
Este parámetro solamente se admite en gpt-3.5-turbo-instruct.
No
Ninguno
temperatura
number
Temperatura de muestreo que se vaya a usar, entre 0 y 2. Los valores más altos, como 0,8, harán que la salida sea más aleatoria, mientras que los valores más bajos, como 0,2, la harán más enfocada y determinista.
Por lo general, recomendamos modificar esto o top_p, pero no ambos.
No
1
top_p
number
Una alternativa al muestreo con temperatura, llamada muestreo de núcleo, donde el modelo considera los resultados de los tokens con masa de probabilidad top_p. Así, 0,1 significa que solo se consideran los tokens que comprenden la masa de probabilidad del 10% superior.
Por lo general, recomendamos modificar esto o temperature, pero no ambos.
No
1
usuario
string
Identificador único que representa al usuario final, lo que puede ayudar a supervisar y detectar abusos.
Representa una respuesta de finalización de la API. Nota: Los objetos de respuesta transmitidos y no transmitidos comparten la misma forma (a diferencia del punto de conexión de chat).
Crea una finalización para el símbolo del sistema, los parámetros y el modelo elegido proporcionados.
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2024-10-21
{
"prompt": [
"tell me a joke about mango"
],
"max_tokens": 32,
"temperature": 1.0,
"n": 1
}
Respuestas: Código de estado: 200
{
"body": {
"id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
"created": 1686617332,
"choices": [
{
"text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
"index": 0,
"finish_reason": "stop",
"logprobs": null
}
],
"usage": {
"completion_tokens": 20,
"prompt_tokens": 6,
"total_tokens": 26
}
}
}
Inserciones
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21
Obtenga una representación vectorial de una entrada dada que pueda ser consumida fácilmente por modelos y algoritmos de aprendizaje automático.
Parámetros de identificador URI
Nombre
En
Obligatorio
Type
Descripción
endpoint
path
Sí
string dirección URL
Puntos de conexión de Azure OpenAI admitidos (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com. Reemplace "aoairesource" por el nombre del recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id
path
Sí
cadena
api-version
consulta
Sí
string
Versión de API
Encabezado de solicitud
Nombre
Obligatorio
Type
Descripción
api-key
True
string
Proporcione la clave de API de Azure OpenAI aquí
Cuerpo de la solicitud
Content-Type: application/json
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
input
cadena o matriz
Texto de entrada para insertar, codificado como una cadena o matriz de tokens. Para insertar varias entradas en una sola solicitud, pase una matriz de cadenas o matriz de matrices de tokens. La entrada no debe superar el número máximo de tokens de entrada para el modelo (8192 tokens para text-embedding-ada-002), no puede ser una cadena vacía y ninguna matriz debe tener 2048 dimensiones o menos.
Sí
usuario
string
Un identificador único que representa al usuario final, que podría ayudar a supervisar y detectar abusos.
No
input-type
string
tipo de entrada de búsqueda de inserción que se va a usar
No
encoding_format
string
Formato en el que se devuelven las incrustaciones. Puede ser float o base64. Su valor predeterminado es float.
No
dimensiones
integer
Número de dimensiones que deben tener las incrustaciones de salida resultantes. Solo se admite en modelos text-embedding-3 y versiones posteriores.
No
Respuestas
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
objeto
string
Sí
modelo
string
Sí
data
array
Sí
usada
objeto
Sí
Propiedades de uso
prompt_tokens
Nombre
Escribir
Descripción
Valor predeterminado
prompt_tokens
integer
total_tokens
Nombre
Escribir
Descripción
Valor predeterminado
total_tokens
integer
Código de estado: 200
Descripción: OK
Content-Type
Tipo
Descripción
application/json
objeto
Ejemplos
Ejemplo
Devuelve las incrustaciones de un mensaje determinado.
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2024-10-21
{
"input": [
"this is a test"
]
}
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
Crea una finalización para el mensaje de chat
Parámetros de identificador URI
Nombre
En
Obligatorio
Type
Descripción
endpoint
path
Sí
string dirección URL
Puntos de conexión de Azure OpenAI admitidos (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com. Reemplace "aoairesource" por el nombre del recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id
path
Sí
string
Identificador de implementación del modelo que se implementó.
api-version
consulta
Sí
string
Versión de API
Encabezado de solicitud
Nombre
Obligatorio
Type
Descripción
api-key
True
string
Proporcione la clave de API de Azure OpenAI aquí
Cuerpo de la solicitud
Content-Type: application/json
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
temperatura
number
Temperatura de muestreo que se vaya a usar, entre 0 y 2. Los valores más altos, como 0,8, harán que la salida sea más aleatoria, mientras que los valores más bajos, como 0,2, la harán más enfocada y determinista.
Por lo general, recomendamos modificar esto o top_p, pero no ambos.
No
1
top_p
number
Una alternativa al muestreo con temperatura, llamada muestreo de núcleo, donde el modelo considera los resultados de los tokens con masa de probabilidad top_p. Así, 0,1 significa que solo se consideran los tokens que comprenden la masa de probabilidad del 10% superior.
Por lo general, recomendamos modificar esto o temperature, pero no ambos.
No
1
flujo
boolean
Si se establece, se enviarán deltas de mensajes parciales, como en ChatGPT. Los tokens se enviarán como eventos enviados por el servidor solo de datos a medida que estén disponibles, con la transmisión terminada por un mensaje data: [DONE].
No
False
stop
cadena o matriz
Hasta cuatro secuencias en las que la API dejará de generar más tokens.
No
max_tokens
integer
Número máximo de tokens que se pueden generar en la finalización del chat.
La longitud total de los tokens de entrada y los tokens generados está limitado por la longitud de contexto del modelo.
No
max_completion_tokens
integer
Límite superior del número de tokens que se pueden generar para una finalización, incluidos los tokens de razonamiento y los tokens de salida visibles.
No
presence_penalty
number
Número entre 2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de su aparición en el texto hasta el momento, aumentando la probabilidad de que el modelo hable de nuevos temas.
No
0
frequency_penalty
number
Número entre 2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de su frecuencia existente en el texto hasta el momento, disminuyendo la probabilidad del modelo de repetir la misma línea textualmente.
No
0
logit_bias
objeto
Modifica la probabilidad de que los tokens especificados aparezcan en la finalización.
Acepta un objeto JSON que asigna tokens (especificados por su Id. de token en el tokenizador) a un valor de sesgo asociado de -100 a 100. Matemáticamente, el sesgo se agrega a los logits generados por el modelo antes del muestreo. El efecto exacto variará según el modelo, pero los valores entre -1 y 1 deberían disminuir o aumentar la probabilidad de selección; valores como -100 o 100 deberían dar lugar a una prohibición o selección exclusiva del token correspondiente.
No
Ninguno
usuario
string
Identificador único que representa al usuario final, lo que puede ayudar a supervisar y detectar abusos.
No
messages
array
Una lista de mensajes que componen la conversación hasta ahora.
Sí
data_sources
array
Las entradas de configuración de las extensiones de chat de Azure OpenAI que las usan. Esta especificación adicional solo es compatible con Azure OpenAI.
No
logprobs
boolean
Si se devuelven probabilidades de registro de los tokens de salida o no. Si es true, devuelve las probabilidades de registro de cada token de salida devuelto en el content de message.
No
False
top_logprobs
integer
Entero entre 0 y 20 que especifica el número de tokens más probables que se devolverán en cada posición del token, cada uno con una probabilidad de registro asociada. logprobs debe establecerse en true si se usa este parámetro.
No
n
integer
Cuántas opciones de finalización de chat se van a generar para cada mensaje de entrada. Tenga en cuenta que se le cobrará en función del número de tokens generados en todas las opciones. Mantenga n como 1 para minimizar los costos.
Objeto que especifica el formato que debe generar el modelo. Compatible con GPT-4o, GPT-4o mini, GPT-4 Turbo y todos los modelos GPT-3.5 Turbo a partir de gpt-3.5-turbo-1106.
Si se establece en { "type": "json_schema", "json_schema": {...} }, se habilitan las salidas estructuradas, lo que garantiza que el modelo coincidirá con el esquema JSON proporcionado.
La configuración en { "type": "json_object" } habilita el modo JSON, lo que garantiza que el mensaje que genera el modelo es JSON válido.
Importante: Cuando utilice el modo JSON, también deberá instruir usted mismo al modelo para que produzca JSON a través de un mensaje del sistema o del usuario. Sin esta instrucción, el modelo puede generar una secuencia de espacios en blanco sin fin hasta que la generación alcance el límite de tokens, lo que da lugar a una solicitud de larga duración y aparentemente "bloqueada". Tenga en cuenta que el contenido del mensaje puede cortarse parcialmente si finish_reason="length", lo que indica que la generación superó max_tokens o la conversación superó la longitud máxima del contexto.
No
seed
integer
Esta característica se encuentra en su versión beta. Si se especifica, el sistema realizará un mejor esfuerzo para muestrear de forma determinista, de modo que las solicitudes repetidas con un mismo seed y parámetros deben devolver el mismo resultado. No se garantiza el determinismo y debe hacer referencia al parámetro de respuesta system_fingerprint para supervisar los cambios en el back-end.
No
tools
array
Una lista de herramientas a las que puede llamar el modelo. Actualmente, solo se admiten funciones como una herramienta. Úselo para proporcionar una lista de funciones para las que el modelo puede generar entradas JSON. Se admite un máximo de 128 funciones.
Controla la herramienta (si existe) a la que llama el modelo. none significa que el modelo no llamará a ninguna herramienta y en su lugar, generará un mensaje. auto significa que el modelo puede elegir entre generar un mensaje o llamar a una o varias herramientas. required significa que el modelo debe llamar a una o varias herramientas. Especificar una herramienta determinada a través de {"type": "function", "function": {"name": "my_function"}} obliga al modelo a llamar a esa herramienta. none es el valor predeterminado cuando no hay herramientas presentes. auto es el valor predeterminado si las herramientas están presentes.
Controla la función (si existe) a la que llama el modelo. none significa que el modelo no llamará a una función, sino que generará un mensaje. auto significa que el modelo puede elegir entre generar un mensaje o llamar a una función. Especificar una función determinada a través de {"name": "my_function"} obliga al modelo a llamar a esa función.
none es el valor predeterminado cuando no hay funciones presentes. auto es el valor predeterminado si hay funciones.
No
functions
array
En desuso en favor de tools.
Una lista de funciones para las que el modelo puede generar entradas JSON.
Crea una finalización para el símbolo del sistema, los parámetros y el modelo elegido proporcionados.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
{
"messages": [
{
"role": "system",
"content": "you are a helpful assistant that talks like a pirate"
},
{
"role": "user",
"content": "can you tell me how to care for a parrot?"
}
]
}
Respuestas: Código de estado: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Ejemplo
Crea una finalización basada en los datos de Azure Search y la identidad administrada asignada por el sistema.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"authentication": {
"type": "system_assigned_managed_identity"
}
}
}
]
}
Crea una finalización basada en los datos vectoriales de Azure Search, el mensaje del asistente anterior y la identidad administrada asignada por el usuario.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2024-10-21
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a cat?"
},
{
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"intent": "cat care"
}
},
{
"role": "user",
"content": "how about dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"authentication": {
"type": "user_assigned_managed_identity",
"managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
},
"index_name": "{index name}",
"query_type": "vector",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"in_scope": true,
"top_n_documents": 5,
"strictness": 3,
"role_information": "You are an AI assistant that helps people find information.",
"fields_mapping": {
"content_fields_separator": "\\n",
"content_fields": [
"content"
],
"filepath_field": "filepath",
"title_field": "title",
"url_field": "url",
"vector_fields": [
"contentvector"
]
}
}
}
]
}
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21
Transcribe el audio en el idioma de entrada.
Parámetros de identificador URI
Nombre
En
Obligatorio
Type
Descripción
endpoint
path
Sí
string dirección URL
Puntos de conexión de Azure OpenAI admitidos (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com. Reemplace "aoairesource" por el nombre del recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id
path
Sí
string
Id. de implementación del modelo de susurro.
api-version
consulta
Sí
string
Versión de API
Encabezado de solicitud
Nombre
Obligatorio
Type
Descripción
api-key
True
string
Proporcione la clave de API de Azure OpenAI aquí
Cuerpo de la solicitud
Tipo de contenido: varias partes/datos de formulario
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
file
string
Objeto de archivo de audio que se va a transcribir.
Sí
símbolo del sistema
string
Texto opcional para guiar el estilo del modelo o continuar con un segmento de audio anterior. El mensaje debe coincidir con el idioma del audio.
Temperatura de muestreo, entre 0 y 1. Los valores más altos, como 0,8, harán que la salida sea más aleatoria, mientras que los valores más bajos, como 0,2, la harán más enfocada y determinista. Si se fija en 0, el modelo utilizará la probabilidad logarítmica para aumentar automáticamente la temperatura hasta que se alcancen determinados umbrales.
No
0
language
string
El idioma del audio de entrada. Suministrar la lengua de entrada en formato ISO-639-1 mejorará la precisión y la latencia.
Texto transcrito en el formato de salida (cuando response_format era uno de texto, vtt o srt).
Ejemplos
Ejemplo
Obtiene texto transcrito y metadatos asociados de los datos de audio hablados proporcionados.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21
Respuestas: Código de estado: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Ejemplo
Obtiene texto transcrito y metadatos asociados de los datos de audio hablados proporcionados.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2024-10-21
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Respuestas: Código de estado: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Traducciones: crear
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21
Transcribe y traduce el audio de entrada en texto en inglés.
Parámetros de identificador URI
Nombre
En
Obligatorio
Type
Descripción
endpoint
path
Sí
string dirección URL
Puntos de conexión de Azure OpenAI admitidos (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com. Reemplace "aoairesource" por el nombre del recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id
path
Sí
string
Id. de implementación del modelo de susurro que se implementó.
api-version
consulta
Sí
string
Versión de API
Encabezado de solicitud
Nombre
Obligatorio
Type
Descripción
api-key
True
string
Proporcione la clave de API de Azure OpenAI aquí
Cuerpo de la solicitud
Tipo de contenido: varias partes/datos de formulario
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
file
string
Archivo de audio que se va a traducir.
Sí
símbolo del sistema
string
Texto opcional para guiar el estilo del modelo o continuar con un segmento de audio anterior. El mensaje debe estar en inglés.
Temperatura de muestreo, entre 0 y 1. Los valores más altos, como 0,8, harán que la salida sea más aleatoria, mientras que los valores más bajos, como 0,2, la harán más enfocada y determinista. Si se fija en 0, el modelo utilizará la probabilidad logarítmica para aumentar automáticamente la temperatura hasta que se alcancen determinados umbrales.
Texto transcrito en el formato de salida (cuando response_format era uno de texto, vtt o srt).
Ejemplos
Ejemplo
Obtiene el texto transcrito en inglés y los metadatos asociados de los datos de audio hablados proporcionados.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Respuestas: Código de estado: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Ejemplo
Obtiene el texto transcrito en inglés y los metadatos asociados de los datos de audio hablados proporcionados.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2024-10-21
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Respuestas: Código de estado: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Imagen y generación
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21
Genera un lote de imágenes a partir de un de texto en una implementación de modelo Dall-e determinada
Parámetros de identificador URI
Nombre
En
Obligatorio
Type
Descripción
endpoint
path
Sí
string dirección URL
Puntos de conexión de Azure OpenAI admitidos (protocolo y nombre de host, por ejemplo: https://aoairesource.openai.azure.com. Reemplace "aoairesource" por el nombre del recurso de Azure OpenAI). https://{your-resource-name}.openai.azure.com
deployment-id
path
Sí
string
Id. de implementación del modelo de DALL-E que se ha implementado.
api-version
consulta
Sí
string
Versión de API
Encabezado de solicitud
Nombre
Obligatorio
Type
Descripción
api-key
True
string
Proporcione la clave de API de Azure OpenAI aquí
Cuerpo de la solicitud
Content-Type: application/json
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
símbolo del sistema
string
Descripción de texto de las imágenes deseadas. La longitud máxima es de 4000 caracteres.
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2024-10-21
{
"prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
"n": 1,
"style": "natural",
"quality": "standard"
}
Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si se ha detectado, así como el nivel de gravedad (very_low, bajo, medio y alto escala que determina la intensidad y el nivel de riesgo de contenido dañino) y si se ha filtrado o no. Información sobre el contenido de jailbreak y las palabras soeces, si se ha detectado y si se ha filtrado o no. E información sobre la lista de bloqueados del cliente, si se ha filtrado y su identificador.
No
innerErrorCode
Códigos de error para el objeto de error interno.
Descripción: códigos de error para el objeto de error interno.
Tipo: string
Valor predeterminado:
Nombre de enumeración: InnerErrorCode
Valores de enumeración:
Valor
Descripción
ResponsibleAIPolicyViolation
El mensaje infringía una de las reglas de filtro de contenido.
Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si se ha detectado, así como el nivel de gravedad (very_low, bajo, medio y alto escala que determina la intensidad y el nivel de riesgo de contenido dañino) y si se ha filtrado o no. Información sobre el contenido de jailbreak y las palabras soeces, si se ha detectado y si se ha filtrado o no. E información sobre la lista de bloqueados del cliente, si se ha filtrado y su identificador.
No
revised_prompt
string
Mensaje que se usó para generar la imagen, si se ha producido alguna revisión en el símbolo del sistema.
No
contentFilterResultBase
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
filtered
boolean
Sí
contentFilterSeverityResult
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
filtered
boolean
Sí
severity
string
No
contentFilterDetectedResult
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
filtered
boolean
Sí
detectado
boolean
No
contentFilterDetectedWithCitationResult
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
cita
objeto
No
Propiedades de la cita
URL
Nombre
Escribir
Descripción
Valor predeterminado
Dirección URL
string
license
Nombre
Escribir
Descripción
Valor predeterminado
license
string
contentFilterResultsBase
Información sobre los resultados del filtrado de contenido.
Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si se ha detectado, así como el nivel de gravedad (very_low, bajo, medio y alto escala que determina la intensidad y el nivel de riesgo de contenido dañino) y si se ha filtrado o no. Información sobre el contenido de jailbreak y las palabras soeces, si se ha detectado y si se ha filtrado o no. E información sobre la lista de bloqueados del cliente, si se ha filtrado y su identificador.
Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si se ha detectado, así como el nivel de gravedad (very_low, bajo, medio y alto escala que determina la intensidad y el nivel de riesgo de contenido dañino) y si se ha filtrado o no. Información sobre texto de terceros y palabras soeces, si se ha detectado y si se ha filtrado o no. E información sobre la lista de bloqueados del cliente, si se ha filtrado y su identificador.
Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si se ha detectado, así como el nivel de gravedad (very_low, bajo, medio y alto escala que determina la intensidad y el nivel de riesgo de contenido dañino) y si se ha filtrado o no. Información sobre el contenido de jailbreak y las palabras soeces, si se ha detectado y si se ha filtrado o no. E información sobre la lista de bloqueados del cliente, si se ha filtrado y su identificador.
No
promptFilterResults
Resultados del filtrado de contenido para cero o más indicaciones en la solicitud. En una solicitud de streaming, los resultados de las distintas indicaciones pueden llegar en distintos momentos o en distintos órdenes.
No hay propiedades definidas para este componente.
dalleContentFilterResults
Información sobre los resultados del filtrado de contenido.
Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si se ha detectado, así como el nivel de gravedad (very_low, bajo, medio y alto escala que determina la intensidad y el nivel de riesgo de contenido dañino) y si se ha filtrado o no. Información sobre el contenido de jailbreak y las palabras soeces, si se ha detectado y si se ha filtrado o no. E información sobre la lista de bloqueados del cliente, si se ha filtrado y su identificador.
Temperatura de muestreo que se vaya a usar, entre 0 y 2. Los valores más altos, como 0,8, harán que la salida sea más aleatoria, mientras que los valores más bajos, como 0,2, la harán más enfocada y determinista. Por lo general, recomendamos modificar esto o top_p, pero no ambos.
No
1
top_p
number
Una alternativa al muestreo con temperatura, llamada muestreo de núcleo, donde el modelo considera los resultados de los tokens con masa de probabilidad top_p. Así, 0,1 significa que solo se consideran los tokens que comprenden la masa de probabilidad del 10% superior. Por lo general, recomendamos modificar esto o temperature, pero no ambos.
No
1
flujo
boolean
Si se establece, se enviarán deltas de mensajes parciales, como en ChatGPT. Los tokens se enviarán como eventos enviados por el servidor de sólo datos a medida que estén disponibles, y el flujo terminará con un mensaje de data: [DONE].
No
False
stop
cadena o matriz
Hasta cuatro secuencias en las que la API dejará de generar más tokens.
No
max_tokens
integer
Número máximo de tokens permitidos para la respuesta generada. De forma predeterminada, el número de tokens que puede devolver el modelo será (4096: tokens de aviso). Este valor ha entrado ahora en desuso en favor de max_completion_tokens y no es compatible con los modelos de la serie o1.
No
4096
max_completion_tokens
integer
Límite superior del número de tokens que se pueden generar para una finalización, incluidos los tokens de razonamiento y los tokens de salida visibles.
No
presence_penalty
number
Número entre 2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de su aparición en el texto hasta el momento, aumentando la probabilidad de que el modelo hable de nuevos temas.
No
0
frequency_penalty
number
Número entre 2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de su frecuencia existente en el texto hasta el momento, disminuyendo la probabilidad del modelo de repetir la misma línea textualmente.
No
0
logit_bias
objeto
Modifica la probabilidad de que los tokens especificados aparezcan en la finalización. Acepta un objeto JSON que asignará tokens (especificados por su id. de token en el tokenizador) a un valor de sesgo asociado de -100 a 100. Matemáticamente, el sesgo se agrega a los logits generados por el modelo antes del muestreo. El efecto exacto variará según el modelo, pero los valores entre -1 y 1 deberían disminuir o aumentar la probabilidad de selección; valores como -100 o 100 deberían dar lugar a una prohibición o selección exclusiva del token correspondiente.
No
usuario
string
Identificador único que representa al usuario final y puede ayudar a Azure OpenAI a supervisar y detectar abusos.
No
createCompletionRequest
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
símbolo del sistema
cadena o matriz
Las indicaciones para generar finalizaciones de codificaciones como una cadena, matriz de cadenas, matriz de tokens o matriz de matrices de tokens.
Tenga en cuenta que <|endoftext|> es el separador de documentos que el modelo ve durante el entrenamiento, por lo que si no se especifica una indicación el modelo generará como si fuera desde el principio de un nuevo documento.
Sí
best_of
integer
Genera finalizaciones best_of del lado del servidor y devuelve la "mejor" (la que tiene la menor probabilidad logarítmica por token). Los resultados no se pueden transmitir.
Cuando se usa con n, best_of controla el número de finalizaciones candidatas y n especifica cuántas devolver: best_of debe ser mayor que n.
Nota: Dado que este parámetro genera muchas finalizaciones, puede consumir rápidamente la cuota de tokens. Úselo cuidadosamente y asegúrese de tener una configuración razonable para max_tokens y stop.
No
1
echo
boolean
Devuelve la solicitud además de la finalización
No
False
frequency_penalty
number
Número entre 2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de su frecuencia existente en el texto hasta el momento, disminuyendo la probabilidad del modelo de repetir la misma línea textualmente.
No
0
logit_bias
objeto
Modifica la probabilidad de que los tokens especificados aparezcan en la finalización.
Acepta un objeto JSON que asigna tokens (especificados por el ID de token en el tokenizador de GPT) a un valor de sesgo asociado de -100 a 100. Matemáticamente, el sesgo se agrega a los logits generados por el modelo antes del muestreo. El efecto exacto variará según el modelo, pero los valores entre -1 y 1 deberían disminuir o aumentar la probabilidad de selección; valores como -100 o 100 deberían dar lugar a una prohibición o selección exclusiva del token correspondiente.
Como ejemplo, puede pasar {"50256": -100} para evitar que se genere el token <|endoftext|>.
No
Ninguno
logprobs
integer
Incluye las probabilidades logarítmicas en los tokens más probables de logprobs, así como los tokens elegidos. Por ejemplo, si logprobs es 5, la API devolverá una lista de los cinco tokens más probables. La API siempre devolverá el valor logprob del token muestreado, por lo que puede haber hasta logprobs+1 elementos en la respuesta.
El valor máximo de logprobs es 5.
No
Ninguno
max_tokens
integer
Número máximo de tokens que se pueden generar en la finalización.
El número de tokens de su pregunta más max_tokens no puede exceder la longitud del contexto del modelo.
No
16
n
integer
Cuántas terminaciones generar para cada pregunta.
Nota: Dado que este parámetro genera muchas finalizaciones, puede consumir rápidamente la cuota de tokens. Úselo cuidadosamente y asegúrese de tener una configuración razonable para max_tokens y stop.
No
1
presence_penalty
number
Número entre 2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de su aparición en el texto hasta el momento, aumentando la probabilidad de que el modelo hable de nuevos temas.
No
0
seed
integer
Si se especifica, el sistema realizará un mejor esfuerzo para muestrear de forma determinista, de modo que las solicitudes repetidas con un mismo seed y parámetros deben devolver el mismo resultado.
No se garantiza el determinismo y debe hacer referencia al parámetro de respuesta system_fingerprint para supervisar los cambios en el back-end.
No
stop
cadena o matriz
Hasta cuatro secuencias en las que la API dejará de generar más tokens. El texto devuelto no contendrá la secuencia de detención.
No
flujo
boolean
Si se transmite el progreso parcial. Si se establece, los tokens se enviarán como eventos enviados servidor a medida que estén disponibles, con la secuencia terminada por un mensaje data: [DONE].
No
False
sufijo
string
Sufijo que viene después de completar el texto insertado.
Este parámetro solamente se admite en gpt-3.5-turbo-instruct.
No
Ninguno
temperatura
number
Temperatura de muestreo que se vaya a usar, entre 0 y 2. Los valores más altos, como 0,8, harán que la salida sea más aleatoria, mientras que los valores más bajos, como 0,2, la harán más enfocada y determinista.
Por lo general, recomendamos modificar esto o top_p, pero no ambos.
No
1
top_p
number
Una alternativa al muestreo con temperatura, llamada muestreo de núcleo, donde el modelo considera los resultados de los tokens con masa de probabilidad top_p. Así, 0,1 significa que solo se consideran los tokens que comprenden la masa de probabilidad del 10% superior.
Por lo general, recomendamos modificar esto o temperature, pero no ambos.
No
1
usuario
string
Identificador único que representa al usuario final, lo que puede ayudar a supervisar y detectar abusos.
No
createCompletionResponse
Representa una respuesta de finalización de la API. Nota: Los objetos de respuesta transmitidos y no transmitidos comparten la misma forma (a diferencia del punto de conexión de chat).
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
id
string
Identificador único para la finalización.
Sí
opciones
array
La lista de opciones de finalización que el modelo generó para el mensaje de entrada.
Sí
created
integer
Marca de tiempo de Unix (en segundos) de cuando se creó la finalización.
Resultados del filtrado de contenido para cero o más indicaciones en la solicitud. En una solicitud de streaming, los resultados de las distintas indicaciones pueden llegar en distintos momentos o en distintos órdenes.
No
system_fingerprint
string
Esta huella digital representa la configuración de back-end con la que se ejecuta el modelo.
Se puede usar junto con el parámetro de solicitud seed para comprender cuándo se han realizado cambios de back-end que podrían afectar al determinismo.
No
objeto
enum
Tipo de objeto, que siempre es "text_completion" Valores posibles: text_completion
Estadísticas de uso de la solicitud de finalización.
No
CreateChatCompletionRequest
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
temperatura
number
Temperatura de muestreo que se vaya a usar, entre 0 y 2. Los valores más altos, como 0,8, harán que la salida sea más aleatoria, mientras que los valores más bajos, como 0,2, la harán más enfocada y determinista.
Por lo general, recomendamos modificar esto o top_p, pero no ambos.
No
1
top_p
number
Una alternativa al muestreo con temperatura, llamada muestreo de núcleo, donde el modelo considera los resultados de los tokens con masa de probabilidad top_p. Así, 0,1 significa que solo se consideran los tokens que comprenden la masa de probabilidad del 10% superior.
Por lo general, recomendamos modificar esto o temperature, pero no ambos.
No
1
flujo
boolean
Si se establece, se enviarán deltas de mensajes parciales, como en ChatGPT. Los tokens se enviarán como eventos enviados por el servidor solo de datos a medida que estén disponibles, con la transmisión terminada por un mensaje data: [DONE].
No
False
stop
cadena o matriz
Hasta cuatro secuencias en las que la API dejará de generar más tokens.
No
max_tokens
integer
Número máximo de tokens que se pueden generar en la finalización del chat.
La longitud total de los tokens de entrada y los tokens generados está limitado por la longitud de contexto del modelo.
No
max_completion_tokens
integer
Límite superior del número de tokens que se pueden generar para una finalización, incluidos los tokens de razonamiento y los tokens de salida visibles.
No
presence_penalty
number
Número entre 2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de su aparición en el texto hasta el momento, aumentando la probabilidad de que el modelo hable de nuevos temas.
No
0
frequency_penalty
number
Número entre 2.0 y 2.0. Los valores positivos penalizan los nuevos tokens en función de su frecuencia existente en el texto hasta el momento, disminuyendo la probabilidad del modelo de repetir la misma línea textualmente.
No
0
logit_bias
objeto
Modifica la probabilidad de que los tokens especificados aparezcan en la finalización.
Acepta un objeto JSON que asigna tokens (especificados por su Id. de token en el tokenizador) a un valor de sesgo asociado de -100 a 100. Matemáticamente, el sesgo se agrega a los logits generados por el modelo antes del muestreo. El efecto exacto variará según el modelo, pero los valores entre -1 y 1 deberían disminuir o aumentar la probabilidad de selección; valores como -100 o 100 deberían dar lugar a una prohibición o selección exclusiva del token correspondiente.
No
Ninguno
usuario
string
Identificador único que representa al usuario final, lo que puede ayudar a supervisar y detectar abusos.
No
messages
array
Una lista de mensajes que componen la conversación hasta ahora.
Sí
data_sources
array
Las entradas de configuración de las extensiones de chat de Azure OpenAI que las usan. Esta especificación adicional solo es compatible con Azure OpenAI.
No
logprobs
boolean
Si se devuelven probabilidades de registro de los tokens de salida o no. Si es true, devuelve las probabilidades de registro de cada token de salida devuelto en el content de message.
No
False
top_logprobs
integer
Entero entre 0 y 20 que especifica el número de tokens más probables que se devolverán en cada posición del token, cada uno con una probabilidad de registro asociada. logprobs debe establecerse en true si se usa este parámetro.
No
n
integer
Cuántas opciones de finalización de chat se van a generar para cada mensaje de entrada. Tenga en cuenta que se le cobrará en función del número de tokens generados en todas las opciones. Mantenga n como 1 para minimizar los costos.
Objeto que especifica el formato que debe generar el modelo. Compatible con GPT-4o, GPT-4o mini, GPT-4 Turbo y todos los modelos GPT-3.5 Turbo a partir de gpt-3.5-turbo-1106.
Si se establece en { "type": "json_schema", "json_schema": {...} }, se habilitan las salidas estructuradas, lo que garantiza que el modelo coincidirá con el esquema JSON proporcionado.
La configuración en { "type": "json_object" } habilita el modo JSON, lo que garantiza que el mensaje que genera el modelo es JSON válido.
Importante: Cuando utilice el modo JSON, también deberá instruir usted mismo al modelo para que produzca JSON a través de un mensaje del sistema o del usuario. Sin esta instrucción, el modelo puede generar una secuencia de espacios en blanco sin fin hasta que la generación alcance el límite de tokens, lo que da lugar a una solicitud de larga duración y aparentemente "bloqueada". Tenga en cuenta que el contenido del mensaje puede cortarse parcialmente si finish_reason="length", lo que indica que la generación superó max_tokens o la conversación superó la longitud máxima del contexto.
No
seed
integer
Esta característica se encuentra en su versión beta. Si se especifica, el sistema realizará un mejor esfuerzo para muestrear de forma determinista, de modo que las solicitudes repetidas con un mismo seed y parámetros deben devolver el mismo resultado. No se garantiza el determinismo y debe hacer referencia al parámetro de respuesta system_fingerprint para supervisar los cambios en el back-end.
No
tools
array
Una lista de herramientas a las que puede llamar el modelo. Actualmente, solo se admiten funciones como una herramienta. Úselo para proporcionar una lista de funciones para las que el modelo puede generar entradas JSON. Se admite un máximo de 128 funciones.
Controla la herramienta (si existe) a la que llama el modelo. none significa que el modelo no llamará a ninguna herramienta y en su lugar, generará un mensaje. auto significa que el modelo puede elegir entre generar un mensaje o llamar a una o varias herramientas. required significa que el modelo debe llamar a una o varias herramientas. Especificar una herramienta determinada a través de {"type": "function", "function": {"name": "my_function"}} obliga al modelo a llamar a esa herramienta. none es el valor predeterminado cuando no hay herramientas presentes. auto es el valor predeterminado si las herramientas están presentes.
Controla la función (si existe) a la que llama el modelo. none significa que el modelo no llamará a una función, sino que generará un mensaje. auto significa que el modelo puede elegir entre generar un mensaje o llamar a una función. Especificar una función determinada a través de {"name": "my_function"} obliga al modelo a llamar a esa función.
none es el valor predeterminado cuando no hay funciones presentes. auto es el valor predeterminado si hay funciones.
No
functions
array
En desuso en favor de tools.
Una lista de funciones para las que el modelo puede generar entradas JSON.
No
chatCompletionFunctions
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
descripción
string
Descripción de lo que hace la función, que usa el modelo para elegir cuándo y cómo llamar a la función.
No
name
cadena
El nombre de la función que se llamará. Debe ser a-z, A-Z, 0-9, o contener caracteres de subrayado y guiones, con una longitud máxima de 64.
Los parámetros que aceptan las funciones, que se describen como un objeto de Esquema JSON. Consulte la guía para obtener ejemplos y referencia del esquema JSON de documentación sobre el formato.
Al omitir parameters se define una función con una lista de parámetros vacía.
No
chatCompletionFunctionCallOption
Especificar una función determinada a través de {"name": "my_function"} obliga al modelo a llamar a esa función.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
nombre
cadena
El nombre de la función que se va a llamar.
Sí
chatCompletionRequestMessage
Este componente puede ser uno de los siguientes:
chatCompletionRequestSystemMessage
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
content
cadena o matriz
El contenido del mensaje del sistema.
Sí
rol
enum
Rol del autor de mensajes, en este caso system. Valores posibles: system
Sí
nombre
string
Nombre opcional para el participante. Proporciona la información del modelo para diferenciar entre los participantes con el mismo rol.
No
chatCompletionRequestUserMessage
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
content
cadena o matriz
Contenido del mensaje del usuario.
Sí
rol
enum
Rol del autor de mensajes, en este caso user. Valores posibles: user
Sí
nombre
string
Nombre opcional para el participante. Proporciona la información del modelo para diferenciar entre los participantes con el mismo rol.
No
chatCompletionRequestAssistantMessage
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
content
cadena o matriz
Contenido del mensaje del asistente. Obligatorio a menos que se especifique tool_calls o function_call.
No
refusal
string
Mensaje de denegación por parte del asistente.
No
rol
enum
Rol del autor de mensajes, en este caso assistant. Valores posibles: assistant
Sí
nombre
string
Nombre opcional para el participante. Proporciona la información del modelo para diferenciar entre los participantes con el mismo rol.
Llamadas a herramientas generadas por el modelo, como las llamadas a funciones.
No
function_call
objeto
En desuso y reemplazado por tool_calls. Nombre y argumentos de una función a la que se debe llamar, según lo generado por el modelo.
No
Propiedades de function_call
argumentos
Nombre
Escribir
Descripción
Valor predeterminado
argumentos
string
Argumentos para llamar a la función, según lo generado por el modelo en formato JSON. Tenga en cuenta que el modelo no siempre genera JSON válido y puede generar parámetros no definidos por el esquema de función. Valide los argumentos del código antes de llamar a la función.
nombre
Nombre
Escribir
Descripción
Valor predeterminado
nombre
cadena
El nombre de la función que se va a llamar.
chatCompletionRequestToolMessage
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
rol
enum
Rol del autor de mensajes, en este caso tool. Valores posibles: tool
Sí
content
cadena o matriz
Contenido del mensaje de la herramienta.
Sí
tool_call_id
string
Llamada a la herramienta a la que va a responder este mensaje.
Sí
chatCompletionRequestFunctionMessage
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
rol
enum
Rol del autor de mensajes, en este caso function. Valores posibles: función
Sí
content
string
Contenido del mensaje de la función.
Sí
nombre
cadena
El nombre de la función que se va a llamar.
Sí
chatCompletionRequestSystemMessageContentPart
Este componente puede ser uno de los siguientes:
chatCompletionRequestUserMessageContentPart
Este componente puede ser uno de los siguientes:
chatCompletionRequestAssistantMessageContentPart
Este componente puede ser uno de los siguientes:
chatCompletionRequestToolMessageContentPart
Este componente puede ser uno de los siguientes:
chatCompletionRequestMessageContentPartText
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
type
enum
Tipo del elemento de contenido. Valores posibles: text
Sí
text
string
Contenido de texto.
Sí
chatCompletionRequestMessageContentPartImage
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
type
enum
Tipo del elemento de contenido. Valores posibles: image_url
Sí
image_url
objeto
Sí
Propiedades de image_url
dirección url
Nombre
Escribir
Descripción
Valor predeterminado
dirección url
string
Dirección URL de la imagen o datos de imagen codificados en base64.
detail
Nombre
Escribir
Descripción
Valor predeterminado
detail
string
Especifica el nivel de detalle de la imagen. Más información en la guía de visión.
auto
chatCompletionRequestMessageContentPartRefusal
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
type
enum
Tipo del elemento de contenido. Valores posibles: refusal
Sí
refusal
string
Mensaje de denegación generado por el modelo.
Sí
azureChatExtensionConfiguration
Representación de los datos de configuración para una única extensión de chat de Azure OpenAI. Esto se usará mediante una solicitud de finalizaciones de chat que debe usar extensiones de chat de Azure OpenAI para aumentar el comportamiento de la respuesta.
El uso de esta configuración solo es compatible con Azure OpenAI.
Representación de los datos de configuración para una única extensión de chat de Azure OpenAI. Esto lo usará un chat solicitudes de finalización que deben usar extensiones de chat de Azure OpenAI para aumentar el comportamiento de la respuesta. El uso de esta configuración solo es compatible con Azure OpenAI.
Sí
azureChatExtensionType
Representación de los datos de configuración para una única extensión de chat de Azure OpenAI. Esto se usará mediante una solicitud de finalizaciones de chat que debe usar extensiones de chat de Azure OpenAI para aumentar el comportamiento de la respuesta.
El uso de esta configuración solo es compatible con Azure OpenAI.
Descripción: representación de los datos de configuración para una única extensión de chat de Azure OpenAI. Esto se usará mediante una solicitud de finalizaciones de chat que debe usar extensiones de chat de Azure OpenAI para aumentar el comportamiento de la respuesta. El uso de esta configuración solo es compatible con Azure OpenAI.
Tipo: string
Valor predeterminado:
Nombre de enumeración: AzureChatExtensionType
Valores de enumeración:
Valor
Descripción
azure_search
Representa el uso de Azure Search como una extensión de chat de Azure OpenAI.
azure_cosmos_db
Representa el uso de Azure Cosmos DB como una extensión de chat de Azure OpenAI.
azureSearchChatExtensionConfiguration
Representación específica de las opciones configurables para Azure Search al usarlo como una extensión de chat de Azure OpenAI.
Representación de los datos de configuración para una única extensión de chat de Azure OpenAI. Esto lo usará un chat solicitudes de finalización que deben usar extensiones de chat de Azure OpenAI para aumentar el comportamiento de la respuesta. El uso de esta configuración solo es compatible con Azure OpenAI.
El número superior configurado de documentos que se van a presentar para la consulta configurada.
No
in_scope
boolean
Si las consultas deben restringirse al uso de datos indexados.
No
rigurosidad
integer
La configuración estricta del filtrado de relevancia de búsqueda. Cuanto más estricta sea, mayor será la precisión, pero una menor coincidencia de la respuesta.
No
role_information
string
Proporcione instrucciones al modelo sobre cómo debe comportarse y cualquier contexto al que debe hacer referencia al generar una respuesta. Puede describir la personalidad del asistente y indicarle cómo dar formato a las respuestas. Hay un límite de 100 tokens para él y cuenta con respecto al límite total de tokens.
No
endpoint
string
Ruta de acceso del punto de conexión absoluto para el recurso de Azure Search que se va a usar.
Sí
index_name
string
El nombre del índice a utilizar como disponible en el recurso Azure Search referenciado.
Representación de los datos de configuración para una única extensión de chat de Azure OpenAI. Esto lo usará un chat solicitudes de finalización que deben usar extensiones de chat de Azure OpenAI para aumentar el comportamiento de la respuesta. El uso de esta configuración solo es compatible con Azure OpenAI.
Las opciones de autenticación de Azure OpenAI en los datos al usar una cadena de conexión.
Sí
top_n_documents
integer
El número superior configurado de documentos que se van a presentar para la consulta configurada.
No
in_scope
boolean
Si las consultas deben restringirse al uso de datos indexados.
No
rigurosidad
integer
La configuración estricta del filtrado de relevancia de búsqueda. Cuanto más estricta sea, mayor será la precisión, pero una menor coincidencia de la respuesta.
No
role_information
string
Proporcione instrucciones al modelo sobre cómo debe comportarse y cualquier contexto al que debe hacer referencia al generar una respuesta. Puede describir la personalidad del asistente y indicarle cómo dar formato a las respuestas. Hay un límite de 100 tokens para él y cuenta con respecto al límite total de tokens.
No
database_name
string
El nombre de base de datos de núcleo virtual de MongoDB que se va a usar con Azure Cosmos DB.
Sí
container_name
string
El nombre del contenedor de recursos de Azure Cosmos DB.
Sí
index_name
string
El nombre de índice de núcleo virtual de MongoDB que se va a usar con Azure Cosmos DB.
Representa los orígenes disponibles que Azure OpenAI en los datos puede usar para configurar la vectorización de datos para su uso con vector de búsqueda.
Sí
onYourDataVectorizationSourceType
Representa los orígenes disponibles que Azure OpenAI en los datos puede usar para configurar la vectorización de datos para su uso con la vector de búsqueda.
Descripción: representa los orígenes disponibles que Azure OpenAI en los datos puede usar para configurar la vectorización de datos para su uso con vector de búsqueda.
Tipo: string
Valor predeterminado:
Nombre de enumeración: OnYourDataVectorizationSourceType
Valores de enumeración:
Valor
Descripción
endpoint
Representa la vectorización realizada por llamadas de servicio público a un modelo de inserción de Azure OpenAI.
deployment_name
Representa un nombre de implementación del modelo de Ada que se va a usar. Esta implementación del modelo debe estar en el mismo recurso de Azure OpenAI, pero En los datos, usará esta implementación del modelo a través de una llamada interna en lugar de una pública, lo que permite el vector buscar incluso en redes privadas.
onYourDataDeploymentNameVectorizationSource
Los detalles de un origen de vectorización, que usa Azure OpenAI en los datos al aplicar un vector de búsqueda, que se basa en un nombre de implementación de modelos de inserción interno en el mismo recurso de Azure OpenAI.
Representa los orígenes disponibles que Azure OpenAI en los datos puede usar para configurar la vectorización de datos para su uso con vector de búsqueda.
Sí
deployment_name
string
Especifica el nombre de la implementación de modelo que se va a usar para la vectorización. Esta implementación del modelo debe estar en el mismo recurso de Azure OpenAI, pero En los datos usará esta implementación de modelo a través de una llamada interna en lugar de una pública, lo que permite el vector de búsqueda incluso en redes privadas.
No
onYourDataEndpointVectorizationSource
Los detalles de un origen de vectorización, que usa Azure OpenAI en los datos al aplicar la búsqueda de vectores, que se basa en una llamada pública de punto de conexión de Azure OpenAI para incrustaciones.
Representa los orígenes disponibles que Azure OpenAI en los datos puede usar para configurar la vectorización de datos para su uso con vector de búsqueda.
Las opciones de autenticación de Azure OpenAI en los datos al usar una clave de API.
No
endpoint
string
Especifica el punto de conexión que se va a usar para la vectorización. Este punto de conexión debe estar en el mismo recurso de Azure OpenAI, pero On Your Data usará este punto de conexión a través de una llamada interna en lugar de una pública, lo que habilita la vector de búsqueda incluso en redes privadas.
No
azureChatExtensionsMessageContext
Representación de la información de contexto adicional disponible cuando las extensiones de chat de Azure OpenAI participan en la generación de una respuesta de finalizaciones de chat correspondiente. Esta información de contexto solo se rellena cuando se usa una solicitud de Azure OpenAI configurada para usar una extensión coincidente.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
Citas
array
Resultado de la recuperación del origen de datos, que se usa para generar el mensaje del asistente en la respuesta.
No
intención
string
La intención detectada del historial de chat, que se usa para pasar al siguiente turno para llevar el contexto.
No
cita
información de cita para un mensaje de respuesta de finalizaciones de chat.
Tipo de la llamada a la herramienta, en este caso function.
Sí
function
objeto
Función a la que llamó el modelo.
Sí
Propiedades de la función
nombre
Nombre
Escribir
Descripción
Valor predeterminado
nombre
cadena
El nombre de la función que se va a llamar.
argumentos
Nombre
Escribir
Descripción
Valor predeterminado
argumentos
string
Argumentos para llamar a la función, según lo generado por el modelo en formato JSON. Tenga en cuenta que el modelo no siempre genera JSON válido y puede generar parámetros no definidos por el esquema de función. Valide los argumentos del código antes de llamar a la función.
toolCallType
Tipo de la llamada a la herramienta, en este caso function.
Descripción: el tipo de la llamada a la herramienta, en este caso function.
Tipo: string
Valor predeterminado:
Nombre de enumeración: ToolCallType
Valores de enumeración:
Valor
Descripción
function
El tipo de llamada de herramienta es función.
chatCompletionRequestMessageTool
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
tool_call_id
string
Llamada a la herramienta a la que va a responder este mensaje.
No
content
string
Contenido del mensaje.
No
chatCompletionRequestMessageFunction
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
rol
enum
Rol del autor de mensajes, en este caso function. Valores posibles: función
No
name
string
Contenido del mensaje.
No
content
string
Contenido del mensaje.
No
CreateChatCompletionResponse
Representa una respuesta de finalización de chat devuelta por el modelo, en función de la entrada proporcionada.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
id
string
Identificador único para la finalización del chat.
Resultados del filtrado de contenido para cero o más indicaciones en la solicitud. En una solicitud de streaming, los resultados de las distintas indicaciones pueden llegar en distintos momentos o en distintos órdenes.
No
opciones
array
Una lista de opciones de finalización de chat. Puede ser más de uno si n es mayor que 1.
Sí
created
integer
Marca de tiempo de Unix (en segundos) de cuando se creó la finalización de chat.
Sí
modelo
string
Modelo usado para la finalización de chat.
Sí
system_fingerprint
string
Esta huella digital representa la configuración de back-end con la que se ejecuta el modelo.
Se puede usar junto con el parámetro de solicitud seed para comprender cuándo se han realizado cambios de back-end que podrían afectar al determinismo.
No
objeto
enum
Tipo de objeto, que siempre es chat.completion. Valores posibles: chat.completion
Estadísticas de uso de la solicitud de finalización.
No
createChatCompletionStreamResponse
Representa un fragmento transmitido de una respuesta de finalización de chat devuelta por el modelo, en función de la entrada proporcionada.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
id
string
Identificador único para la finalización del chat. Cada fragmento tiene el mismo id.
Sí
opciones
array
Una lista de opciones de finalización de chat. Puede contener más de un elemento si n es mayor que 1.
Sí
created
integer
Marca de tiempo de Unix (en segundos) de cuando se creó la finalización de chat. Cada fragmento tiene la misma marca de tiempo.
Sí
modelo
string
Modelo para generar la finalización.
Sí
system_fingerprint
string
Esta huella digital representa la configuración de back-end con la que se ejecuta el modelo. Se puede usar junto con el parámetro de solicitud seed para comprender cuándo se han realizado cambios de back-end que podrían afectar al determinismo.
No
objeto
enum
Tipo de objeto, que siempre es chat.completion.chunk. Valores posibles: chat.completion.chunk
Sí
chatCompletionStreamResponseDelta
Una diferencia de finalización del chat generada por respuestas del modelo transmitido.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
content
string
Contenido del fragmento del mensaje.
No
function_call
objeto
En desuso y reemplazado por tool_calls. Nombre y argumentos de una función a la que se debe llamar, según lo generado por el modelo.
No
tool_calls
array
No
rol
enum
Rol del autor de este mensaje. Valores posibles: system, user, assistant, tool
No
refusal
string
Mensaje de denegación generado por el modelo.
No
Propiedades de function_call
argumentos
Nombre
Escribir
Descripción
Valor predeterminado
argumentos
string
Argumentos para llamar a la función, según lo generado por el modelo en formato JSON. Tenga en cuenta que el modelo no siempre genera JSON válido y puede generar parámetros no definidos por el esquema de función. Valide los argumentos del código antes de llamar a la función.
nombre
Nombre
Escribir
Descripción
Valor predeterminado
nombre
cadena
El nombre de la función que se va a llamar.
chatCompletionMessageToolCallChunk
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
índice
integer
Sí
id
string
Identificador de la llamada a la herramienta.
No
type
enum
El tipo de la herramienta. Actualmente, solo se admite function. Valores posibles: función
No
function
objeto
No
Propiedades de la función
nombre
Nombre
Escribir
Descripción
Valor predeterminado
nombre
cadena
El nombre de la función que se va a llamar.
argumentos
Nombre
Escribir
Descripción
Valor predeterminado
argumentos
string
Argumentos para llamar a la función, según lo generado por el modelo en formato JSON. Tenga en cuenta que el modelo no siempre genera JSON válido y puede generar parámetros no definidos por el esquema de función. Valide los argumentos del código antes de llamar a la función.
chatCompletionStreamOptions
Opciones para la respuesta de streaming. Establezca este valor solo cuando defina stream: true.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
include_usage
boolean
Si se establece, se transmitirá un fragmento adicional delante del mensaje data: [DONE]. El campo usage de este fragmento muestra las estadísticas de uso de tokens de toda la solicitud y el campo choices siempre será una matriz vacía. El resto de fragmentos también incluirá un campo usage, pero con un valor NULL.
No
chatCompletionChoiceLogProbs
Registre la información de probabilidad para la elección.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
content
array
Lista de tokens de contenido de mensajes con información de probabilidad de registro.
Sí
refusal
array
Lista de tokens de mensajes de denegación con información de probabilidad logarítmica.
No
chatCompletionTokenLogprob
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
token
string
Token.
Sí
logprob
number
Probabilidad de registro de este token.
Sí
bytes
array
Lista de enteros que representan la representación de bytes UTF-8 del token. Resulta útil en instancias en las que los caracteres se representan mediante varios tokens y sus representaciones de bytes deben combinarse para generar la representación de texto correcta. Puede ser null si no hay ninguna representación de bytes para el token.
Sí
top_logprobs
array
Lista de los tokens más probables y su probabilidad de registro, en esta posición del token. En raras ocasiones, puede que se devuelvan menos top_logprobs de los solicitados.
Sí
ChatCompletionResponseMessage
Mensaje de finalización del chat generado por el modelo.
Representación de la información de contexto adicional disponible cuando intervienen extensiones de chat de Azure OpenAI en la generación de una respuesta de finalizaciones de chat correspondiente. Esta información de contexto solo se rellena cuando mediante una solicitud de Azure OpenAI configurada para usar una extensión coincidente.
No
chatCompletionResponseMessageRole
Rol del autor del mensaje de respuesta.
Descripción: rol del autor del mensaje de respuesta.
Tipo: string
Valor predeterminado:
Valores de enumeración:
assistant
chatCompletionToolChoiceOption
Controla la herramienta (si existe) a la que llama el modelo. none significa que el modelo no llamará a ninguna herramienta y en su lugar, generará un mensaje. auto significa que el modelo puede elegir entre generar un mensaje o llamar a una o varias herramientas. required significa que el modelo debe llamar a una o varias herramientas. Especificar una herramienta determinada a través de {"type": "function", "function": {"name": "my_function"}} obliga al modelo a llamar a esa herramienta. none es el valor predeterminado cuando no hay herramientas presentes. auto es el valor predeterminado si las herramientas están presentes.
Este componente puede ser uno de los siguientes:
chatCompletionNamedToolChoice
Especifica una herramienta que debe usar el modelo. Use para forzar que el modelo llame a una función específica.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
type
enum
El tipo de la herramienta. Actualmente, solo se admite function. Valores posibles: función
Sí
function
objeto
Sí
Propiedades de la función
nombre
Nombre
Escribir
Descripción
Valor predeterminado
nombre
cadena
El nombre de la función que se va a llamar.
ParallelToolCalls
Indica si se debe habilitar la llamada a funciones paralelas durante el uso de la herramienta.
No hay propiedades definidas para este componente.
chatCompletionMessageToolCalls
Llamadas a herramientas generadas por el modelo, como las llamadas a funciones.
No hay propiedades definidas para este componente.
chatCompletionFunctionCall
En desuso y reemplazado por tool_calls. Nombre y argumentos de una función a la que se debe llamar, según lo generado por el modelo.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
nombre
cadena
El nombre de la función que se va a llamar.
Sí
argumentos
string
Argumentos para llamar a la función, según lo generado por el modelo en formato JSON. Tenga en cuenta que el modelo no siempre genera JSON válido y puede generar parámetros no definidos por el esquema de función. Valide los argumentos del código antes de llamar a la función.
Sí
CompletionUsage
Estadísticas de uso de la solicitud de finalización.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
prompt_tokens
integer
Número de tokens en el símbolo del sistema.
Sí
completion_tokens
integer
Número de tokens en la finalización generada.
Sí
total_tokens
integer
Número total de tokens usados en la solicitud (solicitud + finalización).
Sí
completion_tokens_details
objeto
Desglose de los tokens que se usan en una finalización.
No
Propiedades de completion_tokens_details
reasoning_tokens
Nombre
Escribir
Descripción
Valor predeterminado
reasoning_tokens
integer
Tokens generados por el modelo para razonamiento.
chatCompletionTool
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
type
enum
El tipo de la herramienta. Actualmente, solo se admite function. Valores posibles: función
Los parámetros que aceptan las funciones, que se describen como un objeto de Esquema JSON. Consulte la guía para obtener ejemplos y referencia del esquema JSON de documentación sobre el formato.
Al omitir parameters se define una función con una lista de parámetros vacía.
No hay propiedades definidas para este componente.
FunctionObject
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
descripción
string
Descripción de lo que hace la función, que usa el modelo para elegir cuándo y cómo llamar a la función.
No
name
cadena
El nombre de la función que se llamará. Debe ser a-z, A-Z, 0-9, o contener caracteres de subrayado y guiones, con una longitud máxima de 64.
Los parámetros que aceptan las funciones, que se describen como un objeto de Esquema JSON. Consulte la guía para obtener ejemplos y referencia del esquema JSON de documentación sobre el formato.
Al omitir parameters se define una función con una lista de parámetros vacía.
No
strict
boolean
Indica si se debe habilitar el cumplimiento estricto del esquema al generar la llamada a la función. Si se establece en true, el modelo seguirá el esquema exacto definido en el campo parameters. Solo se admite un subconjunto del esquema JSON cuando strict es true.
No
False
ResponseFormatText
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
type
enum
Tipo de formato de respuesta que se va a definir: text Valores posibles: text
Sí
ResponseFormatJsonObject
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
type
enum
Tipo de formato de respuesta que se va a definir: json_object Valores posibles: json_object
Sí
ResponseFormatJsonSchemaSchema
Esquema para el formato de respuesta, descrito como un objeto de esquema JSON.
No hay propiedades definidas para este componente.
ResponseFormatJsonSchema
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
type
enum
Tipo de formato de respuesta que se va a definir: json_schema Valores posibles: json_schema
Sí
json_schema
objeto
Sí
Propiedades para json_schema
descripción
Nombre
Escribir
Descripción
Valor predeterminado
descripción
string
Descripción del formato de respuesta que usa el modelo para determinar cómo responder en el formato.
nombre
Nombre
Escribir
Descripción
Valor predeterminado
nombre
string
Nombre del formato de respuesta. Debe ser a-z, A-Z, 0-9, o contener caracteres de subrayado y guiones, con una longitud máxima de 64.
Esquema para el formato de respuesta, descrito como un objeto de esquema JSON.
strict
Nombre
Escribir
Descripción
Valor predeterminado
strict
boolean
Indica si se debe habilitar el cumplimiento estricto del esquema al generar la respuesta. Si se establece en true, el modelo siempre seguirá el esquema exacto definido en el campo schema. Solo se admite un subconjunto del esquema JSON cuando strict es true.
False
chatCompletionChoiceCommon
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
índice
integer
No
finish_reason
string
No
createTranslationRequest
Solicitud de traducción.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
file
string
Archivo de audio que se va a traducir.
Sí
símbolo del sistema
string
Texto opcional para guiar el estilo del modelo o continuar con un segmento de audio anterior. El mensaje debe estar en inglés.
Temperatura de muestreo, entre 0 y 1. Los valores más altos, como 0,8, harán que la salida sea más aleatoria, mientras que los valores más bajos, como 0,2, la harán más enfocada y determinista. Si se fija en 0, el modelo utilizará la probabilidad logarítmica para aumentar automáticamente la temperatura hasta que se alcancen determinados umbrales.
No
0
audioResponse
Respuesta de traducción o transcripción cuando response_format era json
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
text
string
Texto traducido o transcrito.
Sí
audioVerboseResponse
Respuesta de traducción o transcripción cuando se verbose_json response_format
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
text
string
Texto traducido o transcrito.
Sí
task
string
Tipo de tarea de audio.
No
language
string
Idioma.
No
duración
number
Duración.
No
segmentos
array
No
audioResponseFormat
Define el formato del archivo.
Descripción: define el formato de la salida.
Tipo: string
Valor predeterminado:
Valores de enumeración:
json
text
srt
verbose_json
vtt
createTranscriptionRequest
Solicitud de transcripción.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
file
string
Objeto de archivo de audio que se va a transcribir.
Sí
símbolo del sistema
string
Texto opcional para guiar el estilo del modelo o continuar con un segmento de audio anterior. El mensaje debe coincidir con el idioma del audio.
Temperatura de muestreo, entre 0 y 1. Los valores más altos, como 0,8, harán que la salida sea más aleatoria, mientras que los valores más bajos, como 0,2, la harán más enfocada y determinista. Si se fija en 0, el modelo utilizará la probabilidad logarítmica para aumentar automáticamente la temperatura hasta que se alcancen determinados umbrales.
No
0
language
string
El idioma del audio de entrada. Suministrar la lengua de entrada en formato ISO-639-1 mejorará la precisión y la latencia.
No
audioSegment
Segmento de transcripción o traducción.
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
id
integer
Identificador de segmento.
No
Seek
number
Desplazamiento del segmento.
No
start
number
Desplazamiento de inicio del segmento.
No
end
number
Desplazamiento final del segmento.
No
text
string
Segmentar texto.
No
tokens
array
Tokens del texto.
No
temperatura
number
Temperatura.
No
avg_logprob
number
Probabilidad media del registro.
No
compression_ratio
number
Razón de compresión.
No
no_speech_prob
number
Probabilidad de no speech.
No
imageQuality
Calidad de la imagen que se generará.
Descripción: calidad de la imagen que se generará.
Tipo: string
Valor predeterminado: estándar
Nombre de enumeración: Calidad
Valores de enumeración:
Valor
Descripción
Estándar
La calidad estándar crea imágenes con calidad estándar.
hd
La calidad HD crea imágenes con detalles más finos y mayor consistencia en toda la imagen.
imagesResponseFormat
Formato en el que se devuelven las imágenes generadas.
Descripción: El formato en el que se devuelven las imágenes generadas.
Tipo: string
Valor predeterminado: url
Nombre de enumeración: ImagesResponseFormat
Valores de enumeración:
Valor
Descripción
dirección url
Dirección URL que proporciona acceso temporal para descargar las imágenes generadas.
b64_json
Las imágenes generadas se devuelven como cadena codificada en base64.
imageSize
Tamaño de las imágenes generadas.
Descripción: El tamaño de las imágenes generadas.
Tipo: string
Valor predeterminado: 1024x1024
Nombre de enumeración: Tamaño
Valores de enumeración:
Valor
Descripción
1792x1024
El tamaño deseado de la imagen generada es de 1792 x 1024 píxeles.
1024x1792
El tamaño deseado de la imagen generada es de 1024 x 1792 píxeles.
1024x1024
El tamaño deseado de la imagen generada es de 1024 x 1024 píxeles.
imageStyle
Estilo de las imágenes generadas.
Descripción: estilo de las imágenes generadas.
Tipo: string
Valor predeterminado: vívido
Nombre de enumeración: Estilo
Valores de enumeración:
Valor
Descripción
Vívido
Vívidas crea imágenes que son hiper-realistas y dramáticas.
natural
Natural crea imágenes que son más naturales y menos hiper-realistas.
imageGenerationsRequest
Nombre
Escribir
Descripción
Necesario
Valor predeterminado
símbolo del sistema
string
Descripción de texto de las imágenes deseadas. La longitud máxima es de 4000 caracteres.
Información sobre la categoría de filtrado de contenido (odio, sexual, violencia, self_harm), si se ha detectado, así como el nivel de gravedad (very_low, bajo, medio y alto escala que determina la intensidad y el nivel de riesgo de contenido dañino) y si se ha filtrado o no. Información sobre el contenido de jailbreak y las palabras soeces, si se ha detectado y si se ha filtrado o no. E información sobre la lista de bloqueados del cliente, si se ha filtrado y su identificador.
No
Extensiones de finalizaciones
Las extensiones de finalización no forman parte de la versión más reciente de disponibilidad general de la especificación de inferencia del plano de datos de Azure OpenAI.
Chatmessage
El objeto de mensaje de chat no forma parte de la versión más reciente de disponibilidad general de la especificación de inferencia del plano de datos de Azure OpenAI.
Texto a voz
Actualmente no forma parte de la versión más reciente de disponibilidad general de Azure OpenAI de la especificación de inferencia del plano de datos de Azure OpenAI. Consulte la última versión preliminar para esta capacidad.
Obtenga más información sobre cómo usar el SDK de .NET con el servicio Azure OpenAI para que sus aplicaciones mantengan conversaciones con los usuarios en lenguaje natural.