Sorties structurées
Les sorties structurées font en sorte qu’un modèle suive une définition de Schéma JSON que vous fournissez dans le cadre de votre appel à l’API d’inférence. Cela contraste avec l’ancienne fonctionnalité du mode JSON, qui garantissait la génération d’un JSON valide, mais n’était pas en mesure d’assurer le respect strict du schéma fourni. Les sorties structurées sont recommandées pour l’appel de fonctions, l’extraction de données structurées et l’élaboration de flux de travail complexes en plusieurs étapes.
Remarque
- Actuellement, les sorties structurées ne sont pas prises en charge sur les scénarios de type Apporter vos propres données.
Modèles pris en charge
Actuellement, seule la version gpt-4o
: 2024-08-06
prend en charge les sorties structurées.
Prise en charge des API
La prise en charge des sorties structurées a été ajoutée pour la première fois dans la version 2024-08-01-preview
de l’API.
Mise en route
Pour définir des schémas d’objet en Python, vous pouvez utiliser Pydantic
. Selon la version de l' OpenAI et les Pydantic
bibliothèques vous exécutez, vous devrez peut-être effectuer une mise à niveau vers une version plus récente. Ces exemples ont été testés par rapport à openai 1.42.0
et pydantic 2.8.2
.
pip install openai pydantic --upgrade
Si vous utilisez pour la première fois Microsoft Entra ID pour l’authentification, consultez Comment configurer Azure OpenAI Service avec l’authentification Microsoft Entra ID.
from pydantic import BaseModel
from openai import AzureOpenAI
from azure.identity import DefaultAzureCredential, get_bearer_token_provider
token_provider = get_bearer_token_provider(
DefaultAzureCredential(), "https://cognitiveservices.azure.com/.default"
)
client = AzureOpenAI(
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"),
azure_ad_token_provider=token_provider,
api_version="2024-08-01-preview"
)
class CalendarEvent(BaseModel):
name: str
date: str
participants: list[str]
completion = client.beta.chat.completions.parse(
model="MODEL_DEPLOYMENT_NAME", # replace with the model deployment name of your gpt-4o 2024-08-06 deployment
messages=[
{"role": "system", "content": "Extract the event information."},
{"role": "user", "content": "Alice and Bob are going to a science fair on Friday."},
],
response_format=CalendarEvent,
)
event = completion.choices[0].message.parsed
print(event)
print(completion.model_dump_json(indent=2))
Sortie
name='Science Fair' date='Friday' participants=['Alice', 'Bob']
{
"id": "chatcmpl-A1EUP2fAmL4SeB1lVMinwM7I2vcqG",
"choices": [
{
"finish_reason": "stop",
"index": 0,
"logprobs": null,
"message": {
"content": "{\n \"name\": \"Science Fair\",\n \"date\": \"Friday\",\n \"participants\": [\"Alice\", \"Bob\"]\n}",
"refusal": null,
"role": "assistant",
"function_call": null,
"tool_calls": [],
"parsed": {
"name": "Science Fair",
"date": "Friday",
"participants": [
"Alice",
"Bob"
]
}
}
}
],
"created": 1724857389,
"model": "gpt-4o-2024-08-06",
"object": "chat.completion",
"service_tier": null,
"system_fingerprint": "fp_1c2eaec9fe",
"usage": {
"completion_tokens": 27,
"prompt_tokens": 32,
"total_tokens": 59
}
}
Appel de fonction avec sorties structurées
Les sorties structurées pour l’appel de fonctions peuvent être activées avec un seul paramètre, en fournissant strict: true
.
Remarque
Les sorties structurées ne sont pas prises en charge avec les appels de fonctions parallèles. Lorsque vous utilisez des sorties structurées, définissez parallel_tool_calls
sur false
.
from enum import Enum
from typing import Union
from pydantic import BaseModel
import openai
from openai import AzureOpenAI
client = AzureOpenAI(
azure_endpoint = os.getenv("AZURE_OPENAI_ENDPOINT"),
api_key=os.getenv("AZURE_OPENAI_API_KEY"),
api_version="2024-08-01-preview"
)
class GetDeliveryDate(BaseModel):
order_id: str
tools = [openai.pydantic_function_tool(GetDeliveryDate)]
messages = []
messages.append({"role": "system", "content": "You are a helpful customer support assistant. Use the supplied tools to assist the user."})
messages.append({"role": "user", "content": "Hi, can you tell me the delivery date for my order #12345?"})
response = client.chat.completions.create(
model="MODEL_DEPLOYMENT_NAME", # replace with the model deployment name of your gpt-4o 2024-08-06 deployment
messages=messages,
tools=tools
)
print(response.choices[0].message.tool_calls[0].function)
print(response.model_dump_json(indent=2))
Schémas pris en charge et limitations
Les sorties structurées Azure OpenAI prennent en charge le même sous-ensemble du Schéma JSON que OpenAI.
Types pris en charge
- Chaîne
- Number
- Boolean
- Integer
- Object
- Array
- Enum
- anyOf
Remarque
Les objets racines ne peuvent pas être le type anyOf
.
Tous les champs doivent être obligatoires
Tous les champs ou paramètres de fonction doivent être inclus si nécessaire. Dans l’exemple ci-dessous, location
et unit
sont tous les deux spécifiés sous "required": ["location", "unit"]
.
{
"name": "get_weather",
"description": "Fetches the weather in the given location",
"strict": true,
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The location to get the weather for"
},
"unit": {
"type": "string",
"description": "The unit to return the temperature in",
"enum": ["F", "C"]
}
},
"additionalProperties": false,
"required": ["location", "unit"]
}
Si nécessaire, il est possible d’émuler un paramètre optionnel en utilisant un type d’union avec null
. Dans cet exemple, la ligne "type": ["string", "null"],
permet d’atteindre cet objectif.
{
"name": "get_weather",
"description": "Fetches the weather in the given location",
"strict": true,
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The location to get the weather for"
},
"unit": {
"type": ["string", "null"],
"description": "The unit to return the temperature in",
"enum": ["F", "C"]
}
},
"additionalProperties": false,
"required": [
"location", "unit"
]
}
}
Profondeur d’imbrication
Un schéma peut avoir jusqu’à 100 propriétés d’objet au total, avec jusqu’à cinq niveaux d’imbrication
additionalProperties : false doit toujours être défini dans les objets
Cette propriété permet de contrôler si un objet peut avoir des paires clé-valeur supplémentaires qui n’ont pas été définies dans le Schéma JSON. Pour utiliser les sorties structurées, vous devez définir cette valeur sur false.
Classement des clés
Les sorties structurées sont ordonnées de la même manière que le schéma fourni. Pour modifier l’ordre de sortie, modifiez l’ordre du schéma que vous envoyez dans le cadre de votre demande d’inférence.
Mots clés spécifiques à un type non pris en charge
Type | Mot clé non pris en charge |
---|---|
Chaîne | minlength maxLength pattern format |
Number | minimum maximum multipleOf |
Objets | patternProperties unevaluatedProperties propertyNames minProperties maxProperties |
Tableaux | unevaluatedItems contains minContains maxContains minItems maxItems uniqueItems |
Les schémas imbriqués qui utilisent anyOf doivent respecter le sous-ensemble de Schéma JSON général.
Exemple de schéma anyOf
pris en charge :
{
"type": "object",
"properties": {
"item": {
"anyOf": [
{
"type": "object",
"description": "The user object to insert into the database",
"properties": {
"name": {
"type": "string",
"description": "The name of the user"
},
"age": {
"type": "number",
"description": "The age of the user"
}
},
"additionalProperties": false,
"required": [
"name",
"age"
]
},
{
"type": "object",
"description": "The address object to insert into the database",
"properties": {
"number": {
"type": "string",
"description": "The number of the address. Eg. for 123 main st, this would be 123"
},
"street": {
"type": "string",
"description": "The street name. Eg. for 123 main st, this would be main st"
},
"city": {
"type": "string",
"description": "The city of the address"
}
},
"additionalProperties": false,
"required": [
"number",
"street",
"city"
]
}
]
}
},
"additionalProperties": false,
"required": [
"item"
]
}
Les définitions sont prises en charge
Exemple pris en charge :
{
"type": "object",
"properties": {
"steps": {
"type": "array",
"items": {
"$ref": "#/$defs/step"
}
},
"final_answer": {
"type": "string"
}
},
"$defs": {
"step": {
"type": "object",
"properties": {
"explanation": {
"type": "string"
},
"output": {
"type": "string"
}
},
"required": [
"explanation",
"output"
],
"additionalProperties": false
}
},
"required": [
"steps",
"final_answer"
],
"additionalProperties": false
}
Les schémas récursifs sont pris en charge
Exemple d’utilisation de # pour la récursivité racine :
{
"name": "ui",
"description": "Dynamically generated UI",
"strict": true,
"schema": {
"type": "object",
"properties": {
"type": {
"type": "string",
"description": "The type of the UI component",
"enum": ["div", "button", "header", "section", "field", "form"]
},
"label": {
"type": "string",
"description": "The label of the UI component, used for buttons or form fields"
},
"children": {
"type": "array",
"description": "Nested UI components",
"items": {
"$ref": "#"
}
},
"attributes": {
"type": "array",
"description": "Arbitrary attributes for the UI component, suitable for any element",
"items": {
"type": "object",
"properties": {
"name": {
"type": "string",
"description": "The name of the attribute, for example onClick or className"
},
"value": {
"type": "string",
"description": "The value of the attribute"
}
},
"additionalProperties": false,
"required": ["name", "value"]
}
}
},
"required": ["type", "label", "children", "attributes"],
"additionalProperties": false
}
}
Exemple de récursivité explicite :
{
"type": "object",
"properties": {
"linked_list": {
"$ref": "#/$defs/linked_list_node"
}
},
"$defs": {
"linked_list_node": {
"type": "object",
"properties": {
"value": {
"type": "number"
},
"next": {
"anyOf": [
{
"$ref": "#/$defs/linked_list_node"
},
{
"type": "null"
}
]
}
},
"additionalProperties": false,
"required": [
"next",
"value"
]
}
},
"additionalProperties": false,
"required": [
"linked_list"
]
}