Poznámka:
Přístup k této stránce vyžaduje autorizaci. Můžete se zkusit přihlásit nebo změnit adresáře.
Přístup k této stránce vyžaduje autorizaci. Můžete zkusit změnit adresáře.
Tento článek obsahuje obecné informace o rozhraní API pro rozhraní API modelu Databricks Foundation a modely, které podporují. Rozhraní API základního modelu jsou navržená tak, aby byla podobná rozhraní REST API OpenAI, aby se usnadnila migrace stávajících projektů. Koncové body s platbou za token i zřízenou propustností přijímají požadavky ve stejném formátu rozhraní REST API.
koncové body
Rozhraní API základních modelů podporují koncové body s platbou za token a koncové body s garantovanou propustností.
Předkonfigurovaný koncový bod je k dispozici ve vašem pracovním prostoru pro každý model podporovaný s platbami za token a uživatelé můžou s těmito koncovými body pracovat pomocí požadavků HTTP POST. Viz Podporované základní modely na platformě Mosaic AI Model Serving pro seznam podporovaných modelů.
Koncové body zřízené propustnosti je možné vytvořit pomocí rozhraní API neboobslužného uživatelského rozhraní . Tyto koncové body podporují více modelů na koncový bod pro testování A/B, pokud oba obsluhované modely zpřístupňují stejný formát rozhraní API. Oba modely jsou například modely chatu. Parametry konfigurace koncového bodu najdete v POST /api/2.0/serving-endpoints.
Požadavky a odpovědi používají JSON, přesná struktura JSON závisí na typu úlohy koncového bodu. Koncové body pro chat a generování dokončení podporují streamování odpovědí.
Použití
Odpovědi zahrnují dílčí zprávu usage, která hlásí počet tokenů v požadavku a odpovědi. Formát této dílčí zprávy je stejný pro všechny typy úkolů.
| Pole | Typ | Popis |
|---|---|---|
completion_tokens |
Celé číslo | Počet vygenerovaných tokenů Není zahrnuto ve vkládání odpovědí. |
prompt_tokens |
Celé číslo | Počet tokenů ze vstupních výzev |
total_tokens |
Celé číslo | Počet celkového počtu tokenů |
reasoning_tokens |
Celé číslo | Počet myšlenkových tokenů Platí pouze pro modely odůvodnění. |
U modelů, jako je databricks-meta-llama-3-3-70b-instruct, se výzva uživatele před předáním do modelu transformuje pomocí šablony výzvy. U koncových bodů s platbou za token může být přidána také systémová výzva.
prompt_tokens obsahuje veškerý text přidaný naším serverem.
Rozhraní API pro odpovědi
Důležité
Rozhraní API pro odpovědi je kompatibilní pouze s modely OpenAI.
Rozhraní API pro odpovědi umožňuje s modelem více konverzací. Na rozdíl od dokončování chatu rozhraní API pro odpovědi používá input místo messages.
Požadavek na odpovědi rozhraní API
| Pole | Výchozí | Typ | Popis |
|---|---|---|---|
model |
Řetězec | Požadované. ID modelu použité k vygenerování odpovědi | |
input |
String nebo List[ResponsesInput] |
Požadované. Textové, obrázkové nebo souborové vstupy do modelu, které se používají k vygenerování odpovědi. Na rozdíl od messagestohoto pole se používá input k určení obsahu konverzace. |
|
instructions |
null |
Řetězec | Zpráva systému (nebo vývojáře) vložená do kontextu modelu. |
max_output_tokens |
null |
null, což znamená bez omezení nebo celé číslo větší než nula |
Horní mez počtu tokenů, které lze vygenerovat pro odpověď, včetně viditelných výstupních tokenů a zdůvodnění tokenů. |
temperature |
1.0 |
Plovoucí v [0,2] | Teplota vzorkování. Hodnota 0 je deterministická a vyšší hodnoty představují větší náhodnost. |
top_p |
1.0 |
Float v intervalu (0,1] | Prahová hodnota pravděpodobnosti použitá pro vzorkování jádra. |
stream |
false |
logický | Pokud je nastavená hodnota true, data odpovědi modelu se streamují do klienta, protože se generují pomocí událostí odeslaných serverem. |
stream_options |
null |
StreamOptions | Možnosti pro streamované odpovědi Toto nastavení nastavíte pouze při nastavení stream: true. |
text |
null |
TextConfig | Možnosti konfigurace textové odpovědi z modelu Může to být prostý text nebo strukturovaná data JSON. |
reasoning |
null |
ReasoningConfig | Konfigurace logického závěrování pro modely gpt-5 a o-series. |
tool_choice |
"auto" |
String nebo ToolChoiceObject | Způsob, jakým má model vybrat nástroj (nebo nástroje), který se má použít při generování odpovědi V parametru tools se dozvíte, jak určit nástroje, které model může volat. |
tools |
null |
Seznam[ToolObject] | Pole nástrojů, které může model volat při generování odpovědi. Poznámka: Databricks nepodporuje interpret kódu a nástroje pro vyhledávání na webu. |
parallel_tool_calls |
true |
logický | Jestli chcete modelu povolit paralelní spouštění volání nástrojů. |
max_tool_calls |
null |
Celé číslo větší než nula | Maximální počet volání integrovaných nástrojů, které je možné zpracovat v odpovědi. |
metadata |
null |
Objekt | Sada 16 párů klíč-hodnota, které lze připojit k objektu. |
prompt_cache_key |
null |
Řetězec | Používá se k ukládání odpovědí do mezipaměti pro podobné požadavky pro optimalizaci míry přístupů do mezipaměti. Pole user nahradí. |
prompt_cache_retention |
null |
Řetězec | Zásady uchovávání pro mezipaměť podnětů. Nastavte na "24h" pro zapnutí rozšířeného ukládání výzev do mezipaměti, které udržuje předpony uložené v mezipaměti aktivní déle, až na maximálně 24 hodin. |
safety_identifier |
null |
Řetězec | Stabilní identifikátor používaný k detekci uživatelů vaší aplikace, kteří můžou narušit zásady použití. |
user |
null |
Řetězec |
Nepodporované. Použijte safety_identifier a prompt_cache_key místo toho. |
truncation |
null |
Řetězec | Strategie zkrácení, která se má použít pro odpověď modelu. |
top_logprobs |
null |
Celé číslo | Celé číslo v rozmezí od 0 do 20 určující počet nejpravděpodobnějších tokenů, které se mají vrátit na každé pozici tokenu, každý s přidruženou pravděpodobností protokolu. |
include |
null |
Seznam[Řetězec] | Zadejte další výstupní data, která se mají zahrnout do odpovědi modelu. |
prompt |
null |
Objekt | Odkaz na šablonu výzvy a její proměnné |
Nepodporované parametry: Databricks nepodporuje následující parametry a v případě zadání vrátí chybu 400:
-
background– Zpracování na pozadí není podporováno. -
store- Uložené odpovědi nejsou podporovány. -
conversation– Konverzační API není podporováno. -
service_tier– Výběr úrovně služby spravuje Databricks.
ResponsesInput
Pole input přijímá buď řetězec, nebo seznam vstupních objektů zprávy s rolí a obsahem.
| Pole | Typ | Popis |
|---|---|---|
role |
Řetězec |
Požadované. Role autora zprávy. Může být "user" nebo "assistant". |
content |
String nebo List[ResponsesContentBlock] | Požadované. Obsah zprávy, buď jako řetězec, nebo pole bloků obsahu. |
ResponsesContentBlock
Bloky obsahu definují typ obsahu ve vstupních a výstupních zprávách. Typ bloku obsahu je určen polem type .
InputText
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec |
Požadované. Musí být "input_text". |
text |
Řetězec | Požadované. Textový obsah. |
OutputText
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec |
Požadované. Musí být "output_text". |
text |
Řetězec | Požadované. Textový obsah. |
annotations |
Seznam[Objekt] | Volitelné poznámky pro textový obsah |
InputImage
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec |
Požadované. Musí být "input_image". |
image_url |
Řetězec | Požadované. URL nebo base64-kódovaný datový URI obrázku. |
InputFile
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec |
Požadované. Musí být "input_file". |
file_id |
Řetězec | Identifikátor souboru, pokud používáte nahrané soubory. |
filename |
Řetězec | Název souboru. |
file_data |
Řetězec | URI dat kódovaných Base64 s předponou formátu Soubory PDF například používají formát data:application/pdf;base64,<base64 data>. |
FunctionCall
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec |
Požadované. Musí být "function_call". |
id |
Řetězec | Požadované. Jedinečný identifikátor volání funkce. |
call_id |
Řetězec | Požadované. Identifikátor volání. |
name |
Řetězec | Požadované. Název volané funkce. |
arguments |
Objekt nebo řetězec | Požadované. Argumenty funkce jako objekt NEBO řetězec JSON. |
FunctionCallOutput
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec |
Požadované. Musí být "function_call_output". |
call_id |
Řetězec | Požadované. Identifikátor volání, kterému tento výstup odpovídá. |
output |
String/Object | Požadované. Výstup funkce jako řetězec nebo objekt JSON. |
CustomToolCall
Vráceno v poli odpovědi output, když je volán vlastní nástroj. Na rozdíl od volání funkcí vlastní volání nástroje vrací prostý text input místo JSON arguments.
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec |
Požadované. Musí být "custom_tool_call". |
id |
Řetězec | Požadované. Jedinečný identifikátor pro volání tohoto vlastního nástroje. |
call_id |
Řetězec | Požadované. Identifikátor volání. |
name |
Řetězec | Požadované. Název volaného vlastního nástroje. |
input |
Řetězec | Požadované. Vstup nástroje jako prostý text (nikoli JSON). |
status |
Řetězec | Stav volání nástroje. Jeden z: completed, in_progress. |
CustomToolCallOutput
Tento typ vstupu slouží k poskytnutí výsledku volání vlastního nástroje zpět do modelu v konverzaci s vícenásobným otáčením.
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec |
Požadované. Musí být "custom_tool_call_output". |
call_id |
Řetězec | Požadované. Identifikátor volání, kterému tento výstup odpovídá. |
output |
Řetězec | Požadované. Výstup vlastního nástroje jako řetězec. |
StreamOptions
Konfigurace pro streamované odpovědi Používá se pouze v případech, kdy stream: true.
| Pole | Typ | Popis |
|---|---|---|
include_usage |
logický | Pokud je hodnota true, zahrňte do datového proudu informace o využití tokenu. Výchozí hodnota je false. |
TextConfig
Konfigurace textového výstupu, včetně strukturovaných výstupů
| Pole | Typ | Popis |
|---|---|---|
format |
ResponsesFormatObject | Specifikace formátu textového výstupu. |
ResponsesFormatObject
Určuje výstupní formát pro textové odpovědi.
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec |
Požadované. Typ formátu: "text" pro prostý text, "json_object" JSON nebo "json_schema" strukturovaný JSON. |
json_schema |
Objekt |
Vyžaduje se, pokud type je "json_schema". Objekt schématu JSON, který definuje strukturu výstupu. |
Objekt json_schema má stejnou strukturu jako JsonSchemaObject zdokumentovaný v rozhraní API pro dokončování chatu.
ReasoningConfig
Konfigurace pro chování při usuzování v modelech usuzování (modely řady o a gpt-5).
| Pole | Typ | Popis |
|---|---|---|
effort |
Řetězec | Úroveň úsilí zdůvodnění: "low", "medium"nebo "high". Výchozí hodnota je "medium". |
encrypted_content |
Řetězec | Šifrovaný obsah pro bezstavový režim. Bylo poskytnuto modelem v předchozích odpovědích. |
ToolObject
Viz volání funkce v Azure Databricks.
Poznámka:
Rozhraní API pro odpovědi podporuje následující typy nástrojů: function, custom, mcpimage_generation, , shell. Vlastní nástroje a formáty výstupu založené na gramatikě jsou k dispozici pouze u modelů řady GPT-5 (gpt-5, gpt-5.1, gpt-5.2).
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec | Požadované. Typ nástroje. Podporované hodnoty najdete v poznámce výše. |
function |
FunctionObject | Vyžaduje se, pokud type je function. Definice funkce přidružená k nástroji. |
name |
Řetězec | Vyžaduje se, pokud type je custom. Název vlastního nástroje. |
description |
Řetězec | Vyžaduje se, pokud type je custom. Popis toho, co přizpůsobený nástroj dělá. |
format |
Customformat | Optional. Pokud je typecustom, určuje se výstupní formát. Výchozí hodnota je {"type": "text"}. Lze také použít {"type": "grammar", "definition": "<grammar>", "syntax": "lark"} pro strukturovaný výstup. Podporuje se pouze u modelů řady GPT-5. |
CustomToolObject
Vlastní nástroje umožňují modelu vrátit libovolný řetězcový výstup místo argumentů funkce formátovaných jako JSON. To je užitečné pro generování kódu, použití oprav nebo jiných případů použití, kdy se nevyžaduje strukturovaný JSON.
Poznámka:
Vlastní nástroje jsou podporovány pouze u modelů řady GPT-5 (gpt-5, gpt-5.1, gpt-5.2) prostřednictvím rozhraní API pro odpovědi.
Příklad vlastního nástroje:
{
"type": "custom",
"name": "code_exec",
"description": "Executes arbitrary Python code. Return only valid Python code."
}
Příklad vlastního nástroje s gramatikou:
{
"type": "custom",
"name": "apply_patch",
"description": "Apply a patch to create or modify files.",
"format": {
"type": "grammar",
"definition": "start: begin_patch hunk end_patch\nbegin_patch: \"*** Begin Patch\" LF\n...",
"syntax": "lark"
}
}
Při zavolání vlastního nástroje obsahuje custom_tool_call odpověď výstupní položku s prostým textem input místo JSON arguments.
CustomFormat
Formáty výstupu založené na gramatikě jsou podporovány pouze u modelů řady GPT-5.
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec |
Požadované. Buď "text" pro výstup ve formátu prostého textu, nebo "grammar" pro výstup s omezením gramatiky. |
definition |
Řetězec | Vyžaduje se, pokud type je "grammar". Řetězec definice gramatiky pomocí syntaxe Lark. |
syntax |
Řetězec | Vyžaduje se, pokud type je "grammar". Syntaxe gramatiky. V současné době se podporuje pouze "lark". |
FunctionObject
ToolChoiceObject
Viz volání funkce v Azure Databricks.
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec |
Požadované. Typ nástroje, který chcete vynutit. Podporované hodnoty odpovídají typům nástrojů v ToolObject: "function", "custom"atd. |
function |
Objekt | Vyžaduje se, pokud type je "function". Objekt formuláře {"name": "my_function"} , kde "my_function" je název FunctionObject v tools poli. |
name |
Řetězec | Vyžaduje se, pokud type je "custom". Název vlastního nástroje, který se má vynutit. Podporuje se pouze u modelů řady GPT-5. |
Odpovědi API
U požadavků, které nejsou streamované, je odpovědí jeden objekt odpovědi. U streamovacích požadavků je odpovědí text/event-stream, a každá událost představuje část odpovědi.
| Pole | Typ | Popis |
|---|---|---|
id |
Řetězec | Jedinečný identifikátor odpovědi. Poznámka: Databricks zašifruje toto ID pro zabezpečení. |
object |
Řetězec | Typ objektu. Rovná se "response". |
created_at |
Celé číslo | Časové razítko unixu (v sekundách) při vytvoření odpovědi. |
status |
Řetězec | Stav odpovědi. Jedna z těchto možností: completed, , failedin_progress, cancelled, queued, nebo incomplete. |
model |
Řetězec | Verze modelu použitá k vygenerování odpovědi. |
output |
Seznam[ResponsesMessage] | Výstup vygenerovaný modelem, obvykle obsahující objekty zpráv. |
usage |
Využití | Metadata použití tokenů. |
error |
Error | Informace o chybě, pokud odpověď selhala. |
incomplete_details |
Neúplné detaily | Podrobnosti o tom, proč je odpověď neúplná, pokud je k dispozici. |
instructions |
Řetězec | Pokyny uvedené v žádosti. |
max_output_tokens |
Celé číslo | Maximální výstupní tokeny zadané v požadavku. |
temperature |
Plovat | Teplota použitá pro generování. |
top_p |
Plovat | Hodnota top_p použitá pro generování. |
tools |
Seznam[ToolObject] | Nástroje zadané v požadavku. |
tool_choice |
String nebo ToolChoiceObject | Nastavení tool_choice z požadavku. |
parallel_tool_calls |
logický | Zda byla povolena volání nástrojů paralelně. |
store |
logický | Zda byla odpověď uložena. |
metadata |
Objekt | Metadata připojená k odpovědi. |
ResponsesMessage
Objekty zpráv v output poli, které obsahují obsah odpovědi modelu.
| Pole | Typ | Popis |
|---|---|---|
id |
Řetězec | Požadované. Jedinečný identifikátor zprávy. |
role |
Řetězec |
Požadované. Role zprávy. Buď "user", nebo "assistant". |
content |
Seznam[ResponsesContentBlock] | Požadované. Bloky obsahu ve zprávě. |
status |
Řetězec | Stav zpracování zprávy. |
type |
Řetězec |
Požadované. Typ objektu. Rovná se "message". |
Error
Informace o chybě, když odpověď selže.
| Pole | Typ | Popis |
|---|---|---|
code |
Řetězec | Požadované. Kód chyby. |
message |
Řetězec | Požadované. Chybová zpráva čitelná člověkem. |
param |
Řetězec | Parametr, který způsobil chybu, pokud je k dispozici. |
type |
Řetězec | Požadované. Typ chyby. |
IncompleteDetails
Podrobnosti o tom, proč je odpověď neúplná.
| Pole | Typ | Popis |
|---|---|---|
reason |
Řetězec | Požadované. Důvod, proč je odpověď neúplná. |
Rozhraní API pro dokončování chatu
Rozhraní API pro dokončování chatu umožňuje více konverzací s modelem. Odpověď modelu poskytuje následující assistant zprávu v konverzaci. Viz POST /serving-endpoints/{name}/invocations pro dotazování parametrů koncového bodu.
Žádost o chat
| Pole | Výchozí | Typ | Popis |
|---|---|---|---|
messages |
ChatMessage seznam | Požadované. Seznam zpráv představujících aktuální konverzaci | |
max_tokens |
null |
null, což znamená bez omezení nebo celé číslo větší než nula |
Maximální počet tokenů, které se mají vygenerovat. |
stream |
true |
logický | Umožněte streamování odpovědí zpět klientovi, aby bylo možné poskytnout částečné výsledky pro požadavky. Pokud je tento parametr součástí požadavku, odpovědi se posílají pomocí standardu pro události zasílané serverem. |
temperature |
1.0 |
Plovoucí v [0,2] | Teplota vzorkování. Hodnota 0 je deterministická a vyšší hodnoty představují větší náhodnost. |
top_p |
1.0 |
Float v intervalu (0,1] | Prahová hodnota pravděpodobnosti použitá pro vzorkování jádra. |
top_k |
null |
null, což znamená bez omezení nebo celé číslo větší než nula |
Definuje počet nejpravděpodobnějších k tokenů pro použití při filtrování top-k. Nastavte tuto hodnotu na hodnotu 1, aby byl výstup deterministický. |
stop |
[] | Řetězec nebo Seznam [Řetězec] | Model přestane generovat další tokeny, když dojde k nějaké sekvenci v stop. |
n |
1 | Celé číslo větší než nula | Rozhraní API vrátí n nezávislé dokončování chatu při zadání n. Doporučuje se pro úlohy, které generují více dokončení na stejném vstupu pro další efektivitu odvozování a úsporu nákladů. K dispozici pouze pro koncové body s provisionovanou kapacitou propustnosti. |
tool_choice |
none |
String nebo ToolChoiceObject | Používá se pouze ve spojení s polem tools.
tool_choice podporuje různé řetězce klíčových slov, jako jsou auto, requireda none.
auto znamená, že necháte model rozhodnout, který nástroj je vhodné použít, pokud vůbec existuje. Pokud auto model nevěří, že některý z nástrojů tools je relevantní, model místo volání nástroje vygeneruje standardní zprávu asistenta.
required znamená, že model vybere nejrelevavantnější nástroj v tools a musí vygenerovat volání nástroje.
none znamená, že model negeneruje žádná volání nástrojů a místo toho musí vygenerovat standardní zprávu asistenta. Chcete-li vynutit volání nástroje s konkrétním nástrojem definovaným v tools, použijte ToolChoiceObject. Ve výchozím nastavení, pokud je pole tools vyplněno tool_choice = "auto". Jinak pole tools ve výchozím nastavení přebírá hodnotu tool_choice = "none". |
tools |
null |
ToolObject | Seznam tools, které model může volat. V současné době je function jediným podporovaným typem tool a podporuje se maximálně 32 funkcí. |
response_format |
null |
responseFormatObject | Objekt určující formát, který musí model vypíše. Akceptované typy jsou text, json_schema nebo json_objectNastavení { "type": "json_schema", "json_schema": {...} } umožňuje strukturované výstupy, které zajistí, že model následuje za zadaným schématem JSON.Nastavení { "type": "json_object" } zajišťuje, že odpovědi, které model vygeneruje, jsou platné JSON, ale nezajistí, aby odpovědi dodržovaly konkrétní schéma. |
logprobs |
false |
logický | Tento parametr určuje, jestli se má poskytnout logaritmická pravděpodobnost výběru tokenu. |
top_logprobs |
null |
Celé číslo | Tento parametr určuje počet nejpravděpodobnějších tokenů, pro které se v každém kroku vzorkování vrací logaritmované pravděpodobnosti. Může být 0–20.
logprobs musí být true, pokud se používá toto pole. |
reasoning_effort |
"medium" |
Řetězec | Řídí úroveň odůvodnění, které by model měl použít při generování odpovědí. Přijaté hodnoty jsou "low", "medium"nebo "high". Vyšší úsilí může vést k promyšlenějším a přesným odpovědím, ale může zvýšit latenci a využití tokenů. Tento parametr je přijímán pouze omezenou sadou modelů, včetně databricks-gpt-oss-120b a databricks-gpt-oss-20b. |
ChatMessage
| Pole | Typ | Popis |
|---|---|---|
role |
Řetězec |
Požadované. Role autora zprávy Může být "system", "user", "assistant" nebo "tool". |
content |
Řetězec | Obsah zprávy. Požadované pro úlohy chatu, které nezahrnují volání nástrojů. |
tool_calls |
seznam ToolCall | Seznam tool_calls, který model vygeneroval. Musí mít role jako "assistant" a žádné specifikace pro pole content. |
tool_call_id |
Řetězec | Když je role"tool", jedná se o ID přidružené ke ToolCall, na kterou zpráva odpovídá. Musí být prázdné pro ostatní možnosti role. |
Roli system lze použít jenom jednou, jako první zprávu v konverzaci. Přepíše výchozí systémovou výzvu modelu.
ToolCall
Návrh akce pro volání nástroje podle modelu. Viz volání funkce v Azure Databricks.
| Pole | Typ | Popis |
|---|---|---|
id |
Řetězec | Požadované. Jedinečný identifikátor pro návrh na volání tohoto nástroje. |
type |
Řetězec |
Požadované. Podporuje se jenom "function". |
function |
FunctionCallCompletion | Požadované. Volání funkce navrhované modelem |
cache_control |
Řetězec | Povolí ukládání do mezipaměti pro vaši žádost. Tento parametr přijímá pouze modely Claude hostované službou Databricks. Viz ukládání promptu do mezipaměti pro příklad. |
FunctionCallCompletion
| Pole | Typ | Popis |
|---|---|---|
name |
Řetězec | Povinné. Název funkce, kterou model doporučil. |
arguments |
Objekt | Povinné. Argumenty pro funkci ve formě serializovaného JSON slovníku. |
Poznámka: ToolChoiceObject, ToolObjecta FunctionObject jsou definovány v části Rozhraní API odpovědi a jsou sdíleny mezi oběma rozhraními API.
ResponseFormatObject
Viz část Strukturované výstupy ve službě Azure Databricks.
| Pole | Typ | Popis |
|---|---|---|
type |
Řetězec |
Požadované. Typ formátu odpovědi, který se definuje. Buď text pro nestrukturovaný text, json_object pro nestrukturované objekty JSON, nebo json_schema pro objekty JSON, které dodržují konkrétní schéma. |
json_schema |
jsonSchemaObject |
Požadované. Schéma JSON, které se má dodržovat, pokud je type nastavená na json_schema |
JsonSchemaObject
Viz část Strukturované výstupy ve službě Azure Databricks.
| Pole | Typ | Popis |
|---|---|---|
name |
Řetězec | Požadované. Název formátu odpovědi. |
description |
Řetězec | Popis formátu odpovědi, který model používá k určení způsobu reakce v tomto formátu. |
schema |
Objekt | Požadované. Schéma pro formát odpovědi popsané jako objekt schématu JSON. |
strict |
logický | Zda povolit přísné dodržování schématu při generování výstupu. Pokud je nastavená hodnota true, model se řídí přesným schématem definovaným v poli schématu. Pokud je striktní true, podporuje se pouze podmnožina schématu JSON. |
Odpověď na chat
U požadavků, které nejsou streamované, je odpovědí jeden objekt dokončení chatu. U požadavků na streamování je odpověď ve formátu text/event-stream, kde každá událost je objekt kompletního segmentu. Struktura objektů dokončení a dílčích objektů nejvyšší úrovně je téměř identická: pouze choices má jiný typ.
| Pole | Typ | Popis |
|---|---|---|
id |
Řetězec | Jedinečný identifikátor dokončení chatu. |
choices |
List[ChatCompletionChoice] nebo List[ChatCompletionChunk] (streamování) | Seznam textových zpráv o dokončení chatu Volby n se vrátí, pokud je zadán parametr n. |
object |
Řetězec | Typ objektu. Rovná se buď "chat.completions" pro nestreamování, nebo "chat.completion.chunk" pro streamování. |
created |
Celé číslo | Doba, za kterou bylo dokončení chatu vygenerováno, vyjádřená v sekundách. |
model |
Řetězec | Verze modelu použitá k vygenerování odpovědi. |
usage |
Využití | Metadata použití tokenů. Na streamovacích odpovědích nemusí být přítomen. |
ChatCompletionChoice
| Pole | Typ | Popis |
|---|---|---|
index |
Celé číslo | Index výběru v seznamu vygenerovaných možností. |
message |
ChatMessage | Zpráva o dokončení chatu vrácená modelem Úloha bude assistant. |
finish_reason |
Řetězec | Důvod, proč model přestal generovat tokeny |
extra_fields |
Řetězec | Při použití proprietárních modelů od externích poskytovatelů modelů můžou rozhraní API poskytovatele obsahovat do odpovědí další metadata. Databricks tyto odpovědi filtruje a vrací pouze podmnožinu původních polí poskytovatele. Toto safetyRating je jediné dodatečné pole podporované v tuto chvíli, další podrobnosti najdete v dokumentaci Gemini . |
ChatCompletionChunk
| Pole | Typ | Popis |
|---|---|---|
index |
Celé číslo | Index výběru v seznamu vygenerovaných možností. |
delta |
ChatMessage | Zpráva o dokončení chatu, která je součástí vygenerovaných streamovaných odpovědí z modelu Je zaručeno, že pouze první blok dat bude mít role naplněno. |
finish_reason |
Řetězec | Důvod, proč model přestal generovat tokeny Pouze poslední blok bude mít tuto informaci vyplněnou. |
Rozhraní API pro vestavěné prvky
Úkoly vkládání mapují vstupní řetězce na vektory vkládání. V každém požadavku je možné dosát dohromady mnoho vstupů. Viz POST /serving-endpoints/{name}/invocations pro dotazování parametrů koncového bodu.
Žádost o vložení
| Pole | Typ | Popis |
|---|---|---|
input |
Řetězec nebo Seznam [Řetězec] | Požadované. Vstupní text, který chcete vložit. Může to být řetězec nebo seznam řetězců. |
instruction |
Řetězec | Volitelná instrukce, která se má předat modelu vkládání. |
Pokyny jsou volitelné a vysoce specifické pro model. Autoři BGE například při indexování bloků dat nedoporučují žádné instrukce a doporučují používat instrukce "Represent this sentence for searching relevant passages:" pro načítání dotazů. Další modely, jako je Instructor-XL, podporují širokou škálu instrukčních řetězců.
Odpověď vkládání
| Pole | Typ | Popis |
|---|---|---|
id |
Řetězec | Jedinečný identifikátor pro vkládání. |
object |
Řetězec | Typ objektu. Rovná se "list". |
model |
Řetězec | Název modelu použitý k vytvoření vložení |
data |
EmbeddingObject | Embedující objekt. |
usage |
Využití | Metadata použití tokenů. |
EmbeddingObject
| Pole | Typ | Popis |
|---|---|---|
object |
Řetězec | Typ objektu. Rovná se "embedding". |
index |
Celé číslo | Index vkládání v seznamu vložených objektů vygenerovaných modelem. |
embedding |
Seznam[Float] | Vektor vkládání. Každý model vrátí vektor pevné velikosti (1024 pro BGE-Large). |
Rozhraní API pro dokončování
Úkoly dokončování textu slouží k generování odpovědí na jednu výzvu. Na rozdíl od chatu tato úloha podporuje dávkové vstupy: v jedné žádosti lze odeslat několik nezávislých výzev. Viz POST /serving-endpoints/{name}/invocations pro dotazování parametrů koncového bodu.
Žádost o dokončení
| Pole | Výchozí | Typ | Popis |
|---|---|---|---|
prompt |
Řetězec nebo Seznam [Řetězec] | Požadované. Výzvy pro model. | |
max_tokens |
null |
null, což znamená bez omezení nebo celé číslo větší než nula |
Maximální počet tokenů, které se mají vygenerovat. |
stream |
true |
logický | Umožněte streamování odpovědí zpět klientovi, aby bylo možné poskytnout částečné výsledky pro požadavky. Pokud je tento parametr součástí požadavku, odpovědi se posílají pomocí standardu pro události zasílané serverem. |
temperature |
1.0 |
Plovoucí v [0,2] | Teplota vzorkování. Hodnota 0 je deterministická a vyšší hodnoty představují větší náhodnost. |
top_p |
1.0 |
Float v intervalu (0,1] | Prahová hodnota pravděpodobnosti použitá pro vzorkování jádra. |
top_k |
null |
null, což znamená bez omezení nebo celé číslo větší než nula |
Definuje počet nejpravděpodobnějších k tokenů pro použití při filtrování top-k. Nastavte tuto hodnotu na hodnotu 1, aby byl výstup deterministický. |
error_behavior |
"error" |
"truncate" nebo "error" |
Chyby překročení časového limitu a chyby překročení délky kontextu. Jedna z těchto možností: "truncate" (vrácení co nejvíce tokenů) a "error" (vrácení chyby). Tento parametr je přijímán pouze koncovými body s platbou za token. |
n |
1 | Celé číslo větší než nula | Rozhraní API vrátí n nezávislé dokončování chatu při zadání n. Doporučuje se pro úlohy, které generují více dokončení na stejném vstupu pro další efektivitu odvozování a úsporu nákladů. K dispozici pouze pro koncové body s provisionovanou kapacitou propustnosti. |
stop |
[] | Řetězec nebo Seznam [Řetězec] | Model přestane generovat další tokeny, když dojde k nějaké sekvenci v stop. |
suffix |
"" |
Řetězec | Řetězec, který je připojen na konec každého dokončení. |
echo |
false |
logický | Vrátí výzvu k akci spolu s dokončením. |
use_raw_prompt |
false |
logický | Pokud true, předejte prompt přímo do modelu bez transformace. |
Odpověď na dokončení úkolu
| Pole | Typ | Popis |
|---|---|---|
id |
Řetězec | Jedinečný identifikátor pro dokončování textu. |
choices |
Výběr dokončení | Seznam dokončování textu. Při každém předání podnětu se vygenerují n volby, pokud je zadáno n. Výchozí n je 1. |
object |
Řetězec | Typ objektu. Rovná se "text_completion" |
created |
Celé číslo | Čas, kdy bylo dokončení vygenerováno, v sekundách. |
usage |
Využití | Metadata použití tokenů. |
CompletionChoice
| Pole | Typ | Popis |
|---|---|---|
index |
Celé číslo | Index výzvy v požadavku. |
text |
Řetězec | Vygenerované dokončení. |
finish_reason |
Řetězec | Důvod, proč model přestal generovat tokeny |