Referenční informace k rozhraní REST API základního modelu

Tento článek obsahuje obecné informace o rozhraní API pro rozhraní API modelu Databricks Foundation a modely, které podporují. Rozhraní API základního modelu jsou navržená tak, aby byla podobná rozhraní REST API OpenAI, aby se usnadnila migrace stávajících projektů. Koncové body s platbou za token i zřízenou propustností přijímají požadavky ve stejném formátu rozhraní REST API.

koncové body

Rozhraní API základních modelů podporují koncové body s platbou za token a koncové body s garantovanou propustností.

Předkonfigurovaný koncový bod je k dispozici ve vašem pracovním prostoru pro každý model podporovaný s platbami za token a uživatelé můžou s těmito koncovými body pracovat pomocí požadavků HTTP POST. Viz Podporované základní modely na platformě Mosaic AI Model Serving pro seznam podporovaných modelů.

Koncové body zřízené propustnosti je možné vytvořit pomocí rozhraní API neboobslužného uživatelského rozhraní . Tyto koncové body podporují více modelů na koncový bod pro testování A/B, pokud oba obsluhované modely zpřístupňují stejný formát rozhraní API. Oba modely jsou například modely chatu. Parametry konfigurace koncového bodu najdete v POST /api/2.0/serving-endpoints.

Požadavky a odpovědi používají JSON, přesná struktura JSON závisí na typu úlohy koncového bodu. Koncové body pro chat a generování dokončení podporují streamování odpovědí.

Použití

Odpovědi zahrnují dílčí zprávu usage, která hlásí počet tokenů v požadavku a odpovědi. Formát této dílčí zprávy je stejný pro všechny typy úkolů.

Pole	Typ	Popis
`completion_tokens`	Celé číslo	Počet vygenerovaných tokenů Není zahrnuto ve vkládání odpovědí.
`prompt_tokens`	Celé číslo	Počet tokenů ze vstupních výzev
`total_tokens`	Celé číslo	Počet celkového počtu tokenů
`reasoning_tokens`	Celé číslo	Počet myšlenkových tokenů Platí pouze pro modely odůvodnění.

U modelů, jako je databricks-meta-llama-3-3-70b-instruct, se výzva uživatele před předáním do modelu transformuje pomocí šablony výzvy. U koncových bodů s platbou za token může být přidána také systémová výzva. prompt_tokens obsahuje veškerý text přidaný naším serverem.

Rozhraní API pro odpovědi

Důležité

Rozhraní API pro odpovědi je kompatibilní pouze s modely OpenAI.

Rozhraní API pro odpovědi umožňuje s modelem více konverzací. Na rozdíl od dokončování chatu rozhraní API pro odpovědi používá input místo messages.

Požadavek na odpovědi rozhraní API

Pole	Výchozí	Typ	Popis
`model`		Řetězec	Požadované. ID modelu použité k vygenerování odpovědi
`input`		String nebo List[ResponsesInput]	Požadované. Textové, obrázkové nebo souborové vstupy do modelu, které se používají k vygenerování odpovědi. Na rozdíl od `messages`tohoto pole se používá `input` k určení obsahu konverzace.
`instructions`	`null`	Řetězec	Zpráva systému (nebo vývojáře) vložená do kontextu modelu.
`max_output_tokens`	`null`	`null`, což znamená bez omezení nebo celé číslo větší než nula	Horní mez počtu tokenů, které lze vygenerovat pro odpověď, včetně viditelných výstupních tokenů a zdůvodnění tokenů.
`temperature`	`1.0`	Plovoucí v [0,2]	Teplota vzorkování. Hodnota 0 je deterministická a vyšší hodnoty představují větší náhodnost.
`top_p`	`1.0`	Float v intervalu (0,1]	Prahová hodnota pravděpodobnosti použitá pro vzorkování jádra.
`stream`	`false`	logický	Pokud je nastavená hodnota true, data odpovědi modelu se streamují do klienta, protože se generují pomocí událostí odeslaných serverem.
`stream_options`	`null`	StreamOptions	Možnosti pro streamované odpovědi Toto nastavení nastavíte pouze při nastavení `stream: true`.
`text`	`null`	TextConfig	Možnosti konfigurace textové odpovědi z modelu Může to být prostý text nebo strukturovaná data JSON.
`reasoning`	`null`	ReasoningConfig	Konfigurace logického závěrování pro modely gpt-5 a o-series.
`tool_choice`	`"auto"`	String nebo ToolChoiceObject	Způsob, jakým má model vybrat nástroj (nebo nástroje), který se má použít při generování odpovědi V parametru `tools` se dozvíte, jak určit nástroje, které model může volat.
`tools`	`null`	Seznam[ToolObject]	Pole nástrojů, které může model volat při generování odpovědi. Poznámka: Databricks nepodporuje interpret kódu a nástroje pro vyhledávání na webu.
`parallel_tool_calls`	`true`	logický	Jestli chcete modelu povolit paralelní spouštění volání nástrojů.
`max_tool_calls`	`null`	Celé číslo větší než nula	Maximální počet volání integrovaných nástrojů, které je možné zpracovat v odpovědi.
`metadata`	`null`	Objekt	Sada 16 párů klíč-hodnota, které lze připojit k objektu.
`prompt_cache_key`	`null`	Řetězec	Používá se k ukládání odpovědí do mezipaměti pro podobné požadavky pro optimalizaci míry přístupů do mezipaměti. Pole `user` nahradí.
`prompt_cache_retention`	`null`	Řetězec	Zásady uchovávání pro mezipaměť podnětů. Nastavte na `"24h"` pro zapnutí rozšířeného ukládání výzev do mezipaměti, které udržuje předpony uložené v mezipaměti aktivní déle, až na maximálně 24 hodin.
`safety_identifier`	`null`	Řetězec	Stabilní identifikátor používaný k detekci uživatelů vaší aplikace, kteří můžou narušit zásady použití.
`user`	`null`	Řetězec	Nepodporované. Použijte `safety_identifier` a `prompt_cache_key` místo toho.
`truncation`	`null`	Řetězec	Strategie zkrácení, která se má použít pro odpověď modelu.
`top_logprobs`	`null`	Celé číslo	Celé číslo v rozmezí od 0 do 20 určující počet nejpravděpodobnějších tokenů, které se mají vrátit na každé pozici tokenu, každý s přidruženou pravděpodobností protokolu.
`include`	`null`	Seznam[Řetězec]	Zadejte další výstupní data, která se mají zahrnout do odpovědi modelu.
`prompt`	`null`	Objekt	Odkaz na šablonu výzvy a její proměnné

Nepodporované parametry: Databricks nepodporuje následující parametry a v případě zadání vrátí chybu 400:

background – Zpracování na pozadí není podporováno.
store - Uložené odpovědi nejsou podporovány.
conversation – Konverzační API není podporováno.
service_tier – Výběr úrovně služby spravuje Databricks.

`ResponsesInput`

Pole input přijímá buď řetězec, nebo seznam vstupních objektů zprávy s rolí a obsahem.

Pole	Typ	Popis
`role`	Řetězec	Požadované. Role autora zprávy. Může být `"user"` nebo `"assistant"`.
`content`	String nebo List[ResponsesContentBlock]	Požadované. Obsah zprávy, buď jako řetězec, nebo pole bloků obsahu.

`ResponsesContentBlock`

Bloky obsahu definují typ obsahu ve vstupních a výstupních zprávách. Typ bloku obsahu je určen polem type .

`InputText`

Pole	Typ	Popis
`type`	Řetězec	Požadované. Musí být `"input_text"`.
`text`	Řetězec	Požadované. Textový obsah.

`OutputText`

Pole	Typ	Popis
`type`	Řetězec	Požadované. Musí být `"output_text"`.
`text`	Řetězec	Požadované. Textový obsah.
`annotations`	Seznam[Objekt]	Volitelné poznámky pro textový obsah

`InputImage`

Pole	Typ	Popis
`type`	Řetězec	Požadované. Musí být `"input_image"`.
`image_url`	Řetězec	Požadované. URL nebo base64-kódovaný datový URI obrázku.

`InputFile`

Pole	Typ	Popis
`type`	Řetězec	Požadované. Musí být `"input_file"`.
`file_id`	Řetězec	Identifikátor souboru, pokud používáte nahrané soubory.
`filename`	Řetězec	Název souboru.
`file_data`	Řetězec	URI dat kódovaných Base64 s předponou formátu Soubory PDF například používají formát `data:application/pdf;base64,<base64 data>`.

`FunctionCall`

Pole	Typ	Popis
`type`	Řetězec	Požadované. Musí být `"function_call"`.
`id`	Řetězec	Požadované. Jedinečný identifikátor volání funkce.
`call_id`	Řetězec	Požadované. Identifikátor volání.
`name`	Řetězec	Požadované. Název volané funkce.
`arguments`	Objekt nebo řetězec	Požadované. Argumenty funkce jako objekt NEBO řetězec JSON.

`FunctionCallOutput`

Pole	Typ	Popis
`type`	Řetězec	Požadované. Musí být `"function_call_output"`.
`call_id`	Řetězec	Požadované. Identifikátor volání, kterému tento výstup odpovídá.
`output`	String/Object	Požadované. Výstup funkce jako řetězec nebo objekt JSON.

`CustomToolCall`

Vráceno v poli odpovědi output, když je volán vlastní nástroj. Na rozdíl od volání funkcí vlastní volání nástroje vrací prostý text input místo JSON arguments.

Pole	Typ	Popis
`type`	Řetězec	Požadované. Musí být `"custom_tool_call"`.
`id`	Řetězec	Požadované. Jedinečný identifikátor pro volání tohoto vlastního nástroje.
`call_id`	Řetězec	Požadované. Identifikátor volání.
`name`	Řetězec	Požadované. Název volaného vlastního nástroje.
`input`	Řetězec	Požadované. Vstup nástroje jako prostý text (nikoli JSON).
`status`	Řetězec	Stav volání nástroje. Jeden z: `completed`, `in_progress`.

`CustomToolCallOutput`

Tento typ vstupu slouží k poskytnutí výsledku volání vlastního nástroje zpět do modelu v konverzaci s vícenásobným otáčením.

Pole	Typ	Popis
`type`	Řetězec	Požadované. Musí být `"custom_tool_call_output"`.
`call_id`	Řetězec	Požadované. Identifikátor volání, kterému tento výstup odpovídá.
`output`	Řetězec	Požadované. Výstup vlastního nástroje jako řetězec.

`StreamOptions`

Konfigurace pro streamované odpovědi Používá se pouze v případech, kdy stream: true.

Pole	Typ	Popis
`include_usage`	logický	Pokud je hodnota true, zahrňte do datového proudu informace o využití tokenu. Výchozí hodnota je `false`.

`TextConfig`

Konfigurace textového výstupu, včetně strukturovaných výstupů

Pole	Typ	Popis
`format`	ResponsesFormatObject	Specifikace formátu textového výstupu.

`ResponsesFormatObject`

Určuje výstupní formát pro textové odpovědi.

Pole	Typ	Popis
`type`	Řetězec	Požadované. Typ formátu: `"text"` pro prostý text, `"json_object"` JSON nebo `"json_schema"` strukturovaný JSON.
`json_schema`	Objekt	Vyžaduje se, pokud `type` je `"json_schema"`. Objekt schématu JSON, který definuje strukturu výstupu.

Objekt json_schema má stejnou strukturu jako JsonSchemaObject zdokumentovaný v rozhraní API pro dokončování chatu.

`ReasoningConfig`

Konfigurace pro chování při usuzování v modelech usuzování (modely řady o a gpt-5).

Pole	Typ	Popis
`effort`	Řetězec	Úroveň úsilí zdůvodnění: `"low"`, `"medium"`nebo `"high"`. Výchozí hodnota je `"medium"`.
`encrypted_content`	Řetězec	Šifrovaný obsah pro bezstavový režim. Bylo poskytnuto modelem v předchozích odpovědích.

`ToolObject`

Viz volání funkce v Azure Databricks.

Poznámka:

Rozhraní API pro odpovědi podporuje následující typy nástrojů: function, custom, mcpimage_generation, , shell. Vlastní nástroje a formáty výstupu založené na gramatikě jsou k dispozici pouze u modelů řady GPT-5 (gpt-5, gpt-5.1, gpt-5.2).

Pole	Typ	Popis
`type`	Řetězec	Požadované. Typ nástroje. Podporované hodnoty najdete v poznámce výše.
`function`	FunctionObject	Vyžaduje se, pokud `type` je `function`. Definice funkce přidružená k nástroji.
`name`	Řetězec	Vyžaduje se, pokud `type` je `custom`. Název vlastního nástroje.
`description`	Řetězec	Vyžaduje se, pokud `type` je `custom`. Popis toho, co přizpůsobený nástroj dělá.
`format`	Customformat	Optional. Pokud je `typecustom`, určuje se výstupní formát. Výchozí hodnota je `{"type": "text"}`. Lze také použít `{"type": "grammar", "definition": "<grammar>", "syntax": "lark"}` pro strukturovaný výstup. Podporuje se pouze u modelů řady GPT-5.

`CustomToolObject`

Vlastní nástroje umožňují modelu vrátit libovolný řetězcový výstup místo argumentů funkce formátovaných jako JSON. To je užitečné pro generování kódu, použití oprav nebo jiných případů použití, kdy se nevyžaduje strukturovaný JSON.

Poznámka:

Vlastní nástroje jsou podporovány pouze u modelů řady GPT-5 (gpt-5, gpt-5.1, gpt-5.2) prostřednictvím rozhraní API pro odpovědi.

Příklad vlastního nástroje:

{
  "type": "custom",
  "name": "code_exec",
  "description": "Executes arbitrary Python code. Return only valid Python code."
}

Příklad vlastního nástroje s gramatikou:

{
  "type": "custom",
  "name": "apply_patch",
  "description": "Apply a patch to create or modify files.",
  "format": {
    "type": "grammar",
    "definition": "start: begin_patch hunk end_patch\nbegin_patch: \"*** Begin Patch\" LF\n...",
    "syntax": "lark"
  }
}

Při zavolání vlastního nástroje obsahuje custom_tool_call odpověď výstupní položku s prostým textem input místo JSON arguments.

`CustomFormat`

Formáty výstupu založené na gramatikě jsou podporovány pouze u modelů řady GPT-5.

Pole	Typ	Popis
`type`	Řetězec	Požadované. Buď `"text"` pro výstup ve formátu prostého textu, nebo `"grammar"` pro výstup s omezením gramatiky.
`definition`	Řetězec	Vyžaduje se, pokud `type` je `"grammar"`. Řetězec definice gramatiky pomocí syntaxe Lark.
`syntax`	Řetězec	Vyžaduje se, pokud `type` je `"grammar"`. Syntaxe gramatiky. V současné době se podporuje pouze `"lark"`.

`FunctionObject`

Pole	Typ	Popis
`name`	Řetězec	Požadované. Název funkce, která se má volat.
`description`	Objekt	Požadované. Podrobný popis funkce. Model používá tento popis, aby lépe pochopil, jak je funkce relevantní k zadání, a mohl s vyšší přesností generovat volání nástrojů.
`parameters`	Objekt	Parametry, které funkce přijímá, jsou popsány jako platný objekt schématu JSON . Pokud je nástroj volán, pak volání nástroje odpovídá poskytnutému schématu JSON. Vynechání parametrů definuje funkci bez parametrů. Počet `properties` je omezený na 15 klíčů.
`strict`	logický	Zda povolit přísné dodržování schématu při generování volání funkce. Pokud je nastavená hodnota `true`, model se řídí přesným schématem definovaným v poli schématu. Pokud je striktní `true`, podporuje se pouze podmnožina schématu JSON.

`ToolChoiceObject`

Viz volání funkce v Azure Databricks.

Pole	Typ	Popis
`type`	Řetězec	Požadované. Typ nástroje, který chcete vynutit. Podporované hodnoty odpovídají typům nástrojů v ToolObject: `"function"`, `"custom"`atd.
`function`	Objekt	Vyžaduje se, pokud `type` je `"function"`. Objekt formuláře `{"name": "my_function"}` , kde `"my_function"` je název FunctionObject v `tools` poli.
`name`	Řetězec	Vyžaduje se, pokud `type` je `"custom"`. Název vlastního nástroje, který se má vynutit. Podporuje se pouze u modelů řady GPT-5.

Odpovědi API

U požadavků, které nejsou streamované, je odpovědí jeden objekt odpovědi. U streamovacích požadavků je odpovědí text/event-stream, a každá událost představuje část odpovědi.

Pole	Typ	Popis
`id`	Řetězec	Jedinečný identifikátor odpovědi. Poznámka: Databricks zašifruje toto ID pro zabezpečení.
`object`	Řetězec	Typ objektu. Rovná se `"response"`.
`created_at`	Celé číslo	Časové razítko unixu (v sekundách) při vytvoření odpovědi.
`status`	Řetězec	Stav odpovědi. Jedna z těchto možností: `completed`, , `failedin_progress`, `cancelled`, `queued`, nebo `incomplete`.
`model`	Řetězec	Verze modelu použitá k vygenerování odpovědi.
`output`	Seznam[ResponsesMessage]	Výstup vygenerovaný modelem, obvykle obsahující objekty zpráv.
`usage`	Využití	Metadata použití tokenů.
`error`	Error	Informace o chybě, pokud odpověď selhala.
`incomplete_details`	Neúplné detaily	Podrobnosti o tom, proč je odpověď neúplná, pokud je k dispozici.
`instructions`	Řetězec	Pokyny uvedené v žádosti.
`max_output_tokens`	Celé číslo	Maximální výstupní tokeny zadané v požadavku.
`temperature`	Plovat	Teplota použitá pro generování.
`top_p`	Plovat	Hodnota top_p použitá pro generování.
`tools`	Seznam[ToolObject]	Nástroje zadané v požadavku.
`tool_choice`	String nebo ToolChoiceObject	Nastavení tool_choice z požadavku.
`parallel_tool_calls`	logický	Zda byla povolena volání nástrojů paralelně.
`store`	logický	Zda byla odpověď uložena.
`metadata`	Objekt	Metadata připojená k odpovědi.

`ResponsesMessage`

Objekty zpráv v output poli, které obsahují obsah odpovědi modelu.

Pole	Typ	Popis
`id`	Řetězec	Požadované. Jedinečný identifikátor zprávy.
`role`	Řetězec	Požadované. Role zprávy. Buď `"user"`, nebo `"assistant"`.
`content`	Seznam[ResponsesContentBlock]	Požadované. Bloky obsahu ve zprávě.
`status`	Řetězec	Stav zpracování zprávy.
`type`	Řetězec	Požadované. Typ objektu. Rovná se `"message"`.

`Error`

Informace o chybě, když odpověď selže.

Pole	Typ	Popis
`code`	Řetězec	Požadované. Kód chyby.
`message`	Řetězec	Požadované. Chybová zpráva čitelná člověkem.
`param`	Řetězec	Parametr, který způsobil chybu, pokud je k dispozici.
`type`	Řetězec	Požadované. Typ chyby.

`IncompleteDetails`

Podrobnosti o tom, proč je odpověď neúplná.

Pole	Typ	Popis
`reason`	Řetězec	Požadované. Důvod, proč je odpověď neúplná.

Rozhraní API pro dokončování chatu

Rozhraní API pro dokončování chatu umožňuje více konverzací s modelem. Odpověď modelu poskytuje následující assistant zprávu v konverzaci. Viz POST /serving-endpoints/{name}/invocations pro dotazování parametrů koncového bodu.

Žádost o chat

Pole	Výchozí	Typ	Popis
`messages`		ChatMessage seznam	Požadované. Seznam zpráv představujících aktuální konverzaci
`max_tokens`	`null`	`null`, což znamená bez omezení nebo celé číslo větší než nula	Maximální počet tokenů, které se mají vygenerovat.
`stream`	`true`	logický	Umožněte streamování odpovědí zpět klientovi, aby bylo možné poskytnout částečné výsledky pro požadavky. Pokud je tento parametr součástí požadavku, odpovědi se posílají pomocí standardu pro události zasílané serverem.
`temperature`	`1.0`	Plovoucí v [0,2]	Teplota vzorkování. Hodnota 0 je deterministická a vyšší hodnoty představují větší náhodnost.
`top_p`	`1.0`	Float v intervalu (0,1]	Prahová hodnota pravděpodobnosti použitá pro vzorkování jádra.
`top_k`	`null`	`null`, což znamená bez omezení nebo celé číslo větší než nula	Definuje počet nejpravděpodobnějších k tokenů pro použití při filtrování top-k. Nastavte tuto hodnotu na hodnotu 1, aby byl výstup deterministický.
`stop`	[]	Řetězec nebo Seznam [Řetězec]	Model přestane generovat další tokeny, když dojde k nějaké sekvenci v `stop`.
`n`	1	Celé číslo větší než nula	Rozhraní API vrátí `n` nezávislé dokončování chatu při zadání `n`. Doporučuje se pro úlohy, které generují více dokončení na stejném vstupu pro další efektivitu odvozování a úsporu nákladů. K dispozici pouze pro koncové body s provisionovanou kapacitou propustnosti.
`tool_choice`	`none`	String nebo ToolChoiceObject	Používá se pouze ve spojení s polem `tools`. `tool_choice` podporuje různé řetězce klíčových slov, jako jsou `auto`, `required`a `none`. `auto` znamená, že necháte model rozhodnout, který nástroj je vhodné použít, pokud vůbec existuje. Pokud `auto` model nevěří, že některý z nástrojů `tools` je relevantní, model místo volání nástroje vygeneruje standardní zprávu asistenta. `required` znamená, že model vybere nejrelevavantnější nástroj v `tools` a musí vygenerovat volání nástroje. `none` znamená, že model negeneruje žádná volání nástrojů a místo toho musí vygenerovat standardní zprávu asistenta. Chcete-li vynutit volání nástroje s konkrétním nástrojem definovaným v `tools`, použijte `ToolChoiceObject`. Ve výchozím nastavení, pokud je pole `tools` vyplněno `tool_choice = "auto"`. Jinak pole `tools` ve výchozím nastavení přebírá hodnotu `tool_choice = "none"`.
`tools`	`null`	ToolObject	Seznam `tools`, které model může volat. V současné době je `function` jediným podporovaným typem `tool` a podporuje se maximálně 32 funkcí.
`response_format`	`null`	responseFormatObject	Objekt určující formát, který musí model vypíše. Akceptované typy jsou `text`, `json_schema` nebo `json_object` Nastavení `{ "type": "json_schema", "json_schema": {...} }` umožňuje strukturované výstupy, které zajistí, že model následuje za zadaným schématem JSON. Nastavení `{ "type": "json_object" }` zajišťuje, že odpovědi, které model vygeneruje, jsou platné JSON, ale nezajistí, aby odpovědi dodržovaly konkrétní schéma.
`logprobs`	`false`	logický	Tento parametr určuje, jestli se má poskytnout logaritmická pravděpodobnost výběru tokenu.
`top_logprobs`	`null`	Celé číslo	Tento parametr určuje počet nejpravděpodobnějších tokenů, pro které se v každém kroku vzorkování vrací logaritmované pravděpodobnosti. Může být 0–20. `logprobs` musí být `true`, pokud se používá toto pole.
`reasoning_effort`	`"medium"`	Řetězec	Řídí úroveň odůvodnění, které by model měl použít při generování odpovědí. Přijaté hodnoty jsou `"low"`, `"medium"`nebo `"high"`. Vyšší úsilí může vést k promyšlenějším a přesným odpovědím, ale může zvýšit latenci a využití tokenů. Tento parametr je přijímán pouze omezenou sadou modelů, včetně `databricks-gpt-oss-120b` a `databricks-gpt-oss-20b`.

`ChatMessage`

Pole	Typ	Popis
`role`	Řetězec	Požadované. Role autora zprávy Může být `"system"`, `"user"`, `"assistant"` nebo `"tool"`.
`content`	Řetězec	Obsah zprávy. Požadované pro úlohy chatu, které nezahrnují volání nástrojů.
`tool_calls`	seznam ToolCall	Seznam `tool_calls`, který model vygeneroval. Musí mít `role` jako `"assistant"` a žádné specifikace pro pole `content`.
`tool_call_id`	Řetězec	Když je `role"tool"`, jedná se o ID přidružené ke `ToolCall`, na kterou zpráva odpovídá. Musí být prázdné pro ostatní možnosti `role`.

Roli system lze použít jenom jednou, jako první zprávu v konverzaci. Přepíše výchozí systémovou výzvu modelu.

`ToolCall`

Návrh akce pro volání nástroje podle modelu. Viz volání funkce v Azure Databricks.

Pole	Typ	Popis
`id`	Řetězec	Požadované. Jedinečný identifikátor pro návrh na volání tohoto nástroje.
`type`	Řetězec	Požadované. Podporuje se jenom `"function"`.
`function`	FunctionCallCompletion	Požadované. Volání funkce navrhované modelem
`cache_control`	Řetězec	Povolí ukládání do mezipaměti pro vaši žádost. Tento parametr přijímá pouze modely Claude hostované službou Databricks. Viz ukládání promptu do mezipaměti pro příklad.

`FunctionCallCompletion`

Pole	Typ	Popis
`name`	Řetězec	Povinné. Název funkce, kterou model doporučil.
`arguments`	Objekt	Povinné. Argumenty pro funkci ve formě serializovaného JSON slovníku.

Poznámka: ToolChoiceObject, ToolObjecta FunctionObject jsou definovány v části Rozhraní API odpovědi a jsou sdíleny mezi oběma rozhraními API.

`ResponseFormatObject`

Viz část Strukturované výstupy ve službě Azure Databricks.

Pole	Typ	Popis
`type`	Řetězec	Požadované. Typ formátu odpovědi, který se definuje. Buď `text` pro nestrukturovaný text, `json_object` pro nestrukturované objekty JSON, nebo `json_schema` pro objekty JSON, které dodržují konkrétní schéma.
`json_schema`	jsonSchemaObject	Požadované. Schéma JSON, které se má dodržovat, pokud je `type` nastavená na `json_schema`

`JsonSchemaObject`

Viz část Strukturované výstupy ve službě Azure Databricks.

Pole	Typ	Popis
`name`	Řetězec	Požadované. Název formátu odpovědi.
`description`	Řetězec	Popis formátu odpovědi, který model používá k určení způsobu reakce v tomto formátu.
`schema`	Objekt	Požadované. Schéma pro formát odpovědi popsané jako objekt schématu JSON.
`strict`	logický	Zda povolit přísné dodržování schématu při generování výstupu. Pokud je nastavená hodnota `true`, model se řídí přesným schématem definovaným v poli schématu. Pokud je striktní `true`, podporuje se pouze podmnožina schématu JSON.

Odpověď na chat

U požadavků, které nejsou streamované, je odpovědí jeden objekt dokončení chatu. U požadavků na streamování je odpověď ve formátu text/event-stream, kde každá událost je objekt kompletního segmentu. Struktura objektů dokončení a dílčích objektů nejvyšší úrovně je téměř identická: pouze choices má jiný typ.

Pole	Typ	Popis
`id`	Řetězec	Jedinečný identifikátor dokončení chatu.
`choices`	List[ChatCompletionChoice] nebo List[ChatCompletionChunk] (streamování)	Seznam textových zpráv o dokončení chatu Volby `n` se vrátí, pokud je zadán parametr `n`.
`object`	Řetězec	Typ objektu. Rovná se buď `"chat.completions"` pro nestreamování, nebo `"chat.completion.chunk"` pro streamování.
`created`	Celé číslo	Doba, za kterou bylo dokončení chatu vygenerováno, vyjádřená v sekundách.
`model`	Řetězec	Verze modelu použitá k vygenerování odpovědi.
`usage`	Využití	Metadata použití tokenů. Na streamovacích odpovědích nemusí být přítomen.

`ChatCompletionChoice`

Pole	Typ	Popis
`index`	Celé číslo	Index výběru v seznamu vygenerovaných možností.
`message`	ChatMessage	Zpráva o dokončení chatu vrácená modelem Úloha bude `assistant`.
`finish_reason`	Řetězec	Důvod, proč model přestal generovat tokeny
`extra_fields`	Řetězec	Při použití proprietárních modelů od externích poskytovatelů modelů můžou rozhraní API poskytovatele obsahovat do odpovědí další metadata. Databricks tyto odpovědi filtruje a vrací pouze podmnožinu původních polí poskytovatele. Toto `safetyRating` je jediné dodatečné pole podporované v tuto chvíli, další podrobnosti najdete v dokumentaci Gemini .

`ChatCompletionChunk`

Pole	Typ	Popis
`index`	Celé číslo	Index výběru v seznamu vygenerovaných možností.
`delta`	ChatMessage	Zpráva o dokončení chatu, která je součástí vygenerovaných streamovaných odpovědí z modelu Je zaručeno, že pouze první blok dat bude mít `role` naplněno.
`finish_reason`	Řetězec	Důvod, proč model přestal generovat tokeny Pouze poslední blok bude mít tuto informaci vyplněnou.

Rozhraní API pro vestavěné prvky

Úkoly vkládání mapují vstupní řetězce na vektory vkládání. V každém požadavku je možné dosát dohromady mnoho vstupů. Viz POST /serving-endpoints/{name}/invocations pro dotazování parametrů koncového bodu.

Žádost o vložení

Pole	Typ	Popis
`input`	Řetězec nebo Seznam [Řetězec]	Požadované. Vstupní text, který chcete vložit. Může to být řetězec nebo seznam řetězců.
`instruction`	Řetězec	Volitelná instrukce, která se má předat modelu vkládání.

Pokyny jsou volitelné a vysoce specifické pro model. Autoři BGE například při indexování bloků dat nedoporučují žádné instrukce a doporučují používat instrukce "Represent this sentence for searching relevant passages:" pro načítání dotazů. Další modely, jako je Instructor-XL, podporují širokou škálu instrukčních řetězců.

Odpověď vkládání

Pole	Typ	Popis
`id`	Řetězec	Jedinečný identifikátor pro vkládání.
`object`	Řetězec	Typ objektu. Rovná se `"list"`.
`model`	Řetězec	Název modelu použitý k vytvoření vložení
`data`	EmbeddingObject	Embedující objekt.
`usage`	Využití	Metadata použití tokenů.

`EmbeddingObject`

Pole	Typ	Popis
`object`	Řetězec	Typ objektu. Rovná se `"embedding"`.
`index`	Celé číslo	Index vkládání v seznamu vložených objektů vygenerovaných modelem.
`embedding`	Seznam[Float]	Vektor vkládání. Každý model vrátí vektor pevné velikosti (1024 pro BGE-Large).

Rozhraní API pro dokončování

Úkoly dokončování textu slouží k generování odpovědí na jednu výzvu. Na rozdíl od chatu tato úloha podporuje dávkové vstupy: v jedné žádosti lze odeslat několik nezávislých výzev. Viz POST /serving-endpoints/{name}/invocations pro dotazování parametrů koncového bodu.

Žádost o dokončení

Pole	Výchozí	Typ	Popis
`prompt`		Řetězec nebo Seznam [Řetězec]	Požadované. Výzvy pro model.
`max_tokens`	`null`	`null`, což znamená bez omezení nebo celé číslo větší než nula	Maximální počet tokenů, které se mají vygenerovat.
`stream`	`true`	logický	Umožněte streamování odpovědí zpět klientovi, aby bylo možné poskytnout částečné výsledky pro požadavky. Pokud je tento parametr součástí požadavku, odpovědi se posílají pomocí standardu pro události zasílané serverem.
`temperature`	`1.0`	Plovoucí v [0,2]	Teplota vzorkování. Hodnota 0 je deterministická a vyšší hodnoty představují větší náhodnost.
`top_p`	`1.0`	Float v intervalu (0,1]	Prahová hodnota pravděpodobnosti použitá pro vzorkování jádra.
`top_k`	`null`	`null`, což znamená bez omezení nebo celé číslo větší než nula	Definuje počet nejpravděpodobnějších k tokenů pro použití při filtrování top-k. Nastavte tuto hodnotu na hodnotu 1, aby byl výstup deterministický.
`error_behavior`	`"error"`	`"truncate"` nebo `"error"`	Chyby překročení časového limitu a chyby překročení délky kontextu. Jedna z těchto možností: `"truncate"` (vrácení co nejvíce tokenů) a `"error"` (vrácení chyby). Tento parametr je přijímán pouze koncovými body s platbou za token.
`n`	1	Celé číslo větší než nula	Rozhraní API vrátí `n` nezávislé dokončování chatu při zadání `n`. Doporučuje se pro úlohy, které generují více dokončení na stejném vstupu pro další efektivitu odvozování a úsporu nákladů. K dispozici pouze pro koncové body s provisionovanou kapacitou propustnosti.
`stop`	[]	Řetězec nebo Seznam [Řetězec]	Model přestane generovat další tokeny, když dojde k nějaké sekvenci v `stop`.
`suffix`	`""`	Řetězec	Řetězec, který je připojen na konec každého dokončení.
`echo`	`false`	logický	Vrátí výzvu k akci spolu s dokončením.
`use_raw_prompt`	`false`	logický	Pokud `true`, předejte `prompt` přímo do modelu bez transformace.

Odpověď na dokončení úkolu

Pole	Typ	Popis
`id`	Řetězec	Jedinečný identifikátor pro dokončování textu.
`choices`	Výběr dokončení	Seznam dokončování textu. Při každém předání podnětu se vygenerují `n` volby, pokud je zadáno `n`. Výchozí `n` je 1.
`object`	Řetězec	Typ objektu. Rovná se `"text_completion"`
`created`	Celé číslo	Čas, kdy bylo dokončení vygenerováno, v sekundách.
`usage`	Využití	Metadata použití tokenů.

`CompletionChoice`

Pole	Typ	Popis
`index`	Celé číslo	Index výzvy v požadavku.
`text`	Řetězec	Vygenerované dokončení.
`finish_reason`	Řetězec	Důvod, proč model přestal generovat tokeny

Další zdroje informací

Základní modely hostované v Databricks dostupné v rozhraních API pro základní modely

Váš názor

Byla tato stránka užitečná?

Last updated on 2026-01-09

Sdílet prostřednictvím

Referenční informace k rozhraní REST API základního modelu

koncové body

Použití

Rozhraní API pro odpovědi

Požadavek na odpovědi rozhraní API

ResponsesInput

ResponsesContentBlock

InputText

OutputText

InputImage

InputFile

FunctionCall

FunctionCallOutput

CustomToolCall

CustomToolCallOutput

StreamOptions

TextConfig

ResponsesFormatObject

ReasoningConfig

ToolObject

CustomToolObject

CustomFormat

FunctionObject

ToolChoiceObject