GetChatCompletionsOptions interface
此課程模組包含我們想要與對應產生的模型並存的模型。 這適用於提供具有與所產生模型不同名稱/類型的面向客戶模型。
- Extends
屬性
azure |
使用它們之 Azure OpenAI 聊天延伸模組的組態專案。 這個額外的規格只與 Azure OpenAI 相容。 |
frequency |
值,根據所產生文字中的累計頻率,影響產生的令牌出現機率。 正值會使令牌在頻率增加時較不常出現,並降低重複相同語句的模型可能性。 |
function |
控制模型如何回應函式呼叫。 「none」表示模型不會呼叫函式,然後回應使用者。 「auto」表示模型可以在使用者或呼叫函式之間挑選。
透過 |
functions | 模型可能會為其產生 JSON 輸入的函式清單。 |
logit |
GPT 令牌標識碼與偏差分數之間的對應,會影響特定令牌出現在完成回應中的機率。 令牌標識碼是透過外部令牌化工具來計算,而偏差分數則分別位於 -100 到 100 的範圍內,其最小值和最大值分別對應到令牌的完整禁止或獨佔選取。 給定偏差分數的確切行為會依模型而有所不同。 |
max |
要產生的令牌數目上限。 |
n | 聊天完成回應應該產生的聊天完成選項數目。 由於此設定可能會產生許多完成,因此可能會快速取用您的令牌配額。 請仔細使用,並確保 maxTokens 和停止的合理設定。 |
presence |
值,根據所產生文字中現有的令牌出現,影響所產生令牌的機率。 正值會使令牌在已經存在時較不可能出現,並增加模型輸出新主題的可能性。 |
response |
物件,指定模型必須輸出的格式。 用來啟用 JSON 模式。 |
seed | 如果指定,系統會盡最大努力以確定性方式取樣,讓具有相同種子和參數的重複要求應該傳回相同的結果。 確定性不保證,您應該參考system_fingerprint響應參數來監視後端的變更。」 |
stop | 將結束完成產生之文字序列的集合。 |
temperature | 用來控制所產生完成明顯創意的取樣溫度。 較高的值會使輸出更隨機,而較低的值會使結果更具焦點且具決定性。 不建議針對這兩個設定的互動修改溫度和 topP,因為這兩個設定的互動很難預測。 |
tool |
如果指定,模型會設定它可用於聊天完成回應的所提供工具。 |
tools | 聊天完成要求可以使用的可用工具定義,包括呼叫端定義的函式。 |
topP | 使用溫度進行取樣的替代方法,稱為「取樣」。 這個值會使模型考慮具有所提供機率質量的標記結果。 例如,值 0.15 將只會考慮包含前 15% 機率質量的標記。 不建議針對這兩個設定的互動修改溫度和 topP,因為這兩個設定的互動很難預測。 |
user | 作業呼叫端或終端使用者的標識碼。 這可用於追蹤或速率限制用途。 |
繼承的屬性
abort |
可用來中止要求的訊號。 |
on |
每次從伺服器收到回應時,要呼叫的函式,同時執行要求的作業。 可以多次呼叫。 |
request |
建立和傳送此作業之 HTTP 要求時所使用的選項。 |
tracing |
啟用追蹤時所使用的選項。 |
屬性詳細資料
azureExtensionOptions
使用它們之 Azure OpenAI 聊天延伸模組的組態專案。 這個額外的規格只與 Azure OpenAI 相容。
azureExtensionOptions?: AzureExtensionsOptions
屬性值
frequencyPenalty
值,根據所產生文字中的累計頻率,影響產生的令牌出現機率。 正值會使令牌在頻率增加時較不常出現,並降低重複相同語句的模型可能性。
frequencyPenalty?: number
屬性值
number
functionCall
控制模型如何回應函式呼叫。 「none」表示模型不會呼叫函式,然後回應使用者。 「auto」表示模型可以在使用者或呼叫函式之間挑選。
透過 {"name": "my_function"}
指定特定函式會強制模型呼叫該函式。
當沒有任何函式存在時,「none」為預設值。 如果函式存在,「auto」為預設值。
functionCall?: string | FunctionName
屬性值
string | FunctionName
functions
logitBias
GPT 令牌標識碼與偏差分數之間的對應,會影響特定令牌出現在完成回應中的機率。 令牌標識碼是透過外部令牌化工具來計算,而偏差分數則分別位於 -100 到 100 的範圍內,其最小值和最大值分別對應到令牌的完整禁止或獨佔選取。 給定偏差分數的確切行為會依模型而有所不同。
logitBias?: Record<string, number>
屬性值
Record<string, number>
maxTokens
要產生的令牌數目上限。
maxTokens?: number
屬性值
number
n
聊天完成回應應該產生的聊天完成選項數目。 由於此設定可能會產生許多完成,因此可能會快速取用您的令牌配額。 請仔細使用,並確保 maxTokens 和停止的合理設定。
n?: number
屬性值
number
presencePenalty
值,根據所產生文字中現有的令牌出現,影響所產生令牌的機率。 正值會使令牌在已經存在時較不可能出現,並增加模型輸出新主題的可能性。
presencePenalty?: number
屬性值
number
responseFormat
物件,指定模型必須輸出的格式。 用來啟用 JSON 模式。
responseFormat?: ChatCompletionsResponseFormat
屬性值
seed
如果指定,系統會盡最大努力以確定性方式取樣,讓具有相同種子和參數的重複要求應該傳回相同的結果。 確定性不保證,您應該參考system_fingerprint響應參數來監視後端的變更。」
seed?: number
屬性值
number
stop
將結束完成產生之文字序列的集合。
stop?: string[]
屬性值
string[]
temperature
用來控制所產生完成明顯創意的取樣溫度。 較高的值會使輸出更隨機,而較低的值會使結果更具焦點且具決定性。 不建議針對這兩個設定的互動修改溫度和 topP,因為這兩個設定的互動很難預測。
temperature?: number
屬性值
number
toolChoice
如果指定,模型會設定它可用於聊天完成回應的所提供工具。
toolChoice?: ChatCompletionsNamedToolSelectionUnion
屬性值
tools
聊天完成要求可以使用的可用工具定義,包括呼叫端定義的函式。
tools?: ChatCompletionsToolDefinitionUnion[]
屬性值
topP
使用溫度進行取樣的替代方法,稱為「取樣」。 這個值會使模型考慮具有所提供機率質量的標記結果。 例如,值 0.15 將只會考慮包含前 15% 機率質量的標記。 不建議針對這兩個設定的互動修改溫度和 topP,因為這兩個設定的互動很難預測。
topP?: number
屬性值
number
user
作業呼叫端或終端使用者的標識碼。 這可用於追蹤或速率限制用途。
user?: string
屬性值
string
繼承的屬性詳細資料
abortSignal
onResponse
每次從伺服器收到回應時,要呼叫的函式,同時執行要求的作業。 可以多次呼叫。
onResponse?: RawResponseCallback
屬性值
繼承自 OperationOptions.onResponse
requestOptions
建立和傳送此作業之 HTTP 要求時所使用的選項。
requestOptions?: OperationRequestOptions
屬性值
繼承自 OperationOptions.requestOptions
tracingOptions
啟用追蹤時所使用的選項。
tracingOptions?: OperationTracingOptions
屬性值
繼承自 OperationOptions.tracingOptions