Get Chat Completions - Get Chat Completions
Mendapatkan penyelesaian obrolan untuk pesan obrolan yang disediakan.
Penyelesaian mendukung berbagai tugas dan menghasilkan teks yang berlanjut dari atau "menyelesaikan" data permintaan yang disediakan. Metode ini melakukan panggilan REST API ke rute /chat/completions pada titik akhir yang diberikan.
POST https://{resource}.services.ai.azure.com/models/chat/completions?api-version=2024-05-01-preview
Parameter URI
| Nama | Dalam | Diperlukan | Jenis | Deskripsi |
|---|---|---|---|---|
|
resource
|
path | True |
string |
Nama sumber daya Azure AI Services, misalnya 'my-resource' |
|
api-version
|
query | True |
string minLength: 1 |
Versi API yang akan digunakan untuk operasi ini. |
Header Permintaan
| Nama | Diperlukan | Jenis | Deskripsi |
|---|---|---|---|
| extra-parameters |
Mengontrol apa yang terjadi jika parameter tambahan, yang tidak ditentukan oleh REST API, diteruskan dalam payload permintaan JSON.
Ini mengatur header permintaan HTTP |
Isi Permintaan
| Nama | Diperlukan | Jenis | Deskripsi |
|---|---|---|---|
| messages | True | ChatRequestMessage[]: |
Kumpulan pesan konteks yang terkait dengan permintaan penyelesaian obrolan ini. Penggunaan umum dimulai dengan pesan obrolan untuk peran Sistem yang memberikan instruksi untuk perilaku asisten, diikuti dengan pesan alternatif antara peran Pengguna dan Asisten. |
| frequency_penalty |
number (float) minimum: -2maximum: 2 |
Nilai yang memengaruhi probabilitas token yang dihasilkan muncul berdasarkan frekuensi kumulatifnya dalam teks yang dihasilkan. Nilai positif akan membuat token lebih kecil kemungkinannya muncul saat frekuensinya meningkat dan mengurangi kemungkinan model mengulangi pernyataan verbatim yang sama. Rentang yang didukung adalah [-2, 2]. |
|
| max_tokens |
integer (int32) minimum: 0 |
Jumlah maksimum token yang akan dihasilkan. |
|
| modalities |
Modalitas yang diizinkan untuk digunakan model untuk respons penyelesaian obrolan. Modalitas default adalah |
||
| model |
string |
ID model AI tertentu untuk digunakan, jika lebih dari satu model tersedia di titik akhir. |
|
| presence_penalty |
number (float) minimum: -2maximum: 2 |
Nilai yang memengaruhi probabilitas token yang dihasilkan muncul berdasarkan kehadiran yang ada dalam teks yang dihasilkan. Nilai positif akan membuat token lebih kecil kemungkinannya muncul ketika sudah ada dan meningkatkan kemungkinan model untuk menghasilkan topik baru. Rentang yang didukung adalah [-2, 2]. |
|
| response_format | ChatCompletionsResponseFormat: |
Objek yang menentukan format yang harus dihasilkan model. Pengaturan ke Pengaturan ke
Penting: saat menggunakan mode JSON, Anda juga harus menginstruksikan model untuk menghasilkan JSON sendiri melalui sistem atau pesan pengguna. Tanpa ini, model dapat menghasilkan aliran spasi kosong yang tidak berujung sampai pembuatan mencapai batas token, yang mengakibatkan permintaan yang berjalan lama dan tampaknya "macet". Perhatikan juga bahwa konten pesan mungkin dipotong sebagian jika |
|
| seed |
integer (int64) |
Jika ditentukan, sistem akan melakukan upaya terbaik untuk mengambil sampel secara deterministik sehingga permintaan berulang dengan seed dan parameter yang sama harus mengembalikan hasil yang sama. Determinisme tidak dijamin. |
|
| stop |
string[] |
Kumpulan urutan tekstual yang akan mengakhiri pembuatan penyelesaian. |
|
| stream |
boolean |
Nilai yang menunjukkan apakah penyelesaian obrolan harus dialirkan untuk permintaan ini. |
|
| temperature |
number (float) minimum: 0maximum: 1 |
Suhu pengambilan sampel untuk digunakan yang mengontrol kreativitas yang jelas dari penyelesaian yang dihasilkan. Nilai yang lebih tinggi akan membuat output lebih acak sementara nilai yang lebih rendah akan membuat hasil lebih fokus dan deterministik. Tidak disarankan untuk memodifikasi suhu dan top_p untuk permintaan penyelesaian yang sama karena interaksi kedua pengaturan ini sulit diprediksi. Rentang yang didukung adalah [0, 1]. |
|
| tool_choice |
Jika ditentukan, model akan mengonfigurasi alat mana yang disediakan yang dapat digunakannya untuk respons penyelesaian obrolan. |
||
| tools |
Daftar alat yang mungkin diminta model untuk dipanggil. Saat ini, hanya fungsi yang didukung sebagai alat. Model dapat merespons dengan permintaan panggilan fungsi dan memberikan argumen input dalam format JSON untuk fungsi tersebut. |
||
| top_p |
number (float) minimum: 0maximum: 1 |
Alternatif untuk pengambilan sampel dengan suhu yang disebut pengambilan sampel nukleus. Nilai ini menyebabkan model mempertimbangkan hasil token dengan massa probabilitas yang disediakan. Sebagai contoh, nilai 0,15 hanya akan menyebabkan token yang terdiri dari 15% massa probabilitas teratas untuk dipertimbangkan. Tidak disarankan untuk memodifikasi suhu dan top_p untuk permintaan penyelesaian yang sama karena interaksi kedua pengaturan ini sulit diprediksi. Rentang yang didukung adalah [0, 1]. |
Respons
| Nama | Jenis | Deskripsi |
|---|---|---|
| 200 OK |
Permintaan telah berhasil. |
|
| Other Status Codes |
Respons kesalahan tak terduga. Header x-ms-error-code: string |
Keamanan
api-key
Jenis:
apiKey
Dalam:
header
OAuth2Auth
Jenis:
oauth2
Alur:
implicit
URL Otorisasi:
https://login.microsoftonline.com/common/oauth2/v2.0/authorize
Cakupan
| Nama | Deskripsi |
|---|---|
| https://cognitiveservices.azure.com/.default |
Contoh
| Audio modality chat completion |
| maximum set chat completion |
| minimum set chat completion |
Audio modality chat completion
Permintaan sampel
POST https://{resource}.services.ai.azure.com/models/chat/completions?api-version=2024-05-01-preview
{
"modalities": [
"text",
"audio"
],
"messages": [
{
"role": "system",
"content": "You are a helpful assistant"
},
{
"role": "user",
"content": [
{
"type": "input_audio",
"input_audio": {
"data": "<base64 encoded audio data>",
"format": "wav"
}
}
]
},
{
"role": "assistant",
"content": null,
"audio": {
"id": "abcdef1234"
}
},
{
"role": "user",
"content": [
{
"type": "input_audio",
"input_audio": {
"data": "<base64 encoded audio data>",
"format": "wav"
}
}
]
}
],
"frequency_penalty": 0,
"presence_penalty": 0,
"temperature": 0,
"top_p": 0,
"seed": 21,
"model": "my-model-name"
}
Respon sampel
{
"id": "kgousajxgzyhugvqekuswuqbk",
"object": "chat.completion",
"created": 1696522361,
"model": "my-model-name",
"usage": {
"completion_tokens": 19,
"prompt_tokens": 28,
"total_tokens": 16,
"completion_tokens_details": {
"audio_tokens": 5,
"total_tokens": 5
},
"prompt_tokens_details": {
"audio_tokens": 10,
"cached_tokens": 0
}
},
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": null,
"tool_calls": null,
"audio": {
"id": "abcdef1234",
"format": "wav",
"data": "<base64 encoded audio data>",
"expires_at": 1896522361,
"transcript": "This is a sample transcript"
}
}
}
]
}
maximum set chat completion
Permintaan sampel
POST https://{resource}.services.ai.azure.com/models/chat/completions?api-version=2024-05-01-preview
{
"modalities": [
"text"
],
"messages": [
{
"role": "system",
"content": "You are a helpful assistant"
},
{
"role": "user",
"content": "Explain Riemann's conjecture"
},
{
"role": "assistant",
"content": "The Riemann Conjecture is a deep mathematical conjecture around prime numbers and how they can be predicted. It was first published in Riemann's groundbreaking 1859 paper. The conjecture states that the Riemann zeta function has its zeros only at the negative even integers and complex numbers with real part 1/21. Many consider it to be the most important unsolved problem in pure mathematics. The Riemann hypothesis is a way to predict the probability that numbers in a certain range are prime that was also devised by German mathematician Bernhard Riemann in 18594."
},
{
"role": "user",
"content": "Ist it proved?"
}
],
"frequency_penalty": 0,
"stream": true,
"presence_penalty": 0,
"temperature": 0,
"top_p": 0,
"max_tokens": 255,
"response_format": {
"type": "text"
},
"stop": [
"<|endoftext|>"
],
"tools": [
{
"type": "function",
"function": {
"name": "my-function-name",
"description": "A function useful to know if a theroem is proved or not"
}
}
],
"seed": 21,
"model": "my-model-name"
}
Respon sampel
{
"id": "kgousajxgzyhugvqekuswuqbk",
"object": "chat.completion",
"created": 18,
"model": "my-model-name",
"usage": {
"completion_tokens": 19,
"prompt_tokens": 28,
"total_tokens": 16
},
"choices": [
{
"index": 7,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": null,
"tool_calls": [
{
"id": "yrobmilsrugmbwukmzo",
"type": "function",
"function": {
"name": "my-function-name",
"arguments": "{ \"arg1\": \"value1\", \"arg2\": \"value2\" }"
}
}
]
}
}
]
}
minimum set chat completion
Permintaan sampel
POST https://{resource}.services.ai.azure.com/models/chat/completions?api-version=2024-05-01-preview
{
"messages": [
{
"role": "user",
"content": "Explain Riemann's conjecture"
}
]
}
Respon sampel
{
"id": "kgousajxgzyhugvqekuswuqbk",
"object": "chat.completion",
"created": 1234567890,
"model": "my-model-name",
"usage": {
"prompt_tokens": 205,
"completion_tokens": 5,
"total_tokens": 210
},
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "The Riemann Conjecture is a deep mathematical conjecture around prime numbers and how they can be predicted. It was first published in Riemann's groundbreaking 1859 paper. The conjecture states that the Riemann zeta function has its zeros only at the negative even integers and complex numbers with real part 1/21. Many consider it to be the most important unsolved problem in pure mathematics. The Riemann hypothesis is a way to predict the probability that numbers in a certain range are prime that was also devised by German mathematician Bernhard Riemann in 18594"
}
}
]
}
Definisi
| Nama | Deskripsi |
|---|---|
|
Audio |
Representasi dari kemungkinan format audio untuk audio. |
|
Azure. |
Objek kesalahan. |
|
Azure. |
Respons yang berisi detail kesalahan. |
|
Azure. |
Objek yang berisi informasi yang lebih spesifik tentang kesalahan. Sesuai pedoman Azure REST API - https://aka.ms/AzureRestApiGuidelines#handling-errors. |
|
Chat |
Representasi penyelesaian permintaan tunggal sebagai bagian dari permintaan penyelesaian obrolan secara keseluruhan.
Umumnya, pilihan |
|
Chat |
Representasi data respons dari permintaan penyelesaian obrolan. Penyelesaian mendukung berbagai tugas dan menghasilkan teks yang berlanjut dari atau "menyelesaikan" data permintaan yang disediakan. |
|
Chat |
Representasi audio yang dihasilkan oleh model. |
|
Chat |
Modalitas yang diizinkan untuk digunakan model untuk respons penyelesaian obrolan. |
|
Chat |
Informasi konfigurasi untuk permintaan penyelesaian obrolan. Penyelesaian mendukung berbagai tugas dan menghasilkan teks yang berlanjut dari atau "menyelesaikan" data permintaan yang disediakan. |
|
Chat |
Format respons untuk Penyelesaian Obrolan yang membatasi respons untuk memancarkan objek JSON yang valid. Perhatikan bahwa untuk mengaktifkan mode JSON, beberapa model AI mungkin juga mengharuskan Anda menginstruksikan model untuk menghasilkan JSON melalui sistem atau pesan pengguna. |
|
Chat |
Format respons untuk Penyelesaian Obrolan yang membatasi respons untuk memancarkan objek JSON yang valid, dengan skema JSON yang ditentukan oleh pemanggil. |
|
Chat |
Definisi skema JSON yang diperlukan dalam respons, dan metadata terkait. |
|
Chat |
Format respons untuk Penyelesaian Obrolan yang memancarkan respons teks. Ini adalah format respons default. |
|
Chat |
Panggilan alat fungsi yang diminta oleh model AI. |
|
Chat |
Definisi alat penyelesaian obrolan yang dapat memanggil fungsi. |
|
Chat |
Pesan obrolan permintaan yang mewakili respons atau tindakan dari asisten. |
|
Chat |
Referensi ke respons audio yang dihasilkan oleh model. |
|
Chat |
Pesan obrolan permintaan yang berisi instruksi sistem yang memengaruhi bagaimana model akan menghasilkan respons penyelesaian obrolan. |
|
Chat |
Pesan obrolan permintaan yang mewakili output yang diminta dari alat yang dikonfigurasi. |
|
Chat |
Pesan obrolan permintaan yang mewakili input pengguna ke asisten. |
|
Chat |
Representasi pesan obrolan seperti yang diterima sebagai respons. |
|
Chat |
Deskripsi tujuan yang dimaksudkan dari pesan dalam interaksi penyelesaian obrolan. |
|
Completions |
Representasi cara di mana respons penyelesaian disimpulkan. |
|
Completions |
Representasi jumlah token yang diproses untuk permintaan penyelesaian. Hitungan mempertimbangkan semua token di seluruh perintah, pilihan, pilihan alternatif, generasi best_of, dan konsumen lainnya. |
|
Completions |
Perincian token yang digunakan dalam penyelesaian. |
|
Extra |
Mengontrol apa yang terjadi jika parameter tambahan, yang tidak ditentukan oleh REST API, diteruskan dalam payload permintaan JSON. |
|
Function |
Nama dan argumen fungsi yang harus dipanggil, seperti yang dihasilkan oleh model. |
|
Function |
Definisi fungsi yang ditentukan pemanggil yang dapat dipanggil penyelesaian obrolan sebagai respons terhadap input pengguna yang cocok. |
|
Prompt |
Perincian token yang digunakan dalam riwayat perintah/obrolan. |
AudioContentFormat
Representasi dari kemungkinan format audio untuk audio.
| Nilai | Deskripsi |
|---|---|
| wav |
Menentukan audio dalam format WAV. |
| mp3 |
Menentukan audio dalam format MP3. |
Azure.Core.Foundations.Error
Objek kesalahan.
| Nama | Jenis | Deskripsi |
|---|---|---|
| code |
string |
Salah satu sekumpulan kode kesalahan yang ditentukan server. |
| details |
Array detail tentang kesalahan tertentu yang menyebabkan kesalahan yang dilaporkan ini. |
|
| innererror |
Objek yang berisi informasi yang lebih spesifik daripada objek saat ini tentang kesalahan. |
|
| message |
string |
Representasi kesalahan yang dapat dibaca manusia. |
| target |
string |
Target kesalahan. |
Azure.Core.Foundations.ErrorResponse
Respons yang berisi detail kesalahan.
| Nama | Jenis | Deskripsi |
|---|---|---|
| error |
Objek kesalahan. |
Azure.Core.Foundations.InnerError
Objek yang berisi informasi yang lebih spesifik tentang kesalahan. Sesuai pedoman Azure REST API - https://aka.ms/AzureRestApiGuidelines#handling-errors.
| Nama | Jenis | Deskripsi |
|---|---|---|
| code |
string |
Salah satu sekumpulan kode kesalahan yang ditentukan server. |
| innererror |
Kesalahan dalam. |
ChatChoice
Representasi penyelesaian permintaan tunggal sebagai bagian dari permintaan penyelesaian obrolan secara keseluruhan.
Umumnya, pilihan n dihasilkan per prompt yang disediakan dengan nilai default 1.
Batas token dan pengaturan lainnya dapat membatasi jumlah pilihan yang dihasilkan.
| Nama | Jenis | Deskripsi |
|---|---|---|
| finish_reason |
Alasan bahwa pilihan penyelesaian obrolan ini menyelesaikan hasilnya. |
|
| index |
integer (int32) |
Indeks terurut yang terkait dengan pilihan penyelesaian obrolan ini. |
| message |
Pesan obrolan untuk permintaan penyelesaian obrolan tertentu. |
ChatCompletions
Representasi data respons dari permintaan penyelesaian obrolan. Penyelesaian mendukung berbagai tugas dan menghasilkan teks yang berlanjut dari atau "menyelesaikan" data permintaan yang disediakan.
| Nama | Jenis | Deskripsi |
|---|---|---|
| choices |
Kumpulan pilihan penyelesaian yang terkait dengan respons penyelesaian ini.
Umumnya, pilihan |
|
| created |
integer (unixtime) |
Tanda waktu pertama yang terkait dengan aktivitas pembuatan untuk respons penyelesaian ini, diwakili sebagai detik sejak awal epoch Unix 00:00 pada 1 Jan 1970. |
| id |
string |
Pengidentifikasi unik yang terkait dengan respons penyelesaian obrolan ini. |
| model |
string |
Model yang digunakan untuk penyelesaian obrolan. |
| object |
enum:
chat. |
Jenis objek respons, yang selalu |
| usage |
Informasi penggunaan untuk token yang diproses dan dihasilkan sebagai bagian dari operasi penyelesaian ini. |
ChatCompletionsAudio
Representasi audio yang dihasilkan oleh model.
| Nama | Jenis | Deskripsi |
|---|---|---|
| data |
string |
Data audio yang dikodekan Base64 |
| expires_at |
integer (unixtime) |
Tanda waktu Unix (dalam detik) tempat bagian audio kedaluwarsa dan tidak dapat dirujuk lagi oleh ID-nya dalam percakapan multi-giliran. |
| format |
Format konten audio. Jika format tidak disediakan, format akan cocok dengan format yang digunakan dalam permintaan audio input. |
|
| id |
string |
Pengidentifikasi unik untuk respons audio. Nilai ini dapat digunakan dalam pesan riwayat obrolan alih-alih meneruskan objek audio lengkap. |
| transcript |
string |
Transkrip file audio. |
ChatCompletionsModality
Modalitas yang diizinkan untuk digunakan model untuk respons penyelesaian obrolan.
| Nilai | Deskripsi |
|---|---|
| text |
Model hanya diizinkan untuk menghasilkan teks. |
| audio |
Model diizinkan untuk menghasilkan audio. |
ChatCompletionsOptions
Informasi konfigurasi untuk permintaan penyelesaian obrolan. Penyelesaian mendukung berbagai tugas dan menghasilkan teks yang berlanjut dari atau "menyelesaikan" data permintaan yang disediakan.
| Nama | Jenis | Nilai default | Deskripsi |
|---|---|---|---|
| frequency_penalty |
number (float) minimum: -2maximum: 2 |
0 |
Nilai yang memengaruhi probabilitas token yang dihasilkan muncul berdasarkan frekuensi kumulatifnya dalam teks yang dihasilkan. Nilai positif akan membuat token lebih kecil kemungkinannya muncul saat frekuensinya meningkat dan mengurangi kemungkinan model mengulangi pernyataan verbatim yang sama. Rentang yang didukung adalah [-2, 2]. |
| max_tokens |
integer (int32) minimum: 0 |
Jumlah maksimum token yang akan dihasilkan. |
|
| messages | ChatRequestMessage[]: |
Kumpulan pesan konteks yang terkait dengan permintaan penyelesaian obrolan ini. Penggunaan umum dimulai dengan pesan obrolan untuk peran Sistem yang memberikan instruksi untuk perilaku asisten, diikuti dengan pesan alternatif antara peran Pengguna dan Asisten. |
|
| modalities |
Modalitas yang diizinkan untuk digunakan model untuk respons penyelesaian obrolan. Modalitas default adalah |
||
| model |
string |
ID model AI tertentu untuk digunakan, jika lebih dari satu model tersedia di titik akhir. |
|
| presence_penalty |
number (float) minimum: -2maximum: 2 |
0 |
Nilai yang memengaruhi probabilitas token yang dihasilkan muncul berdasarkan kehadiran yang ada dalam teks yang dihasilkan. Nilai positif akan membuat token lebih kecil kemungkinannya muncul ketika sudah ada dan meningkatkan kemungkinan model untuk menghasilkan topik baru. Rentang yang didukung adalah [-2, 2]. |
| response_format | ChatCompletionsResponseFormat: |
Objek yang menentukan format yang harus dihasilkan model. Pengaturan ke Pengaturan ke
Penting: saat menggunakan mode JSON, Anda juga harus menginstruksikan model untuk menghasilkan JSON sendiri melalui sistem atau pesan pengguna. Tanpa ini, model dapat menghasilkan aliran spasi kosong yang tidak berujung sampai pembuatan mencapai batas token, yang mengakibatkan permintaan yang berjalan lama dan tampaknya "macet". Perhatikan juga bahwa konten pesan mungkin dipotong sebagian jika |
|
| seed |
integer (int64) |
Jika ditentukan, sistem akan melakukan upaya terbaik untuk mengambil sampel secara deterministik sehingga permintaan berulang dengan seed dan parameter yang sama harus mengembalikan hasil yang sama. Determinisme tidak dijamin. |
|
| stop |
string[] |
Kumpulan urutan tekstual yang akan mengakhiri pembuatan penyelesaian. |
|
| stream |
boolean |
Nilai yang menunjukkan apakah penyelesaian obrolan harus dialirkan untuk permintaan ini. |
|
| temperature |
number (float) minimum: 0maximum: 1 |
0.7 |
Suhu pengambilan sampel untuk digunakan yang mengontrol kreativitas yang jelas dari penyelesaian yang dihasilkan. Nilai yang lebih tinggi akan membuat output lebih acak sementara nilai yang lebih rendah akan membuat hasil lebih fokus dan deterministik. Tidak disarankan untuk memodifikasi suhu dan top_p untuk permintaan penyelesaian yang sama karena interaksi kedua pengaturan ini sulit diprediksi. Rentang yang didukung adalah [0, 1]. |
| tool_choice |
Jika ditentukan, model akan mengonfigurasi alat mana yang disediakan yang dapat digunakannya untuk respons penyelesaian obrolan. |
||
| tools |
Daftar alat yang mungkin diminta model untuk dipanggil. Saat ini, hanya fungsi yang didukung sebagai alat. Model dapat merespons dengan permintaan panggilan fungsi dan memberikan argumen input dalam format JSON untuk fungsi tersebut. |
||
| top_p |
number (float) minimum: 0maximum: 1 |
1 |
Alternatif untuk pengambilan sampel dengan suhu yang disebut pengambilan sampel nukleus. Nilai ini menyebabkan model mempertimbangkan hasil token dengan massa probabilitas yang disediakan. Sebagai contoh, nilai 0,15 hanya akan menyebabkan token yang terdiri dari 15% massa probabilitas teratas untuk dipertimbangkan. Tidak disarankan untuk memodifikasi suhu dan top_p untuk permintaan penyelesaian yang sama karena interaksi kedua pengaturan ini sulit diprediksi. Rentang yang didukung adalah [0, 1]. |
ChatCompletionsResponseFormatJsonObject
Format respons untuk Penyelesaian Obrolan yang membatasi respons untuk memancarkan objek JSON yang valid. Perhatikan bahwa untuk mengaktifkan mode JSON, beberapa model AI mungkin juga mengharuskan Anda menginstruksikan model untuk menghasilkan JSON melalui sistem atau pesan pengguna.
| Nama | Jenis | Deskripsi |
|---|---|---|
| type |
string:
json_object |
Jenis format respons yang digunakan untuk penyelesaian obrolan. |
ChatCompletionsResponseFormatJsonSchema
Format respons untuk Penyelesaian Obrolan yang membatasi respons untuk memancarkan objek JSON yang valid, dengan skema JSON yang ditentukan oleh pemanggil.
| Nama | Jenis | Deskripsi |
|---|---|---|
| json_schema |
Definisi skema JSON yang diperlukan dalam respons, dan metadata terkait. |
|
| type |
string:
json_schema |
Jenis format respons yang digunakan untuk penyelesaian obrolan. |
ChatCompletionsResponseFormatJsonSchemaDefinition
Definisi skema JSON yang diperlukan dalam respons, dan metadata terkait.
| Nama | Jenis | Nilai default | Deskripsi |
|---|---|---|---|
| description |
string |
Deskripsi format respons, digunakan oleh model AI untuk menentukan cara menghasilkan respons dalam format ini. |
|
| name |
string |
Nama format respons. Harus a-z, A-Z, 0-9, atau berisi garis bawah dan tanda hubung, dengan panjang maksimum 64. |
|
| schema |
Definisi skema JSON |
||
| strict |
boolean |
False |
Apakah akan mengaktifkan kepatuhan skema yang ketat saat menghasilkan output.
Jika diatur ke true, model akan selalu mengikuti skema yang tepat yang ditentukan di bidang |
ChatCompletionsResponseFormatText
Format respons untuk Penyelesaian Obrolan yang memancarkan respons teks. Ini adalah format respons default.
| Nama | Jenis | Deskripsi |
|---|---|---|
| type |
string:
text |
Jenis format respons yang digunakan untuk penyelesaian obrolan. |
ChatCompletionsToolCall
Panggilan alat fungsi yang diminta oleh model AI.
| Nama | Jenis | Deskripsi |
|---|---|---|
| function |
Detail panggilan fungsi yang diminta oleh model AI. |
|
| id |
string |
ID panggilan alat. |
| type |
enum:
function |
Jenis panggilan alat. Saat ini, hanya |
ChatCompletionsToolDefinition
Definisi alat penyelesaian obrolan yang dapat memanggil fungsi.
| Nama | Jenis | Deskripsi |
|---|---|---|
| function |
Detail definisi fungsi untuk alat fungsi. |
|
| type |
enum:
function |
Jenis alat. Saat ini, hanya |
ChatRequestAssistantMessage
Pesan obrolan permintaan yang mewakili respons atau tindakan dari asisten.
| Nama | Jenis | Deskripsi |
|---|---|---|
| audio |
Audio yang dihasilkan oleh respons sebelumnya dalam percakapan multi-giliran. |
|
| content |
string |
Konten pesan. |
| role |
string:
assistant |
Peran obrolan yang terkait dengan pesan ini. |
| tool_calls |
Panggilan alat yang harus diselesaikan dan outputnya ditambahkan ke pesan input berikutnya untuk permintaan penyelesaian obrolan untuk diselesaikan seperti yang dikonfigurasi. |
ChatRequestAudioReference
Referensi ke respons audio yang dihasilkan oleh model.
| Nama | Jenis | Deskripsi |
|---|---|---|
| id |
string |
Pengidentifikasi unik untuk respons audio. Nilai ini sesuai dengan id penyelesaian audio sebelumnya. |
ChatRequestSystemMessage
Pesan obrolan permintaan yang berisi instruksi sistem yang memengaruhi bagaimana model akan menghasilkan respons penyelesaian obrolan.
| Nama | Jenis | Deskripsi |
|---|---|---|
| content |
string |
Isi pesan sistem. |
| role |
string:
system |
Peran obrolan yang terkait dengan pesan ini. |
ChatRequestToolMessage
Pesan obrolan permintaan yang mewakili output yang diminta dari alat yang dikonfigurasi.
| Nama | Jenis | Deskripsi |
|---|---|---|
| content |
string |
Konten pesan. |
| role |
string:
tool |
Peran obrolan yang terkait dengan pesan ini. |
| tool_call_id |
string |
ID panggilan alat diselesaikan oleh konten yang disediakan. |
ChatRequestUserMessage
Pesan obrolan permintaan yang mewakili input pengguna ke asisten.
| Nama | Jenis | Deskripsi |
|---|---|---|
| content |
Konten pesan pengguna, dengan jenis input yang tersedia bervariasi menurut model yang dipilih. |
|
| role |
string:
user |
Peran obrolan yang terkait dengan pesan ini. |
ChatResponseMessage
Representasi pesan obrolan seperti yang diterima sebagai respons.
| Nama | Jenis | Deskripsi |
|---|---|---|
| audio |
Audio yang dihasilkan oleh model sebagai respons terhadap pesan jika model dikonfigurasi untuk menghasilkan audio. |
|
| content |
string |
Konten pesan. |
| role |
Peran obrolan yang terkait dengan pesan. |
|
| tool_calls |
Panggilan alat yang harus diselesaikan dan outputnya ditambahkan ke pesan input berikutnya untuk permintaan penyelesaian obrolan untuk diselesaikan seperti yang dikonfigurasi. |
ChatRole
Deskripsi tujuan yang dimaksudkan dari pesan dalam interaksi penyelesaian obrolan.
| Nilai | Deskripsi |
|---|---|
| system |
Peran yang menginstruksikan atau mengatur perilaku asisten. |
| developer |
Peran yang memberikan instruksi untuk model yang diprioritaskan di depan pesan pengguna. |
| user |
Peran yang menyediakan input untuk penyelesaian obrolan. |
| assistant |
Peran yang memberikan respons terhadap input yang diinstruksikan sistem dan diminta pengguna. |
| tool |
Peran yang mewakili aktivitas alat ekstensi dalam operasi penyelesaian obrolan. |
CompletionsFinishReason
Representasi cara di mana respons penyelesaian disimpulkan.
| Nilai | Deskripsi |
|---|---|
| stop |
Penyelesaian berakhir secara normal dan mencapai akhir pembuatan token. |
| length |
Penyelesaian batas token yang tersedia habis sebelum pembuatan dapat diselesaikan. |
| content_filter |
Penyelesaian menghasilkan respons yang diidentifikasi sebagai kebijakan moderasi konten yang berpotensi sensitif. |
| tool_calls |
Penyelesaian berakhir dengan model memanggil alat yang disediakan untuk output. |
CompletionsUsage
Representasi jumlah token yang diproses untuk permintaan penyelesaian. Hitungan mempertimbangkan semua token di seluruh perintah, pilihan, pilihan alternatif, generasi best_of, dan konsumen lainnya.
| Nama | Jenis | Deskripsi |
|---|---|---|
| completion_tokens |
integer (int32) |
Jumlah token yang dihasilkan di semua emisi penyelesaian. |
| completion_tokens_details |
Perincian token yang digunakan dalam penyelesaian. |
|
| prompt_tokens |
integer (int32) |
Jumlah token dalam permintaan yang disediakan untuk permintaan penyelesaian. |
| prompt_tokens_details |
Perincian token yang digunakan dalam riwayat perintah/obrolan. |
|
| total_tokens |
integer (int32) |
Jumlah total token yang diproses untuk permintaan dan respons penyelesaian. |
CompletionsUsageDetails
Perincian token yang digunakan dalam penyelesaian.
| Nama | Jenis | Deskripsi |
|---|---|---|
| audio_tokens |
integer (int32) |
Jumlah token yang sesuai dengan input audio. |
| total_tokens |
integer (int32) |
Jumlah total token yang diproses untuk permintaan dan respons penyelesaian. |
ExtraParameters
Mengontrol apa yang terjadi jika parameter tambahan, yang tidak ditentukan oleh REST API, diteruskan dalam payload permintaan JSON.
| Nilai | Deskripsi |
|---|---|
| error |
Layanan akan melakukan kesalahan jika mendeteksi parameter tambahan dalam payload permintaan. Ini adalah default layanan. |
| drop |
Layanan akan mengabaikan (menghilangkan) parameter tambahan dalam payload permintaan. Ini hanya akan meneruskan parameter yang diketahui ke model AI back-end. |
| pass-through |
Layanan ini akan meneruskan parameter tambahan ke model AI back-end. |
FunctionCall
Nama dan argumen fungsi yang harus dipanggil, seperti yang dihasilkan oleh model.
| Nama | Jenis | Deskripsi |
|---|---|---|
| arguments |
string |
Argumen untuk memanggil fungsi dengan, seperti yang dihasilkan oleh model dalam format JSON. Perhatikan bahwa model tidak selalu menghasilkan JSON yang valid, dan mungkin berhalusinasi parameter yang tidak ditentukan oleh skema fungsi Anda. Validasi argumen dalam kode Anda sebelum memanggil fungsi Anda. |
| name |
string |
Nama fungsi yang akan dipanggil. |
FunctionDefinition
Definisi fungsi yang ditentukan pemanggil yang dapat dipanggil penyelesaian obrolan sebagai respons terhadap input pengguna yang cocok.
| Nama | Jenis | Deskripsi |
|---|---|---|
| description |
string |
Deskripsi tentang apa yang dilakukan fungsi. Model akan menggunakan deskripsi ini saat memilih fungsi dan menginterpretasikan parameternya. |
| name |
string |
Nama fungsi yang akan dipanggil. |
| parameters |
Parameter yang diterima fungsi, dijelaskan sebagai objek Skema JSON. |
PromptUsageDetails
Perincian token yang digunakan dalam riwayat perintah/obrolan.
| Nama | Jenis | Deskripsi |
|---|---|---|
| audio_tokens |
integer (int32) |
Jumlah token yang sesuai dengan input audio. |
| cached_tokens |
integer (int32) |
Jumlah total token yang di-cache. |