Notatka
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Ten artykuł zawiera szczegóły dotyczące endpointów REST API inferencyjnego dla Azure OpenAI.
Specyfikacje interfejsu API
Zarządzanie i interakcja z modelami i zasobami Azure OpenAI podzielone są na trzy główne powierzchnie API:
- Płaszczyzna sterowania
- Płaszczyzna danych – autorowanie
- Płaszczyzna danych – wnioskowanie
Każda powierzchnia/specyfikacja API zawiera inny zestaw możliwości Azure OpenAI. Każde API ma własny, unikalny zestaw wersji podglądowych oraz stabilnych/ogólnie dostępnych (GA) wersji API. Obecnie premierowe premiery mają tendencję do miesięcznego rytmu.
Ważna
Obecnie pojawiło się nowe API do podglądu wnioskowania. Dowiedz się więcej w naszym przewodniku po cyklu życia API.
| API | Najnowsza wersja zapowiedziowa | Najnowsza wersja GA | Specifications | Opis |
|---|---|---|---|---|
| Płaszczyzna sterowania | 2025-07-01-preview |
2025-06-01 |
Pliki specyfikacji | API płaszczyzny sterowania jest wykorzystywane do operacji takich jak tworzenie zasobów, wdrażanie modeli oraz inne zadania zarządzania zasobami na wyższym poziomie. Płaszczyzna sterowania reguluje również możliwości takie jak Azure Resource Manager, Bicep, Terraform i Azure CLI. |
| Płaszczyzna danych | v1 preview |
v1 |
Pliki specyfikacji | API płaszczyzny danych kontroluje operacje wnioskowania i autorstwa. |
Authentication
Azure OpenAI oferuje dwie metody uwierzytelniania. Możesz użyć kluczy API lub Microsoft Entra ID.
Uwierzytelnianie klucza API: W przypadku tego typu uwierzytelniania wszystkie żądania API muszą zawierać klucz API w nagłówku
api-keyHTTP. Quickstart zawiera wskazówki, jak wykonywać połączenia z tego typu uwierzytelnianiem.Microsoft Entra ID uwierzytelnianie: Możesz uwierzytelnić wywołanie API za pomocą tokena Microsoft Entra. Tokeny uwierzytelniające są zawarte w żądaniu jako nagłówek
Authorization. Dostarczony token musi być poprzedzonyBearerprzez , na przykładBearer YOUR_AUTH_TOKEN. Możesz przeczytać nasz przewodnik instrukcyjny dotyczący uwierzytelniania za pomocą Microsoft Entra ID.
Wersjonowanie REST API
API usług są wersjonowane za pomocą parametru api-version zapytania. Wszystkie wersje mają strukturę dat YYYY-MM-DD. Przykład:
POST https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/chat/completions?api-version=2024-06-01
Wnioskowanie na płaszczyźnie danych
Reszta artykułu obejmuje wersję podglądową 2025-04-01-preview specyfikacji wnioskowania Azure płaszczyzny danych OpenAI.
Jeśli szukasz dokumentacji najnowszej wersji interfejsu API ga, zapoznaj się z najnowszym interfejsem API wnioskowania płaszczyzny danych ogólnie dostępnego.
Ukończenia - Stwórz
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview
Tworzy uzupełnienie dla podanego promptu, parametrów i wybranego modelu.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator wdrożenia | ścieżka | Tak | ciąg | |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| najlepsze z | liczba całkowita | Generuje best_of ukończenia po stronie serwera i zwraca "najlepsze" (to o najwyższym prawdopodobieństwie logu na token). Wyników nie można transmitować w streamingu.Gdy używamy z , nbest_ofkontroluje liczbę kandydatów na uzupełnienia i określa, n ile z nich best_of musi być większe niż n.Uwaga: Ponieważ ten parametr generuje wiele ukończeń, może szybko pochłonąć Twój limit tokenów. Używaj ostrożnie i upewnij się, że masz rozsądne ustawienia dla max_tokens i stop. |
No | 1 |
| echo | boolean | Powtórz prompt oprócz zakończenia | No | Nieprawda |
| frequency_penalty | number | Liczba między -2,0 a 2,0. Wartości dodatnie karzą nowe tokeny na podstawie ich dotychczasowej częstotliwości w tekście, zmniejszając prawdopodobieństwo powtórzenia tej samej linii dosłownie. | No | 0 |
| logit_bias | obiekt | Zmodyfikuj prawdopodobieństwo pojawienia się określonych żetonów w finale. Akceptuje obiekt JSON, który mapuje tokeny (określone przez ich identyfikator tokena w tokenizatorze GPT) na powiązaną wartość bias od -100 do 100. Matematycznie to bias jest dodawane do logitów generowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości między -1 a 1 powinny zmniejszać lub zwiększać prawdopodobieństwo selekcji; wartości takie jak -100 czy 100 powinny skutkować banem lub wyłącznym wyborem odpowiedniego tokena. Na przykład możesz przepuścić {"50256": -100} , aby zapobiec generowaniu tokena <|endoftext|> . |
No | Żadne |
| logprobs | liczba całkowita | Uwzględnij prawdopodobieństwa logiczne dla najbardziej logprobs prawdopodobnych tokenów wyjściowych, a także wybranych tokenów. Na przykład, jeśli logprobs wynosi 5, API zwraca listę 5 najbardziej prawdopodobnych tokenów. API zawsze zwraca , logprob z tokena próbkowanym, więc w odpowiedzi może być więcej logprobs+1 elementów.Maksymalna wartość dla logprobs to 5. |
No | Żadne |
| max_tokens | liczba całkowita | Maksymalna liczba tokenów, które można wygenerować podczas zakończenia. Liczba tokenów w twoim promptie plus max_tokens nie może przekroczyć długości kontekstu modelu. |
No | 16 |
| n | liczba całkowita | Ile ukończeń wygenerować dla każdego promptu. Uwaga: Ponieważ ten parametr generuje wiele ukończeń, może szybko pochłonąć Twój limit tokenów. Używaj ostrożnie i upewnij się, że masz rozsądne ustawienia dla max_tokens i stop. |
No | 1 |
| kara za obecność | number | Liczba między -2,0 a 2,0. Wartości dodatnie karzą nowe tokeny w zależności od tego, czy pojawiają się w tekście, zwiększając prawdopodobieństwo modelu do poruszania nowych tematów. | No | 0 |
| monit | ciąg lub tablica | Prompt do generowania uzupełnień zakodowanych jako ciąg znaków, tablica łańcuchów, tablica tokenów lub tablica tokenów. Należy zauważyć, że <|endoftext|> to separator dokumentów, który model widzi podczas treningu, więc jeśli prompt nie jest określony, model generuje się tak, jakby od początku nowego dokumentu. |
Tak | |
| seed | liczba całkowita | Jeśli jest to określone, nasz system podejmuje najlepsze starania, aby próbkować deterministyczne, tak aby powtarzające się żądania z tymi samymi seed parametrami i powinny zwracać ten sam wynik.Determinizm nie jest gwarantowany i powinieneś odwołać się do parametru system_fingerprint odpowiedzi, aby monitorować zmiany w backendzie. |
No | |
| stop | ciąg lub tablica | Do czterech sekwencji, w których API przestaje generować kolejne tokeny. Zwrócony tekst nie zawiera sekwencji stop. | No | |
| odtwarzać strumieniowo | boolean | Czy odtworzyć częściowy postęp. Jeśli są ustawione, tokeny są wysyłane jako zdarzenia wysyłane tylko na serwer z danymi, gdy tylko stają się dostępne, a strumień kończy się wiadomością data: [DONE] .
Przykład Python kod. |
No | Nieprawda |
| Sufiks | ciąg | Przyrostek pojawiający się po uzupełnieniu wstawionego tekstu. Ten parametr jest obsługiwany tylko dla gpt-3.5-turbo-instruct. |
No | Żadne |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, jak 0,8, sprawiają, że wynik jest bardziej losowy, podczas gdy niższe, jak 0,2, jest bardziej skupiony i deterministyczny. Zazwyczaj zalecamy modyfikację tego lub top_p nie obu tych rzeczy. |
No | 1 |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy modyfikację tego lub temperature nie obu tych rzeczy. |
No | 1 |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który pomaga monitorować i wykrywać nadużycia. |
No |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | createCompletionResponse |
Kod statusu: domyślny
Opis: Usługa niedostępna
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | errorResponse |
Examples
Przykład
Tworzy uzupełnienie dla podanego promptu, parametrów i wybranego modelu.
POST https://{endpoint}/openai/deployments/{deployment-id}/completions?api-version=2025-04-01-preview
{
"prompt": [
"tell me a joke about mango"
],
"max_tokens": 32,
"temperature": 1.0,
"n": 1
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "cmpl-7QmVI15qgYVllxK0FtxVGG6ywfzaq",
"created": 1686617332,
"choices": [
{
"text": "es\n\nWhat do you call a mango who's in charge?\n\nThe head mango.",
"index": 0,
"finish_reason": "stop",
"logprobs": null
}
],
"usage": {
"completion_tokens": 20,
"prompt_tokens": 6,
"total_tokens": 26
}
}
}
Osadzenia - Utwórz
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview
Uzyskaj reprezentację wektorową danego wejścia, którą łatwo wykorzystają modele i algorytmy uczenia maszynowego.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator wdrożenia | ścieżka | Tak | ciąg | ID wdrożenia modelu, który został wdrożony. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| wymiary | liczba całkowita | Liczba wymiarów, jakie powinny mieć powstałe osadzenia wyjściowe. Obsługiwane tylko w text-embedding-3 modelach i późniejszych. |
No | |
| encoding_format | ciąg | Format, w którym zwraca się osadzenia. Może być albo albo floatbase64. Domyślnie przyjmuje .float |
No | |
| dane wejściowe | ciąg lub tablica | Wprowadzanie tekstu do osadzenia, kodowane jako ciąg lub tablica tokenów. Aby osadzić wiele wejść w jednym żądaniu, należy przekazać tablicę łańcuchów lub tablicę tablic tokenów. Dane wejściowe nie mogą przekraczać maksymalnej liczby tokenów wejściowych dla modelu (8 192 tokenów dla text-embedding-ada-002), nie może być pustym ciągiem tekstowym, a każda tablica musi mieć co najmniej 2 048 wymiarów. Oprócz limitu tokenu dla danych wejściowych wszystkie modele osadzania wymuszają maksymalnie 300 000 tokenów sumowanych we wszystkich danych wejściowych w jednym żądaniu. |
Tak | |
| typ_wprowadzenia | ciąg | Typ wyszukiwania osadzonego wejściowego do wykorzystania | No | |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który może pomóc w monitorowaniu i wykrywaniu nadużyć. | No |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | obiekt |
Examples
Przykład
Zwróć osadzenia dla danego promptu.
POST https://{endpoint}/openai/deployments/{deployment-id}/embeddings?api-version=2025-04-01-preview
{
"input": [
"this is a test"
]
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"data": [
{
"index": 0,
"embedding": [
-0.012838088,
-0.007421397,
-0.017617522,
-0.028278312,
-0.018666342,
0.01737855,
-0.01821495,
-0.006950092,
-0.009937238,
-0.038580645,
0.010674067,
0.02412286,
-0.013647936,
0.013189907,
0.0021125758,
0.012406612,
0.020790534,
0.00074595667,
0.008397198,
-0.00535031,
0.008968075,
0.014351576,
-0.014086051,
0.015055214,
-0.022211088,
-0.025198232,
0.0065186154,
-0.036350243,
0.009180495,
-0.009698266,
0.009446018,
-0.008463579,
-0.0020113448
]
}
],
"usage": {
"prompt_tokens": 4,
"total_tokens": 4
}
}
}
Ukończenie czatu - Stwórz
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
Tworzy zakończenie wiadomości czatu
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator wdrożenia | ścieżka | Tak | ciąg | |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| audio | obiekt | Parametry wyjścia audio. Wymagane, gdy żądane jest wyjście audio z .modalities: ["audio"] |
No | |
| Format └─ | wyliczenie | Określa format wyjściowego dźwięku. Musi być jednym z wav, mp3, flac, opus, lub pcm16. Możliwe wartości: wav, mp3, flac, , opuspcm16 |
No | |
| └─ głos | wyliczenie | Określa typ głosu. Głosy wspierane to alloy, echo, fable, onyx, nova, oraz .shimmerMożliwe wartości: alloy, echo, fable, , onyx, nova, shimmer |
No | |
| data_sources | macierz | Wpisy konfiguracyjne dla rozszerzeń czatu Azure OpenAI, które je używają. Ta dodatkowa specyfikacja jest kompatybilna tylko z Azure OpenAI. |
No | |
| frequency_penalty | number | Liczba między -2,0 a 2,0. Wartości dodatnie karzą nowe tokeny na podstawie ich dotychczasowej częstotliwości w tekście, zmniejszając prawdopodobieństwo powtórzenia tej samej linii dosłownie. |
No | 0 |
| function_call | string lub chatCompletionFunctionCallOption | Wycofane na rzecz tool_choice.Kontroluje, która (jeśli w ogóle) funkcja jest wywoływana przez model. none oznacza to, że model nie wywołuje funkcji, lecz generuje wiadomość.auto oznacza to, że model może wybrać między generowaniem wiadomości a wywołaniem funkcji.Określenie konkretnej funkcji przez {"name": "my_function"} wymusza wywołanie tej funkcji przez model.none jest domyślnym, gdy nie ma żadnych funkcji.
auto jest domyślnym, jeśli funkcje są obecne. |
No | |
| functions | macierz | Wycofane na rzecz tools.Lista funkcji, dla których model może generować wejścia JSON. |
No | |
| logit_bias | obiekt | Zmodyfikuj prawdopodobieństwo pojawienia się określonych żetonów w finale. Akceptuje obiekt JSON, który mapuje tokeny (określone przez ich identyfikator tokena w tokenizerze) na przypisaną wartość bias od -100 do 100. Matematycznie to bias jest dodawane do logitów generowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości między -1 a 1 powinny zmniejszać lub zwiększać prawdopodobieństwo selekcji; wartości takie jak -100 czy 100 powinny skutkować banem lub wyłącznym wyborem odpowiedniego tokena. |
No | Żadne |
| logprobs | boolean | Czy zwracać logarytmiczne prawdopodobieństwa tokenów wyjściowych, czy nie. Jeśli jest prawdziwa, zwraca logarytmiczne prawdopodobieństwa każdego tokena wyjściowego zwróconego w .contentmessage |
No | Nieprawda |
| max_completion_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować dla zakończenia, w tym widocznych tokenów wyjściowych i tokenów rozumowania. | No | |
| max_tokens | liczba całkowita | Maksymalna liczba tokenów, które można wygenerować podczas zakończenia czatu. Całkowita długość tokenów wejściowych i wygenerowanych jest ograniczona przez długość kontekstu modelu. |
No | |
| messages | macierz | Lista wiadomości składających się na dotychczasową rozmowę. Przykład Python kod. | Tak | |
| metadane | obiekt | Tagi i wartości definiowane przez dewelopera używane do filtrowania zakończeń w pulpicie z przechowywanymi kompletacjami. | No | |
| Sposoby | ChatCompletionModalities | Typy wyników, które model chciałby wygenerować dla tego żądania. Większość modeli potrafi generować tekst, co jest domyślne: ["text"]Model ten gpt-4o-audio-preview może być również używany do generowania dźwięku. Aby poprosić ten model o generowanie zarówno odpowiedzi tekstowych, jak i audio, możesz użyć:["text", "audio"] |
No | |
| n | liczba całkowita | Ile opcji uzupełniania czatu wygenerować dla każdej wiadomości wejściowej. Opłata będzie zależana od liczby wygenerowanych żetonów we wszystkich opcjach. Dbaj n o 1 minimalizację kosztów. |
No | 1 |
| wywołania_narzędzia_równoległe | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas użycia narzędzia. | No | True |
| przewidywanie | PredictionContent | Konfiguracja dla przewidywanego wyjścia, która może znacznie poprawić czas reakcji, gdy duże części odpowiedzi modelu są znane z wyprzedzeniem. Najczęściej dzieje się to przy regeneracji pliku z jedynie drobnymi zmianami w większości treści. | No | |
| kara za obecność | number | Liczba między -2,0 a 2,0. Wartości dodatnie karzą nowe tokeny w zależności od tego, czy pojawiają się w tekście, zwiększając prawdopodobieństwo modelu do poruszania nowych tematów. |
No | 0 |
| wysiłek rozumowania | wyliczenie |
Tylko modele O1 Ogranicza wysiłek związany z rozumowaniem dla modeli rozumowania. Obecnie obsługiwane wartości to low, medium, oraz high. Zmniejszenie wysiłku rozumowania może skutkować szybszymi odpowiedziami i mniejszą liczbą tokenów używanych do rozumowania w odpowiedzi.Możliwe wartości: low, medium, high |
No | |
| format_odpowiedzi | ResponseFormatText lub ResponseFormatJsonObject lub ResponseFormatJsonSchema | Obiekt określający format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4o mini, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo nowszymi od gpt-3.5-turbo-1106.Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które gwarantują, że model odpowiada dostarczonemu schematowi JSON.Ustawienie trybu { "type": "json_object" } JSON, który gwarantuje, że generowany przez model komunikat jest poprawny w JSON.Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| seed | liczba całkowita | Ta funkcja jest w fazie beta. Jeśli jest to określone, nasz system podejmuje najlepsze starania, aby próbkować deterministyczne, tak aby powtarzające się żądania z tymi samymi seed parametrami i powinny zwracać ten sam wynik.Determinizm nie jest gwarantowany i powinieneś odwołać się do parametru system_fingerprint odpowiedzi, aby monitorować zmiany w backendzie. |
No | |
| stop | ciąg lub tablica | Do 4 sekwencji, w których API przestaje generować kolejne tokeny. |
No | |
| przechowywać | boolean | Czy przechowywać wynik tego żądania zakończenia czatu do wykorzystania w naszych produktach do destylacji lub oceny modelu. | No | |
| odtwarzać strumieniowo | boolean | Jeśli jest ustawiona, wysyłane są częściowe delta wiadomości, jak w ChatGPT. Tokeny są wysyłane jako zdarzenia wysyłane wyłącznie przez serwer za pośrednictwem danych, gdy tylko stają się dostępne, a strumień kończy się wiadomością data: [DONE] .
Przykład Python kod. |
No | Nieprawda |
| stream_options | chatCompletionStreamOptions | Opcje odpowiedzi na streaming. Ustawiam to tylko wtedy, gdy ustawiasz stream: true. |
No | Żadne |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, jak 0,8, sprawiają, że wynik jest bardziej losowy, podczas gdy niższe, jak 0,2, jest bardziej skupiony i deterministyczny. Zazwyczaj zalecamy modyfikację tego lub top_p nie obu tych rzeczy. |
No | 1 |
| tool_choice | chatCompletionToolChoiceOption | Kontroluje, które (jeśli w ogóle) narzędzie jest wywoływane przez model.
none Oznacza to, że model nie wywołuje żadnego narzędzia, lecz generuje komunikat.
auto oznacza to, że model może wybrać między generowaniem wiadomości a wywołaniem jednego lub więcej narzędzi.
required oznacza, że model musi wywołać jedno lub więcej narzędzi. Określenie konkretnego narzędzia via {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.
none jest domyślne, gdy nie ma narzędzi.
auto jest domyślne, jeśli narzędzia są obecne. |
No | |
| Narzędzia | macierz | Lista narzędzi, które model może wywołać. Obecnie obsługiwane są tylko funkcje jako narzędzie. Użyj tego, aby uzyskać listę funkcji, dla których model może generować wejścia JSON. Obsługiwanych jest maksymalnie 128 funkcji. |
No | |
| top_logprobs | liczba całkowita | Liczba całkowita od 0 do 20 określająca liczbę najbardziej prawdopodobnych tokenów do zwrócenia na każdej pozycji tokena, z przypisanym logarytmem prawdopodobieństwa.
logprobs musi być ustawione na , true jeśli ten parametr jest używany. |
No | |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy modyfikację tego lub temperature nie obu tych rzeczy. |
No | 1 |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który pomaga monitorować i wykrywać nadużycia. |
No | |
| user_security_context | userSecurityContext | Kontekst bezpieczeństwa użytkownika zawiera kilka parametrów opisujących samą aplikację AI oraz użytkownika końcowego, który z nią wchodzi. Te obszary pomagają zespołom operacji bezpieczeństwa badać i ograniczać incydenty bezpieczeństwa, oferując kompleksowe podejście do ochrony aplikacji AI. Dowiedz się więcej o ochronie aplikacji AI za pomocą Microsoft Defender dla Chmury. | No |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | obiekt |
Kod statusu: domyślny
Opis: Usługa niedostępna
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | errorResponse |
Examples
Przykład
Tworzy uzupełnienie dla podanego promptu, parametrów i wybranego modelu.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "system",
"content": "you are a helpful assistant that talks like a pirate"
},
{
"role": "user",
"content": "can you tell me how to care for a parrot?"
}
]
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Ahoy matey! So ye be wantin' to care for a fine squawkin' parrot, eh? Well, shiver me timbers, let ol' Cap'n Assistant share some wisdom with ye! Here be the steps to keepin' yer parrot happy 'n healthy:\n\n1. Secure a sturdy cage: Yer parrot be needin' a comfortable place to lay anchor! Be sure ye get a sturdy cage, at least double the size of the bird's wingspan, with enough space to spread their wings, yarrrr!\n\n2. Perches 'n toys: Aye, parrots need perches of different sizes, shapes, 'n textures to keep their feet healthy. Also, a few toys be helpin' to keep them entertained 'n their minds stimulated, arrrh!\n\n3. Proper grub: Feed yer feathered friend a balanced diet of high-quality pellets, fruits, 'n veggies to keep 'em strong 'n healthy. Give 'em fresh water every day, or ye\u00e2\u20ac\u2122ll have a scurvy bird on yer hands!\n\n4. Cleanliness: Swab their cage deck! Clean their cage on a regular basis: fresh water 'n food daily, the floor every couple of days, 'n a thorough scrubbing ev'ry few weeks, so the bird be livin' in a tidy haven, arrhh!\n\n5. Socialize 'n train: Parrots be a sociable lot, arrr! Exercise 'n interact with 'em daily to create a bond 'n maintain their mental 'n physical health. Train 'em with positive reinforcement, treat 'em kindly, yarrr!\n\n6. Proper rest: Yer parrot be needin' \u00e2\u20ac\u2122bout 10-12 hours o' sleep each night. Cover their cage 'n let them slumber in a dim, quiet quarter for a proper night's rest, ye scallywag!\n\n7. Keep a weather eye open for illness: Birds be hidin' their ailments, arrr! Be watchful for signs of sickness, such as lethargy, loss of appetite, puffin' up, or change in droppings, and make haste to a vet if need be.\n\n8. Provide fresh air 'n avoid toxins: Parrots be sensitive to draft and pollutants. Keep yer quarters well ventilated, but no drafts, arrr! Be mindful of toxins like Teflon fumes, candles, or air fresheners.\n\nSo there ye have it, me hearty! With proper care 'n commitment, yer parrot will be squawkin' \"Yo-ho-ho\" for many years to come! Good luck, sailor, and may the wind be at yer back!"
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Przykład
Tworzy kompletację na podstawie danych Azure Search oraz przypisanej przez system tożsamości zarządzanej.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"authentication": {
"type": "system_assigned_managed_identity"
}
}
}
]
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Przykład
Tworzy kompletację na podstawie danych wektorowych obrazów z Azure Search.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"index_name": "{index name}",
"query_type": "vector",
"fields_mapping": {
"image_vector_fields": [
"image_vector"
]
},
"authentication": {
"type": "api_key",
"key": "{api key}"
}
}
}
]
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion."
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Przykład
Tworzy uzupełnienie na podstawie danych wektorowych Azure Search, poprzedniej wiadomości asystenta oraz przypisanej przez użytkownika tożsamości zarządzanej.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a cat?"
},
{
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"intent": "cat care"
}
},
{
"role": "user",
"content": "how about dog?"
}
],
"data_sources": [
{
"type": "azure_search",
"parameters": {
"endpoint": "https://your-search-endpoint.search.windows.net/",
"authentication": {
"type": "user_assigned_managed_identity",
"managed_identity_resource_id": "/subscriptions/{subscription-id}/resourceGroups/{resource-group}/providers/Microsoft.ManagedIdentity/userAssignedIdentities/{resource-name}"
},
"index_name": "{index name}",
"query_type": "vector",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"in_scope": true,
"top_n_documents": 5,
"strictness": 3,
"role_information": "You are an AI assistant that helps people find information.",
"fields_mapping": {
"content_fields_separator": "\\n",
"content_fields": [
"content"
],
"filepath_field": "filepath",
"title_field": "title",
"url_field": "url",
"vector_fields": [
"contentvector"
]
}
}
}
]
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content 2.",
"title": "Citation Title 2",
"filepath": "contoso2.txt",
"url": "https://contoso.blob.windows.net/container/contoso2.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Przykład
Tworzy kompletację dla dostarczonej bazy Azure Cosmos DB.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "azure_cosmos_db",
"parameters": {
"authentication": {
"type": "connection_string",
"connection_string": "mongodb+srv://rawantest:{password}$@{cluster-name}.mongocluster.cosmos.azure.com/?tls=true&authMechanism=SCRAM-SHA-256&retrywrites=false&maxIdleTimeMS=120000"
},
"database_name": "vectordb",
"container_name": "azuredocs",
"index_name": "azuredocindex",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"content_fields": [
"content"
],
"vector_fields": [
"contentvector"
]
}
}
}
]
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Przykład
Tworzy kompletację dla dostarczonego pliku Mongo DB.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "mongo_db",
"parameters": {
"authentication": {
"type": "username_and_password",
"username": "<username>",
"password": "<password>"
},
"endpoint": "<endpoint_name>",
"app_name": "<application name>",
"database_name": "sampledb",
"collection_name": "samplecollection",
"index_name": "sampleindex",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"content_fields": [
"content"
],
"vector_fields": [
"contentvector"
]
}
}
}
]
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Przykład
Tworzy uzupełnienie dla dostarczonego Elasticsearch.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "elasticsearch",
"parameters": {
"endpoint": "https://your-elasticsearch-endpoint.eastus.azurecontainer.io",
"index_name": "{index name}",
"authentication": {
"type": "key_and_key_id",
"key": "{key}",
"key_id": "{key id}"
}
}
}
]
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Przykład
Tworzy kompletację dla dostarczonego zasobu Pinecone.
POST https://{endpoint}/openai/deployments/{deployment-id}/chat/completions?api-version=2025-04-01-preview
{
"messages": [
{
"role": "user",
"content": "can you tell me how to care for a dog?"
}
],
"data_sources": [
{
"type": "pinecone",
"parameters": {
"authentication": {
"type": "api_key",
"key": "{api key}"
},
"environment": "{environment name}",
"index_name": "{index name}",
"embedding_dependency": {
"type": "deployment_name",
"deployment_name": "{embedding deployment name}"
},
"fields_mapping": {
"title_field": "title",
"url_field": "url",
"filepath_field": "filepath",
"content_fields": [
"content"
],
"content_fields_separator": "\n"
}
}
}
]
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "chatcmpl-7R1nGnsXO8n4oi9UPz2f3UHdgAYMn",
"created": 1686676106,
"choices": [
{
"index": 0,
"finish_reason": "stop",
"message": {
"role": "assistant",
"content": "Content of the completion [doc1].",
"context": {
"citations": [
{
"content": "Citation content.",
"title": "Citation Title",
"filepath": "contoso.txt",
"url": "https://contoso.blob.windows.net/container/contoso.txt",
"chunk_id": "0"
}
],
"intent": "dog care"
}
}
}
],
"usage": {
"completion_tokens": 557,
"prompt_tokens": 33,
"total_tokens": 590
}
}
}
Transkrypcje - Stwórz
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
Transkrybuje dźwięk do języka wejściowego.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator wdrożenia | ścieżka | Tak | ciąg | |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: dane wielu części/formularzu
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| model | ciąg | Identyfikacja modelu, którego należy użyć. Opcje to gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, whisper-1, oraz .gpt-4o-transcribe-diarize |
Tak | |
| plik | ciąg | Plik audio wymaga transkrypcji. | Tak | |
| język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 poprawia dokładność i opóźnienia. | No | |
| monit | ciąg | Opcjonalny tekst wskazujący styl modelu lub kontynuujący wcześniejszy segment audio. Prompt powinien odpowiadać językowi dźwięku. | No | |
| format_odpowiedzi | audioResponseFormat | Definiuje format wyjścia. | No | |
| temperatura | number | Temperatura próbkowania, między 0 a 1. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. Jeśli ustawimy ją na 0, model wykorzystuje logarytmiczne prawdopodobieństwo do automatycznego podnoszenia temperatury aż do osiągnięcia określonych progów. | No | 0 |
| timestamp_granularities[] | macierz | Szczegóły dotyczące znaczników czasowych do wypełnienia dla tej transkrypcji.
response_format musi być ustawiony verbose_json tak, aby używać szczegółowości znaczników czasu. Obsługiwane są te opcje lub obie: word, lub segment. Uwaga: Nie ma dodatkowego opóźnienia dla znaczników czasu segmentów, ale generowanie znaczników czasu słów powoduje dodatkowe opóźnienia. |
No | ['segment'] |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | obiekt | |
| text/plain | ciąg | Przepisany tekst w formacie wyjściowym (gdy response_format był jednym z text, vtt lub srt). |
Examples
Przykład
Pobiera przepisany tekst i powiązane metadane z dostarczonych danych dźwiękowych.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Przykład
Pobiera przepisany tekst i powiązane metadane z dostarczonych danych dźwiękowych.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/transcriptions?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Odpowiedzi: Kod statusu: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Tłumaczenia - Stwórz
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
Transkrybuje i tłumaczy wejście audio na tekst angielski.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator wdrożenia | ścieżka | Tak | ciąg | |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: dane wielu części/formularzu
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| plik | ciąg | Plik audio do tłumaczenia. | Tak | |
| monit | ciąg | Opcjonalny tekst wskazujący styl modelu lub kontynuujący wcześniejszy segment audio. Zadanie powinno być po angielsku. | No | |
| format_odpowiedzi | audioResponseFormat | Definiuje format wyjścia. | No | |
| temperatura | number | Temperatura próbkowania, między 0 a 1. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. Jeśli ustawimy ją na 0, model wykorzystuje logarytmiczne prawdopodobieństwo do automatycznego podnoszenia temperatury aż do osiągnięcia określonych progów. | No | 0 |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | obiekt | |
| text/plain | ciąg | Transkrybowany tekst w formacie wyjściowym (gdy response_format był tekstowy, VTT lub srt). |
Examples
Przykład
Otrzymuje transkrybowany tekst w języku angielskim oraz powiązane metadane z udostępnionych danych audio mówionych.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Odpowiedzi: Kod statusu: 200
{
"body": {
"text": "A structured object when requesting json or verbose_json"
}
}
Przykład
Otrzymuje transkrybowany tekst w języku angielskim oraz powiązane metadane z udostępnionych danych audio mówionych.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/translations?api-version=2025-04-01-preview
"---multipart-boundary\nContent-Disposition: form-data; name=\"file\"; filename=\"file.wav\"\nContent-Type: application/octet-stream\n\nRIFF..audio.data.omitted\n---multipart-boundary--"
Odpowiedzi: Kod statusu: 200
{
"type": "string",
"example": "plain text when requesting text, srt, or vtt"
}
Mowa - Stwórz
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview
Generuje dźwięk z tekstu wejściowego.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator wdrożenia | ścieżka | Tak | ciąg | |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: dane wielu części/formularzu
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane wejściowe | ciąg | Tekst do syntezy dźwięku. Maksymalna długość to 4 096 znaków. | Tak | |
| format_odpowiedzi | wyliczenie | Format do syntezy dźwięku. Możliwe wartości: mp3, opus, aac, , flac, wav, pcm |
No | |
| Prędkość | number | Szybkość syntetycznego dźwięku. Wybierz wartość z 0.25 do .4.0
1.0 jest domyślna. |
No | 1.0 |
| voice | wyliczenie | Głos do syntezy mowy. Możliwe wartości: alloy, echo, fable, , onyx, nova, shimmer |
Tak |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/octet-stream | ciąg |
Examples
Przykład
Syntetyzuje dźwięk z dostarczonego tekstu.
POST https://{endpoint}/openai/deployments/{deployment-id}/audio/speech?api-version=2025-04-01-preview
{
"input": "Hi! What are you going to make?",
"voice": "fable",
"response_format": "mp3"
}
Odpowiedzi: Kod statusu: 200
{
"body": "101010101"
}
Generowanie obrazów - Stwórz
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview
Generuje partię obrazów z podpisu tekstowego przy wdrożeniu modelu generowania obrazów
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator wdrożenia | ścieżka | Tak | ciąg | |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| tło | imageBackground | Pozwala ustawić przezroczystość tła wygenerowanych obrazów. Ten parametr jest obsługiwany tylko dla modeli serii gpt-image-1. | No | samochód |
| n | liczba całkowita | Liczba obrazów do wygenerowania. Dla dall-e-3 obsługiwane jest tylko n=1. | No | 1 |
| kompresja wyjściowa | liczba całkowita | Poziom kompresji (0-100%) dla wygenerowanych obrazów. Ten parametr jest obsługiwany tylko dla modeli serii gpt-image-1 z formatem wyjściowym jpeg. | No | 100 |
| format_wyjściowy | imagesOutputFormat | Format pliku, w którym zwracane są wygenerowane obrazy. Obsługiwane tylko dla modeli z serii gpt-image-1. | No | png |
| monit | ciąg | Tekstowy opis pożądanego obrazu(ów). Maksymalna długość to 32000 znaków dla serii gpt-image-1 i 4000 znaków dla dall-e-3 | Tak | |
| częściowe_obrazy | liczba całkowita | Liczba częściowych obrazów do wygenerowania. Ten parametr jest używany do strumieniowania odpowiedzi, które zwracają częściowe obrazy. Wartość musi mieścić się między 0 a 3. Po ustawieniu na 0 odpowiedź będzie pojedynczym obrazem wysłanym w jednym zdarzeniu streamingowym. Należy zauważyć, że ostateczny obraz może zostać wysłany przed wygenerowaniem pełnej liczby częściowych obrazów, jeśli pełny obraz zostanie wygenerowany szybciej. | 0 | |
| odtwarzać strumieniowo | boolean | Edytuj obraz w trybie streamingu. | nie | false |
| jakość | imageQuality | Jakość wygenerowanego obrazu. | No | samochód |
| format_odpowiedzi | imagesResponseFormat | Format, w którym zwracane są wygenerowane obrazy. Ten parametr nie jest obsługiwany dla gpt-image-1modeli serii -series, które zawsze zwracają obrazy kodowane w base64.Możliwe wartości: url, b64_json. |
No | Adres url |
| size | imageSize | Rozmiar wygenerowanych obrazów. | No | samochód |
| styl | imageStyle | Styl generowanych obrazów. Obsługiwane tylko dla dall-e-3. | No | żywy |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który pomaga monitorować i wykrywać nadużycia. | No |
Responses
Kod statusu: 200
Opis: Ok
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | generateImagesResponse |
Kod statusu: domyślny
Opis: Wystąpił błąd.
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | dalleErrorResponse |
Examples
Przykład
Tworzy obrazy na podstawie promptu.
POST https://{endpoint}/openai/deployments/{deployment-id}/images/generations?api-version=2025-04-01-preview
{
"prompt": "In the style of WordArt, Microsoft Clippy wearing a cowboy hat.",
"n": 1,
"style": "natural",
"quality": "standard"
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"created": 1698342300,
"data": [
{
"revised_prompt": "A vivid, natural representation of Microsoft Clippy wearing a cowboy hat.",
"prompt_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
},
"profanity": {
"detected": false,
"filtered": false
},
"custom_blocklists": {
"filtered": false,
"details": []
}
},
"url": "https://dalletipusw2.blob.core.windows.net/private/images/e5451cc6-b1ad-4747-bd46-b89a3a3b8bc3/generated_00.png?se=2023-10-27T17%3A45%3A09Z&...",
"content_filter_results": {
"sexual": {
"severity": "safe",
"filtered": false
},
"violence": {
"severity": "safe",
"filtered": false
},
"hate": {
"severity": "safe",
"filtered": false
},
"self_harm": {
"severity": "safe",
"filtered": false
}
}
}
]
}
}
Generowanie obrazów - Edytuj
POST https://{endpoint}/openai/deployments/{deployment-id}/images/edits?api-version=2025-04-01-preview
Edytuje obraz z podpisu tekstowego przy danym wdrożeniu modelu gpt-image-1
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator wdrożenia | ścieżka | Tak | ciąg | |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: dane wielu części/formularzu
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| obraz | ciąg lub tablica | Obraz(y) do edycji. Musi to być wspierany plik obrazów lub tablica obrazów. Każdy obraz powinien mieć format png, czyli plik jpg mniejszy niż 50MB. | Tak | |
| input_fidelity | ciąg | Kontroluj, ile wysiłku model włoży, aby dopasować styl i cechy, zwłaszcza rysy twarzy, do obrazów wejściowych. Ten parametr jest obsługiwany tylko dla modeli serii gpt-image-1. Podpory high i low. |
nie |
low. |
| maska | ciąg | Dodatkowy obraz, którego w pełni przezroczyste obszary (np. gdzie alfa wynosi zero) wskazują, gdzie należy edytować obraz. Jeśli podano wiele obrazów, maska zostanie nałożona na pierwszy obraz. Musi to być poprawny plik PNG, mniejszy niż 4MB i mieć takie same wymiary jak obraz. | No | |
| n | liczba całkowita | Liczba obrazów do wygenerowania. Musi być między 1 a 10. | No | 1 |
| monit | ciąg | Tekstowy opis pożądanego obrazu(ów). Maksymalna długość to 32000 znaków. | Tak | |
| jakość | imageQuality | Jakość wygenerowanego obrazu. | No | samochód |
| częściowe_obrazy | Liczba częściowych obrazów do wygenerowania. Ten parametr jest używany do strumieniowania odpowiedzi, które zwracają częściowe obrazy. Wartość musi mieścić się między 0 a 3. Po ustawieniu na 0 odpowiedź będzie pojedynczym obrazem wysłanym w jednym zdarzeniu streamingowym. Należy zauważyć, że ostateczny obraz może zostać wysłany przed wygenerowaniem pełnej liczby częściowych obrazów, jeśli pełny obraz zostanie wygenerowany szybciej. | |||
| odtwarzać strumieniowo | boolean | Edytuj obraz w trybie streamingu. | nie | false |
| format_odpowiedzi | imagesResponseFormat | Format, w którym zwracane są wygenerowane obrazy. | No | Adres url |
| size | imageSize | Rozmiar wygenerowanych obrazów. | No | samochód |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który pomaga monitorować i wykrywać nadużycia. | No |
Responses
Kod statusu: 200
Opis: Ok
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | generateImagesResponse |
Kod statusu: domyślny
Opis: Wystąpił błąd.
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | dalleErrorResponse |
Lista - Asystenci
Note
API Asystentów jest wycofane i zostanie wycofane 26 sierpnia 2026 roku. Korzystaj z powszechnie dostępnej usługi Microsoft Foundry Agents. Postępuj zgodnie z przewodnikiem migracji , aby zaktualizować swoje obciążenia. Dowiedz się więcej.
GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
Zwraca listę asystentów.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| limit | kwerenda | No | liczba całkowita | Limit liczby obiektów, które należy zwrócić. Limit może wahać się od 1 do 100, a domyślny to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc dla kolejności rosnącej i desc malejącej. |
| Po | kwerenda | No | ciąg | Kursor do użycia w paginacji.
after to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów kończących się na obj_foo, kolejne wywołanie może zawierać after=obj_foo, aby pobrać następną stronę listy. |
| przed | kwerenda | No | ciąg | Kursor do użycia w paginacji.
before to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów, zaczynając od obj_foo, kolejne wywołanie może zawierać zanim=obj_foo, aby pobrać poprzednią stronę listy. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | listAssistantsResponse |
Examples
Przykład
Zwraca listę asystentów.
GET https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "asst_abc123",
"object": "assistant",
"created_at": 1707257477,
"name": "Stock Analyst",
"description": null,
"model": "gpt-4-1106-preview",
"instructions": "You are a financial analyst that analyzes stock market prices and other financial data present on user uploaded files or by calling external APIs.",
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
},
{
"id": "asst_abc456",
"object": "assistant",
"created_at": 1698982718,
"name": "My Assistant",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are a helpful assistant designed to make me better at coding!",
"tools": [],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
},
{
"id": "asst_abc789",
"object": "assistant",
"created_at": 1698982643,
"name": null,
"description": null,
"model": "gpt-4-turbo",
"instructions": null,
"tools": [],
"tool_resources": {},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
],
"first_id": "asst_abc123",
"last_id": "asst_abc789",
"has_more": false
}
}
Stwórz - Asystent
POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
Stwórz asystenta z modelem i instrukcjami.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| opis | ciąg | Opis asystenta. Maksymalna długość to 512 znaków. |
No | |
| instructions | ciąg | System instruuje asystenta. Maksymalna długość to 256 000 znaków. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| model | ciąg | Tak | ||
| nazwa | ciąg | Imię asystenta. Maksymalna długość to 256 znaków. |
No | |
| format_odpowiedzi | assistantsApiResponseFormatOption | Określa format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo od .gpt-3.5-turbo-1106Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które zapewniają, że model odpowiada dostarczonemu schematowi JSON. Dowiedz się więcej w przewodniku po Structured Outputs.Ustawienie na { "type": "json_object" } włączenie trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON.Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. |
No | 1 |
| tool_resources | obiekt | Zestaw zasobów wykorzystywanych przez narzędzia asystenta. Zasoby są specyficzne dla rodzaju narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, podczas gdy narzędzie file_search wymaga listy identyfikatorów pamięci wektorowej. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Z narzędziem może być maksymalnie 20 plików. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorów przypisany do tego asystenta. Asystent może być dołączony maksymalnie do jednego pamięci wektorowej. |
No | |
| └─ przechowalnie_wektorów | macierz | Pomocnik do utworzenia magazynu wektorowego za pomocą file_ids i dołączenia go do tego asystenta. Asystent może być dołączony maksymalnie do jednego pamięci wektorowej. |
No | |
| Narzędzia | macierz | Lista narzędzi włączonych na asystencie. Maksymalnie 128 narzędzi na asystenta może być przeznaczonych. Narzędzia mogą mieć typy code_interpreter, retrieval, lub function. |
No | [] |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy zmianę tego lub temperatury, ale nie obu naraz. |
No | 1 |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | assistantObject |
Examples
Przykład
Stwórz asystenta z modelem i instrukcjami.
POST https://{endpoint}/openai/assistants?api-version=2025-04-01-preview
{
"name": "Math Tutor",
"instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
"tools": [
{
"type": "code_interpreter"
}
],
"model": "gpt-4-1106-preview"
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
"object": "assistant",
"created_at": 1707295707,
"name": "Math Tutor",
"description": null,
"model": "gpt-4-1106-preview",
"instructions": "When a customer asks about a specific math problem, use Python to evaluate their query.",
"tools": [
{
"type": "code_interpreter"
}
],
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
Pobierz - Asystent
GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
Odzyskuje asystenta.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| assistant_id | ścieżka | Tak | ciąg | Identyfikacja asystenta do odzyskania. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | assistantObject |
Examples
Przykład
Odzyskuje asystenta.
GET https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "asst_abc123",
"object": "assistant",
"created_at": 1699009709,
"name": "HR Helper",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies.",
"tools": [
{
"type": "file_search"
}
],
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
Modyfikacja - Asystent
POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
Modyfikuje asystenta.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| assistant_id | ścieżka | Tak | ciąg | Identyfikacja asystenta do modyfikacji. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| opis | ciąg | Opis asystenta. Maksymalna długość to 512 znaków. |
No | |
| instructions | ciąg | System instruuje asystenta. Maksymalna długość to 32768 znaków. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| model | ciąg | No | ||
| nazwa | ciąg | Imię asystenta. Maksymalna długość to 256 znaków. |
No | |
| format_odpowiedzi | assistantsApiResponseFormatOption | Określa format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo od .gpt-3.5-turbo-1106Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które zapewniają, że model odpowiada dostarczonemu schematowi JSON. Dowiedz się więcej w przewodniku po Structured Outputs.Ustawienie na { "type": "json_object" } włączenie trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON.Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. |
No | 1 |
| tool_resources | obiekt | Zestaw zasobów wykorzystywanych przez narzędzia asystenta. Zasoby są specyficzne dla rodzaju narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, podczas gdy narzędzie file_search wymaga listy identyfikatorów pamięci wektorowej. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Nadpisuje listę identyfikatorów plików udostępnionych narzędziu code_interpreter . Z narzędziem może być maksymalnie 20 plików. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | To nadpisuje wektorowy magazyn przypisany do tego asystenta. Asystent może być dołączony maksymalnie do jednego pamięci wektorowej. |
No | |
| Narzędzia | macierz | Lista narzędzi włączonych na asystencie. Maksymalnie 128 narzędzi na asystenta może być przeznaczonych. Narzędzia mogą mieć typy code_interpreter, retrieval, lub function. |
No | [] |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy zmianę tego lub temperatury, ale nie obu naraz. |
No | 1 |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | assistantObject |
Examples
Przykład
Modyfikuje asystenta.
POST https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
{
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
"tools": [
{
"type": "file_search"
}
],
"model": "gpt-4-turbo"
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "asst_123",
"object": "assistant",
"created_at": 1699009709,
"name": "HR Helper",
"description": null,
"model": "gpt-4-turbo",
"instructions": "You are an HR bot, and you have access to files to answer employee questions about company policies. Always response with info from either of the files.",
"tools": [
{
"type": "file_search"
}
],
"tool_resources": {
"file_search": {
"vector_store_ids": []
}
},
"metadata": {},
"top_p": 1.0,
"temperature": 1.0,
"response_format": "auto"
}
}
Usuń - Asystent
DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
Usuń asystenta.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| assistant_id | ścieżka | Tak | ciąg | ID asystenta do usunięcia. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | deleteAssistantResponse |
Examples
Przykład
Usuwa asystenta.
DELETE https://{endpoint}/openai/assistants/{assistant_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "asst_4nsG2qgNzimRPE7MazXTXbU7",
"object": "assistant.deleted",
"deleted": true
}
}
Stwórz - Wątek
Note
API Asystentów jest wycofane i zostanie wycofane 26 sierpnia 2026 roku. Korzystaj z powszechnie dostępnej usługi Microsoft Foundry Agents. Postępuj zgodnie z przewodnikiem migracji , aby zaktualizować swoje obciążenia. Dowiedz się więcej.
POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview
Załóż wątek.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| messages | macierz | Lista wiadomości, od których warto zacząć wątek. | No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| tool_resources | obiekt | Zestaw zasobów dostępnych dla narzędzi asystenta w tym wątku. Zasoby są specyficzne dla rodzaju narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, podczas gdy narzędzie file_search wymaga listy identyfikatorów pamięci wektorowej. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Z narzędziem może być maksymalnie 20 plików. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorowy dołączony do tego wątku. Do wątku może być dołączony maksymalnie 1 pojemnik wektorowy. |
No | |
| └─ przechowalnie_wektorów | macierz | Pomocnik do stworzenia magazynu wektorowego z file_ids i dołączenia go do tego wątku. Do wątku może być dołączony maksymalnie 1 pojemnik wektorowy. |
No |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | threadObject |
Examples
Przykład
Tworzy wątek.
POST https://{endpoint}/openai/threads?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {}
}
}
Pobierz — wątek
GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
Pobiera wątek.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątku do pobrania. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | threadObject |
Examples
Przykład
Pobiera wątek.
GET https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {},
"tool_resources": {
"code_interpreter": {
"file_ids": []
}
}
}
}
Modyfikacja - Wątek
POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
Modyfikuje wątek.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątku do modyfikacji. Tylko one metadata mogą być modyfikowane. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| tool_resources | obiekt | Zestaw zasobów dostępnych dla narzędzi asystenta w tym wątku. Zasoby są specyficzne dla rodzaju narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, podczas gdy narzędzie file_search wymaga listy identyfikatorów pamięci wektorowej. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Z narzędziem może być maksymalnie 20 plików. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorowy dołączony do tego wątku. Do wątku może być dołączony maksymalnie 1 pojemnik wektorowy. |
No |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | threadObject |
Examples
Przykład
Modyfikuje wątek.
POST https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
{
"metadata": {
"modified": "true",
"user": "abc123"
}
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread",
"created_at": 1707297136,
"metadata": {
"modified": "true",
"user": "abc123"
},
"tool_resources": {}
}
}
Usuń - Wątek
DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
Usuń wątek.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątku do usunięcia. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | deleteThreadResponse |
Examples
Przykład
Usuwa wątek.
DELETE https://{endpoint}/openai/threads/{thread_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"object": "thread.deleted",
"deleted": true
}
}
Lista - Wiadomości
Note
API Asystentów jest wycofane i zostanie wycofane 26 sierpnia 2026 roku. Korzystaj z powszechnie dostępnej usługi Microsoft Foundry Agents. Postępuj zgodnie z przewodnikiem migracji , aby zaktualizować swoje obciążenia. Dowiedz się więcej.
GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
Zwraca listę wiadomości dla danego wątku.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątków, do których należą te wiadomości. |
| limit | kwerenda | No | liczba całkowita | Limit liczby obiektów, które należy zwrócić. Limit może wahać się od 1 do 100, a domyślny to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc dla kolejności rosnącej i desc malejącej. |
| Po | kwerenda | No | ciąg | Kursor do użycia w paginacji.
after to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów kończących się na obj_foo, kolejne wywołanie może zawierać after=obj_foo, aby pobrać następną stronę listy. |
| przed | kwerenda | No | ciąg | Kursor do użycia w paginacji.
before to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów, zaczynając od obj_foo, kolejne wywołanie może zawierać zanim=obj_foo, aby pobrać poprzednią stronę listy. |
| run_id | kwerenda | No | ciąg | Filtruj wiadomości według identyfikatora uruchomienia, który je wygenerował. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | listMessagesResponse |
Examples
Przykład
Lista komunikatów
GET https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "msg_abc123",
"object": "thread.message",
"created_at": 1699016383,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "How does AI work? Explain it in simple terms.",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
},
{
"id": "msg_abc456",
"object": "thread.message",
"created_at": 1699016383,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "Hello, what is AI?",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
}
],
"first_id": "msg_abc123",
"last_id": "msg_abc456",
"has_more": false
}
}
Stwórz - Wiadomość
POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
Stwórz wiadomość.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątków, dla których należy utworzyć wiadomość. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| Załączniki | macierz | Lista plików dołączonych do wiadomości oraz narzędzi, do których powinny zostać dodane. | No | |
| zawartość | ciąg | Treść wiadomości. | Tak | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| rola | ciąg | Rola podmiotu, który tworzy przekaz. Dozwolone wartości obejmują: - user: Oznacza, że wiadomość została wysłana przez rzeczywistego użytkownika i powinna być w większości przypadków używana do reprezentowania wiadomości generowanych przez użytkowników.- assistant: Oznacza, że wiadomość jest generowana przez asystenta. Użyj tej wartości, aby wstawić wiadomości od asystenta do rozmowy. |
Tak |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | messageObject |
Examples
Przykład
Stwórz wiadomość.
POST https://{endpoint}/openai/threads/{thread_id}/messages?api-version=2025-04-01-preview
{
"role": "user",
"content": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces."
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
"object": "thread.message",
"created_at": 1707298421,
"assistant_id": null,
"thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
"annotations": []
}
}
],
"attachments": [],
"metadata": {}
}
}
Pobierz - Wiadomość
GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
Pobierz wiadomość.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątków, do których należy ta wiadomość. |
| message_id | ścieżka | Tak | ciąg | ID wiadomości do pobrania. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | messageObject |
Examples
Przykład
Pobierz wiadomość.
GET https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "msg_as3XIk1tpVP3hdHjWBGg3uG4",
"object": "thread.message",
"created_at": 1707298421,
"thread_id": "thread_v7V4csrNOxtNmgcwGg496Smx",
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "What is the cube root of the sum of 12, 14, 1234, 4321, 90000, 123213541223, 443123123124, 5423324234, 234324324234, 653434534545, 200000000, 98237432984, 99999999, 99999999999, 220000000000, 3309587702? Give me the answer rounded to the nearest integer without commas or spaces.",
"annotations": []
}
}
],
"file_ids": [],
"assistant_id": null,
"run_id": null,
"metadata": {}
}
}
Zmodyfikuj - Wiadomość
POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
Modyfikuje wiadomość.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątku, do którego należy ta wiadomość. |
| message_id | ścieżka | Tak | ciąg | ID wiadomości do modyfikacji. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | messageObject |
Examples
Przykład
Zmodyfikuj wiadomość.
POST https://{endpoint}/openai/threads/{thread_id}/messages/{message_id}?api-version=2025-04-01-preview
{
"metadata": {
"modified": "true",
"user": "abc123"
}
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "msg_abc123",
"object": "thread.message",
"created_at": 1699017614,
"assistant_id": null,
"thread_id": "thread_abc123",
"run_id": null,
"role": "user",
"content": [
{
"type": "text",
"text": {
"value": "How does AI work? Explain it in simple terms.",
"annotations": []
}
}
],
"file_ids": [],
"metadata": {
"modified": "true",
"user": "abc123"
}
}
}
Stwórz - Wątkaj i Uruchom
Note
API Asystentów jest wycofane i zostanie wycofane 26 sierpnia 2026 roku. Korzystaj z powszechnie dostępnej usługi Microsoft Foundry Agents. Postępuj zgodnie z przewodnikiem migracji , aby zaktualizować swoje obciążenia. Dowiedz się więcej.
POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview
Stwórz wątek i uruchom go w jednym żądaniu.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| assistant_id | ciąg | ID asystenta, którego należy użyć do wykonania tego przebiegu. | Tak | |
| instructions | ciąg | Nadpisz domyślny komunikat systemowy asystenta. Jest to przydatne do modyfikacji zachowania na podstawie pojedynczego biegu. | No | |
| max_completion_tokens | liczba całkowita | Maksymalna liczba tokenów ukończenia, które można użyć w trakcie trwania rozgrywki. Run stara się używać tylko określonej liczby tokenów ukończenia przez kilka tur rozgrywki. Jeśli przebieg przekroczy podaną liczbę tokenów ukończenia, zakończy się ze statusem incomplete. Zobacz więcej incomplete_details informacji. |
No | |
| max_prompt_tokens | liczba całkowita | Maksymalna liczba tokenów promptów, które można użyć w trakcie trwania biegu. Run stara się używać tylko określonej liczby tokenów promptu przez kilka tur rozgrywki. Jeśli przebieg przekroczy określoną liczbę tokenów promptu, zakończy się ze statusem incomplete. Zobacz więcej incomplete_details informacji. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| model | ciąg | ID modeli, które mają zostać użyte do wykonania tego przebiegu. Jeśli tutaj podana jest wartość, zostanie ona nadpisana przez model powiązany z asystentem. Jeśli nie, zostanie użyty model powiązany z asystentem. | No | |
| wywołania_narzędzia_równoległe | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas użycia narzędzia. | No | True |
| format_odpowiedzi | assistantsApiResponseFormatOption | Określa format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo od .gpt-3.5-turbo-1106Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które zapewniają, że model odpowiada dostarczonemu schematowi JSON. Dowiedz się więcej w przewodniku po Structured Outputs.Ustawienie na { "type": "json_object" } włączenie trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON.Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| odtwarzać strumieniowo | boolean | Jeśli true, zwraca strumień zdarzeń, które mają miejsce podczas Run jako zdarzenia wysyłane przez serwer, kończąc się, gdy Run wchodzi w stan terminalowy z wiadomością data: [DONE] . |
No | |
| stream_options | chatCompletionStreamOptions | Opcje odpowiedzi na streaming. Ustawiam to tylko wtedy, gdy ustawiasz stream: true. |
No | Żadne |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. |
No | 1 |
| konwersacja | createThreadRequest | No | ||
| tool_choice | assistantsApiToolChoiceOption | Kontroluje, które (jeśli w ogóle) narzędzie jest wywoływane przez model.none Oznacza to, że model nie wywołuje żadnych narzędzi, lecz generuje wiadomość.auto jest wartością domyślną i oznacza, że model może wybrać między generowaniem wiadomości a wywołaniem narzędzia.Określenie konkretnego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymuszanie wywołania tego narzędzia, wymusza model. |
No | |
| tool_resources | obiekt | Zestaw zasobów wykorzystywanych przez narzędzia asystenta. Zasoby są specyficzne dla rodzaju narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, podczas gdy narzędzie file_search wymaga listy identyfikatorów pamięci wektorowej. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Z narzędziem może być maksymalnie 20 plików. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Identyfikator magazynu wektorów przypisany do tego asystenta. Asystent może być dołączony maksymalnie do jednego pamięci wektorowej. |
No | |
| Narzędzia | macierz | Nadpisz narzędzia, których asystent może użyć w tym biegu. Jest to przydatne do modyfikacji zachowania na podstawie pojedynczego biegu. | No | |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy zmianę tego lub temperatury, ale nie obu naraz. |
No | 1 |
| truncation_strategy | obcięcie obiektuObject | Kontrole dotyczące tego, jak wątek zostanie obcięty przed uruchomieniem. Użyj tego do kontrolowania początkowego okna kontekstu przebiegu. | No |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | runObject |
Examples
Przykład
Stwórz wątek i uruchom go w jednym żądaniu.
POST https://{endpoint}/openai/threads/runs?api-version=2025-04-01-preview
{
"assistant_id": "asst_abc123",
"thread": {
"messages": [
{
"role": "user",
"content": "Explain deep learning to a 5 year old."
}
]
}
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699076792,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "queued",
"started_at": null,
"expires_at": 1699077392,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"required_action": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": "You are a helpful assistant.",
"tools": [],
"tool_resources": {},
"metadata": {},
"temperature": 1.0,
"top_p": 1.0,
"max_completion_tokens": null,
"max_prompt_tokens": null,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"incomplete_details": null,
"usage": null,
"response_format": "auto",
"tool_choice": "auto"
}
}
Lista - Biegi
GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
Zwraca listę przebiegów należących do wątku.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątku, do którego należy ten przebieg. |
| limit | kwerenda | No | liczba całkowita | Limit liczby obiektów, które należy zwrócić. Limit może wahać się od 1 do 100, a domyślny to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc dla kolejności rosnącej i desc malejącej. |
| Po | kwerenda | No | ciąg | Kursor do użycia w paginacji.
after to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów kończących się na obj_foo, kolejne wywołanie może zawierać after=obj_foo, aby pobrać następną stronę listy. |
| przed | kwerenda | No | ciąg | Kursor do użycia w paginacji.
before to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów, zaczynając od obj_foo, kolejne wywołanie może zawierać zanim=obj_foo, aby pobrać poprzednią stronę listy. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | listRunsResponse |
Examples
Przykład
Zwraca listę przebiegów należących do wątku.
GET https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699075072,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699075072,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699075073,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
},
{
"id": "run_abc456",
"object": "thread.run",
"created_at": 1699063290,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699063290,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699063291,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
],
"first_id": "run_abc123",
"last_id": "run_abc456",
"has_more": false
}
}
Stwórz - Uciekaj
POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
Stwórz bieg.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątku do uruchomienia. |
| include[] | kwerenda | No | macierz | Lista dodatkowych pól do uwzględnienia w odpowiedzi. Obecnie jedyną obsługiwaną wartością step_details.tool_calls[*].file_search.results[*].content jest pobieranie wyników wyszukiwania plików. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| additional_instructions | ciąg | Dodaje dodatkowe instrukcje na końcu instrukcji dotyczących przebiegu. Jest to przydatne do modyfikacji zachowania na każdy bieg bez nadpisywania innych instrukcji. | No | |
| additional_messages | macierz | Dodaje dodatkowe wiadomości do wątku przed utworzeniem uruchomienia. | No | |
| assistant_id | ciąg | ID asystenta, którego należy użyć do wykonania tego przebiegu. | Tak | |
| instructions | ciąg | Nadpisz domyślny komunikat systemowy asystenta. Jest to przydatne do modyfikacji zachowania na podstawie pojedynczego biegu. | No | |
| max_completion_tokens | liczba całkowita | Maksymalna liczba tokenów ukończenia, które można użyć w trakcie trwania rozgrywki. Run stara się używać tylko określonej liczby tokenów ukończenia przez kilka tur rozgrywki. Jeśli przebieg przekroczy podaną liczbę tokenów ukończenia, zakończy się ze statusem incomplete. Zobacz więcej incomplete_details informacji. |
No | |
| max_prompt_tokens | liczba całkowita | Maksymalna liczba tokenów promptów, które można użyć w trakcie trwania biegu. Run stara się używać tylko określonej liczby tokenów promptu przez kilka tur rozgrywki. Jeśli przebieg przekroczy określoną liczbę tokenów promptu, zakończy się ze statusem incomplete. Zobacz więcej incomplete_details informacji. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| model | ciąg | ID Modelu użytego do wykonania tego przebiegu. Jeśli tutaj podana jest wartość, zostanie ona nadpisana przez model powiązany z asystentem. Jeśli nie, zostanie użyty model powiązany z asystentem. | No | |
| wywołania_narzędzia_równoległe | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas użycia narzędzia. | No | True |
| format_odpowiedzi | assistantsApiResponseFormatOption | Określa format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo od .gpt-3.5-turbo-1106Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które zapewniają, że model odpowiada dostarczonemu schematowi JSON. Dowiedz się więcej w przewodniku po Structured Outputs.Ustawienie na { "type": "json_object" } włączenie trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON.Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| odtwarzać strumieniowo | boolean | Jeśli true, zwraca strumień zdarzeń, które mają miejsce podczas Run jako zdarzenia wysyłane przez serwer, kończąc się, gdy Run wchodzi w stan terminalowy z wiadomością data: [DONE] . |
No | |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. |
No | 1 |
| tool_choice | assistantsApiToolChoiceOption | Kontroluje, które (jeśli w ogóle) narzędzie jest wywoływane przez model.none Oznacza to, że model nie wywołuje żadnych narzędzi, lecz generuje wiadomość.auto jest wartością domyślną i oznacza, że model może wybrać między generowaniem wiadomości a wywołaniem narzędzia.Określenie konkretnego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymuszanie wywołania tego narzędzia, wymusza model. |
No | |
| Narzędzia | macierz | Nadpisz narzędzia, których asystent może użyć w tym biegu. Jest to przydatne do modyfikacji zachowania na podstawie pojedynczego biegu. | No | |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy zmianę tego lub temperatury, ale nie obu naraz. |
No | 1 |
| truncation_strategy | obcięcie obiektuObject | Kontrole dotyczące tego, jak wątek zostanie obcięty przed uruchomieniem. Użyj tego do kontrolowania początkowego okna kontekstu przebiegu. | No |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | runObject |
Examples
Przykład
Stwórz bieg.
POST https://{endpoint}/openai/threads/{thread_id}/runs?api-version=2025-04-01-preview
{
"assistant_id": "asst_abc123"
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699063290,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "queued",
"started_at": 1699063290,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699063291,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
Uciekaj - Uciekaj
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
Odzyskuje bieg.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątków, które zostały uruchomione. |
| run_id | ścieżka | Tak | ciąg | Identyfikacja biegu do odzyskania. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | runObject |
Examples
Przykład
Dostaje bieg.
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "run_HsO8tYM4K5AAMAHgK0J3om8Q",
"object": "thread.run",
"created_at": 1707303196,
"assistant_id": "asst_JtTwHk28cIocgFXZPCBxhOzl",
"thread_id": "thread_eRNwflE3ncDYak1np6MdMHJh",
"status": "completed",
"started_at": 1707303197,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1707303201,
"last_error": null,
"model": "gpt-4-1106-preview",
"instructions": "You are an AI model that empowers every person and every organization on the planet to achieve more.",
"tools": [],
"file_ids": [],
"metadata": {}
}
}
Modyfikacja - Uruchom
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
Modyfikuje rozgrywkę.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątków, które zostały uruchomione. |
| run_id | ścieżka | Tak | ciąg | ID biegu do modyfikacji. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | runObject |
Examples
Przykład
Modyfikuje rozgrywkę.
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}?api-version=2025-04-01-preview
{
"metadata": {
"user_id": "user_abc123"
}
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699075072,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "completed",
"started_at": 1699075072,
"expires_at": null,
"cancelled_at": null,
"failed_at": null,
"completed_at": 1699075073,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"incomplete_details": null,
"tools": [
{
"type": "code_interpreter"
}
],
"tool_resources": {
"code_interpreter": {
"file_ids": [
"file-abc123",
"file-abc456"
]
}
},
"metadata": {
"user_id": "user_abc123"
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
},
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
Submit - Narzędzia do uruchomienia
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview
Gdy uruchomienie ma i status: "requires_action"required_action.type jest , submit_tool_outputsten punkt końcowy może być użyty do przesłania wyników wywołań narzędzi po ich zakończeniu wszystkim. Wszystkie wyniki muszą być przesłane w jednym żądaniu.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątków, do których należy ten przebieg. |
| run_id | ścieżka | Tak | ciąg | ID serii, która wymaga przesłania wyjścia narzędzia. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| odtwarzać strumieniowo | boolean | Jeśli true, zwraca strumień zdarzeń, które mają miejsce podczas Run jako zdarzenia wysyłane przez serwer, kończąc się, gdy Run wchodzi w stan terminalowy z wiadomością data: [DONE] . |
No | |
| tool_outputs | macierz | Lista narzędzi, dla których przesyłane są wyniki. | Tak |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | runObject |
Examples
Przykład
Gdy uruchomienie ma i status: "requires_action"required_action.type jest , submit_tool_outputsten punkt końcowy może być użyty do przesłania wyników wywołań narzędzi po ich zakończeniu wszystkim. Wszystkie wyniki muszą być przesłane w jednym żądaniu.
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/submit_tool_outputs?api-version=2025-04-01-preview
{
"tool_outputs": [
{
"tool_call_id": "call_001",
"output": "70 degrees and sunny."
}
]
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "run_123",
"object": "thread.run",
"created_at": 1699075592,
"assistant_id": "asst_123",
"thread_id": "thread_123",
"status": "queued",
"started_at": 1699075592,
"expires_at": 1699076192,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": null,
"tools": [
{
"type": "function",
"function": {
"name": "get_current_weather",
"description": "Get the current weather in a given location",
"parameters": {
"type": "object",
"properties": {
"location": {
"type": "string",
"description": "The city and state, e.g. San Francisco, CA"
},
"unit": {
"type": "string",
"enum": [
"celsius",
"fahrenheit"
]
}
},
"required": [
"location"
]
}
}
}
],
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"max_prompt_tokens": 1000,
"max_completion_tokens": 1000,
"truncation_strategy": {
"type": "auto",
"last_messages": null
},
"response_format": "auto",
"tool_choice": "auto"
}
}
Anuluj - Uciekaj
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview
Anuluje przebieg, który jest .in_progress
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątku, do którego należy ten przebieg. |
| run_id | ścieżka | Tak | ciąg | Identyfikator biegu do odwołania. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | runObject |
Examples
Przykład
Anuluje przebieg, który jest .in_progress
POST https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/cancel?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "run_abc123",
"object": "thread.run",
"created_at": 1699076126,
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"status": "cancelling",
"started_at": 1699076126,
"expires_at": 1699076726,
"cancelled_at": null,
"failed_at": null,
"completed_at": null,
"last_error": null,
"model": "gpt-4-turbo",
"instructions": "You summarize books.",
"tools": [
{
"type": "file_search"
}
],
"tool_resources": {
"file_search": {
"vector_store_ids": [
"vs_123"
]
}
},
"metadata": {},
"usage": null,
"temperature": 1.0,
"top_p": 1.0,
"response_format": "auto"
}
}
Lista - Run Steps
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview
Zwraca listę kroków przebiegu należących do przebiegu.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątku, do którego należą kroki run i run. |
| run_id | ścieżka | Tak | ciąg | ID biegu, do którego należą te kroki. |
| limit | kwerenda | No | liczba całkowita | Limit liczby obiektów, które należy zwrócić. Limit może wahać się od 1 do 100, a domyślny to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc dla kolejności rosnącej i desc malejącej. |
| Po | kwerenda | No | ciąg | Kursor do użycia w paginacji.
after to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów kończących się na obj_foo, kolejne wywołanie może zawierać after=obj_foo, aby pobrać następną stronę listy. |
| przed | kwerenda | No | ciąg | Kursor do użycia w paginacji.
before to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów, zaczynając od obj_foo, kolejne wywołanie może zawierać zanim=obj_foo, aby pobrać poprzednią stronę listy. |
| wersja API | kwerenda | Tak | ciąg | |
| include[] | kwerenda | No | macierz | Lista dodatkowych pól do uwzględnienia w odpowiedzi. Obecnie jedyną obsługiwaną wartością step_details.tool_calls[*].file_search.results[*].content jest pobieranie wyników wyszukiwania plików. |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | listRunStepsResponse |
Examples
Przykład
Zwraca listę kroków przebiegu należących do przebiegu.
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "step_abc123",
"object": "thread.run.step",
"created_at": 1699063291,
"run_id": "run_abc123",
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"type": "message_creation",
"status": "completed",
"cancelled_at": null,
"completed_at": 1699063291,
"expired_at": null,
"failed_at": null,
"last_error": null,
"step_details": {
"type": "message_creation",
"message_creation": {
"message_id": "msg_abc123"
}
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
}
}
],
"first_id": "step_abc123",
"last_id": "step_abc456",
"has_more": false
}
}
Pobieranie — krok uruchamiania
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview
Odzyskuje krok biegu.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| thread_id | ścieżka | Tak | ciąg | ID wątku, do którego należy krok run i run. |
| run_id | ścieżka | Tak | ciąg | ID serii, do której należy ten krok. |
| step_id | ścieżka | Tak | ciąg | ID kroku biegu do pobrania. |
| include[] | kwerenda | No | macierz | Lista dodatkowych pól do uwzględnienia w odpowiedzi. Obecnie jedyną obsługiwaną wartością step_details.tool_calls[*].file_search.results[*].content jest pobieranie wyników wyszukiwania plików. |
| wersja API | kwerenda | Tak | ciąg |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | runStepObject |
Examples
Przykład
Odzyskuje krok biegu.
GET https://{endpoint}/openai/threads/{thread_id}/runs/{run_id}/steps/{step_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "step_abc123",
"object": "thread.run.step",
"created_at": 1699063291,
"run_id": "run_abc123",
"assistant_id": "asst_abc123",
"thread_id": "thread_abc123",
"type": "message_creation",
"status": "completed",
"cancelled_at": null,
"completed_at": 1699063291,
"expired_at": null,
"failed_at": null,
"last_error": null,
"step_details": {
"type": "message_creation",
"message_creation": {
"message_id": "msg_abc123"
}
},
"usage": {
"prompt_tokens": 123,
"completion_tokens": 456,
"total_tokens": 579
}
}
}
Lista - Sklepy Wektorowe
GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
Zwraca listę zapisów wektorowych.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| limit | kwerenda | No | liczba całkowita | Limit liczby obiektów, które należy zwrócić. Limit może wahać się od 1 do 100, a domyślny to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc dla kolejności rosnącej i desc malejącej. |
| Po | kwerenda | No | ciąg | Kursor do użycia w paginacji.
after to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów kończących się na obj_foo, kolejne wywołanie może zawierać after=obj_foo, aby pobrać następną stronę listy. |
| przed | kwerenda | No | ciąg | Kursor do użycia w paginacji.
before to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów, zaczynając od obj_foo, kolejne wywołanie może zawierać zanim=obj_foo, aby pobrać poprzednią stronę listy. |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | listVectorStoresResponse |
Examples
Przykład
Zwraca listę zapisów wektorowych.
GET https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
},
{
"id": "vs_abc456",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ v2",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
],
"first_id": "vs_abc123",
"last_id": "vs_abc456",
"has_more": false
}
}
Utwórz - Vector Store
POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
Stwórz magazyn wektorów.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| chunking_strategy | autoChunkingStrategyRequestParam lub staticChunkingStrategyRequestParam | Strategia chunkingu używana do chunkowania plików. Jeśli nie jest ustawione, użyję tej strategii auto . Dotyczy tylko wtedy, gdy file_ids jest niepusty. |
No | |
| wygasa po | vectorStoreExpirationAfter | Polityka wygaśnięcia sklepu wektorowego. | No | |
| identyfikatory_plików | macierz | Lista identyfikatorów plików, których powinien używać magazyn wektorowy. Przydatne do takich narzędzi file_search do dostępu do plików. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| nazwa | ciąg | Nazwa magazynu wektorowego. | No |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | vectorStoreObject |
Examples
Przykład
Tworzy magazyn wektorowy.
POST https://{endpoint}/openai/vector_stores?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
}
Pobierz - Vector Store
GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
Odzyskuje zapis wektorowy.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID magazynu wektorowego do pobrania. |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | vectorStoreObject |
Examples
Przykład
Odzyskuje zapis wektorowy.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776
}
}
Modyfikuj — magazyn wektorów
POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
Modyfikuje magazyn wektorów.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID zapisu wektorowego do modyfikacji. |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| wygasa po | vectorStoreExpirationAfter | Polityka wygaśnięcia sklepu wektorowego. | No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| nazwa | ciąg | Nazwa magazynu wektorowego. | No |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | vectorStoreObject |
Examples
Przykład
Modyfikuje magazyn wektorów.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
{
"name": "Support FAQ"
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store",
"created_at": 1699061776,
"name": "Support FAQ",
"bytes": 139920,
"file_counts": {
"in_progress": 0,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 3
}
}
}
Usuń - Vector Store
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
Usuń magazyn wektorowy.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID wektorowego zapisu do usunięcia. |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | deleteVectorStoreResponse |
Examples
Przykład
Usuwa magazyn wektorowy.
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "vs_abc123",
"object": "vector_store.deleted",
"deleted": true
}
}
Lista - pliki pamięci wektorowej
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
Zwraca listę plików pamięci wektorowej.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID pamięci wektorowej, do której należą pliki. |
| limit | kwerenda | No | liczba całkowita | Limit liczby obiektów, które należy zwrócić. Limit może wahać się od 1 do 100, a domyślny to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc dla kolejności rosnącej i desc malejącej. |
| Po | kwerenda | No | ciąg | Kursor do użycia w paginacji.
after to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów kończących się na obj_foo, kolejne wywołanie może zawierać after=obj_foo, aby pobrać następną stronę listy. |
| przed | kwerenda | No | ciąg | Kursor do użycia w paginacji.
before to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów, zaczynając od obj_foo, kolejne wywołanie może zawierać zanim=obj_foo, aby pobrać poprzednią stronę listy. |
| filtr | kwerenda | No | ciąg Możliwe wartości: in_progress, completed, , failedcancelled |
Filtruj według statusu pliku. Jeden z in_progress, , , completed. failedcancelled |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | listVectorStoreFilesResponse |
Examples
Przykład
Zwraca listę plików pamięci wektorowej.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
},
{
"id": "file-abc456",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
}
],
"first_id": "file-abc123",
"last_id": "file-abc456",
"has_more": false
}
}
Utwórz - plik pamięci wektorowej
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
Utwórz plik pamięci wektorowej, dołączając plik do magazynu wektorowego.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID wektorowego zapisu, dla którego należy utworzyć plik. |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| chunking_strategy | fragmentingStrategyRequestParam | Strategia chunkingu używana do chunkowania plików. Jeśli nie jest ustawione, użyję tej strategii auto . |
No | |
| identyfikator_pliku | ciąg | Identyfikator pliku, którego powinien używać magazyn wektorowy. Przydatne do takich narzędzi file_search do dostępu do plików. |
Tak |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | vectorStoreFileObject |
Examples
Przykład
Utwórz plik pamięci wektorowej, dołączając plik do magazynu wektorowego.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files?api-version=2025-04-01-preview
{
"file_id": "file-abc123"
}
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"usage_bytes": 1234,
"vector_store_id": "vs_abcd",
"status": "completed",
"last_error": null
}
}
Pobierz - plik pamięci wektorowej
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
Pobiera plik pamięci wektorowej.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID magazynu wektorowego, do którego należy plik. |
| identyfikator_pliku | ścieżka | Tak | ciąg | Identyfikacja pliku pobieranego. |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | vectorStoreFileObject |
Examples
Przykład
Pobiera plik pamięci wektorowej.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abcd",
"status": "completed",
"last_error": null
}
}
Usuń - plik pamięci wektorowej
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
Usuń plik pamięci wektorowej. To usunie plik z pamięci wektorowej, ale sam plik nie zostanie usunięty. Aby usunąć plik, użyj endpointu usuwania plików.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID magazynu wektorowego, do którego należy plik. |
| identyfikator_pliku | ścieżka | Tak | ciąg | ID pliku do usunięcia. |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | deleteVectorStoreFileResponse |
Examples
Przykład
Usuń plik pamięci wektorowej. To usunie plik z pamięci wektorowej, ale sam plik nie zostanie usunięty. Aby usunąć plik, użyj endpointu usuwania plików.
DELETE https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "file_abc123",
"object": "vector_store.file.deleted",
"deleted": true
}
}
Updatevectorstorefileattributes
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}?api-version=2025-04-01-preview
Aktualizuj atrybuty w pliku pamięci wektorowej.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID wektorowego przechowywania, do którego należy plik. |
| identyfikator_pliku | ścieżka | Tak | ciąg | ID pliku do aktualizacji atrybutów. |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| attributes | VectorStoreFileAttributes | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie oraz do zapytań o obiekty za pomocą API lub pulpitu. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków, wartości boole lub liczby. |
Tak |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | vectorStoreFileObject |
Pobieranie wektorowego przechowywania zawartości pliku
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/files/{file_id}/content?api-version=2025-04-01-preview
Pobierz przeanalizowaną zawartość pliku pamięci wektorowej.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID magazynu wektorowego. |
| identyfikator_pliku | ścieżka | Tak | ciąg | ID pliku w magazynie wektorowym. |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | VectorStoreFileContentResponse |
Wyszukiwanie w pamięci wektorowej
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/search?api-version=2025-04-01-preview
Przeszukaj magazyn wektorowy pod kątem odpowiednich fragmentów na podstawie filtra zapytań i atrybutów pliku.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID wektora do wyszukiwania. |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| filters | ComparisonFilter lub CompoundFilter | Filtr do stosowania na podstawie atrybutów pliku. | No | |
| maks_liczba_wyników | liczba całkowita | Maksymalna liczba wyników do zwrócenia. Ta liczba powinna mieścić się w zakresie od 1 do 50 włącznie. | No | 10 |
| kwerenda | ciąg lub tablica | Ciąg zapytania do wyszukiwania | Tak | |
| opcje rankingu | obiekt | Opcje rankingu w wyszukiwarce. | No | |
| └} ranker | wyliczenie | Możliwe wartości: auto, default-2024-11-15 |
No | |
| └─ próg_punktowy | number | No | 0 | |
| rewrite_query | boolean | Czy przepisać zapytanie w języku naturalnym dla wyszukiwania wektorowego. | No | Nieprawda |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | VectorStoreSearchResultsPage |
Stwórz - Partia plików Vector Store
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview
Utwórz partię plików do pamięci wektorowej.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID magazynu wektorowego, dla którego należy utworzyć File Batch. |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| chunking_strategy | fragmentingStrategyRequestParam | Strategia chunkingu używana do chunkowania plików. Jeśli nie jest ustawione, użyję tej strategii auto . |
No | |
| identyfikatory_plików | macierz | Lista identyfikatorów plików, których powinien używać magazyn wektorowy. Przydatne do takich narzędzi file_search do dostępu do plików. |
Tak |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | vectorStoreFileBatchObject |
Examples
Przykład
Utwórz partię plików do pamięci wektorowej.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches?api-version=2025-04-01-preview
{
"file_ids": [
"file-abc123",
"file-abc456"
]
}
Odpowiedzi: Kod statusu: 200
{
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "in_progress",
"file_counts": {
"in_progress": 1,
"completed": 1,
"failed": 0,
"cancelled": 0,
"total": 0
}
}
Pobierz - Partia plików Vector Store
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview
Pobiera partię plików z pamięci wektorowej.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID pamięci wektorowej, do której należy partia plików. |
| batch_id | ścieżka | Tak | ciąg | ID pobieranej partii plików. |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | vectorStoreFileBatchObject |
Examples
Przykład
Pobiera partię plików z pamięci wektorowej.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "in_progress",
"file_counts": {
"in_progress": 1,
"completed": 1,
"failed": 0,
"cancelled": 0,
"total": 0
}
}
}
Anuluj - Partia plików pamięci wektorowej
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview
Anuluj partię plików z pamięci wektorowej. Próbuje to jak najszybciej anulować przetwarzanie plików w tej partii.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID pamięci wektorowej, do której należy partia plików. |
| batch_id | ścieżka | Tak | ciąg | ID partii plików do anulowania. |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | vectorStoreFileBatchObject |
Examples
Przykład
Anuluj partię plików z pamięci wektorowej. Próbuje to jak najszybciej anulować przetwarzanie plików w tej partii.
POST https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/cancel?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"id": "vsfb_abc123",
"object": "vector_store.file_batch",
"created_at": 1699061776,
"vector_store_id": "vs_abc123",
"status": "cancelling",
"file_counts": {
"in_progress": 12,
"completed": 3,
"failed": 0,
"cancelled": 0,
"total": 15
}
}
}
Lista - pliki wsadowe Vector Store
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview
Zwraca listę plików pamięci wektorowej w partii.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| identyfikator_magazynu_wektorów | ścieżka | Tak | ciąg | ID pamięci wektorowej, do której należą pliki. |
| batch_id | ścieżka | Tak | ciąg | ID partii plików, do której należą te pliki. |
| limit | kwerenda | No | liczba całkowita | Limit liczby obiektów, które należy zwrócić. Limit może wahać się od 1 do 100, a domyślny to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Sortuj kolejność według znacznika created_at czasu obiektów.
asc dla kolejności rosnącej i desc malejącej. |
| Po | kwerenda | No | ciąg | Kursor do użycia w paginacji.
after to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów kończących się na obj_foo, kolejne wywołanie może zawierać after=obj_foo, aby pobrać następną stronę listy. |
| przed | kwerenda | No | ciąg | Kursor do użycia w paginacji.
before to identyfikator obiektu, który definiuje twoje miejsce na liście. Na przykład, jeśli wykonasz żądanie listy i otrzymasz 100 obiektów, zaczynając od obj_foo, kolejne wywołanie może zawierać zanim=obj_foo, aby pobrać poprzednią stronę listy. |
| filtr | kwerenda | No | ciąg Możliwe wartości: in_progress, completed, , failedcancelled |
Filtruj według statusu pliku. Jeden z in_progress, , , completed. failedcancelled |
| wersja API | kwerenda | Tak | ciąg | wersja interfejsu API |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | listVectorStoreFilesResponse |
Examples
Przykład
Zwraca listę plików pamięci wektorowej.
GET https://{endpoint}/openai/vector_stores/{vector_store_id}/file_batches/{batch_id}/files?api-version=2025-04-01-preview
Odpowiedzi: Kod statusu: 200
{
"body": {
"object": "list",
"data": [
{
"id": "file-abc123",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
},
{
"id": "file-abc456",
"object": "vector_store.file",
"created_at": 1699061776,
"vector_store_id": "vs_abc123"
}
],
"first_id": "file-abc123",
"last_id": "file-abc456",
"has_more": false
}
}
Utwórz - Sesja w czasie rzeczywistym
POST https://{endpoint}/openai/realtimeapi/sessions?api-version=2025-04-01-preview
Stwórz efemeryczny token API do użycia w aplikacjach po stronie klienta z API czasu rzeczywistego. Można skonfigurować z tymi samymi parametrami sesji co zdarzenie session.update klienta.
Odpowiada obiektem sesji oraz kluczem client_secret zawierającym użyteczny, efemeryczny token API, który może być używany do uwierzytelniania klientów przeglądarki dla API czasu rzeczywistego.
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| input_audio_format | wyliczenie | Format dźwięku wejściowego. Opcje to pcm16, g711_ulaw, lub g711_alaw.Dla pcm16, dźwięk wejściowy musi być 16-bitowy PCM przy częstotliwości próbkowania 24kHz, jednokanałowy (mono) i w rzędzie bajtów little-endian.Możliwe wartości: pcm16, g711_ulaw, g711_alaw |
No | |
| input_audio_noise_reduction | obiekt | Konfiguracja redukcji szumów audio wejściowych. Można to ustawić na null wyłączenie.Redukcja szumów filtruje dźwięk dodawany do bufora audio wejściowego przed wysłaniem do VAD i modelu. Filtrowanie dźwięku może poprawić dokładność wykrywania VAD i skrętów (zmniejszając liczbę fałszywych alarmów) oraz modelować wydajność poprzez lepszą percepcję dźwięku wejściowego. |
No | |
| └typ | wyliczenie | Rodzaj redukcji szumów.
near_field jest dla mikrofonów do bliskiego rozmowy, takich jak słuchawki, jest dla mikrofonów dalekiego pola, far_field takich jak laptopy lub mikrofony konferencyjne.Możliwe wartości: near_field, far_field |
No | |
| input_audio_transcription | obiekt | Konfiguracja transkrypcji audio wejściowej domyślnie jest wyłączona i można ustawić null na wyłączenie po włączeniu. Transkrypcja audio wejściowego nie jest natywna dla modelu, ponieważ model konsumuje dźwięk bezpośrednio. Transkrypcja działa asynchronicznie przez punkt końcowy Transcriptions i powinna być traktowana jako wskazówka dla treści audio wejściowej, a nie dokładnie to, co model usłyszał. Klient może opcjonalnie ustawić język i prompt transkrypcji, co zapewnia dodatkowe wskazówki dla usługi transkrypcji. |
No | |
| └* język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np.) enpoprawia dokładność i opóźnienia. |
No | |
| └─ Model | ciąg | Model do transkrypcji, obecnie dostępne opcje to gpt-4o-transcribe, gpt-4o-transcribe-diarize, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, oraz whisper-1. |
No | |
| Zachęta └* | ciąg | Opcjonalny tekst wskazujący styl modelu lub kontynuujący wcześniejszy segment audio. Dla whisper-1, prompt to lista słów kluczowych.W modelach gpt-4o-transcribe prompt to wolny ciąg tekstowy, na przykład "expect words related to technology". |
No | |
| instructions | ciąg | Domyślne instrukcje systemowe (czyli komunikat systemowy) były dołączane do wywołań modelu. To pole pozwala klientowi kierować modelem na żądane odpowiedzi. Model można pouczać na temat treści i formatu odpowiedzi (np. "bądź bardzo zwięzły", "zachowuj się przyjaźnie", "oto przykłady dobrych odpowiedzi") oraz zachowania audio (np. "mów szybko", "wprowadź emocje do głosu", "często się śmiej"). Instrukcje nie są gwarantowane przez model przestrzegania, ale dostarczają mu wskazówek dotyczących pożądanego zachowania. Należy zauważyć, że serwer ustawia domyślne instrukcje, które będą używane, jeśli to pole nie jest ustawione i są widoczne w zdarzeniu session.created na początku sesji. |
No | |
| max_response_output_tokens | liczba całkowita lub ciąg tekstu | Maksymalna liczba tokenów wyjściowych dla jednej odpowiedzi asystenta, wliczając wywołania narzędzi. Podaj liczbę całkowitą od 1 do 4096, aby ograniczyć tokeny wyjściowe lub inf dla maksymalnej dostępności tokenów dla danego modelu. Domyślnie przyjmuje .inf |
No | |
| Sposoby | Zestaw modalności, z którymi model może reagować. Aby wyłączyć dźwięk, ustaw to na ["text"]. |
No | ||
| model | ciąg | Nazwa wdrożenia użytego podczas tej sesji. |
No | |
| output_audio_format | wyliczenie | Format dźwięku wyjściowego. Opcje to pcm16, g711_ulaw, lub g711_alaw.Dla pcm16, dźwięk wyjściowy jest próbkowany z częstotliwością 24kHz.Możliwe wartości: pcm16, g711_ulaw, g711_alaw |
No | |
| temperatura | number | Temperatura próbkowania dla modelu ograniczona do [0.6, 1.2]. W przypadku modeli audio zaleca się temperaturę 0,8 dla najlepszej wydajności. |
No | 0.8 |
| tool_choice | ciąg | Jak model wybiera narzędzia. Opcje to auto, none, required, lub określ funkcję. |
No | samochód |
| Narzędzia | macierz | Narzędzia (funkcje) dostępne dla modelu. | No | |
| turn_detection | obiekt | Konfiguracja wykrywania tur, np. Server VAD lub Semantic VAD. Można to ustawić na null wyłączenie, w takim przypadku klient musi ręcznie wywołać odpowiedź modelu.Server VAD oznacza, że model wykrywa początek i koniec mowy na podstawie głośności dźwięku i odpowiada na końcu wypowiedzi użytkownika. Semantyczny VAD jest bardziej zaawansowany i wykorzystuje model wykrywania skrętów (we współpracy z VAD), aby semantycznie oszacować, czy użytkownik skończył mówić, a następnie dynamicznie ustawia limit czasu na podstawie tego prawdopodobieństwa. Na przykład, jeśli dźwięk użytkownika kończy się na , uhhmmodel uzyska niskie prawdopodobieństwo zakończenia tury i dłużej czeka, aż użytkownik będzie kontynuował mówienie. Może to być przydatne przy bardziej naturalnych rozmowach, ale może mieć wyższe opóźnienia. |
No | |
| └create_response | boolean | Czy automatycznie generować odpowiedź, gdy wystąpi zdarzenie VAD stop. |
No | True |
| └* gotowość | wyliczenie | Używany tylko w semantic_vad trybie pracy. Chęć modelu do odpowiedzi.
low poczeka dłużej, aż użytkownik będzie kontynuował mówienie, odpowiada high szybciej.
autojest domyślnym i jest równoważny .mediumMożliwe wartości: low, medium, , highauto |
No | |
| └reakcja_na_przerwanie | boolean | Czy automatycznie przerwać każdą bieżącą odpowiedź z wyjściem do domyślnej rozmowy (czyli conversation z), autogdy wystąpi zdarzenie startowe VAD. |
No | True |
| └─prefix_padding_ms | liczba całkowita | Używany tylko w server_vad trybie pracy. Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Domyślnie ustawione jest 300ms. |
No | |
| └czas_trwania_ciszy_ms | liczba całkowita | Używany tylko w server_vad trybie pracy. Czas trwania ciszy do wykrycia zatrzymania mowy (w milisekundach). Domyślnie ustawione jest 500ms. Przy krótszych wartościach model odpowiada szybciej, ale może wtrącać się na krótkie przerwy użytkownika. |
No | |
| └* próg | number | Używany tylko w server_vad trybie pracy. Próg aktywacji dla VAD (0,0 do 1,0), domyślnie wynosi 0,5. Wyższy próg wymaga głośniejszego dźwięku do aktywacji modelu, dlatego może działać lepiej w hałaśliwym środowisku. |
No | |
| └typ | wyliczenie | Rodzaj wykrywania skrętów. Możliwe wartości: server_vad, semantic_vad |
No | |
| voice | VoiceIdsShared | No |
Responses
Kod statusu: 200
Opis: Sesja została pomyślnie utworzona.
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | RealtimeSessionCreateResponse |
Utwórz - Transcriptionrealtimesession
POST https://{endpoint}/openai/realtimeapi/transcription_sessions?api-version=2025-04-01-preview
Stwórz efemeryczny token API do użycia w aplikacjach po stronie klienta z API czasu rzeczywistego specjalnie do transkrypcji w czasie rzeczywistym.
Można skonfigurować z tymi samymi parametrami sesji co zdarzenie transcription_session.update klienta.
Odpowiada obiektem sesji oraz kluczem client_secret zawierającym użyteczny, efemeryczny token API, który może być używany do uwierzytelniania klientów przeglądarki dla API czasu rzeczywistego.
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| include | macierz | Zestaw elementów do uwzględnienia w transkrypcji. Obecnie dostępne przedmioty to: - item.input_audio_transcription.logprobs |
No | |
| input_audio_format | wyliczenie | Format dźwięku wejściowego. Opcje to pcm16, g711_ulaw, lub g711_alaw.Dla pcm16, dźwięk wejściowy musi być 16-bitowy PCM przy częstotliwości próbkowania 24kHz, jednokanałowy (mono) i w rzędzie bajtów little-endian.Możliwe wartości: pcm16, g711_ulaw, g711_alaw |
No | |
| input_audio_noise_reduction | obiekt | Konfiguracja redukcji szumów audio wejściowych. Można to ustawić na null wyłączenie.Redukcja szumów filtruje dźwięk dodawany do bufora audio wejściowego przed wysłaniem do VAD i modelu. Filtrowanie dźwięku może poprawić dokładność wykrywania VAD i skrętów (zmniejszając liczbę fałszywych alarmów) oraz modelować wydajność poprzez lepszą percepcję dźwięku wejściowego. |
No | |
| └typ | wyliczenie | Rodzaj redukcji szumów.
near_field jest dla mikrofonów do bliskiego rozmowy, takich jak słuchawki, jest dla mikrofonów dalekiego pola, far_field takich jak laptopy lub mikrofony konferencyjne.Możliwe wartości: near_field, far_field |
No | |
| input_audio_transcription | obiekt | Konfiguracja do transkrypcji audio wejściowej. Klient może opcjonalnie ustawić język i prompt transkrypcji, co zapewnia dodatkowe wskazówki dla usługi transkrypcji. |
No | |
| └* język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np.) enpoprawia dokładność i opóźnienia. |
No | |
| └─ Model | wyliczenie | Model do transkrypcji, obecnie dostępne opcje to gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, oraz whisper-1.Możliwe wartości: gpt-4o-transcribe, gpt-4o-mini-transcribe, , gpt-4o-mini-transcribe-2025-12-15whisper-1 |
No | |
| Zachęta └* | ciąg | Opcjonalny tekst wskazujący styl modelu lub kontynuujący wcześniejszy segment audio. Dla whisper-1, prompt to lista słów kluczowych.W modelach gpt-4o-transcribe prompt to wolny ciąg tekstowy, na przykład "expect words related to technology". |
No | |
| Sposoby | Zestaw modalności, z którymi model może reagować. Aby wyłączyć dźwięk, ustaw to na ["text"]. |
No | ||
| turn_detection | obiekt | Konfiguracja wykrywania tur, np. Server VAD lub Semantic VAD. Można to ustawić na null wyłączenie, w takim przypadku klient musi ręcznie wywołać odpowiedź modelu.Server VAD oznacza, że model wykrywa początek i koniec mowy na podstawie głośności dźwięku i odpowiada na końcu wypowiedzi użytkownika. Semantyczny VAD jest bardziej zaawansowany i wykorzystuje model wykrywania skrętów (we współpracy z VAD), aby semantycznie oszacować, czy użytkownik skończył mówić, a następnie dynamicznie ustawia limit czasu na podstawie tego prawdopodobieństwa. Na przykład, jeśli dźwięk użytkownika kończy się na , uhhmmodel uzyska niskie prawdopodobieństwo zakończenia tury i dłużej czeka, aż użytkownik będzie kontynuował mówienie. Może to być przydatne przy bardziej naturalnych rozmowach, ale może mieć wyższe opóźnienia. |
No | |
| └create_response | boolean | Czy automatycznie generować odpowiedź, gdy wystąpi zdarzenie VAD stop. Niedostępne podczas sesji transkrypcji. |
No | True |
| └* gotowość | wyliczenie | Używany tylko w semantic_vad trybie pracy. Chęć modelu do odpowiedzi.
low poczeka dłużej, aż użytkownik będzie kontynuował mówienie, odpowiada high szybciej.
autojest domyślnym i jest równoważny .mediumMożliwe wartości: low, medium, , highauto |
No | |
| └reakcja_na_przerwanie | boolean | Czy automatycznie przerwać każdą bieżącą odpowiedź z wyjściem do domyślnej rozmowy (czyli conversation z), autogdy wystąpi zdarzenie startowe VAD. Niedostępne podczas sesji transkrypcji. |
No | True |
| └─prefix_padding_ms | liczba całkowita | Używany tylko w server_vad trybie pracy. Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Domyślnie ustawione jest 300ms. |
No | |
| └czas_trwania_ciszy_ms | liczba całkowita | Używany tylko w server_vad trybie pracy. Czas trwania ciszy do wykrycia zatrzymania mowy (w milisekundach). Domyślnie ustawione jest 500ms. Przy krótszych wartościach model odpowiada szybciej, ale może wtrącać się na krótkie przerwy użytkownika. |
No | |
| └* próg | number | Używany tylko w server_vad trybie pracy. Próg aktywacji dla VAD (0,0 do 1,0), domyślnie wynosi 0,5. Wyższy próg wymaga głośniejszego dźwięku do aktywacji modelu, dlatego może działać lepiej w hałaśliwym środowisku. |
No | |
| └typ | wyliczenie | Rodzaj wykrywania skrętów. Możliwe wartości: server_vad, semantic_vad |
No |
Responses
Kod statusu: 200
Opis: Sesja została pomyślnie utworzona.
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | RealtimeTranscriptionSessionCreateResponse |
Responses
POST https://{endpoint}/openai/responses?api-version=2025-04-01-preview
Tworzy modelową odpowiedź.
Treść żądania
Typ zawartości: aplikacja/json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| include | macierz | No | ||
| dane wejściowe | ciąg lub tablica | Dane wejściowe modelu | Tak | |
| instructions | ciąg | Wprowadza komunikat systemowy (lub deweloperski) jako pierwszy element w kontekście modelu. Używając razem z previous_response_id, instrukcje z poprzedniej odpowiedzi nie zostaną przeniesione do następnej odpowiedzi. Ułatwia to zamianę komunikatów systemowych (lub deweloperskich) w nowych odpowiedziach. |
No | |
| max_output_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować dla odpowiedzi, w tym widocznych tokenów wyjściowych i stanu rozmowy. |
No | |
| wywołania_narzędzia_równoległe | boolean | Czy pozwolić modelu na wykonywanie wywołań narzędzi równolegle. |
No | True |
| previous_response_id | ciąg | Unikalne ID poprzedniej odpowiedzi na model. Wykorzystaj to do tworzenia wieloturowych rozmów. Dowiedz się więcej o stanie rozmowy. |
No | |
| reasoning | Reasoning | Opcje konfiguracyjne modeli rozumowania. | No | |
| przechowywać | boolean | Czy przechowywać wygenerowaną odpowiedź modelu do późniejszego pobrania za pomocą API. |
No | True |
| odtwarzać strumieniowo | boolean | Jeśli ustawiono na true, dane odpowiedzi modelu będą przesyłane do klienta w momencie generowania za pomocą zdarzeń wysyłanych przez serwer. Zobacz sekcję Streaming poniżej, aby uzyskać więcej informacji. |
No | Nieprawda |
| SMS | obiekt | Opcje konfiguracyjne odpowiedzi tekstowej z modelu. Może to być tekst zwykły lub ustrukturyzowane dane JSON. Więcej informacji: - Wejścia i wyjścia tekstowe - Strukturalne wyniki |
No | |
| Format └─ | TextResponseFormatConfiguration | Obiekt określający format, który model musi wyprowadzać. Konfiguracja { "type": "json_schema" } umożliwia Structured Outputs, co zapewnia, że model odpowiada dostarczonemu schematowi JSON.Domyślny format to { "type": "text" } brak dodatkowych opcji.Nie zaleca się dla modeli GPT-4O i nowszych: Ustawienie na { "type": "json_object" } włączenie starszego trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON. Preferowane jest używanie json_schema w modelach, które go obsługują. |
No | |
| tool_choice | ToolChoiceOptions,ToolChoiceTypes lub ToolChoiceFunction | Jak model powinien wybierać, którego narzędzia (lub narzędzi) użyć podczas generowania odpowiedzi. Zobacz parametr, tools aby zobaczyć, jak określić, które narzędzia model może wywołać. |
No | |
| Narzędzia | macierz | Zestaw narzędzi, które model może wywołać podczas generowania odpowiedzi. Możesz określić, którego narzędzia użyć, ustawiając parametr.tool_choiceDwie kategorie narzędzi, które możesz udostępnić modelowi, to: - Wbudowane narzędzia: Narzędzia udostępniane przez OpenAI, które rozszerzają możliwości modelu |
No | |
| truncation | wyliczenie | Strategia obcięcia do wykorzystania w odpowiedzi modelu. - auto: Jeśli kontekst tej odpowiedzi i poprzednich przekroczy rozmiar okna kontekstowego modelu, model obcina odpowiedź, aby dopasowała się do okna kontekstu, rezygnując z elementów wejściowych w trakcie rozmowy. - disabled (domyślnie): Jeśli odpowiedź modelu przekroczy rozmiar okna kontekstowego dla modelu, żądanie nie zostanie zadane z błędem 400.Możliwe wartości: auto, disabled |
No |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | response | |
| text/event-stream | responseStreamEvent |
Kod statusu: domyślny
Opis: Usługa niedostępna
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | errorResponse |
API Responses - elementy wejściowe
GET https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview
Pobiera odpowiedź modelu z podanym ID.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| response_id | ścieżka | Tak | ciąg | ID odpowiedzi do pobrania. |
| include | kwerenda | No | macierz | Dodatkowe pola do uwzględnienia w odpowiedzi. Zobacz include parametr tworzenia odpowiedzi powyżej, aby uzyskać więcej informacji. |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | response |
Kod statusu: domyślny
Opis: Usługa niedostępna
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | errorResponse |
Usuń odpowiedź
DELETE https://{endpoint}/openai/responses/{response_id}?api-version=2025-04-01-preview
Usuwa odpowiedź modelu z podanym ID.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| response_id | ścieżka | Tak | ciąg | ID odpowiedzi do usunięcia. |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
Kod statusu: 404
Opis: Nie znaleziono
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | error |
Kod statusu: domyślny
Opis: Usługa niedostępna
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | errorResponse |
Responses API – lista elementów response
GET https://{endpoint}/openai/responses/{response_id}/input_items?api-version=2025-04-01-preview
Zwraca listę elementów wejściowych dla danej odpowiedzi.
Parametry identyfikatora URI
| Name | W | Obowiązkowy | Typ | Opis |
|---|---|---|---|---|
| punkt końcowy | ścieżka | Tak | ciąg znaków URL | Obsługiwane Azure endpointów OpenAI (protokół i nazwa hosta, na przykład: https://aoairesource.openai.azure.com. Zastąp "aoairesource" nazwą swojego zasobu Azure OpenAI). https://{nazwa_zasobu}.openai.azure.com |
| response_id | ścieżka | Tak | ciąg | ID odpowiedzi do pobrania elementów wejściowych dla. |
| limit | kwerenda | No | liczba całkowita | Limit liczby obiektów, które należy zwrócić. Limit może wahać się od 1 do 100, a domyślny to 20. |
| porządek | kwerenda | No | ciąg Możliwe wartości: asc, desc |
Kolejność zwracania elementów wejściowych. Domyślnie jest asc.- asc: Zwróć elementy wejściowe w kolejności rosnącej.- desc: Zwróć elementy wejściowe w kolejności malejącej. |
| Po | kwerenda | No | ciąg | ID przedmiotu do listy elementów, używany w paginacji. |
| przed | kwerenda | No | ciąg | ID przedmiotu do wcześniejszej listy elementów, używany w paginacji. |
Nagłówek żądania
Używaj uwierzytelniania opartego na tokenach lub klucza API. Zaleca się uwierzytelnianie za pomocą tokenów, które jest bardziej bezpieczne.
| Name | Obowiązkowy | Typ | Opis |
|---|---|---|---|
| Autoryzacja | True | ciąg |
Przykład:Authorization: Bearer {Azure_OpenAI_Auth_Token}Aby wygenerować token uwierzytelniający za pomocą Azure CLI: az account get-access-token --resource https://cognitiveservices.azure.comTyp: oauth2 Adres URL autoryzacji: https://login.microsoftonline.com/common/oauth2/v2.0/authorizeZAKRES: https://ai.azure.com/.default |
| klucz API | True | ciąg | Udostępnij klucz API Azure OpenAI tutaj |
Responses
Kod statusu: 200
Opis: OK
| Typ zawartości | Typ | Opis |
|---|---|---|
| application/json | responseItemList |
Components
errorResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| błąd | error | No |
errorBase
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| kod | ciąg | No | ||
| komunikat | ciąg | No |
błąd
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| inner_error | innerError | Błąd wewnętrzny z dodatkowymi szczegółami. | No | |
| param | ciąg | No | ||
| typ | ciąg | No |
innerError
Błąd wewnętrzny z dodatkowymi szczegółami.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| kod | innerErrorCode | Kody błędów dla wewnętrznego obiektu błędu. | No | |
| content_filter_results | contentFilterPromptResults | Informacje o kategorii filtrowania treści (nienawiść, seksualność, przemoc self_harm), czy została wykryta, a także o poziomie nasilenia (very_low, niski, średni, wysoki skali decydującej o intensywności i ryzyku szkodliwych treści) oraz czy zostały one przefiltrowane, czy nie. Informacje o treściach jailbreakowych i przekleństwach, czy zostały wykryte oraz czy zostały przefiltrowane, czy nie. Oraz informacje o liście blokowanych klientów, czy została przefiltrowana i jej identyfikatorze. | No |
innerErrorCode
Kody błędów dla wewnętrznego obiektu błędu.
| Majątek | Wartość |
|---|---|
| Opis | Kody błędów dla wewnętrznego obiektu błędu. |
| Typ | ciąg |
| Wartości | ResponsibleAIPolicyViolation |
dalleErrorResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| błąd | dalleError | No |
dalleError
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| inner_error | dalleInnerError | Błąd wewnętrzny z dodatkowymi szczegółami. | No | |
| param | ciąg | No | ||
| typ | ciąg | No |
dalleInnerError
Błąd wewnętrzny z dodatkowymi szczegółami.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| kod | innerErrorCode | Kody błędów dla wewnętrznego obiektu błędu. | No | |
| content_filter_results | dalleFilterResults | Informacje o kategorii filtrowania treści (nienawiść, seksualność, przemoc self_harm), czy została wykryta, a także o poziomie nasilenia (very_low, niski, średni, wysoki skali decydującej o intensywności i ryzyku szkodliwych treści) oraz czy zostały one przefiltrowane, czy nie. Informacje o treściach jailbreakowych i przekleństwach, czy zostały wykryte oraz czy zostały przefiltrowane, czy nie. Oraz informacje o liście blokowanych klientów, czy została przefiltrowana i jej identyfikatorze. | No | |
| (revised_prompt remains unchanged, assuming it is a placeholder requiring no translation or adaptation) | ciąg | Prompt, który został użyty do wygenerowania obrazu, jeśli nastąpiła jakaś poprawka w poleceniu. | No |
contentFilterCompletionTextSpan
Opisuje zakres w wygenerowanym tekście uzupełnienia. Przesunięcie 0 to pierwszy punkt kodowy UTF32 tekstu uzupełnienia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| completion_end_offset | liczba całkowita | Przesunięcie pierwszego punktu kodowego UTF32, który jest wyłączony z rozpiętości. To pole jest zawsze równe completion_start_offset dla rozpiętości pustych. To pole jest zawsze większe niż completion_start_offset dla rozpięć niepustych. | Tak | |
| completion_start_offset | liczba całkowita | Przesunięcie punktu kodowego UTF32, który rozpoczyna rozpiętość. | Tak |
podstawaWynikuFiltraZawartości
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| filtered | boolean | Tak |
WynikPoziomuSurowościFiltraTreści
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| filtered | boolean | Tak | ||
| severity | ciąg | No |
WykrytoWynikFiltruTreści
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| detected | boolean | No | ||
| filtered | boolean | Tak |
Filtr treści wykryty z wynikiem cytowania
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| cytat | obiekt | No | ||
| └* adres URL | ciąg | No | ||
| └─ Licencja | ciąg | No |
contentFilterDetectedWithCompletionTextSpansResult
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| details | macierz | No |
contentFilterIdResult
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| filtered | boolean | Tak | ||
| id | ciąg | No |
PodstawaWynikówFiltraZawartości
Informacje o wynikach filtrowania treści.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| custom_blocklists | contentFilterDetailedResults | Filtrowanie treści daje szczegółowe identyfikatory filtrów treści dla przefiltrowanych segmentów. | No | |
| błąd | errorBase | No | ||
| hate | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| profanity | wynikWykrywaniaFiltruZawartości | No | ||
| self_harm | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| sexual | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| violence | WynikFiltrowaniaZawartościWedługNasilenia | No |
contentFilterPromptResults
Informacje o kategorii filtrowania treści (nienawiść, seksualność, przemoc self_harm), czy została wykryta, a także o poziomie nasilenia (very_low, niski, średni, wysoki skali decydującej o intensywności i ryzyku szkodliwych treści) oraz czy zostały one przefiltrowane, czy nie. Informacje o treściach jailbreakowych i przekleństwach, czy zostały wykryte oraz czy zostały przefiltrowane, czy nie. Oraz informacje o liście blokowanych klientów, czy została przefiltrowana i jej identyfikatorze.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| custom_blocklists | contentFilterDetailedResults | Filtrowanie treści daje szczegółowe identyfikatory filtrów treści dla przefiltrowanych segmentów. | No | |
| błąd | errorBase | No | ||
| hate | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| indirect_attack | wynikWykrywaniaFiltruZawartości | No | ||
| jailbreak | wynikWykrywaniaFiltruZawartości | No | ||
| profanity | wynikWykrywaniaFiltruZawartości | No | ||
| self_harm | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| sexual | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| violence | WynikFiltrowaniaZawartościWedługNasilenia | No |
wynikiWyboruFiltruZawartości
Informacje o kategorii filtrowania treści (nienawiść, seksualność, przemoc self_harm), czy została wykryta, a także o poziomie nasilenia (very_low, niski, średni, wysoki skali decydującej o intensywności i ryzyku szkodliwych treści) oraz czy zostały one przefiltrowane, czy nie. Informacje o tekście i przekleństwach stron trzecich, czy zostały wykryte oraz czy zostały przefiltrowane, czy nie. Oraz informacje o liście blokowanych klientów, czy została przefiltrowana i jej identyfikatorze.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| custom_blocklists | contentFilterDetailedResults | Filtrowanie treści daje szczegółowe identyfikatory filtrów treści dla przefiltrowanych segmentów. | No | |
| błąd | errorBase | No | ||
| hate | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| profanity | wynikWykrywaniaFiltruZawartości | No | ||
| protected_material_code | wykryto filtr treści z wynikiem cytowania | No | ||
| protected_material_text | wynikWykrywaniaFiltruZawartości | No | ||
| self_harm | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| sexual | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| ungrounded_material | contentFilterDetectedWithCompletionTextSpansResult | No | ||
| violence | WynikFiltrowaniaZawartościWedługNasilenia | No |
contentFilterDetailedResults
Filtrowanie treści daje szczegółowe identyfikatory filtrów treści dla przefiltrowanych segmentów.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| details | macierz | No | ||
| filtered | boolean | Tak |
WynikFiltrowaniaPromptu
Filtrowanie treści wychodzi dla pojedynczego promptu w żądaniu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| content_filter_results | contentFilterPromptResults | Informacje o kategorii filtrowania treści (nienawiść, seksualność, przemoc self_harm), czy została wykryta, a także o poziomie nasilenia (very_low, niski, średni, wysoki skali decydującej o intensywności i ryzyku szkodliwych treści) oraz czy zostały one przefiltrowane, czy nie. Informacje o treściach jailbreakowych i przekleństwach, czy zostały wykryte oraz czy zostały przefiltrowane, czy nie. Oraz informacje o liście blokowanych klientów, czy została przefiltrowana i jej identyfikatorze. | No | |
| prompt_index | liczba całkowita | No |
pokażWynikiFiltru
Filtrowanie treści daje zero lub więcej podpowiedzi w żądaniu. W przypadku zapytania streamingowego wyniki dla różnych promptów mogą pojawić się w różnych godzinach lub w różnej kolejności.
Nie ma zdefiniowanych właściwości dla tego komponentu.
Wyniki Filtra Treści DALL-E
Informacje o wynikach filtrowania treści.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| hate | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| self_harm | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| sexual | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| violence | WynikFiltrowaniaZawartościWedługNasilenia | No |
dalleFilterResults
Informacje o kategorii filtrowania treści (nienawiść, seksualność, przemoc self_harm), czy została wykryta, a także o poziomie nasilenia (very_low, niski, średni, wysoki skali decydującej o intensywności i ryzyku szkodliwych treści) oraz czy zostały one przefiltrowane, czy nie. Informacje o treściach jailbreakowych i przekleństwach, czy zostały wykryte oraz czy zostały przefiltrowane, czy nie. Oraz informacje o liście blokowanych klientów, czy została przefiltrowana i jej identyfikatorze.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| custom_blocklists | contentFilterDetailedResults | Filtrowanie treści daje szczegółowe identyfikatory filtrów treści dla przefiltrowanych segmentów. | No | |
| hate | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| jailbreak | wynikWykrywaniaFiltruZawartości | No | ||
| profanity | wynikWykrywaniaFiltruZawartości | No | ||
| self_harm | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| sexual | WynikFiltrowaniaZawartościWedługNasilenia | No | ||
| violence | WynikFiltrowaniaZawartościWedługNasilenia | No |
ŻądanieKończeniaCzatuWspólne
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| frequency_penalty | number | Liczba między -2,0 a 2,0. Wartości dodatnie karzą nowe tokeny na podstawie ich dotychczasowej częstotliwości w tekście, zmniejszając prawdopodobieństwo powtórzenia tej samej linii dosłownie. | No | 0 |
| logit_bias | obiekt | Zmodyfikuj prawdopodobieństwo pojawienia się określonych żetonów w finale. Akceptuje obiekt json, który mapuje tokeny (określone przez ich identyfikator tokena w tokenizatorze) na przypisaną wartość bias od -100 do 100. Matematycznie uprzedzenie jest dodawane do logitów generowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości między -1 a 1 powinny zmniejszać lub zwiększać prawdopodobieństwo selekcji; wartości takie jak -100 czy 100 powinny skutkować banem lub wyłącznym wyborem odpowiedniego tokena. | No | |
| max_completion_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować dla zakończenia, w tym widocznych tokenów wyjściowych i tokenów rozumowania. | No | |
| max_tokens | liczba całkowita | Maksymalna liczba żetonów dozwolona dla wygenerowanej odpowiedzi. Domyślnie liczba tokenów, które model może zwrócić, wynosi (4096 – tokeny promptu). To nie jest kompatybilne z modelami serii O1. | No | 4096 |
| metadane | obiekt | Tagi i wartości definiowane przez dewelopera używane do filtrowania zakończeń w pulpicie z przechowywanymi kompletacjami. | No | |
| kara za obecność | number | Liczba między -2,0 a 2,0. Wartości dodatnie karzą nowe tokeny w zależności od tego, czy pojawiają się w tekście, zwiększając prawdopodobieństwo modelu do poruszania nowych tematów. | No | 0 |
| stop | ciąg lub tablica | Do 4 sekwencji, w których API przestaje generować kolejne tokeny. | No | |
| przechowywać | boolean | Czy przechowywać wynik tego żądania zakończenia czatu do wykorzystania w naszych produktach do destylacji lub oceny modelu. | No | |
| odtwarzać strumieniowo | boolean | Jeśli jest ustawiona, wysyłane są częściowe delta wiadomości, jak w ChatGPT. Tokeny są wysyłane jako zdarzenia wysyłane wyłącznie przez serwer za pośrednictwem danych, gdy tylko stają się dostępne, a strumień kończy się wiadomością data: [DONE] . |
No | Nieprawda |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. Zazwyczaj zalecamy modyfikację tego lub top_p nie obu tych rzeczy. |
No | 1 |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy modyfikację tego lub temperature nie obu tych rzeczy. |
No | 1 |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który może pomóc Azure OpenAI monitorować i wykrywać nadużycia. | No |
utwórzŻądanieZakończenia
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| najlepsze z | liczba całkowita | Generuje best_of ukończenia po stronie serwera i zwraca "najlepsze" (to o najwyższym prawdopodobieństwie logu na token). Wyników nie można transmitować w streamingu.Gdy używa się n , best_ofkontroluje liczbę kandydatów na ukończenia i określa, n ile należy zwrócić.
best_of musi być większy niż n.Uwaga: Ponieważ ten parametr generuje wiele ukończeń, może szybko pochłonąć Twój limit tokenów. Używaj ostrożnie i upewnij się, że masz rozsądne ustawienia dla max_tokens i stop. |
No | 1 |
| echo | boolean | Powtórz prompt oprócz zakończenia |
No | Nieprawda |
| frequency_penalty | number | Liczba między -2,0 a 2,0. Wartości dodatnie karzą nowe tokeny na podstawie ich dotychczasowej częstotliwości w tekście, zmniejszając prawdopodobieństwo powtórzenia tej samej linii dosłownie. |
No | 0 |
| logit_bias | obiekt | Zmodyfikuj prawdopodobieństwo pojawienia się określonych żetonów w finale. Akceptuje obiekt JSON, który mapuje tokeny (określone przez ich identyfikator tokena w tokenizatorze GPT) na powiązaną wartość bias od -100 do 100. Matematycznie uprzedzenie jest dodawane do logitów generowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości między -1 a 1 powinny zmniejszać lub zwiększać prawdopodobieństwo selekcji; wartości takie jak -100 czy 100 powinny skutkować banem lub wyłącznym wyborem odpowiedniego tokena. Na przykład możesz przepuścić {"50256": -100} , aby zapobiec generowaniu tokena <|endoftext|> . |
No | Żadne |
| logprobs | liczba całkowita | Uwzględnij prawdopodobieństwa logiczne dla najbardziej logprobs prawdopodobnych tokenów wyjściowych, a także wybranych tokenów. Na przykład, jeśli logprobs wynosi 5, API zwróci listę 5 najbardziej prawdopodobnych tokenów. API zawsze zwraca the logprob z próbkowanego tokena, więc w odpowiedzi może być więcej logprobs+1 elementów.Maksymalna wartość dla logprobs to 5. |
No | Żadne |
| max_tokens | liczba całkowita | Maksymalna liczba tokenów, które można wygenerować podczas zakończenia. Liczba tokenów w twoim promptie plus max_tokens nie może przekroczyć długości kontekstu modelu. |
No | 16 |
| n | liczba całkowita | Ile ukończeń wygenerować dla każdego promptu. Uwaga: Ponieważ ten parametr generuje wiele ukończeń, może szybko pochłonąć Twój limit tokenów. Używaj ostrożnie i upewnij się, że masz rozsądne ustawienia dla max_tokens i stop. |
No | 1 |
| kara za obecność | number | Liczba między -2,0 a 2,0. Wartości dodatnie karzą nowe tokeny w zależności od tego, czy pojawiają się w tekście, zwiększając prawdopodobieństwo modelu do poruszania nowych tematów. |
No | 0 |
| monit | ciąg lub tablica | Prompt(y) do generowania uzupełnień kodowane jako ciąg znaków, tablica łańcuchów, tablica tokenów lub tablica tokenów. Należy zauważyć, że <|endoftext|> to separator dokumentów, który model widzi podczas treningu, więc jeśli prompt nie jest określony, model wygeneruje się tak, jakby od początku nowego dokumentu. |
Tak | |
| seed | liczba całkowita | Jeśli jest to określone, nasz system podejmuje najlepsze starania, aby próbkować deterministyczne, tak aby powtarzające się żądania z tymi samymi seed parametrami i powinny zwracać ten sam wynik.Determinizm nie jest gwarantowany i powinieneś odwołać się do parametru system_fingerprint odpowiedzi, aby monitorować zmiany w backendzie. |
No | |
| stop | ciąg lub tablica | Do 4 sekwencji, w których API przestaje generować kolejne tokeny. Zwrócony tekst nie zawiera sekwencji stop. |
No | |
| odtwarzać strumieniowo | boolean | Czy odtworzyć częściowy postęp. Jeśli są ustawione, tokeny są wysyłane jako zdarzenia wysyłane tylko na serwer z danymi, gdy tylko stają się dostępne, a strumień kończy się wiadomością data: [DONE] .
Przykład Python kod. |
No | Nieprawda |
| Sufiks | ciąg | Przyrostek pojawiający się po uzupełnieniu wstawionego tekstu. Ten parametr jest obsługiwany tylko dla gpt-3.5-turbo-instruct. |
No | Żadne |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. Zazwyczaj zalecamy modyfikację tego lub top_p nie obu tych rzeczy. |
No | 1 |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy modyfikację tego lub temperature nie obu tych rzeczy. |
No | 1 |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który pomaga monitorować i wykrywać nadużycia. |
No |
createCompletionResponse
Reprezentuje odpowiedź na zakończenie z API. Uwaga: zarówno obiekty odpowiedzi streamowane, jak i niestreamowane mają ten sam kształt (w przeciwieństwie do endpointu czatu).
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| choices | macierz | Lista opcji uzupełnienia wygenerowana przez model na prompt wejścia. | Tak | |
| utworzone | liczba całkowita | Znacznik czasu Unixa (w sekundach) momentu utworzenia zakończenia. | Tak | |
| id | ciąg | Unikalny identyfikator zakończenia. | Tak | |
| model | ciąg | Model używany do ukończenia. | Tak | |
| obiekt | wyliczenie | Typ obiektu, który zawsze jest "text_completion" Możliwe wartości: text_completion |
Tak | |
| prompt_filter_results | promptFilterResults | Filtrowanie treści daje zero lub więcej podpowiedzi w żądaniu. W przypadku zapytania streamingowego wyniki dla różnych promptów mogą pojawić się w różnych godzinach lub w różnej kolejności. | No | |
| system_fingerprint | ciąg | Ten odcisk palca reprezentuje konfigurację backend, z którą działa model. Może być używany razem z parametrem żądania, seed aby zrozumieć, kiedy wprowadzono zmiany w backendzie, które mogą wpłynąć na determinizm. |
No | |
| użycie | completionUsage | Statystyki wykorzystania wniosku o zakończenie. | No |
UtwórzŻądanieZakończeniaCzatu
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| audio | obiekt | Parametry wyjścia audio. Wymagane, gdy żądane jest wyjście audio z .modalities: ["audio"] |
No | |
| Format └─ | wyliczenie | Określa format wyjściowego dźwięku. Musi być jednym z wav, mp3, flac, opus, lub pcm16. Możliwe wartości: wav, mp3, flac, , opuspcm16 |
No | |
| └─ głos | wyliczenie | Określa typ głosu. Głosy wspierane to alloy, echo, fable, onyx, nova, oraz .shimmerMożliwe wartości: alloy, echo, fable, , onyx, nova, shimmer |
No | |
| data_sources | macierz | Wpisy konfiguracyjne dla rozszerzeń czatu Azure OpenAI, które je używają. Ta dodatkowa specyfikacja jest kompatybilna tylko z Azure OpenAI. |
No | |
| frequency_penalty | number | Liczba między -2,0 a 2,0. Wartości dodatnie karzą nowe tokeny na podstawie ich dotychczasowej częstotliwości w tekście, zmniejszając prawdopodobieństwo powtórzenia tej samej linii dosłownie. |
No | 0 |
| function_call | string lub chatCompletionFunctionCallOption | Wycofane na rzecz tool_choice.Kontroluje, która (jeśli w ogóle) funkcja jest wywoływana przez model. none oznacza to, że model nie wywołuje funkcji, lecz generuje wiadomość.auto oznacza to, że model może wybrać między generowaniem wiadomości a wywołaniem funkcji.Określenie konkretnej funkcji przez {"name": "my_function"} wymusza wywołanie tej funkcji przez model.none jest domyślnym, gdy nie ma żadnych funkcji.
auto jest domyślnym, jeśli funkcje są obecne. |
No | |
| functions | macierz | Wycofane na rzecz tools.Lista funkcji, dla których model może generować wejścia JSON. |
No | |
| logit_bias | obiekt | Zmodyfikuj prawdopodobieństwo pojawienia się określonych żetonów w finale. Akceptuje obiekt JSON, który mapuje tokeny (określone przez ich identyfikator tokena w tokenizerze) na przypisaną wartość bias od -100 do 100. Matematycznie uprzedzenie jest dodawane do logitów generowanych przez model przed próbkowaniem. Dokładny efekt różni się w zależności od modelu, ale wartości między -1 a 1 powinny zmniejszać lub zwiększać prawdopodobieństwo selekcji; wartości takie jak -100 czy 100 powinny skutkować banem lub wyłącznym wyborem odpowiedniego tokena. |
No | Żadne |
| logprobs | boolean | Czy zwracać logarytmiczne prawdopodobieństwa tokenów wyjściowych, czy nie. Jeśli jest prawdziwa, zwraca logarytmiczne prawdopodobieństwa każdego tokena wyjściowego zwróconego w .contentmessage |
No | Nieprawda |
| max_completion_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować dla zakończenia, w tym widocznych tokenów wyjściowych i tokenów rozumowania. | No | |
| max_tokens | liczba całkowita | Maksymalna liczba tokenów, które można wygenerować podczas zakończenia czatu. Całkowita długość tokenów wejściowych i wygenerowanych jest ograniczona przez długość kontekstu modelu. |
No | |
| messages | macierz | Lista wiadomości składających się na dotychczasową rozmowę. Przykład Python kod. | Tak | |
| metadane | obiekt | Tagi i wartości definiowane przez dewelopera używane do filtrowania zakończeń w pulpicie z przechowywanymi kompletacjami. | No | |
| Sposoby | ChatCompletionModalities | Typy wyników, które model chciałby wygenerować dla tego żądania. Większość modeli potrafi generować tekst, co jest domyślne: ["text"]Model ten gpt-4o-audio-preview może być również używany do generowania dźwięku. Aby poprosić ten model o generowanie zarówno odpowiedzi tekstowych, jak i audio, możesz użyć:["text", "audio"] |
No | |
| n | liczba całkowita | Ile opcji uzupełniania czatu wygenerować dla każdej wiadomości wejściowej. Pamiętaj, że opłata będzie zależana od liczby wygenerowanych żetonów we wszystkich opcjach. Dbaj n o 1 minimalizację kosztów. |
No | 1 |
| wywołania_narzędzia_równoległe | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas użycia narzędzia. | No | True |
| przewidywanie | PredictionContent | Konfiguracja dla przewidywanego wyjścia, która może znacznie poprawić czas reakcji, gdy duże części odpowiedzi modelu są znane z wyprzedzeniem. Najczęściej dzieje się to przy regeneracji pliku z jedynie drobnymi zmianami w większości treści. | No | |
| kara za obecność | number | Liczba między -2,0 a 2,0. Wartości dodatnie karzą nowe tokeny w zależności od tego, czy pojawiają się w tekście, zwiększając prawdopodobieństwo modelu do poruszania nowych tematów. |
No | 0 |
| wysiłek rozumowania | wyliczenie |
Tylko modele O1 Ogranicza wysiłek związany z rozumowaniem dla modeli rozumowania. Obecnie obsługiwane wartości to low, medium, oraz high. Zmniejszenie wysiłku rozumowania może skutkować szybszymi odpowiedziami i mniejszą liczbą tokenów używanych do rozumowania w odpowiedzi.Możliwe wartości: low, medium, high |
No | |
| format_odpowiedzi | ResponseFormatText lub ResponseFormatJsonObject lub ResponseFormatJsonSchema | Obiekt określający format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4o mini, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo nowszymi od gpt-3.5-turbo-1106.Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które gwarantują, że model odpowiada dostarczonemu schematowi JSON.Ustawienie trybu { "type": "json_object" } JSON, który gwarantuje, że generowany przez model komunikat jest poprawny w JSON.Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| seed | liczba całkowita | Ta funkcja jest w fazie beta. Jeśli jest to określone, nasz system podejmuje najlepsze starania, aby próbkować deterministyczne, tak aby powtarzające się żądania z tymi samymi seed parametrami i powinny zwracać ten sam wynik.Determinizm nie jest gwarantowany i powinieneś odwołać się do parametru system_fingerprint odpowiedzi, aby monitorować zmiany w backendzie. |
No | |
| stop | ciąg lub tablica | Do 4 sekwencji, w których API przestaje generować kolejne tokeny. |
No | |
| przechowywać | boolean | Czy przechowywać wynik tego żądania zakończenia czatu do wykorzystania w naszych produktach do destylacji lub oceny modelu. | No | |
| odtwarzać strumieniowo | boolean | Jeśli jest ustawiona, wysyłane są częściowe delta wiadomości, jak w ChatGPT. Tokeny są wysyłane jako zdarzenia wysyłane wyłącznie przez serwer za pośrednictwem danych, gdy tylko stają się dostępne, a strumień kończy się wiadomością data: [DONE] .
Przykład Python kod. |
No | Nieprawda |
| stream_options | chatCompletionStreamOptions | Opcje odpowiedzi na streaming. Ustawiam to tylko wtedy, gdy ustawiasz stream: true. |
No | Żadne |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. Zazwyczaj zalecamy modyfikację tego lub top_p nie obu tych rzeczy. |
No | 1 |
| tool_choice | chatCompletionToolChoiceOption | Kontroluje, które (jeśli w ogóle) narzędzie jest wywoływane przez model.
none oznacza to, że model nie wywołuje żadnego narzędzia, lecz generuje komunikat.
auto oznacza to, że model może wybrać między generowaniem wiadomości a wywołaniem jednego lub więcej narzędzi.
required oznacza, że model musi wywołać jedno lub więcej narzędzi. Określenie konkretnego narzędzia via {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.
none jest domyślne, gdy nie ma narzędzi.
auto jest domyślne, jeśli narzędzia są obecne. |
No | |
| Narzędzia | macierz | Lista narzędzi, które model może wywołać. Obecnie obsługiwane są tylko funkcje jako narzędzie. Użyj tego, aby uzyskać listę funkcji, dla których model może generować wejścia JSON. Obsługiwanych jest maksymalnie 128 funkcji. |
No | |
| top_logprobs | liczba całkowita | Liczba całkowita od 0 do 20 określająca liczbę najbardziej prawdopodobnych tokenów do zwrócenia na każdej pozycji tokena, z przypisanym logarytmem prawdopodobieństwa.
logprobs musi być ustawione na , true jeśli ten parametr jest używany. |
No | |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy modyfikację tego lub temperature nie obu tych rzeczy. |
No | 1 |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który pomaga monitorować i wykrywać nadużycia. |
No | |
| user_security_context | userSecurityContext | Kontekst bezpieczeństwa użytkownika zawiera kilka parametrów opisujących samą aplikację AI oraz użytkownika końcowego, który z nią wchodzi. Te obszary pomagają zespołom operacji bezpieczeństwa badać i ograniczać incydenty bezpieczeństwa, oferując kompleksowe podejście do ochrony aplikacji AI. Dowiedz się więcej o ochronie aplikacji AI za pomocą Microsoft Defender dla Chmury. | No |
userSecurityContext
Kontekst bezpieczeństwa użytkownika zawiera kilka parametrów opisujących samą aplikację AI oraz użytkownika końcowego, który z nią wchodzi. Te obszary pomagają zespołom operacji bezpieczeństwa badać i ograniczać incydenty bezpieczeństwa, oferując kompleksowe podejście do ochrony aplikacji AI. Dowiedz się więcej o ochronie aplikacji AI za pomocą Microsoft Defender dla Chmury.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| application_name | ciąg | Nazwa aplikacji. Wrażliwe dane osobowe nie powinny być uwzględniane w tej dziedzinie. | No | |
| end_user_id | ciąg | Ten identyfikator to Microsoft Entra ID (dawniej Azure Active Directory) identyfikator użytkownika używany do uwierzytelniania użytkowników końcowych w aplikacji generatywnej AI. Wrażliwe dane osobowe nie powinny być uwzględniane w tej dziedzinie. | No | |
| end_user_tenant_id | ciąg | Identyfikator tenanta Microsoft 365, do którego należy użytkownik końcowy. Jest to wymagane, gdy generatywna aplikacja AI jest wielodzierżawcą. | No | |
| source_ip | ciąg | Rejestruje adres IP oryginalnego klienta, akceptując zarówno formaty IPv4, jak i IPv6. | No |
funkcjeUkończeniaChatu
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| opis | ciąg | Opis tego, co funkcja robi, używany przez model do wyboru, kiedy i jak wywołać funkcję. | No | |
| nazwa | ciąg | Nazwa funkcji, którą ma się wywołać. Musi być od A do Z, A-Z, 0-9 lub zawierać podkreślenia i kreski, a maksymalna długość to 64. | Tak | |
| parameters | Parametry funkcji | Parametry, które funkcje akceptują, są opisane jako obiekt schematu JSON.
Zobacz przewodnik dla przykładów oraz odniesienie do schematu JSON dla dokumentacji formatu. Pomijanie parameters definiuje funkcję z pustą listą parametrów. |
No |
Opcja wywołania funkcji czatu zakończeniowego
Określenie konkretnej funkcji przez {"name": "my_function"} wymusza wywołanie tej funkcji przez model.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| nazwa | ciąg | Nazwa funkcji, którą trzeba wywołać. | Tak |
chatCompletionFunctionParameters
Parametry, które funkcje akceptują, są opisane jako obiekt schematu JSON. Zobacz przewodnik/ dla przykładów oraz w JSON Schema jako źródło dokumentacji dotyczącej formatu.
Nie ma zdefiniowanych właściwości dla tego komponentu.
chatCompletionRequestMessage
Ten składnik może być jednym z następujących elementów:
- ChatCompletionRequestDeveloperMessage
- chatCompletionRequestSystemMessage
- chatCompletionRequestUserMessage
- chatCompletionRequestAssistantMessage
- chatCompletionRequestToolMessage
- chatCompletionRequestFunctionMessage
ChatCompletionRequestDeveloperMessage
Instrukcje dostarczane przez deweloperów, których model powinien przestrzegać, niezależnie od komunikatów wysyłanych przez użytkownika.
W modelach o1 i nowszych, developer wiadomości zastępują poprzednie system komunikaty.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | ciąg lub tablica | Treść wiadomości deweloperskiej. | Tak | |
| nazwa | ciąg | Opcjonalne imię uczestnika. Dostarcza informacji modelowych pozwalających rozróżnić uczestników tej samej roli. | No | |
| rola | wyliczenie | Rola autora wiadomości, w tym przypadku developer.Możliwe wartości: developer |
Tak |
chatCompletionRequestSystemMessage
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | ciąg lub tablica | Treść wiadomości systemowej. | Tak | |
| nazwa | ciąg | Opcjonalne imię uczestnika. Dostarcza informacji modelowych pozwalających rozróżnić uczestników tej samej roli. | No | |
| rola | wyliczenie | Rola autora wiadomości, w tym przypadku system.Możliwe wartości: system |
Tak |
chatCompletionRequestUserMessage
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | ciąg lub tablica | Treść wiadomości użytkownika. |
Tak | |
| nazwa | ciąg | Opcjonalne imię uczestnika. Dostarcza informacji modelowych pozwalających rozróżnić uczestników tej samej roli. | No | |
| rola | wyliczenie | Rola autora wiadomości, w tym przypadku user.Możliwe wartości: user |
Tak |
wiadomośćAsystentaZwiązanaZProśbąOukończenieCzatu
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | ciąg lub tablica | Treść wiadomości od asystenta. Wymagane, chyba że tool_calls jest to określone lub function_call zakreślone. |
No | |
| function_call | obiekt | Wycofane i zastąpione przez tool_calls. Nazwa i argumenty funkcji, którą należy wywołać, wygenerowane przez model. |
No | |
| └─ Argumenty | ciąg | Argumenty, które mają wywołać funkcję, generowane przez model w formacie JSON. Należy zauważyć, że model nie zawsze generuje prawidłowy JSON i może halucynować parametry niezdefiniowane przez schemat funkcji. Zweryfikowaj argumenty w swoim kodzie przed wywołaniem funkcji. | No | |
| └─ nazwa | ciąg | Nazwa funkcji, którą trzeba wywołać. | No | |
| nazwa | ciąg | Opcjonalne imię uczestnika. Dostarcza informacji modelowych pozwalających rozróżnić uczestników tej samej roli. | No | |
| refusal | ciąg | Wiadomość odmowy od asystenta. | No | |
| rola | wyliczenie | Rola autora wiadomości, w tym przypadku assistant.Możliwe wartości: assistant |
Tak | |
| tool_calls | chatCompletionMessageToolCalls | Wywołania narzędzi generowane przez model, takie jak wywołania funkcji. | No |
chatCompletionRequestToolMessage
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | ciąg lub tablica | Treść wiadomości narzędziowej. | Tak | |
| rola | wyliczenie | Rola autora wiadomości, w tym przypadku tool.Możliwe wartości: tool |
Tak | |
| tool_call_id | ciąg | Wezwanie narzędzi, na które odpowiada ta wiadomość. | Tak |
chatCompletionRequestFunctionMessage
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | ciąg | Zawartość komunikatu funkcji. | Tak | |
| nazwa | ciąg | Nazwa funkcji, którą trzeba wywołać. | Tak | |
| rola | wyliczenie | Rola autora wiadomości, w tym przypadku function.Możliwe wartości: function |
Tak |
chatCompletionRequestDeveloperMessageContentPart
Ten składnik może być jednym z następujących elementów:
Żądanie czatuUzupełnienieSystemKomunikatTreśćCzęść
Ten składnik może być jednym z następujących elementów:
częśćZawartościWiadomościUżytkownikaChatCompletionRequest
Ten składnik może być jednym z następujących elementów:
- chatCompletionRequestMessageContentPartText
- chatCompletionRequestMessageContentPartImage
- chatCompletionRequestMessageContentPartAudio
CzęśćTreściWiadomościAsystentaŻądaniaUkończeniaCzatu
Ten składnik może być jednym z następujących elementów:
TreśćWiadomościNarzędziaŻądaniaUkończeniaCzatu
Ten składnik może być jednym z następujących elementów:
chatCompletionRequestMessageContentPartText
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| SMS | ciąg | Treść tekstu. | Tak | |
| typ | wyliczenie | Rodzaj treści. Możliwe wartości: text |
Tak |
chatCompletionRequestMessageContentPartAudio
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| input_audio | obiekt | Tak | ||
| └─ dane | ciąg | Dane audio zakodowane w Base64. | No | |
| Format └─ | wyliczenie | Format zakodowanych danych audio. Obecnie obsługuje "wav" i "mp3". Możliwe wartości: wav, mp3 |
No | |
| typ | wyliczenie | Rodzaj treści. Zawsze input_audio.Możliwe wartości: input_audio |
Tak |
chatCompletionRequestMessageContentPartImage
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| image_url | obiekt | Tak | ||
| └* szczegóły | wyliczenie | Określa poziom szczegółowości obrazu. Dowiedz się więcej w przewodniku Vision. Możliwe wartości: auto, low, high |
No | |
| └─ adres URL | ciąg | Można to być albo adresem URL obrazu, albo danymi obrazowymi zakodowanymi w base64. | No | |
| typ | wyliczenie | Rodzaj treści. Możliwe wartości: image_url |
Tak |
chatCompletionRequestMessageContentPartRefusal
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| refusal | ciąg | Komunikat odmowy generowany przez model. | Tak | |
| typ | wyliczenie | Rodzaj treści. Możliwe wartości: refusal |
Tak |
KonfiguracjaAzureChatExtension
Reprezentacja danych konfiguracyjnych dla pojedynczego rozszerzenia czatu Azure OpenAI. Będzie to wykorzystywane przez żądanie zakończenia czatu, które powinno wykorzystywać rozszerzenia czatu Azure OpenAI, aby wzmocnić zachowanie odpowiedzi. Użycie tej konfiguracji jest kompatybilne wyłącznie z Azure OpenAI.
###Discriminator dla azureChatExtensionConfiguration
Ten składnik wykorzystuje tę właściwość type do rozróżniania różnych typów:
| Typ wartości | Schema |
|---|---|
azure_search |
azureSearchChatExtensionConfiguration |
azure_cosmos_db |
azureCosmosDBChatExtensionConfiguration |
elasticsearch |
elasticsearchChatExtensionConfiguration |
mongo_db |
mongoDBChatExtensionConfiguration |
pinecone |
pineconeChatExtensionConfiguration |
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | azureChatExtensionType | Reprezentacja danych konfiguracyjnych dla pojedynczego rozszerzenia czatu Azure OpenAI. Będzie to wykorzystywane przez żądanie zakończenia czatu, które powinno wykorzystywać rozszerzenia czatu Azure OpenAI, aby wzmocnić zachowanie odpowiedzi. Użycie tej konfiguracji jest kompatybilne wyłącznie z Azure OpenAI. |
Tak |
Typ rozszerzenia czatu Azure
Reprezentacja danych konfiguracyjnych dla pojedynczego rozszerzenia czatu Azure OpenAI. Będzie to wykorzystywane przez żądanie zakończenia czatu, które powinno wykorzystywać rozszerzenia czatu Azure OpenAI, aby wzmocnić zachowanie odpowiedzi. Użycie tej konfiguracji jest kompatybilne wyłącznie z Azure OpenAI.
| Majątek | Wartość |
|---|---|
| Opis | Reprezentacja danych konfiguracyjnych dla pojedynczego rozszerzenia czatu Azure OpenAI. Będzie to wykorzystywane przez żądanie zakończenia czatu, które powinno wykorzystywać rozszerzenia czatu Azure OpenAI, aby wzmocnić zachowanie odpowiedzi. Użycie tej konfiguracji jest kompatybilne wyłącznie z Azure OpenAI. |
| Typ | ciąg |
| Wartości | azure_searchazure_cosmos_dbelasticsearchmongo_dbpinecone |
Konfiguracja rozszerzenia czatu AzureSearch (azureSearchChatExtensionConfiguration)
Specyficzna reprezentacja konfigurowalnych opcji dla wyszukiwania Azure podczas używania go jako rozszerzenia czatu Azure OpenAI.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| parameters | azureSearchChatExtensionParameters | Parametry dla Azure Search gdy jest używany jako rozszerzenie czatu Azure OpenAI. | No | |
| typ | azureChatExtensionType | Reprezentacja danych konfiguracyjnych dla pojedynczego rozszerzenia czatu Azure OpenAI. Będzie to wykorzystywane przez żądanie zakończenia czatu, które powinno wykorzystywać rozszerzenia czatu Azure OpenAI, aby wzmocnić zachowanie odpowiedzi. Użycie tej konfiguracji jest kompatybilne wyłącznie z Azure OpenAI. |
Tak |
azureSearchChatExtensionParameters
Parametry dla Azure Search gdy jest używany jako rozszerzenie czatu Azure OpenAI.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| allow_partial_result | boolean | Jeśli zostanie oznaczone jako prawdziwe, system pozwoli na użycie częściowych wyników wyszukiwania, a żądanie nie przestaje działać, jeśli wszystkie zapytania się nie powiedzą. Jeśli nie zostanie określona lub zostanie oznaczona jako fałszywa, żądanie nie zostanie zapowiedziane, jeśli jakiekolwiek zapytanie nie powiodę się. | No | Nieprawda |
| uwierzytelnianie | onYourDataApiKeyAuthenticationOptions lub onYourDataSystemAssignedManagedIdentityAuthenticationOptions albo onYourDataUserAssignedManagedIdentityAuthenticationOptions albo onYourDataAccessTokenAuthenticationOptions | Tak | ||
| zależność osadzenia | onYourDataEndpointVectorizationSource lub onYourDataDeploymentNameVectorizationSource albo onYourDataIntegratedVectorizationSource | No | ||
| punkt końcowy | ciąg | Absolutna ścieżka końcowa dla zasobu Azure Search do wykorzystania. | Tak | |
| mapowanie pól | Opcje Mapowania Pola Indeksu Wyszukiwania Azure | Opcjonalne ustawienia do kontrolowania przetwarzania pól podczas korzystania z skonfigurowanego zasobu Azure Search. | No | |
| filtr | ciąg | Filtr wyszukiwania. | No | |
| w zakresie | boolean | Czy zapytania powinny być ograniczone do wykorzystania danych indeksowanych. | No | |
| include_contexts | macierz | Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie jest to określone, wartość domyślna to citations i .intent |
No | |
| nazwa_indeksu | ciąg | Nazwa indeksu, którą można użyć w zasobach Azure Search, do którego się odwołuje. | Tak | |
| max_search_queries | liczba całkowita | Maksymalna liczba przepisanych zapytań powinna być wysłana do dostawcy wyszukiwania dla jednej wiadomości użytkownika. Jeśli nie jest to określone, system zdecyduje o liczbie zapytań do wysłania. | No | |
| typ zapytania | azureSearchQueryType | Typ zapytania wyszukiwania Azure Search, który powinien być wykonywany podczas używania go jako rozszerzenia czatu Azure OpenAI. | No | |
| konfiguracja semantyczna | ciąg | Dodatkowa konfiguracja semantyczna zapytania. | No | |
| ścisłość | liczba całkowita | Konfigurowana rygorystyka filtrowania trafności wyszukiwania. Im bardziej rygorystyczna, tym większa precyzja, ale mniej pamiętana odpowiedź. | No | |
| top_n_documents | liczba całkowita | Skonfigurowana maksymalna liczba dokumentów do wykorzystania dla skonfigurowanego zapytania. | No |
Opcje Mapowania Pola Indeksu Wyszukiwania Azure
Opcjonalne ustawienia do kontrolowania przetwarzania pól podczas korzystania z skonfigurowanego zasobu Azure Search.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| pola_treści | macierz | Nazwy pól indeksu, które powinny być traktowane jako treść. | No | |
| separator_pól_treści | ciąg | Wzorzec separatora, którego powinny używać pola treści. | No | |
| pole ścieżki pliku | ciąg | Nazwa pola indeksu, którą należy użyć jako ścieżki do pliku. | No | |
| image_vector_fields | macierz | Nazwy pól reprezentujących dane wektorowe obrazu. | No | |
| pole_tytułu | ciąg | Nazwa pola indeksu, której można użyć jako tytułu. | No | |
| url_field | ciąg | Nazwa pola indeksu, którą można użyć jako adres URL. | No | |
| pola wektorowe | macierz | Nazwy pól reprezentujących dane wektorowe. | No |
azureSearchQueryType
Typ zapytania wyszukiwania Azure Search, który powinien być wykonywany podczas używania go jako rozszerzenia czatu Azure OpenAI.
| Majątek | Wartość |
|---|---|
| Opis | Typ zapytania wyszukiwania Azure Search, który powinien być wykonywany podczas używania go jako rozszerzenia czatu Azure OpenAI. |
| Typ | ciąg |
| Wartości | simplesemanticvectorvector_simple_hybridvector_semantic_hybrid |
azureCosmosDBChatExtensionConfiguration
Specyficzna reprezentacja konfigurowalnych opcji dla Azure Cosmos DB przy użyciu go jako rozszerzenia czatu Azure OpenAI.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| parameters | azureCosmosDBChatExtensionParameters | Parametry, których należy używać przy konfigurowaniu rozszerzeń czatu Azure OpenAI On Your Data przy użyciu Azure Cosmos DB dla MongoDB vCore. | No | |
| typ | azureChatExtensionType | Reprezentacja danych konfiguracyjnych dla pojedynczego rozszerzenia czatu Azure OpenAI. Będzie to wykorzystywane przez żądanie zakończenia czatu, które powinno wykorzystywać rozszerzenia czatu Azure OpenAI, aby wzmocnić zachowanie odpowiedzi. Użycie tej konfiguracji jest kompatybilne wyłącznie z Azure OpenAI. |
Tak |
azureCosmosDBChatExtensionParameters
Parametry, których należy używać przy konfigurowaniu rozszerzeń czatu Azure OpenAI On Your Data przy użyciu Azure Cosmos DB dla MongoDB vCore.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| allow_partial_result | boolean | Jeśli zostanie oznaczone jako prawdziwe, system pozwoli na użycie częściowych wyników wyszukiwania, a żądanie nie przestaje działać, jeśli wszystkie zapytania się nie powiedzą. Jeśli nie zostanie określona lub zostanie oznaczona jako fałszywa, żądanie nie zostanie zapowiedziane, jeśli jakiekolwiek zapytanie nie powiodę się. | No | Nieprawda |
| uwierzytelnianie | onYourDataConnectionStringOpcjeUwierzytelniania | Opcje uwierzytelniania dla Azure OpenAI On Your Data przy użyciu parametry połączenia. | Tak | |
| nazwa_kontenera | ciąg | Nazwa kontenera zasobów Azure Cosmos DB. | Tak | |
| nazwa_bazy_danych | ciąg | Nazwa bazy MongoDB vCore do użycia z Azure Cosmos DB. | Tak | |
| zależność osadzenia | onYourDataEndpointVectorizationSource lub onYourDataDeploymentNameVectorizationSource | Tak | ||
| mapowanie pól | azureCosmosDBFieldMappingOptions | Opcjonalne ustawienia do kontroli przetwarzania pól podczas korzystania z skonfigurowanego zasobu bazy Azure Cosmos DB. | Tak | |
| w zakresie | boolean | Czy zapytania powinny być ograniczone do wykorzystania danych indeksowanych. | No | |
| include_contexts | macierz | Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie jest to określone, wartość domyślna to citations i .intent |
No | |
| nazwa_indeksu | ciąg | Nazwa indeksu MongoDB vCore do użycia z Azure Cosmos DB. | Tak | |
| max_search_queries | liczba całkowita | Maksymalna liczba przepisanych zapytań powinna być wysłana do dostawcy wyszukiwania dla jednej wiadomości użytkownika. Jeśli nie jest to określone, system zdecyduje o liczbie zapytań do wysłania. | No | |
| ścisłość | liczba całkowita | Konfigurowana rygorystyka filtrowania trafności wyszukiwania. Im bardziej rygorystyczna, tym większa precyzja, ale mniej pamiętana odpowiedź. | No | |
| top_n_documents | liczba całkowita | Skonfigurowana maksymalna liczba dokumentów do wykorzystania dla skonfigurowanego zapytania. | No |
azureCosmosDBFieldMappingOptions
Opcjonalne ustawienia do kontroli przetwarzania pól podczas korzystania z skonfigurowanego zasobu bazy Azure Cosmos DB.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| pola_treści | macierz | Nazwy pól indeksu, które powinny być traktowane jako treść. | Tak | |
| separator_pól_treści | ciąg | Wzorzec separatora, którego powinny używać pola treści. | No | |
| pole ścieżki pliku | ciąg | Nazwa pola indeksu, którą należy użyć jako ścieżki do pliku. | No | |
| pole_tytułu | ciąg | Nazwa pola indeksu, której można użyć jako tytułu. | No | |
| url_field | ciąg | Nazwa pola indeksu, którą można użyć jako adres URL. | No | |
| pola wektorowe | macierz | Nazwy pól reprezentujących dane wektorowe. | Tak |
elasticsearchChatExtensionConfiguration
Konkretna reprezentacja konfigurowalnych opcji dla Elasticsearch podczas używania go jako rozszerzenia czatu Azure OpenAI.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| parameters | elasticsearchChatExtensionParameters | Parametry, których należy użyć podczas konfigurowania Elasticsearch® jako rozszerzenia czatu Azure OpenAI. | No | |
| typ | azureChatExtensionType | Reprezentacja danych konfiguracyjnych dla pojedynczego rozszerzenia czatu Azure OpenAI. Będzie to wykorzystywane przez żądanie zakończenia czatu, które powinno wykorzystywać rozszerzenia czatu Azure OpenAI, aby wzmocnić zachowanie odpowiedzi. Użycie tej konfiguracji jest kompatybilne wyłącznie z Azure OpenAI. |
Tak |
elasticsearchChatExtensionParameters
Parametry, których należy użyć podczas konfigurowania Elasticsearch® jako rozszerzenia czatu Azure OpenAI.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| allow_partial_result | boolean | Jeśli zostanie oznaczone jako prawdziwe, system pozwoli na użycie częściowych wyników wyszukiwania, a żądanie nie przestaje działać, jeśli wszystkie zapytania się nie powiedzą. Jeśli nie zostanie określona lub zostanie oznaczona jako fałszywa, żądanie nie zostanie zapowiedziane, jeśli jakiekolwiek zapytanie nie powiodę się. | No | Nieprawda |
| uwierzytelnianie | onYourDataKeyandKeyIdAuthenticationOptions lub onYourDataEncodedApiKeyAuthenticationOptions | Tak | ||
| zależność osadzenia | onYourDataEndpointVectorizationSource lub onYourDataDeploymentNameVectorizationSource albo onYourDataModelIdVectorizationSource | No | ||
| punkt końcowy | ciąg | Punkt końcowy Elasticsearch.® | Tak | |
| mapowanie pól | elasticsearchIndexFieldMappingOptions | Opcjonalne ustawienia kontrolujące sposób przetwarzania pól przy użyciu skonfigurowanego zasobu Elasticsearch.® | No | |
| w zakresie | boolean | Czy zapytania powinny być ograniczone do wykorzystania danych indeksowanych. | No | |
| include_contexts | macierz | Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie jest to określone, wartość domyślna to citations i .intent |
No | |
| nazwa_indeksu | ciąg | Nazwa indeksowa Elasticsearch.® | Tak | |
| max_search_queries | liczba całkowita | Maksymalna liczba przepisanych zapytań powinna być wysłana do dostawcy wyszukiwania dla jednej wiadomości użytkownika. Jeśli nie jest to określone, system zdecyduje o liczbie zapytań do wysłania. | No | |
| typ zapytania | elasticsearchQueryType | Typ zapytania pobierania Elasticsearch,® który powinien być wykonywany podczas używania go jako rozszerzenia czatu Azure OpenAI. | No | |
| ścisłość | liczba całkowita | Konfigurowana rygorystyka filtrowania trafności wyszukiwania. Im bardziej rygorystyczna, tym większa precyzja, ale mniej pamiętana odpowiedź. | No | |
| top_n_documents | liczba całkowita | Skonfigurowana maksymalna liczba dokumentów do wykorzystania dla skonfigurowanego zapytania. | No |
elasticsearchIndexFieldMappingOptions
Opcjonalne ustawienia kontrolujące sposób przetwarzania pól przy użyciu skonfigurowanego zasobu Elasticsearch.®
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| pola_treści | macierz | Nazwy pól indeksu, które powinny być traktowane jako treść. | No | |
| separator_pól_treści | ciąg | Wzorzec separatora, którego powinny używać pola treści. | No | |
| pole ścieżki pliku | ciąg | Nazwa pola indeksu, którą należy użyć jako ścieżki do pliku. | No | |
| pole_tytułu | ciąg | Nazwa pola indeksu, której można użyć jako tytułu. | No | |
| url_field | ciąg | Nazwa pola indeksu, którą można użyć jako adres URL. | No | |
| pola wektorowe | macierz | Nazwy pól reprezentujących dane wektorowe. | No |
elasticsearchQueryType
Typ zapytania pobierania Elasticsearch,® który powinien być wykonywany podczas używania go jako rozszerzenia czatu Azure OpenAI.
| Majątek | Wartość |
|---|---|
| Opis | Typ zapytania pobierania Elasticsearch,® który powinien być wykonywany podczas używania go jako rozszerzenia czatu Azure OpenAI. |
| Typ | ciąg |
| Wartości | simplevector |
mongoDBChatExtensionConfiguration
Konkretna reprezentacja konfigurowalnych opcji dla bazy Mongo DB podczas używania jej jako rozszerzenia czatu Azure OpenAI.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| parameters | mongoDBChatExtensionParameters | Parametry, których należy używać podczas konfigurowania rozszerzeń czatu Azure OpenAI On Your Data przy korzystaniu z bazy Mongo DB. | No | |
| typ | azureChatExtensionType | Reprezentacja danych konfiguracyjnych dla pojedynczego rozszerzenia czatu Azure OpenAI. Będzie to wykorzystywane przez żądanie zakończenia czatu, które powinno wykorzystywać rozszerzenia czatu Azure OpenAI, aby wzmocnić zachowanie odpowiedzi. Użycie tej konfiguracji jest kompatybilne wyłącznie z Azure OpenAI. |
Tak |
mongoDBChatExtensionParameters
Parametry, których należy używać podczas konfigurowania rozszerzeń czatu Azure OpenAI On Your Data przy korzystaniu z bazy Mongo DB.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| allow_partial_result | boolean | Jeśli zostanie oznaczone jako prawdziwe, system pozwoli na użycie częściowych wyników wyszukiwania, a żądanie nie przestaje działać, jeśli wszystkie zapytania się nie powiedzą. Jeśli nie zostanie określona lub zostanie oznaczona jako fałszywa, żądanie nie zostanie zapowiedziane, jeśli jakiekolwiek zapytanie nie powiodę się. | No | Nieprawda |
| app_name | ciąg | Nazwa aplikacji bazy danych Mongo. | Tak | |
| uwierzytelnianie | onYourDataUsernameAndPasswordAuthenticationOptions | Opcje uwierzytelniania dla Azure OpenAI On Your Data przy użyciu nazwy użytkownika i hasła. | Tak | |
| collection_name | ciąg | Nazwa kolekcji Mongo DB. | Tak | |
| nazwa_bazy_danych | ciąg | Nazwa bazy danych Mongo DB. | Tak | |
| zależność osadzenia | onYourDataEndpointVectorizationSource lub onYourDataDeploymentNameVectorizationSource | Tak | ||
| punkt końcowy | ciąg | Nazwa punktu końcowego klastra Mongo DB. | Tak | |
| mapowanie pól | mongoDBFieldMappingOptions | Opcjonalne ustawienia kontrolujące sposób przetwarzania pól przy użyciu skonfigurowanego zasobu bazy danych Mongo. | Tak | |
| w zakresie | boolean | Czy zapytania powinny być ograniczone do wykorzystania danych indeksowanych. | No | |
| include_contexts | macierz | Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie jest to określone, wartość domyślna to citations i .intent |
No | |
| nazwa_indeksu | ciąg | Nazwa indeksu Mongo DB. | Tak | |
| max_search_queries | liczba całkowita | Maksymalna liczba przepisanych zapytań powinna być wysłana do dostawcy wyszukiwania dla jednej wiadomości użytkownika. Jeśli nie jest to określone, system zdecyduje o liczbie zapytań do wysłania. | No | |
| ścisłość | liczba całkowita | Konfigurowana rygorystyka filtrowania trafności wyszukiwania. Im bardziej rygorystyczna, tym większa precyzja, ale mniej pamiętana odpowiedź. | No | |
| top_n_documents | liczba całkowita | Skonfigurowana maksymalna liczba dokumentów do wykorzystania dla skonfigurowanego zapytania. | No |
mongoDBFieldMappingOptions
Opcjonalne ustawienia kontrolujące sposób przetwarzania pól przy użyciu skonfigurowanego zasobu bazy danych Mongo.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| pola_treści | macierz | Nazwy pól indeksu, które powinny być traktowane jako treść. | Tak | |
| separator_pól_treści | ciąg | Wzorzec separatora, którego powinny używać pola treści. | No | |
| pole ścieżki pliku | ciąg | Nazwa pola indeksu, którą należy użyć jako ścieżki do pliku. | No | |
| pole_tytułu | ciąg | Nazwa pola indeksu, której można użyć jako tytułu. | No | |
| url_field | ciąg | Nazwa pola indeksu, którą można użyć jako adres URL. | No | |
| pola wektorowe | macierz | Nazwy pól reprezentujących dane wektorowe. | Tak |
pineconeChatExtensionConfiguration
Konkretna reprezentacja konfigurowalnych opcji dla Pinecone podczas używania go jako rozszerzenia czatu Azure OpenAI.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| parameters | pineconeChatExtensionParameters | Parametry do konfigurowania Azure OpenAI Pinecone chat extensions. | No | |
| typ | azureChatExtensionType | Reprezentacja danych konfiguracyjnych dla pojedynczego rozszerzenia czatu Azure OpenAI. Będzie to wykorzystywane przez żądanie zakończenia czatu, które powinno wykorzystywać rozszerzenia czatu Azure OpenAI, aby wzmocnić zachowanie odpowiedzi. Użycie tej konfiguracji jest kompatybilne wyłącznie z Azure OpenAI. |
Tak |
pineconeChatExtensionParameters
Parametry do konfigurowania Azure OpenAI Pinecone chat extensions.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| allow_partial_result | boolean | Jeśli zostanie oznaczone jako prawdziwe, system pozwoli na użycie częściowych wyników wyszukiwania, a żądanie nie przestaje działać, jeśli wszystkie zapytania się nie powiedzą. Jeśli nie zostanie określona lub zostanie oznaczona jako fałszywa, żądanie nie zostanie zapowiedziane, jeśli jakiekolwiek zapytanie nie powiodę się. | No | Nieprawda |
| uwierzytelnianie | Opcje uwierzytelniania klucza API Twoje Dane | Opcje uwierzytelniania dla Azure OpenAI On Your Data przy użyciu klucza API. | Tak | |
| zależność osadzenia | onYourDataDeploymentNameVectorizationSource | Szczegóły źródła wektoryzacji, używanego przez Azure OpenAI On Your Data podczas stosowania wyszukiwania wektorowego, opartego na wewnętrznej nazwie modelu wdrożenia embeddingów w tym samym zasobu Azure OpenAI. | Tak | |
| środowisko | ciąg | Nazwa środowiskowa Pinecone. | Tak | |
| mapowanie pól | pineconeFieldMappingOptions | Opcjonalne ustawienia kontrolujące sposób przetwarzania pól przy użyciu skonfigurowanego zasobu Pinecone. | Tak | |
| w zakresie | boolean | Czy zapytania powinny być ograniczone do wykorzystania danych indeksowanych. | No | |
| include_contexts | macierz | Uwzględnione właściwości kontekstu wyjściowego. Jeśli nie jest to określone, wartość domyślna to citations i .intent |
No | |
| nazwa_indeksu | ciąg | Nazwa indeksu bazy danych Pinecone. | Tak | |
| max_search_queries | liczba całkowita | Maksymalna liczba przepisanych zapytań powinna być wysłana do dostawcy wyszukiwania dla jednej wiadomości użytkownika. Jeśli nie jest to określone, system zdecyduje o liczbie zapytań do wysłania. | No | |
| ścisłość | liczba całkowita | Konfigurowana rygorystyka filtrowania trafności wyszukiwania. Im bardziej rygorystyczna, tym większa precyzja, ale mniej pamiętana odpowiedź. | No | |
| top_n_documents | liczba całkowita | Skonfigurowana maksymalna liczba dokumentów do wykorzystania dla skonfigurowanego zapytania. | No |
pineconeFieldMappingOptions
Opcjonalne ustawienia kontrolujące sposób przetwarzania pól przy użyciu skonfigurowanego zasobu Pinecone.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| pola_treści | macierz | Nazwy pól indeksu, które powinny być traktowane jako treść. | Tak | |
| separator_pól_treści | ciąg | Wzorzec separatora, którego powinny używać pola treści. | No | |
| pole ścieżki pliku | ciąg | Nazwa pola indeksu, którą należy użyć jako ścieżki do pliku. | No | |
| pole_tytułu | ciąg | Nazwa pola indeksu, której można użyć jako tytułu. | No | |
| url_field | ciąg | Nazwa pola indeksu, którą można użyć jako adres URL. | No |
OpcjeUwierzytelnianiaTwoichDanych
Opcje uwierzytelniania dla Azure OpenAI na Twoich danych.
Dyskryminator dla opcji uwierzytelniania onYourData
Ten składnik wykorzystuje tę właściwość type do rozróżniania różnych typów:
| Typ wartości | Schema |
|---|---|
api_key |
Opcje uwierzytelniania klucza API Twoje Dane |
connection_string |
onYourDataConnectionStringOpcjeUwierzytelniania |
key_and_key_id |
onYourDataKeyAndKeyIdAuthenticationOptions |
encoded_api_key |
onYourDataEncodedApiKeyAuthenticationOptions |
access_token |
onYourDataAccessTokenAuthenticationOptions |
system_assigned_managed_identity |
onYourDataSystemAssignedManagedIdentityAuthenticationOptions |
user_assigned_managed_identity |
onYourDataUserAssignedManagedIdentityAuthenticationOptions |
username_and_password |
onYourDataUsernameAndPasswordAuthenticationOptions |
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | typUwierzytelnieniaTwoichDanych | Typy uwierzytelniania obsługiwane przez Azure OpenAI On Your Data. | Tak |
onYourDataContextProperty
Właściwość kontekstu.
| Majątek | Wartość |
|---|---|
| Opis | Właściwość kontekstu. |
| Typ | ciąg |
| Wartości | citationsintentall_retrieved_documents |
typUwierzytelnieniaTwoichDanych
Typy uwierzytelniania obsługiwane przez Azure OpenAI On Your Data.
| Majątek | Wartość |
|---|---|
| Opis | Typy uwierzytelniania obsługiwane przez Azure OpenAI On Your Data. |
| Typ | ciąg |
| Wartości | api_keyconnection_stringkey_and_key_idencoded_api_keyaccess_tokensystem_assigned_managed_identityuser_assigned_managed_identityusername_and_password |
Opcje uwierzytelniania klucza API Twoje Dane
Opcje uwierzytelniania dla Azure OpenAI On Your Data przy użyciu klucza API.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| klucz | ciąg | Klucz API do uwierzytelniania. | No | |
| typ | typUwierzytelnieniaTwoichDanych | Typy uwierzytelniania obsługiwane przez Azure OpenAI On Your Data. | Tak |
onYourDataConnectionStringOpcjeUwierzytelniania
Opcje uwierzytelniania dla Azure OpenAI On Your Data przy użyciu parametry połączenia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| connection_string | ciąg | parametry połączenia do uwierzytelniania. | No | |
| typ | typUwierzytelnieniaTwoichDanych | Typy uwierzytelniania obsługiwane przez Azure OpenAI On Your Data. | Tak |
onYourDataKeyAndKeyIdAuthenticationOptions
Opcje uwierzytelniania dla Azure OpenAI On Your Data przy użyciu pary klucza Elasticsearch i ID klucza.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| klucz | ciąg | Klucz Elasticsearch do uwierzytelniania. | No | |
| key_id | ciąg | ID klucza Elasticsearch do uwierzytelniania. | No | |
| typ | typUwierzytelnieniaTwoichDanych | Typy uwierzytelniania obsługiwane przez Azure OpenAI On Your Data. | Tak |
onYourDataEncodedApiKeyAuthenticationOptions
Opcje uwierzytelniania dla Azure OpenAI On Your Data przy użyciu klucza API zakodowanego przez Elasticsearch.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| encoded_api_key | ciąg | Klucz API zakodowany przez Elasticsearch do uwierzytelniania. | No | |
| typ | typUwierzytelnieniaTwoichDanych | Typy uwierzytelniania obsługiwane przez Azure OpenAI On Your Data. | Tak |
onYourDataAccessTokenAuthenticationOptions
Opcje uwierzytelniania dla Azure OpenAI On Your Data podczas korzystania z tokena dostępu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| access_token | ciąg | Token dostępu do uwierzytelniania. | No | |
| typ | typUwierzytelnieniaTwoichDanych | Typy uwierzytelniania obsługiwane przez Azure OpenAI On Your Data. | Tak |
opcjeUwierzytelnianiaTożsamościZarządzanejPrzydzielonejPrzezTwójSystemDanych
Opcje uwierzytelniania dla Azure OpenAI On Your Data przy użyciu systemowej tożsamości zarządzanej.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | typUwierzytelnieniaTwoichDanych | Typy uwierzytelniania obsługiwane przez Azure OpenAI On Your Data. | Tak |
Opcje uwierzytelniania przy użyciu przypisanej tożsamości zarządzanej dla użytkownika na platformie YourData
Opcje uwierzytelniania dla Azure OpenAI On Your Data przy użyciu przypisanej przez użytkownika tożsamości zarządzanej.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| managed_identity_resource_id | ciąg | Identyfikator zasobu przypisanej przez użytkownika tożsamości zarządzanej do uwierzytelniania. | No | |
| typ | typUwierzytelnieniaTwoichDanych | Typy uwierzytelniania obsługiwane przez Azure OpenAI On Your Data. | Tak |
onYourDataUsernameAndPasswordAuthenticationOptions
Opcje uwierzytelniania dla Azure OpenAI On Your Data przy użyciu nazwy użytkownika i hasła.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| hasło | ciąg | Hasło. do uwierzytelniania. | No | |
| typ | typUwierzytelnieniaTwoichDanych | Typy uwierzytelniania obsługiwane przez Azure OpenAI On Your Data. | Tak | |
| nazwa użytkownika | ciąg | Nazwa użytkownika do uwierzytelniania. | No |
ŹródłoWeWektorzeDanych
Abstrakcyjna reprezentacja źródła wektoryzacji dla Azure OpenAI On Your Data z wyszukiwaniem wektorowym.
Ten składnik wykorzystuje tę właściwość type do rozróżniania różnych typów:
| Typ wartości | Schema |
|---|---|
endpoint |
onYourDataEndpointVectorizationSource |
deployment_name |
onYourDataDeploymentNameVectorizationSource |
integrated |
onYourDataIntegratedVectorizationSource |
model_id |
onYourDataModelIdVectorizationSource |
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | naTwójTypŹródłaWeektoryzacjiDanych | Reprezentuje dostępne źródła, które Azure OpenAI On Your Data może wykorzystać do konfiguracji wektoryzacji danych do wyszukiwania wektorowego. | Tak |
naTwójTypŹródłaWeektoryzacjiDanych
Reprezentuje dostępne źródła, które Azure OpenAI On Your Data może wykorzystać do konfiguracji wektoryzacji danych do wyszukiwania wektorowego.
| Majątek | Wartość |
|---|---|
| Opis | Reprezentuje dostępne źródła, które Azure OpenAI On Your Data może wykorzystać do konfiguracji wektoryzacji danych do wyszukiwania wektorowego. |
| Typ | ciąg |
| Wartości | endpointdeployment_nameintegratedmodel_id |
onYourDataEndpointVectorizationSource
Szczegóły źródła wektoryzacji, używanego przez Azure OpenAI On Your Data podczas stosowania wyszukiwania wektorowego, opartego na publicznym wywołaniu punktu końcowego Azure OpenAI dla osadzeń.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| uwierzytelnianie | onYourDataApiKeyOpcje uwierzytelniania lub onYourDataAccessTokenOpcje uwierzytelniania | No | ||
| wymiary | liczba całkowita | Liczba wymiarów, jakie powinny mieć osadzenia. Obsługiwane tylko w text-embedding-3 modelach i późniejszych. |
No | |
| punkt końcowy | ciąg | Określa adres URL endpoint zasobu, z którego należy pobierać osadzenia. Powinien mieć formę https://YOUR_RESOURCE_NAME.openai.azure.com/openai/deployments/YOUR_DEPLOYMENT_NAME/embeddings. Parametr zapytania do wersji API nie jest dozwolony. |
No | |
| typ | naTwójTypŹródłaWeektoryzacjiDanych | Reprezentuje dostępne źródła, które Azure OpenAI On Your Data może wykorzystać do konfiguracji wektoryzacji danych do wyszukiwania wektorowego. | Tak |
onYourDataDeploymentNameWektoryzacjaŹródło
Szczegóły źródła wektoryzacji, używanego przez Azure OpenAI On Your Data podczas stosowania wyszukiwania wektorowego, opartego na wewnętrznej nazwie modelu wdrożenia embeddingów w tym samym zasobu Azure OpenAI.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| nazwa_wdrożenia | ciąg | Określa nazwę wdrożenia modelu do wektoryzacji. To wdrożenie modelu musi być w tym samym zasobu Azure OpenAI, ale On Your Data będzie korzystać z tego modelu poprzez wewnętrzne wywołanie, a nie publiczne, co umożliwia wyszukiwanie wektorowe nawet w sieciach prywatnych. | No | |
| wymiary | liczba całkowita | Liczba wymiarów, jakie powinny mieć osadzenia. Obsługiwane tylko w text-embedding-3 modelach i późniejszych. |
No | |
| typ | naTwójTypŹródłaWeektoryzacjiDanych | Reprezentuje dostępne źródła, które Azure OpenAI On Your Data może wykorzystać do konfiguracji wektoryzacji danych do wyszukiwania wektorowego. | Tak |
onYourDataIntegratedVectorizationSource
Reprezentuje zintegrowany wektorizator zdefiniowany w zasobach wyszukiwania.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | naTwójTypŹródłaWeektoryzacjiDanych | Reprezentuje dostępne źródła, które Azure OpenAI On Your Data może wykorzystać do konfiguracji wektoryzacji danych do wyszukiwania wektorowego. | Tak |
onYourDataModelIdVectorizationSource
Szczegóły źródła wektoryzacji, wykorzystywanego przez Azure OpenAI On Your Data podczas stosowania wyszukiwania wektorowego, opartego na ID modelu usługi wyszukiwania. Obecnie obsługiwany jest wyłącznie przez Elasticsearch.®
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| model_id | ciąg | Określa identyfikator modelu, który ma być użyty do wektoryzacji. Ten identyfikator modelu musi być zdefiniowany w usłudze wyszukiwania. | No | |
| typ | naTwójTypŹródłaWeektoryzacjiDanych | Reprezentuje dostępne źródła, które Azure OpenAI On Your Data może wykorzystać do konfiguracji wektoryzacji danych do wyszukiwania wektorowego. | Tak |
kontekstWiadomościRozszerzeńAzureChat
Przedstawienie dodatkowych informacji kontekstowych dostępnych przy generowaniu odpowiadającej odpowiedzi na zakończenie czatu Azure OpenAI. Te informacje kontekstowe są wypełniane tylko wtedy, gdy używamy żądania Azure OpenAI skonfigurowanego do używania odpowiadającego rozszerzenia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| all_retrieved_documents | macierz | Wszystkie odzyskane dokumenty. | No | |
| citations | macierz | Wynik pobierania źródła danych, używany do generowania wiadomości asystenckiej w odpowiedzi. | No | |
| intencja | ciąg | Wykryty intencji z historii czatu wykorzystywany do przekazywania do następnej tury, by przenieść kontekst. | No |
cytat
Informacje o cytowaniu w wiadomości odpowiedzi na zakończenie czatu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| identyfikator_kawałka | ciąg | Numer numeru cytowania. | No | |
| zawartość | ciąg | Treść uzasadnienia. | Tak | |
| ścieżka pliku | ciąg | Ścieżka pliku do cytatu. | No | |
| rerank_score | number | Ocena ponownego rankingu pobranego dokumentu. | No | |
| tytuł | ciąg | Tytuł uzasadnienia. | No | |
| Adres url | ciąg | URL cytowania. | No |
retrievedDocument
Odzyskany dokument.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| identyfikator_kawałka | ciąg | Numer numeru cytowania. | No | |
| zawartość | ciąg | Treść uzasadnienia. | Tak | |
| data_source_index | liczba całkowita | Indeks źródła danych. | No | |
| ścieżka pliku | ciąg | Ścieżka pliku do cytatu. | No | |
| filter_reason | filterReason | Powód filtrowania pobranego dokumentu. | No | |
| original_search_score | number | Oryginalny wynik wyszukiwania pobranego dokumentu. | No | |
| rerank_score | number | Ocena ponownego rankingu pobranego dokumentu. | No | |
| search_queries | macierz | Zapytania wyszukiwania używane do pobrania dokumentu. | No | |
| tytuł | ciąg | Tytuł uzasadnienia. | No | |
| Adres url | ciąg | URL cytowania. | No |
filterReason
Powód filtrowania pobranego dokumentu.
| Majątek | Wartość |
|---|---|
| Opis | Powód filtrowania pobranego dokumentu. |
| Typ | ciąg |
| Wartości | scorererank |
KomunikatZakończeniaRozmowyNarzędziaCall
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| funkcja | obiekt | Funkcja, którą model wywoływał. | Tak | |
| └─ Argumenty | ciąg | Argumenty, które mają wywołać funkcję, generowane przez model w formacie JSON. Należy zauważyć, że model nie zawsze generuje prawidłowy JSON i może halucynować parametry niezdefiniowane przez schemat funkcji. Zweryfikowaj argumenty w swoim kodzie przed wywołaniem funkcji. | No | |
| └─ nazwa | ciąg | Nazwa funkcji, którą trzeba wywołać. | No | |
| id | ciąg | ID wywołania narzędzia. | Tak | |
| typ | toolCallType | Typ wywołania narzędzia, w tym przypadku function. |
Tak |
typWywołaniaNarzędzia
Typ wywołania narzędzia, w tym przypadku function.
| Majątek | Wartość |
|---|---|
| Opis | Typ wywołania narzędzia, w tym przypadku function. |
| Typ | ciąg |
| Wartości | function |
Narzędzie do wysyłania wiadomości z prośbą o zakończenie czatu
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | ciąg | Treść wiadomości. | No | |
| tool_call_id | ciąg | Wezwanie narzędzi, na które odpowiada ta wiadomość. | No |
chatCompletionRequestMessageFunction
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | ciąg | Treść wiadomości. | No | |
| nazwa | ciąg | Treść wiadomości. | No | |
| rola | wyliczenie | Rola autora wiadomości, w tym przypadku function.Możliwe wartości: function |
No |
utwórzOdpowiedźNaZakończenieCzatu
Reprezentuje odpowiedź zakończenia czatu zwracaną przez model, na podstawie dostarczonego wejścia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| choices | macierz | Lista opcji do ukończenia czatu. Może być więcej niż jeden, jeśli n jest większe niż 1. |
Tak | |
| utworzone | liczba całkowita | Znacznik czasu w Uniksie (w sekundach) momentu ukończenia czatu. | Tak | |
| id | ciąg | Unikalny identyfikator zakończenia czatu. | Tak | |
| model | ciąg | Model użyty do zakończenia czatu. | Tak | |
| obiekt | wyliczenie | Typ obiektu, który zawsze chat.completionjest .Możliwe wartości: chat.completion |
Tak | |
| prompt_filter_results | promptFilterResults | Filtrowanie treści daje zero lub więcej podpowiedzi w żądaniu. W przypadku zapytania streamingowego wyniki dla różnych promptów mogą pojawić się w różnych godzinach lub w różnej kolejności. | No | |
| system_fingerprint | ciąg | Ten odcisk palca reprezentuje konfigurację backend, z którą działa model. Może być używany razem z parametrem żądania, seed aby zrozumieć, kiedy wprowadzono zmiany w backendzie, które mogą wpłynąć na determinizm. |
No | |
| użycie | completionUsage | Statystyki wykorzystania wniosku o zakończenie. | No |
utwórzOdpowiedźNaKompletacjęStrumieniaCzatu
Reprezentuje strumieniowy fragment odpowiedzi zakończenia czatu zwracany przez model, na podstawie dostarczonego wejścia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| choices | macierz | Lista opcji do ukończenia czatu. Może zawierać więcej niż jeden element, jeśli n jest większy niż 1. |
Tak | |
| utworzone | liczba całkowita | Znacznik czasu w Uniksie (w sekundach) momentu ukończenia czatu. Każdy chunk ma ten sam znacznik czasu. | Tak | |
| id | ciąg | Unikalny identyfikator zakończenia czatu. Każdy chunk ma ten sam identyfikator. | Tak | |
| model | ciąg | Model do wygenerowania zakończenia. | Tak | |
| obiekt | wyliczenie | Typ obiektu, który zawsze chat.completion.chunkjest .Możliwe wartości: chat.completion.chunk |
Tak | |
| system_fingerprint | ciąg | Ten odcisk palca reprezentuje konfigurację backend, z którą działa model. Może być używany razem z parametrem żądania, seed aby zrozumieć, kiedy wprowadzono zmiany w backendzie, które mogą wpłynąć na determinizm. |
No |
chatCompletionStreamResponseDelta
Delta zakończenia czatu generowana przez odpowiedzi streamowanych modeli.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | ciąg | Treść wiadomości chunk. | No | |
| function_call | obiekt | Wycofane i zastąpione przez tool_calls. Nazwa i argumenty funkcji, którą należy wywołać, wygenerowane przez model. |
No | |
| └─ Argumenty | ciąg | Argumenty, które mają wywołać funkcję, generowane przez model w formacie JSON. Należy zauważyć, że model nie zawsze generuje prawidłowy JSON i może halucynować parametry niezdefiniowane przez schemat funkcji. Zweryfikowaj argumenty w swoim kodzie przed wywołaniem funkcji. | No | |
| └─ nazwa | ciąg | Nazwa funkcji, którą trzeba wywołać. | No | |
| refusal | ciąg | Komunikat odmowy generowany przez model. | No | |
| rola | wyliczenie | Rola autora tego przesłania. Możliwe wartości: system, user, , assistanttool |
No | |
| tool_calls | macierz | No |
Segment wywołania narzędzia wiadomości chatCompletion
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| funkcja | obiekt | No | ||
| └─ Argumenty | ciąg | Argumenty, które mają wywołać funkcję, generowane przez model w formacie JSON. Należy zauważyć, że model nie zawsze generuje prawidłowy JSON i może halucynować parametry niezdefiniowane przez schemat funkcji. Zweryfikowaj argumenty w swoim kodzie przed wywołaniem funkcji. | No | |
| └─ nazwa | ciąg | Nazwa funkcji, którą trzeba wywołać. | No | |
| id | ciąg | ID wywołania narzędzia. | No | |
| indeks | liczba całkowita | Tak | ||
| typ | wyliczenie | Rodzaj narzędzia. Obecnie obsługiwany jest tylko function on.Możliwe wartości: function |
No |
chatCompletionStreamOptions
Opcje odpowiedzi na streaming. Ustawiam to tylko wtedy, gdy ustawiasz stream: true.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| include_usage | boolean | Jeśli jest ustawiony, przed wiadomością data: [DONE] zostanie wystrzelony dodatkowy fragment. Pole usage w tym bloku pokazuje statystyki użycia tokenów dla całego żądania, a pole choices zawsze będzie pustą tablicą. Wszystkie pozostałe bloki również będą zawierać usage pole, ale z wartością zerową. |
No |
chatCompletionChoiceLogPrawdopodobieństwa
Loguj informacje o prawdopodobieństwie wyboru.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | macierz | Lista tokenów treści wiadomości z logami informacji o prawdopodobieństwie. | Tak | |
| refusal | macierz | Lista tokenów odmowy wiadomości z logicznymi informacjami o prawdopodobieństwie. | No |
chatCompletionTokenLogprob
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| bytes | macierz | Lista liczb całkowitych reprezentujących bajtową reprezentację tokena w UTF-8. Przydatne w przypadkach, gdy znaki są reprezentowane przez wiele tokenów, a ich reprezentacje bajtów muszą być łączone, aby uzyskać poprawną reprezentację tekstową. Może być null , jeśli token nie reprezentuje bajtów. |
Tak | |
| logprob | number | Log probability tego tokena. | Tak | |
| kod przedpłaty | ciąg | Znacznik. | Tak | |
| top_logprobs | macierz | Lista najbardziej prawdopodobnych tokenów i ich log prawdopodobieństwa na tej pozycji tokena. W rzadkich przypadkach może być mniej niż wymagana liczba zwróconych top_logprobs . |
Tak |
WiadomośćOdpowiedziNaZakończenieCzatu
Wiadomość zakończenia czatu wygenerowana przez model.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| audio | obiekt | Jeśli zażądana jest modalność wyjściowa dźwięku, obiekt ten zawiera dane dotyczące odpowiedzi audio z modelu. | No | |
| └─ dane | ciąg | Base64 kodował bajty audio generowane przez model, w formacie określonym w żądaniu. |
No | |
| └─ wygasa_o | liczba całkowita | Znacznik czasu Uniksa (w sekundach), kiedy ta odpowiedź dźwiękowa nie będzie już dostępna na serwerze do wieloturowych rozmów. |
No | |
| └─ ID | ciąg | Unikalny identyfikator tej odpowiedzi audio. | No | |
| └* transkrypcja | ciąg | Transkrypcja dźwięku generowanego przez model. | No | |
| zawartość | ciąg | Treść wiadomości. | Tak | |
| kontekst | azureChatExtensionsMessageContext | Przedstawienie dodatkowych informacji kontekstowych dostępnych przy generowaniu odpowiadającej odpowiedzi na zakończenie czatu Azure OpenAI. Te informacje kontekstowe są wypełniane tylko wtedy, gdy używamy żądania Azure OpenAI skonfigurowanego do używania odpowiadającego rozszerzenia. | No | |
| function_call | chatCompletionFunctionCall | Wycofane i zastąpione przez tool_calls. Nazwa i argumenty funkcji, którą należy wywołać, wygenerowane przez model. |
No | |
| refusal | ciąg | Komunikat odmowy generowany przez model. | Tak | |
| rola | chatCompletionResponseMessageRole | Rola autora wiadomości odpowiedzi. | Tak | |
| tool_calls | macierz | Wywołania narzędzi generowane przez model, takie jak wywołania funkcji. | No |
chatCompletionResponseMessageRole
Rola autora wiadomości odpowiedzi.
| Majątek | Wartość |
|---|---|
| Opis | Rola autora wiadomości odpowiedzi. |
| Typ | ciąg |
| Wartości | assistant |
chatCompletionToolChoiceOption
Kontroluje, które (jeśli w ogóle) narzędzie jest wywoływane przez model.
none oznacza to, że model nie wywołuje żadnego narzędzia, lecz generuje komunikat.
auto oznacza to, że model może wybrać między generowaniem wiadomości a wywołaniem jednego lub więcej narzędzi.
required oznacza, że model musi wywołać jedno lub więcej narzędzi. Określenie konkretnego narzędzia via {"type": "function", "function": {"name": "my_function"}} wymusza wywołanie tego narzędzia przez model.
none jest domyślne, gdy nie ma narzędzi.
auto jest domyślne, jeśli narzędzia są obecne.
Ten składnik może być jednym z następujących elementów:
chatCompletionNamedToolChoice
Określa narzędzie, którego model powinien używać. Używa się do wymuszenia wywołania konkretnej funkcji.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| funkcja | obiekt | Tak | ||
| └─ nazwa | ciąg | Nazwa funkcji, którą trzeba wywołać. | No | |
| typ | wyliczenie | Rodzaj narzędzia. Obecnie obsługiwany jest tylko function on.Możliwe wartości: function |
Tak |
ParallelToolCalls
Czy włączyć równoległe wywoływanie funkcji podczas użycia narzędzia.
Nie ma zdefiniowanych właściwości dla tego komponentu.
PredictionContent
Statyczna przewidywana treść wyjściowa, taka jak zawartość pliku tekstowego, który jest regenerowany.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | ciąg lub tablica | Treść, którą należy dopasować podczas generowania odpowiedzi modelu. Jeśli wygenerowane tokeny będą odpowiadać tej treści, cała odpowiedź modelu może być zwracana znacznie szybciej. | Tak | |
| typ | wyliczenie | Rodzaj przewidywanych treści, które chcesz dostarczyć. Ten typ jest obecnie zawsze content.Możliwe wartości: content |
Tak |
chatCompletionMessageToolCalls
Wywołania narzędzi generowane przez model, takie jak wywołania funkcji.
Nie ma zdefiniowanych właściwości dla tego komponentu.
ChatCompletionModalities
Typy wyników, które model chciałby wygenerować dla tego żądania. Większość modeli potrafi generować tekst, co jest domyślne:
["text"]
Model ten gpt-4o-audio-preview może być również używany do generowania dźwięku. Aby poprosić ten model o generowanie zarówno odpowiedzi tekstowych, jak i audio, możesz użyć:
["text", "audio"]
Nie ma zdefiniowanych właściwości dla tego komponentu.
chatCompletionFunctionCall
Wycofane i zastąpione przez tool_calls. Nazwa i argumenty funkcji, którą należy wywołać, wygenerowane przez model.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| arguments | ciąg | Argumenty, które mają wywołać funkcję, generowane przez model w formacie JSON. Należy zauważyć, że model nie zawsze generuje prawidłowy JSON i może halucynować parametry niezdefiniowane przez schemat funkcji. Zweryfikowaj argumenty w swoim kodzie przed wywołaniem funkcji. | Tak | |
| nazwa | ciąg | Nazwa funkcji, którą trzeba wywołać. | Tak |
completionUsage
Statystyki wykorzystania wniosku o zakończenie.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| completion_tokens | liczba całkowita | Liczba tokenów w wygenerowanym ukończeniu. | Tak | |
| completion_tokens_details | obiekt | Podział tokenów używanych w zakończeniu transakcji. | No | |
| └zaakceptowane_tokeny_predykcji | liczba całkowita | Przy użyciu Predicted Outputs, liczba tokenów w przewidywaniu, które pojawiły się podczas zakończenia. | No | |
| └audio_tokens | liczba całkowita | Tokeny wejściowe audio generowane przez model. | No | |
| └─ tokeny_rozumowania | liczba całkowita | Tokeny generowane przez model do rozumowania. | No | |
| └─ odrzucone_żetony_predykcji | liczba całkowita | Przy użyciu Predicted Outputs, liczba tokenów w przewidywaniu, które nie pojawiły się w ukończeniu. Jednak podobnie jak tokeny rozumowania, te tokeny są nadal liczone do tokenów całkowitego ukończenia na potrzeby rozliczeń, wyników i limitów okien kontekstowych. | No | |
| prompt_tokens | liczba całkowita | Liczba żetonów w promptie. | Tak | |
| prompt_tokens_details | obiekt | Szczegóły tokenów promptu. | No | |
| └audio_tokens | liczba całkowita | Tokeny wejściowe audio obecne w poleceniu. | No | |
| └cached_tokens | liczba całkowita | Liczba zbuforowanych tokenów promptów. | No | |
| total_tokens | liczba całkowita | Całkowita liczba tokenów użytych w żądaniu (prompt + zakończenie). | Tak |
narzędzie do zakończenia czatu
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| funkcja | FunctionObject | Tak | ||
| typ | wyliczenie | Rodzaj narzędzia. Obecnie obsługiwany jest tylko function on.Możliwe wartości: function |
Tak |
Parametry funkcji
Parametry, które funkcje akceptują, są opisane jako obiekt schematu JSON. Zobacz przewodnik dla przykładów oraz odniesienie do schematu JSON dla dokumentacji formatu.
Pomijanie parameters definiuje funkcję z pustą listą parametrów.
Nie ma zdefiniowanych właściwości dla tego komponentu.
FunctionObject
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| opis | ciąg | Opis tego, co funkcja robi, używany przez model do wyboru, kiedy i jak wywołać funkcję. | No | |
| nazwa | ciąg | Nazwa funkcji, którą ma się wywołać. Musi być od A do Z, A-Z, 0-9 lub zawierać podkreślenia i kreski, a maksymalna długość to 64. | Tak | |
| parameters | Parametry funkcji | Parametry, które funkcje akceptują, są opisane jako obiekt schematu JSON.
Zobacz przewodnik dla przykładów oraz odniesienie do schematu JSON dla dokumentacji formatu. Pomijanie parameters definiuje funkcję z pustą listą parametrów. |
No | |
| surowy | boolean | Czy należy umożliwić ścisłe przestrzeganie schematu podczas generowania wywołania funkcji. Jeśli ustawiono na prawdę, model będzie podążał za dokładnym schematem zdefiniowanym w parameters polu. Obsługiwany jest tylko podzbiór schematu JSON, gdy strict jest .true |
No | Nieprawda |
FormatTekstuOdpowiedzi
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | wyliczenie | Typ definiowanego formatu odpowiedzi: textMożliwe wartości: text |
Tak |
FormatOdpowiedziJsonObiekt
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | wyliczenie | Typ definiowanego formatu odpowiedzi: json_objectMożliwe wartości: json_object |
Tak |
ResponseFormatJsonSchemaSchema
Schemat formatu odpowiedzi, opisany jako obiekt schematu JSON.
Nie ma zdefiniowanych właściwości dla tego komponentu.
FormatOdpowiedziJsonSchema
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| json_schema | obiekt | Tak | ||
| Opis └* | ciąg | Opis formatu odpowiedzi, używany przez model do określenia, jak odpowiedzieć w formacie. | No | |
| └─ nazwa | ciąg | Nazwa formatu odpowiedzi. Musi być od A do Z, A-Z, 0-9 lub zawierać podkreślenia i kreski, a maksymalna długość to 64. | No | |
| Schemat └* | ResponseFormatJsonSchemaSchema | Schemat formatu odpowiedzi, opisany jako obiekt schematu JSON. | No | |
| └* ścisłe | boolean | Czy należy umożliwić ścisłe przestrzeganie schematu podczas generowania wyniku. Jeśli ustawimy na true, model zawsze będzie podążał za dokładnym schematem zdefiniowanym schema w polu. Obsługiwany jest tylko podzbiór schematu JSON, gdy strict jest .true |
No | Nieprawda |
| typ | wyliczenie | Typ definiowanego formatu odpowiedzi: json_schemaMożliwe wartości: json_schema |
Tak |
Opcja ukończenia rozmowy wspólna
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| powód zakończenia | ciąg | No | ||
| indeks | liczba całkowita | No |
utwórzŻądanieTłumaczenia
Żądanie tłumaczenia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| plik | ciąg | Plik audio do tłumaczenia. | Tak | |
| monit | ciąg | Opcjonalny tekst wskazujący styl modelu lub kontynuujący wcześniejszy segment audio. Zadanie powinno być po angielsku. | No | |
| format_odpowiedzi | audioResponseFormat | Definiuje format wyjścia. | No | |
| temperatura | number | Temperatura próbkowania, między 0 a 1. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. Jeśli ustawimy ją na 0, model wykorzystuje logarytmiczne prawdopodobieństwo do automatycznego podnoszenia temperatury aż do osiągnięcia określonych progów. | No | 0 |
odpowiedź dźwiękowa
Odpowiedź na tłumaczenie lub transkrypcję, gdy response_format był json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| SMS | ciąg | Tekst przetłumaczony lub przepisany. | Tak |
audioVerboseResponse
Odpowiedź tłumaczeniowa lub transkrypcja, gdy response_format była verbose_json
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| duration | number | Czas trwania. | No | |
| język | ciąg | Language. | No | |
| segments | macierz | No | ||
| zadanie | ciąg | Rodzaj zadania audio. | No | |
| SMS | ciąg | Tekst przetłumaczony lub przepisany. | Tak | |
| Słowy | macierz | No |
audioResponseFormat
Definiuje format wyjścia.
| Majątek | Wartość |
|---|---|
| Opis | Definiuje format wyjścia. |
| Typ | ciąg |
| Wartości | jsontextsrtverbose_jsonvtt |
utwórzŻądanieTranskrypcji
Żądanie transkrypcji.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| plik | ciąg | Plik audio wymaga transkrypcji. | Tak | |
| język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 poprawia dokładność i opóźnienia. | No | |
| monit | ciąg | Opcjonalny tekst wskazujący styl modelu lub kontynuujący wcześniejszy segment audio. Prompt powinien odpowiadać językowi dźwięku. | No | |
| format_odpowiedzi | audioResponseFormat | Definiuje format wyjścia. | No | |
| temperatura | number | Temperatura próbkowania, między 0 a 1. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. Jeśli ustawimy ją na 0, model wykorzystuje logarytmiczne prawdopodobieństwo do automatycznego podnoszenia temperatury aż do osiągnięcia określonych progów. | No | 0 |
| timestamp_granularities[] | macierz | Szczegóły dotyczące znaczników czasowych do wypełnienia dla tej transkrypcji.
response_format musi być ustawiony verbose_json tak, aby używać szczegółowości znaczników czasu. Obsługiwane są te opcje lub obie: word, lub segment. Uwaga: Nie ma dodatkowego opóźnienia dla znaczników czasu segmentów, ale generowanie znaczników czasu słów powoduje dodatkowe opóźnienia. |
No | ['segment'] |
Fragment dźwiękowy
Segment transkrypcji lub tłumaczenia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| avg_logprob | number | Średnie prawdopodobieństwo logu. | No | |
| compression_ratio | number | Współczynnik sprężania. | No | |
| end | number | Przesunięcie końca segmentu. | No | |
| id | liczba całkowita | Identyfikator segmentu. | No | |
| no_speech_prob | number | Prawdopodobieństwo "braku mowy". | No | |
| seek | number | Przesunięcie segmentu. | No | |
| początek | number | Początek segmentu jest przesunuty. | No | |
| temperatura | number | Temperatura. | No | |
| SMS | ciąg | Tekst segmentu. | No | |
| tokens | macierz | Znaki tekstu. | No |
audioWord
Transkrypcja lub tłumaczenie.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| end | number | Word przesunięcie końcowe. | No | |
| początek | number | Word Start offset. | No | |
| słowo | ciąg | Słowo | No |
createSpeechRequest
Żądanie mowy.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane wejściowe | ciąg | Tekst do syntezy dźwięku. Maksymalna długość to 4 096 znaków. | Tak | |
| format_odpowiedzi | wyliczenie | Format do syntezy dźwięku. Możliwe wartości: mp3, opus, aac, , flac, wav, pcm |
No | |
| Prędkość | number | Szybkość syntetycznego dźwięku. Wybierz wartość z 0.25 do .4.0
1.0 jest domyślna. |
No | 1.0 |
| voice | wyliczenie | Głos do syntezy mowy. Możliwe wartości: alloy, echo, fable, , onyx, nova, shimmer |
Tak |
imageQuality
Jakość wygenerowanego obrazu.
| Majątek | Wartość |
|---|---|
| Opis | Jakość wygenerowanego obrazu. |
| Typ | ciąg |
| Wartość domyślna | samochód |
| Wartości | autohighmediumlowhdstandard |
imagesResponseFormat
Format, w którym zwracane są wygenerowane obrazy.
| Majątek | Wartość |
|---|---|
| Opis | Format, w którym zwracane są wygenerowane obrazy. |
| Typ | ciąg |
| Wartość domyślna | Adres url |
| Wartości | urlb64_json |
imagesOutputFormat
Format pliku, w którym zwracane są wygenerowane obrazy. Obsługiwane tylko dla modeli serialowych.
| Majątek | Wartość |
|---|---|
| Opis | Format pliku, w którym zwracane są wygenerowane obrazy. Obsługiwane tylko dla modeli z serii gpt-image-1. |
| Typ | ciąg |
| Wartość domyślna | png |
| Wartości | pngjpeg |
imageSize
Rozmiar wygenerowanych obrazów.
| Majątek | Wartość |
|---|---|
| Opis | Rozmiar wygenerowanych obrazów. |
| Typ | ciąg |
| Wartość domyślna | samochód |
| Wartości | auto1792x10241024x17921024x10241024x15361536x1024 |
imageStyle
Styl generowanych obrazów. Obsługiwane tylko dla dall-e-3.
| Majątek | Wartość |
|---|---|
| Opis | Styl generowanych obrazów. Obsługiwane tylko dla dall-e-3. |
| Typ | ciąg |
| Wartość domyślna | żywy |
| Wartości | vividnatural |
imageBackground
Pozwala ustawić przezroczystość tła wygenerowanego obrazu. Ten parametr jest obsługiwany tylko dla modeli serii gpt-image-1.
| Majątek | Wartość |
|---|---|
| Opis | Pozwala ustawić przezroczystość tła wygenerowanego obrazu. Ten parametr jest obsługiwany tylko dla modeli serii gpt-image-1. |
| Typ | ciąg |
| Wartość domyślna | samochód |
| Wartości | transparentopaqueauto |
żądanieGeneracjiObrazów
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| tło | imageBackground | Pozwala ustawić przezroczystość tła wygenerowanego obrazu. Ten parametr jest obsługiwany tylko dla modeli serii gpt-image-1. | No | samochód |
| n | liczba całkowita | Liczba obrazów do wygenerowania. Dla dall-e-3 obsługiwane jest tylko n=1. | No | 1 |
| kompresja wyjściowa | liczba całkowita | Poziom kompresji (0-100%) dla wygenerowanych obrazów. Ten parametr jest obsługiwany tylko dla modeli serii gpt-image-1 z formatem wyjściowym jpeg. | No | 100 |
| format_wyjściowy | imagesOutputFormat | Format pliku, w którym zwracane są wygenerowane obrazy. Obsługiwane tylko dla modeli z serii gpt-image-1. | No | png |
| monit | ciąg | Tekstowy opis pożądanego obrazu(ów). Maksymalna długość to 32000 znaków dla modeli serii gpt-image-1 oraz 4000 znaków dla dall-e-3 | Tak | |
| jakość | imageQuality | Jakość wygenerowanego obrazu. | No | samochód |
| format_odpowiedzi | imagesResponseFormat | Format, w którym zwracane są wygenerowane obrazy. Obsługiwane tylko dla dall-e-3. | No | Adres url |
| size | imageSize | Rozmiar wygenerowanych obrazów. | No | samochód |
| styl | imageStyle | Styl generowanych obrazów. Obsługiwane tylko dla dall-e-3. | No | żywy |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który pomaga monitorować i wykrywać nadużycia. | No |
imageEditsRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| obraz | ciąg lub tablica | Obraz(y) do edycji. Musi to być wspierany plik obrazów lub tablica obrazów. Każdy obraz powinien mieć plik png, czyli plik jpg mniejszy niż 25MB. | Tak | |
| maska | ciąg | Dodatkowy obraz, którego w pełni przezroczyste obszary (np. gdzie alfa wynosi zero) wskazują, gdzie należy edytować obraz. Jeśli podano wiele obrazów, maska zostanie nałożona na pierwszy obraz. Musi to być poprawny plik PNG, mniejszy niż 4MB i mieć takie same wymiary jak obraz. | No | |
| n | liczba całkowita | Liczba obrazów do wygenerowania. | No | 1 |
| monit | ciąg | Tekstowy opis pożądanego obrazu(ów). Maksymalna długość to 32000 znaków. | Tak | |
| jakość | imageQuality | Jakość wygenerowanego obrazu. | No | samochód |
| format_odpowiedzi | imagesResponseFormat | Format, w którym zwracane są wygenerowane obrazy. | No | Adres url |
| size | imageSize | Rozmiar wygenerowanych obrazów. | No | samochód |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który pomaga monitorować i wykrywać nadużycia. | No |
generateImagesResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| utworzone | liczba całkowita | Znacznik czasu uniksa w momencie utworzenia operacji. | Tak | |
| dane | macierz | Dane wynikowe operacji, jeśli się powiedzą | Tak | |
| użycie | imageGenerationsUsage | Reprezentuje szczegóły użycia tokenów dla żądań generowania obrazów. Tylko dla modeli z serii GPT-Image-1. | No |
wynikObrazu
URL obrazu lub zakodowany obraz, jeśli się powiedzie, a w przeciwnym razie pojawia się błąd.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| b64_json | ciąg | Obraz zakodowany w base64 | No | |
| content_filter_results | Wyniki filtru treści DALL-E | Informacje o wynikach filtrowania treści. | No | |
| prompt_filter_results | dalleFilterResults | Informacje o kategorii filtrowania treści (nienawiść, seksualność, przemoc self_harm), czy została wykryta, a także o poziomie nasilenia (very_low, niski, średni, wysoki skali decydującej o intensywności i ryzyku szkodliwych treści) oraz czy zostały one przefiltrowane, czy nie. Informacje o treściach jailbreakowych i przekleństwach, czy zostały wykryte oraz czy zostały przefiltrowane, czy nie. Oraz informacje o liście blokowanych klientów, czy została przefiltrowana i jej identyfikatorze. | No | |
| (revised_prompt remains unchanged, assuming it is a placeholder requiring no translation or adaptation) | ciąg | Prompt, który został użyty do wygenerowania obrazu, jeśli nastąpiła jakaś poprawka w poleceniu. | No | |
| Adres url | ciąg | URL obrazu. | No |
imageGenerationsUsage
Reprezentuje szczegóły użycia tokenów dla żądań generowania obrazów. Tylko dla modeli z serii GPT-Image-1.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| input_tokens | liczba całkowita | Liczba tokenów wejściowych. | No | |
| input_tokens_details | obiekt | Szczegółowy podział tokenów wejściowych. | No | |
| └image_tokens | liczba całkowita | Liczba tokenów obrazu. | No | |
| └ text_tokens | liczba całkowita | Liczba tokenów tekstowych. | No | |
| output_tokens | liczba całkowita | Liczba tokenów wyjściowych. | No | |
| total_tokens | liczba całkowita | Całkowita liczba użytych żetonów. | No |
linia
Obiekt linii treści składający się z sąsiedniej sekwencji elementów treści, takich jak słowa i znaki zaznaczenia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| Obejmuje | macierz | Tablica rozpięć reprezentujących wykryte obiekty oraz informacje o ich ramkach ograniczających. | Tak | |
| SMS | ciąg | Tak |
Span
Obiekt span reprezentujący wykryty obiekt oraz informacje o jego ramce ograniczającej.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| length | liczba całkowita | Długość rozpiętości w znakach, mierzona w punktach kodowych Unicode. | Tak | |
| przesunąć | liczba całkowita | Przesunięcie znaku w tekście, gdzie zaczyna się rozpiętość. Ten offset definiuje się jako pozycję pierwszego znaku w rozpiętości, licząc od początku tekstu jako punkty kodowe Unicode. | Tak | |
| polygon | macierz | Tablica obiektów reprezentujących punkty w wielokątu, który otacza wykryty obiekt. | Tak | |
| SMS | ciąg | Zawartość tekstu w rozpiętości reprezentującej wykryty obiekt. | Tak |
runCompletionUsage
Statystyki użytkowania związane z biegiem. Ta wartość będzie wtedy, null gdy run nie jest w stanie terminalnym (np. in_progress, queued, itd.).
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| completion_tokens | liczba całkowita | Liczba tokenów ukończenia użytych w trakcie rozgrywki. | Tak | |
| prompt_tokens | liczba całkowita | Liczba tokenów promptu użytych w trakcie trwania rozgrywki. | Tak | |
| total_tokens | liczba całkowita | Łączna liczba użytych tokenów (prompt + ukończenie). | Tak |
runStepCompletionUsage
Statystyki użytkowania związane ze krokiem uruchomienia. Ta wartość będzie wynosiła, null gdy status kroku run wynosi .in_progress
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| completion_tokens | liczba całkowita | Liczba tokenów ukończenia użytych w trakcie kroku przebiegu. | Tak | |
| prompt_tokens | liczba całkowita | Liczba tokenów promptu użytych w trakcie kroku uruchomienia. | Tak | |
| total_tokens | liczba całkowita | Łączna liczba użytych tokenów (prompt + ukończenie). | Tak |
assistantsApiResponseFormatOption
Określa format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo od .gpt-3.5-turbo-1106
Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które zapewniają, że model odpowiada dostarczonemu schematowi JSON. Dowiedz się więcej w przewodniku po Structured Outputs.
Ustawienie na { "type": "json_object" } włączenie trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON.
Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu.
Ten składnik może być jednym z następujących elementów:
assistantsApiResponseFormat
Obiekt opisujący oczekiwany wynik modelu.
json_object Jeśli tylko function typy tools mogą być przekazywane do Run. Jeśli text model może zwrócić tekst lub dowolną wartość,
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | ciąg | Musi być jednym z lub textjson_object. |
No | SMS |
typ Enum: AssistantsApiResponseFormat
| Wartość | Opis |
|---|---|
| SMS | |
| json_object |
assistantObject
Reprezentuje , assistant która może wywołać model i używać narzędzi.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| utworzono_o | liczba całkowita | Znacznik czasu Unixa (w sekundach) oznaczający moment utworzenia asystenta. | Tak | |
| opis | ciąg | Opis asystenta. Maksymalna długość to 512 znaków. |
Tak | |
| id | ciąg | Identyfikator, do którego można się odwołać w końcowych punktach API. | Tak | |
| instructions | ciąg | System instruuje asystenta. Maksymalna długość to 256 000 znaków. |
Tak | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
Tak | |
| model | ciąg | Identyfikacja modelu, którego należy użyć. | Tak | |
| nazwa | ciąg | Imię asystenta. Maksymalna długość to 256 znaków. |
Tak | |
| obiekt | ciąg | Typ obiektu, który zawsze assistantjest . |
Tak | |
| format_odpowiedzi | assistantsApiResponseFormatOption | Określa format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo od .gpt-3.5-turbo-1106Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które zapewniają, że model odpowiada dostarczonemu schematowi JSON. Dowiedz się więcej w przewodniku po Structured Outputs.Ustawienie na { "type": "json_object" } włączenie trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON.Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. |
No | 1 |
| tool_resources | obiekt | Zestaw zasobów wykorzystywanych przez narzędzia asystenta. Zasoby są specyficzne dla rodzaju narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, podczas gdy narzędzie file_search wymaga listy identyfikatorów pamięci wektorowej. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Z narzędziem może być maksymalnie 20 plików. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Identyfikator magazynu wektorów przypisany do tego asystenta. Asystent może być dołączony maksymalnie do jednego pamięci wektorowej. |
No | |
| Narzędzia | macierz | Lista narzędzi włączonych na asystencie. Maksymalnie 128 narzędzi na asystenta może być przeznaczonych. Narzędzia mogą mieć typy code_interpreter, file_search, lub function. |
Tak | [] |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy zmianę tego lub temperatury, ale nie obu naraz. |
No | 1 |
obiekt Enum: AssistantObjectType
| Wartość | Opis |
|---|---|
| asystent | Typ obiektu, którym zawsze jest asystent |
createAssistantRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| opis | ciąg | Opis asystenta. Maksymalna długość to 512 znaków. |
No | |
| instructions | ciąg | System instruuje asystenta. Maksymalna długość to 256 000 znaków. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| model | ciąg | Tak | ||
| nazwa | ciąg | Imię asystenta. Maksymalna długość to 256 znaków. |
No | |
| format_odpowiedzi | assistantsApiResponseFormatOption | Określa format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo od .gpt-3.5-turbo-1106Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które zapewniają, że model odpowiada dostarczonemu schematowi JSON. Dowiedz się więcej w przewodniku po Structured Outputs.Ustawienie na { "type": "json_object" } włączenie trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON.Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. |
No | 1 |
| tool_resources | obiekt | Zestaw zasobów wykorzystywanych przez narzędzia asystenta. Zasoby są specyficzne dla rodzaju narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, podczas gdy narzędzie file_search wymaga listy identyfikatorów pamięci wektorowej. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Z narzędziem może być maksymalnie 20 plików. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorów przypisany do tego asystenta. Asystent może być dołączony maksymalnie do jednego pamięci wektorowej. |
No | |
| └─ przechowalnie_wektorów | macierz | Pomocnik do utworzenia magazynu wektorowego za pomocą file_ids i dołączenia go do tego asystenta. Asystent może być dołączony maksymalnie do jednego pamięci wektorowej. |
No | |
| Narzędzia | macierz | Lista narzędzi włączonych na asystencie. Maksymalnie 128 narzędzi na asystenta może być przeznaczonych. Narzędzia mogą mieć typy code_interpreter, retrieval, lub function. |
No | [] |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy zmianę tego lub temperatury, ale nie obu naraz. |
No | 1 |
modifyAssistantRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| opis | ciąg | Opis asystenta. Maksymalna długość to 512 znaków. |
No | |
| instructions | ciąg | System instruuje asystenta. Maksymalna długość to 32768 znaków. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| model | ciąg | No | ||
| nazwa | ciąg | Imię asystenta. Maksymalna długość to 256 znaków. |
No | |
| format_odpowiedzi | assistantsApiResponseFormatOption | Określa format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo od .gpt-3.5-turbo-1106Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które zapewniają, że model odpowiada dostarczonemu schematowi JSON. Dowiedz się więcej w przewodniku po Structured Outputs.Ustawienie na { "type": "json_object" } włączenie trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON.Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. |
No | 1 |
| tool_resources | obiekt | Zestaw zasobów wykorzystywanych przez narzędzia asystenta. Zasoby są specyficzne dla rodzaju narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, podczas gdy narzędzie file_search wymaga listy identyfikatorów pamięci wektorowej. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Nadpisuje listę identyfikatorów plików udostępnionych narzędziu code_interpreter . Z narzędziem może być maksymalnie 20 plików. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | To nadpisuje wektorowy magazyn przypisany do tego asystenta. Asystent może być dołączony maksymalnie do jednego pamięci wektorowej. |
No | |
| Narzędzia | macierz | Lista narzędzi włączonych na asystencie. Maksymalnie 128 narzędzi na asystenta może być przeznaczonych. Narzędzia mogą mieć typy code_interpreter, retrieval, lub function. |
No | [] |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy zmianę tego lub temperatury, ale nie obu naraz. |
No | 1 |
deleteAssistantResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| usunięta | boolean | Tak | ||
| id | ciąg | Tak | ||
| obiekt | ciąg | Tak |
obiekt Enum: DeleteAssistantResponseState
| Wartość | Opis |
|---|---|
| assistant.deleted |
listAssistantsResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | macierz | Tak | ||
| first_id | ciąg | Tak | ||
| zawiera_więcej | boolean | Tak | ||
| last_id | ciąg | Tak | ||
| obiekt | ciąg | Tak |
assistantToolsCode
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | ciąg | Rodzaj narzędzia definiowanego: code_interpreter |
Tak |
typ Enum: assistantToolsCodeType
| Wartość | Opis |
|---|---|
| code_interpreter |
assistantToolsFileSearch
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| file_search | obiekt | Nadpisuje narzędzie wyszukiwania plików. | No | |
| └max_num_results | liczba całkowita | Maksymalna liczba wyników, jakie powinno wygenerować narzędzie do wyszukiwania plików. Domyślnie to 20 dla modeli GPT-4* i 5 dla GPT-3.5-turbo. Ta liczba powinna mieścić się w zakresie od 1 do 50 włącznie. Należy zauważyć, że narzędzie do wyszukiwania plików może wygenerować mniej niż max_num_results wyniki. |
No | |
| typ | ciąg | Rodzaj narzędzia definiowanego: file_search |
Tak |
type Enum: typWyszukiwaniaPlikówNarzędziAsystenta
| Wartość | Opis |
|---|---|
| file_search |
assistantToolsFileSearchTypeOnly
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | ciąg | Rodzaj narzędzia definiowanego: file_search |
Tak |
type Enum: typWyszukiwaniaPlikówNarzędziAsystenta
| Wartość | Opis |
|---|---|
| file_search |
assistantToolsFunction
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| funkcja | obiekt | Definicja funkcji. | Tak | |
| Opis └* | ciąg | Opis tego, co funkcja robi, używany przez model do wyboru, kiedy i jak wywołać funkcję. | No | |
| └─ nazwa | ciąg | Nazwa funkcji, którą ma się wywołać. Musi być od A do Z, A-Z, 0-9 lub zawierać podkreślenia i kreski, a maksymalna długość to 64. | No | |
| Parametry | chatCompletionFunctionParameters | Parametry, które funkcje akceptują, są opisane jako obiekt schematu JSON. Zobacz przewodnik/ dla przykładów oraz w JSON Schema jako źródło dokumentacji dotyczącej formatu. | No | |
| typ | ciąg | Rodzaj narzędzia definiowanego: function |
Tak |
type Enum: assistantToolsFunction
| Wartość | Opis |
|---|---|
| funkcja |
obcięcie obiektuObject
Kontrole dotyczące tego, jak wątek zostanie obcięty przed uruchomieniem. Użyj tego do kontrolowania początkowego okna kontekstu przebiegu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| last_messages | liczba całkowita | Liczba najnowszych wiadomości z wątku podczas tworzenia kontekstu do przebiegu. | No | |
| typ | ciąg | Strategia obcinania do zastosowania dla wątku. Wartość domyślna to auto. Jeśli ustawimy na , last_messageswątek zostanie obcięty do n najnowszych wiadomości w wątku. Po ustawieniu na auto, wiadomości w środku wątku zostaną usunięte, aby dopasować się do długości kontekstu modelu, max_prompt_tokens. |
Tak |
typ Enum: Truncation Type
| Wartość | Opis |
|---|---|
| samochód | |
| last_messages |
assistantsApiToolChoiceOption
Kontroluje, które (jeśli w ogóle) narzędzie jest wywoływane przez model.
none oznacza to, że model nie wywołuje żadnych narzędzi, lecz generuje wiadomość.
auto jest wartością domyślną i oznacza, że model może wybrać między generowaniem wiadomości a wywołaniem narzędzia.
Określenie konkretnego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymuszanie wywołania tego narzędzia, wymusza model.
Ten składnik może być jednym z następujących elementów:
assistantsNamedToolChoice
Określa narzędzie, którego model powinien używać. Używam go do wymuszenia wywołania konkretnego narzędzia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| funkcja | obiekt | No | ||
| └─ nazwa | ciąg | Nazwa funkcji, którą trzeba wywołać. | No | |
| typ | ciąg | Rodzaj narzędzia. Jeśli typ jest , functionnazwa funkcji musi być ustawiona |
Tak |
typ Enum: AssistantsNamedToolChoiceType
| Wartość | Opis |
|---|---|
| funkcja | |
| code_interpreter | |
| file_search |
runObject
Reprezentuje wykonanie wykonane na wątku.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| assistant_id | ciąg | ID asystenta użytego do wykonania tego przebiegu. | Tak | |
| anulowano_o | liczba całkowita | Znacznik czasu Unixa (w sekundach) oznaczający moment anulowania rozgrywki. | Tak | |
| zakończono_o | liczba całkowita | Znacznik czasu w Unixie (w sekundach) oznaczający moment zakończenia przebiegu. | Tak | |
| utworzono_o | liczba całkowita | Znacznik czasu Unixa (w sekundach) oznaczający moment tworzenia przebiegu. | Tak | |
| wygasa_o | liczba całkowita | Znacznik czasu Unixa (w sekundach) oznaczający wygaśnięcie rozgrywki. | Tak | |
| nie powiodło się o | liczba całkowita | Znacznik czasu w Unixie (w sekundach) oznaczający moment, gdy uruchomienie się nie powiodło. | Tak | |
| id | ciąg | Identyfikator, do którego można się odwołać w końcowych punktach API. | Tak | |
| incomplete_details | obiekt | Szczegóły dotyczące tego, dlaczego run jest niekompletny. Będzie null , jeśli run nie będzie niekompletny. |
Tak | |
| └* przyczyna | ciąg | Powód, dla którego ta seria jest niekompletna. To wskaże, który konkretny limit tokenów został osiągnięty w trakcie trwania rozgrywki. | No | |
| instructions | ciąg | Instrukcje, których asystent użył do tego biegu. | Tak | |
| ostatni błąd | obiekt | Ostatni błąd związany z tym biegiem. Będę null , jeśli nie ma błędów. |
Tak | |
| └─ kod | ciąg | Jeden z server_error lub rate_limit_exceeded. |
No | |
| └─ Komunikat | ciąg | Czytelny opis błędu. | No | |
| max_completion_tokens | liczba całkowita | Maksymalna liczba tokenów ukończenia określona do wykorzystania w trakcie trwania przebiegu. |
Tak | |
| max_prompt_tokens | liczba całkowita | Maksymalna liczba tokenów promptu określona do wykorzystania w trakcie biegu. |
Tak | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
Tak | |
| model | ciąg | Model, którego asystent użył w tym biegu. | Tak | |
| obiekt | ciąg | Typ obiektu, który zawsze thread.runjest . |
Tak | |
| wywołania_narzędzia_równoległe | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas użycia narzędzia. | No | True |
| required_action | obiekt | Szczegóły dotyczące działań potrzebnych do kontynuowania trasy. Będzie null , jeśli nie będzie wymagane żadne działanie. |
Tak | |
| └submit_tool_outputs | obiekt | Szczegóły dotyczące potrzebnych wydruków narzędzi do tej serii będą kontynuowane. | No | |
| └tool_calls | macierz | Lista odpowiednich wywołań narzędzi. | No | |
| └typ | wyliczenie | Na razie to zawsze submit_tool_outputsjest .Możliwe wartości: submit_tool_outputs |
No | |
| format_odpowiedzi | assistantsApiResponseFormatOption | Określa format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo od .gpt-3.5-turbo-1106Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które zapewniają, że model odpowiada dostarczonemu schematowi JSON. Dowiedz się więcej w przewodniku po Structured Outputs.Ustawienie na { "type": "json_object" } włączenie trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON.Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu. |
Tak | |
| started_at | liczba całkowita | Znacznik czasu w Uniksie (w sekundach) oznaczający moment rozpoczęcia rozgrywki. | Tak | |
| stan | ciąg | Status sekwencji, który może być albo queued, in_progress, requires_action, cancelling, cancelled, failed, , completed, lub expired. |
Tak | |
| temperatura | number | Temperatura próbkowania użyta w tym przebiegu. Jeśli nie jest ustawione, domyślnie jest ustawione na 1. | No | |
| thread_id | ciąg | ID wątków, które zostały wykonane w ramach tego uruchomienia. | Tak | |
| tool_choice | assistantsApiToolChoiceOption | Kontroluje, które (jeśli w ogóle) narzędzie jest wywoływane przez model.none oznacza to, że model nie wywołuje żadnych narzędzi, lecz generuje wiadomość.auto jest wartością domyślną i oznacza, że model może wybrać między generowaniem wiadomości a wywołaniem narzędzia.Określenie konkretnego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymuszanie wywołania tego narzędzia, wymusza model. |
Tak | |
| Narzędzia | macierz | Lista narzędzi, których asystent użył podczas tej rozgrywki. | Tak | [] |
| top_p | number | Wartość próbkowania jądra użyta w tym przebiegu. Jeśli nie jest ustawione, domyślnie jest ustawione na 1. | No | |
| truncation_strategy | obcięcie obiektuObject | Kontrole dotyczące tego, jak wątek zostanie obcięty przed uruchomieniem. Użyj tego do kontrolowania początkowego okna kontekstu przebiegu. | Tak | |
| użycie | runCompletionUsage | Statystyki użytkowania związane z biegiem. Ta wartość będzie wtedy, null gdy run nie jest w stanie terminalnym (np. in_progress, queued, itd.). |
Tak |
obiekt Enum: runObjectType
| Wartość | Opis |
|---|---|
| thread.run | Typ obiektu run, który zawsze jest thread.run |
status Enum: StatusUruchomieniaObiektu
| Wartość | Opis |
|---|---|
| w kolejce | Stan kolejki |
| in_progress | Stan in_progress |
| requires_action | Stan required_action |
| Anulowanie | Stan anulujący |
| cancelled | Stan anulowany |
| niepowodzenie | Państwo upadłe |
| Zakończone | Stan ukończony |
| Wygasłe | Stan wygasłości |
createRunRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| additional_instructions | ciąg | Dodaje dodatkowe instrukcje na końcu instrukcji dotyczących przebiegu. Jest to przydatne do modyfikacji zachowania na każdy bieg bez nadpisywania innych instrukcji. | No | |
| additional_messages | macierz | Dodaje dodatkowe wiadomości do wątku przed utworzeniem uruchomienia. | No | |
| assistant_id | ciąg | ID asystenta, którego należy użyć do wykonania tego przebiegu. | Tak | |
| instructions | ciąg | Nadpisz domyślny komunikat systemowy asystenta. Jest to przydatne do modyfikacji zachowania na podstawie pojedynczego biegu. | No | |
| max_completion_tokens | liczba całkowita | Maksymalna liczba tokenów ukończenia, które można użyć w trakcie trwania rozgrywki. Run stara się używać tylko określonej liczby tokenów ukończenia przez kilka tur rozgrywki. Jeśli przebieg przekroczy podaną liczbę tokenów ukończenia, zakończy się ze statusem incomplete. Zobacz więcej incomplete_details informacji. |
No | |
| max_prompt_tokens | liczba całkowita | Maksymalna liczba tokenów promptów, które można użyć w trakcie trwania biegu. Run stara się używać tylko określonej liczby tokenów promptu przez kilka tur rozgrywki. Jeśli przebieg przekroczy określoną liczbę tokenów promptu, zakończy się ze statusem incomplete. Zobacz więcej incomplete_details informacji. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| model | ciąg | ID Modelu użytego do wykonania tego przebiegu. Jeśli tutaj podana jest wartość, zostanie ona nadpisana przez model powiązany z asystentem. Jeśli nie, zostanie użyty model powiązany z asystentem. | No | |
| wywołania_narzędzia_równoległe | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas użycia narzędzia. | No | True |
| format_odpowiedzi | assistantsApiResponseFormatOption | Określa format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo od .gpt-3.5-turbo-1106Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które zapewniają, że model odpowiada dostarczonemu schematowi JSON. Dowiedz się więcej w przewodniku po Structured Outputs.Ustawienie na { "type": "json_object" } włączenie trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON.Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| odtwarzać strumieniowo | boolean | Jeśli true, zwraca strumień zdarzeń, które mają miejsce podczas Run jako zdarzenia wysyłane przez serwer, kończąc się, gdy Run wchodzi w stan terminalowy z wiadomością data: [DONE] . |
No | |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. |
No | 1 |
| tool_choice | assistantsApiToolChoiceOption | Kontroluje, które (jeśli w ogóle) narzędzie jest wywoływane przez model.none oznacza to, że model nie wywołuje żadnych narzędzi, lecz generuje wiadomość.auto jest wartością domyślną i oznacza, że model może wybrać między generowaniem wiadomości a wywołaniem narzędzia.Określenie konkretnego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymuszanie wywołania tego narzędzia, wymusza model. |
No | |
| Narzędzia | macierz | Nadpisz narzędzia, których asystent może użyć w tym biegu. Jest to przydatne do modyfikacji zachowania na podstawie pojedynczego biegu. | No | |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy zmianę tego lub temperatury, ale nie obu naraz. |
No | 1 |
| truncation_strategy | obcięcie obiektuObject | Kontrole dotyczące tego, jak wątek zostanie obcięty przed uruchomieniem. Użyj tego do kontrolowania początkowego okna kontekstu przebiegu. | No |
listRunsResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | macierz | Tak | ||
| first_id | ciąg | Tak | ||
| zawiera_więcej | boolean | Tak | ||
| last_id | ciąg | Tak | ||
| obiekt | ciąg | Tak |
modifyRunRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No |
submitToolOutputsRunRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| odtwarzać strumieniowo | boolean | Jeśli true, zwraca strumień zdarzeń, które mają miejsce podczas Run jako zdarzenia wysyłane przez serwer, kończąc się, gdy Run wchodzi w stan terminalowy z wiadomością data: [DONE] . |
No | |
| tool_outputs | macierz | Lista narzędzi, dla których przesyłane są wyniki. | Tak |
runToolCallObject
Obiekty wywołań narzędzi
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| funkcja | obiekt | Definicja funkcji. | Tak | |
| └─ Argumenty | ciąg | Argumenty, które model oczekuje, że przekażesz do funkcji. | No | |
| └─ nazwa | ciąg | Nazwa funkcji. | No | |
| id | ciąg | ID wywołania narzędzia. Ten identyfikator musi być podany podczas przesyłania wyjść narzędzia, używając wyjść narzędzia do uruchomienia endpointendpoint. | Tak | |
| typ | ciąg | Rodzaj wywołania narzędzia jest wymagane dla wyjścia. Na razie to zawsze functionjest . |
Tak |
Typ Enum: RunToolCallObjectType
| Wartość | Opis |
|---|---|
| funkcja |
createThreadAndRunRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| assistant_id | ciąg | ID asystenta, którego należy użyć do wykonania tego przebiegu. | Tak | |
| instructions | ciąg | Nadpisz domyślny komunikat systemowy asystenta. Jest to przydatne do modyfikacji zachowania na podstawie pojedynczego biegu. | No | |
| max_completion_tokens | liczba całkowita | Maksymalna liczba tokenów ukończenia, które można użyć w trakcie trwania rozgrywki. Run stara się używać tylko określonej liczby tokenów ukończenia przez kilka tur rozgrywki. Jeśli przebieg przekroczy podaną liczbę tokenów ukończenia, zakończy się ze statusem incomplete. Zobacz więcej incomplete_details informacji. |
No | |
| max_prompt_tokens | liczba całkowita | Maksymalna liczba tokenów promptów, które można użyć w trakcie trwania biegu. Run stara się używać tylko określonej liczby tokenów promptu przez kilka tur rozgrywki. Jeśli przebieg przekroczy określoną liczbę tokenów promptu, zakończy się ze statusem incomplete. Zobacz więcej incomplete_details informacji. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| model | ciąg | ID modeli, które mają zostać użyte do wykonania tego przebiegu. Jeśli tutaj podana jest wartość, zostanie ona nadpisana przez model powiązany z asystentem. Jeśli nie, zostanie użyty model powiązany z asystentem. | No | |
| wywołania_narzędzia_równoległe | ParallelToolCalls | Czy włączyć równoległe wywoływanie funkcji podczas użycia narzędzia. | No | True |
| format_odpowiedzi | assistantsApiResponseFormatOption | Określa format, który model musi wyprowadzać. Kompatybilny z GPT-4o, GPT-4 Turbo oraz wszystkimi modelami GPT-3.5 Turbo od .gpt-3.5-turbo-1106Ustawienie na { "type": "json_schema", "json_schema": {...} } aktywne Structured Outputs, które zapewniają, że model odpowiada dostarczonemu schematowi JSON. Dowiedz się więcej w przewodniku po Structured Outputs.Ustawienie na { "type": "json_object" } włączenie trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON.Ważne: podczas korzystania z trybu JSON musisz również polecić modelowi samodzielne wygenerowanie JSON za pomocą komunikatu systemowego lub użytkownika. Bez tego model może generować niekończący się strumień białych przestrzeni, aż generowanie osiągnie limit tokenów, co skutkuje długotrwałym i pozornie "zablokowanym" żądaniem. Należy też zauważyć, że treść wiadomości może być częściowo odcięta, jeśli finish_reason="length", co oznacza, że generowanie przekroczyło max_tokens lub rozmowa przekroczyła maksymalną długość kontekstu. |
No | |
| odtwarzać strumieniowo | boolean | Jeśli true, zwraca strumień zdarzeń, które mają miejsce podczas Run jako zdarzenia wysyłane przez serwer, kończąc się, gdy Run wchodzi w stan terminalowy z wiadomością data: [DONE] . |
No | |
| stream_options | chatCompletionStreamOptions | Opcje odpowiedzi na streaming. Ustawiam to tylko wtedy, gdy ustawiasz stream: true. |
No | Żadne |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. |
No | 1 |
| konwersacja | createThreadRequest | No | ||
| tool_choice | assistantsApiToolChoiceOption | Kontroluje, które (jeśli w ogóle) narzędzie jest wywoływane przez model.none oznacza to, że model nie wywołuje żadnych narzędzi, lecz generuje wiadomość.auto jest wartością domyślną i oznacza, że model może wybrać między generowaniem wiadomości a wywołaniem narzędzia.Określenie konkretnego narzędzia, takiego jak {"type": "file_search"} lub {"type": "function", "function": {"name": "my_function"}} wymuszanie wywołania tego narzędzia, wymusza model. |
No | |
| tool_resources | obiekt | Zestaw zasobów wykorzystywanych przez narzędzia asystenta. Zasoby są specyficzne dla rodzaju narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, podczas gdy narzędzie file_search wymaga listy identyfikatorów pamięci wektorowej. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Z narzędziem może być maksymalnie 20 plików. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Identyfikator magazynu wektorów przypisany do tego asystenta. Asystent może być dołączony maksymalnie do jednego pamięci wektorowej. |
No | |
| Narzędzia | macierz | Nadpisz narzędzia, których asystent może użyć w tym biegu. Jest to przydatne do modyfikacji zachowania na podstawie pojedynczego biegu. | No | |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy zmianę tego lub temperatury, ale nie obu naraz. |
No | 1 |
| truncation_strategy | obcięcie obiektuObject | Kontrole dotyczące tego, jak wątek zostanie obcięty przed uruchomieniem. Użyj tego do kontrolowania początkowego okna kontekstu przebiegu. | No |
threadObject
Reprezentuje wątek zawierający wiadomości.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| utworzono_o | liczba całkowita | Znacznik czasu Unixa (w sekundach) oznaczający moment utworzenia wątku. | Tak | |
| id | ciąg | Identyfikator, do którego można się odwołać w końcowych punktach API. | Tak | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
Tak | |
| obiekt | ciąg | Typ obiektu, który zawsze threadjest . |
Tak | |
| tool_resources | obiekt | Zestaw zasobów dostępnych dla narzędzi asystenta w tym wątku. Zasoby są specyficzne dla rodzaju narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, podczas gdy narzędzie file_search wymaga listy identyfikatorów pamięci wektorowej. |
Tak | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Z narzędziem może być maksymalnie 20 plików. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorowy dołączony do tego wątku. Do wątku może być dołączony maksymalnie 1 pojemnik wektorowy. |
No |
obiekt Enum: ThreadObjectType
| Wartość | Opis |
|---|---|
| konwersacja | Typ obiektu wątku, który zawsze jest thread |
createThreadRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| messages | macierz | Lista wiadomości, od których warto zacząć wątek. | No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| tool_resources | obiekt | Zestaw zasobów dostępnych dla narzędzi asystenta w tym wątku. Zasoby są specyficzne dla rodzaju narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, podczas gdy narzędzie file_search wymaga listy identyfikatorów pamięci wektorowej. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Z narzędziem może być maksymalnie 20 plików. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorowy dołączony do tego wątku. Do wątku może być dołączony maksymalnie 1 pojemnik wektorowy. |
No | |
| └─ przechowalnie_wektorów | macierz | Pomocnik do stworzenia magazynu wektorowego z file_ids i dołączenia go do tego wątku. Do wątku może być dołączony maksymalnie 1 pojemnik wektorowy. |
No |
modifyThreadRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| tool_resources | obiekt | Zestaw zasobów dostępnych dla narzędzi asystenta w tym wątku. Zasoby są specyficzne dla rodzaju narzędzia. Na przykład code_interpreter narzędzie wymaga listy identyfikatorów plików, podczas gdy narzędzie file_search wymaga listy identyfikatorów pamięci wektorowej. |
No | |
| └ code_interpreter | obiekt | No | ||
| └ file_ids | macierz | Lista identyfikatorów plików udostępnionych narzędziu code_interpreter . Z narzędziem może być maksymalnie 20 plików. |
No | [] |
| └file_search | obiekt | No | ||
| └vector_store_ids | macierz | Magazyn wektorowy dołączony do tego wątku. Do wątku może być dołączony maksymalnie 1 pojemnik wektorowy. |
No |
deleteThreadResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| usunięta | boolean | Tak | ||
| id | ciąg | Tak | ||
| obiekt | ciąg | Tak |
object Enum: DeleteThreadResponseObjectState
| Wartość | Opis |
|---|---|
| thread.deleted | Stan odpowiedź typu delete thread response (odpowiedź wątku) jest thread.deleted |
listThreadsResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | macierz | Tak | ||
| first_id | ciąg | Tak | ||
| zawiera_więcej | boolean | Tak | ||
| last_id | ciąg | Tak | ||
| obiekt | ciąg | Tak |
messageObject
Reprezentuje wiadomość w wątkach.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| assistant_id | ciąg | Jeśli dotyczy, ID asystenta, który napisał tę wiadomość. | Tak | |
| Załączniki | macierz | Lista plików dołączonych do wiadomości oraz narzędzi, do których zostały dodane. | Tak | |
| zakończono_o | liczba całkowita | Znacznik czasu Unix (w sekundach) oznaczał moment ukończenia wiadomości. | Tak | |
| zawartość | macierz | Treść wiadomości w formie tekstu i/lub obrazów. | Tak | |
| utworzono_o | liczba całkowita | Znacznik czasu w Unixie (w sekundach) oznaczający moment utworzenia wiadomości. | Tak | |
| id | ciąg | Identyfikator, do którego można się odwołać w końcowych punktach API. | Tak | |
| incomplete_at | liczba całkowita | Znacznik czasu w Unix (w sekundach) oznaczał, gdy wiadomość była oznaczona jako niekompletna. | Tak | |
| incomplete_details | obiekt | W przypadku niekompletnej wiadomości szczegóły wyjaśniające, dlaczego wiadomość jest niekompletna. | Tak | |
| └* przyczyna | ciąg | Powód, dla którego wiadomość jest niekompletna. | No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
Tak | |
| obiekt | ciąg | Typ obiektu, który zawsze thread.messagejest . |
Tak | |
| rola | ciąg | Istota, która wyprodukowała wiadomość. Jeden z user lub assistant. |
Tak | |
| run_id | ciąg | Jeśli dotyczy, ID wyniku powiązanego z autorem tej wiadomości. | Tak | |
| stan | ciąg | Status wiadomości, który może być albo in_progress, incomplete, lub completed. |
Tak | |
| thread_id | ciąg | Wątki wskazują, do których należy ta wiadomość. | Tak |
obiekt Enum: MessageObjectType
| Wartość | Opis |
|---|---|
| thread.message | Typ obiektu wiadomości, który jest thread.message |
Enum statusu: Status obiektu wiadomości
| Wartość | Opis |
|---|---|
| in_progress | |
| Niekompletna | |
| Zakończone |
rola Enum: MessageObjectRole
| Wartość | Opis |
|---|---|
| użytkownik | |
| asystent |
messageDeltaObject
Reprezentuje delta wiadomości, czyli wszelkie zmienione pola w wiadomości podczas streamingu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| delta | obiekt | Delta zawierająca pola, które zmieniły się w wiadomości. | Tak | |
| └─ zawartość | macierz | Treść wiadomości w formie tekstu i/lub obrazów. | No | |
| └─ Rola | ciąg | Istota, która wyprodukowała wiadomość. Jeden z user lub assistant. |
No | |
| id | ciąg | Identyfikator wiadomości, który może być odwołany w końcowych punktach API. | Tak | |
| obiekt | ciąg | Typ obiektu, który zawsze thread.message.deltajest . |
Tak |
obiekt Enum: MessageDeltaObjectType
| Wartość | Opis |
|---|---|
| thread.message.delta |
createMessageRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| Załączniki | macierz | Lista plików dołączonych do wiadomości oraz narzędzi, do których powinny zostać dodane. | No | |
| zawartość | ciąg | Treść wiadomości. | Tak | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| rola | ciąg | Rola podmiotu, który tworzy przekaz. Dozwolone wartości obejmują: - user: Oznacza, że wiadomość została wysłana przez rzeczywistego użytkownika i powinna być w większości przypadków używana do reprezentowania wiadomości generowanych przez użytkowników.- assistant: Oznacza, że wiadomość jest generowana przez asystenta. Użyj tej wartości, aby wstawić wiadomości od asystenta do rozmowy. |
Tak |
role Enum: CreateMessageRequestRole
| Wartość | Opis |
|---|---|
| użytkownik | |
| asystent |
modifyMessageRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No |
deleteMessageResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| usunięta | boolean | Tak | ||
| id | ciąg | Tak | ||
| obiekt | ciąg | Tak |
obiekt Enum: DeleteMessageResponseObject
| Wartość | Opis |
|---|---|
| thread.message.deleted | Stan obiektu odpowiedzi na wiadomość usuwać |
listMessagesResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | macierz | Tak | ||
| first_id | ciąg | Tak | ||
| zawiera_więcej | boolean | Tak | ||
| last_id | ciąg | Tak | ||
| obiekt | ciąg | Tak |
messageContentImageFileObject
Odnosi się do pliku obrazu w treści wiadomości.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| image_file | obiekt | Tak | ||
| └ file_id | ciąg | Identyfikator pliku obrazu w treści wiadomości. | No | |
| typ | ciąg | Zawsze image_file. |
Tak |
type Enum: MessageContentImageFileType ObjectType
| Wartość | Opis |
|---|---|
| image_file | Typ pliku obrazu treści wiadomości |
messageContentTextObject
Treść tekstu będąca częścią wiadomości.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| SMS | obiekt | Tak | ||
| └* adnotacje | macierz | No | ||
| └─ wartość | ciąg | Dane, które tworzą tekst. | No | |
| typ | ciąg | Zawsze text. |
Tak |
type Enum: TypObiektuTekstowegoTreściWiadomości
| Wartość | Opis |
|---|---|
| SMS | Tekst treści wiadomości Typ obiektu |
messageContentTextAnnotationsFileCitationObject
Cytat w wiadomości, który wskazuje na konkretny cytat z konkretnego pliku powiązanego z asystentem lub wiadomością. Generowane przez asystenta używa narzędzia "pobieranie" do przeszukiwania plików.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| end_index | liczba całkowita | Tak | ||
| file_citation | obiekt | Tak | ||
| └ file_id | ciąg | Identyfikator konkretnego pliku, z którego pochodzi cytat. | No | |
| start_index | liczba całkowita | Tak | ||
| SMS | ciąg | Tekst w treści wiadomości, który trzeba wymienić. | Tak | |
| typ | ciąg | Zawsze file_citation. |
Tak |
typ Enum: FileCitationObjectType
| Wartość | Opis |
|---|---|
| file_citation | Typ obiektu cytowania pliku |
messageContentTextAnnotationsFilePathObject
URL pliku, który został wygenerowany, gdy asystent użył code_interpreter narzędzia do wygenerowania pliku.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| end_index | liczba całkowita | Tak | ||
| file_path | obiekt | Tak | ||
| └ file_id | ciąg | ID wygenerowanego pliku. | No | |
| start_index | liczba całkowita | Tak | ||
| SMS | ciąg | Tekst w treści wiadomości, który trzeba wymienić. | Tak | |
| typ | ciąg | Zawsze file_path. |
Tak |
typ Enum: FilePathObjectType
| Wartość | Opis |
|---|---|
| file_path | Typ obiektu ścieżki pliku |
messageDeltaContentImageFileObject
Odnosi się do pliku obrazu w treści wiadomości.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| image_file | obiekt | No | ||
| └ file_id | ciąg | Identyfikator pliku obrazu w treści wiadomości. | No | |
| indeks | liczba całkowita | Indeks treści w wiadomości. | Tak | |
| typ | ciąg | Zawsze image_file. |
Tak |
type Enum: MessageDeltaContentImageFileObjectType
| Wartość | Opis |
|---|---|
| image_file |
messageDeltaContentTextObject
Treść tekstu będąca częścią wiadomości.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| indeks | liczba całkowita | Indeks treści w wiadomości. | Tak | |
| SMS | obiekt | No | ||
| └* adnotacje | macierz | No | ||
| └─ wartość | ciąg | Dane, które tworzą tekst. | No | |
| typ | ciąg | Zawsze text. |
Tak |
type Enum: MessageDeltaContentTextObjectType
| Wartość | Opis |
|---|---|
| SMS |
messageDeltaContentTextAnnotationsFileCitationObject
Cytat w wiadomości, który wskazuje na konkretny cytat z konkretnego pliku powiązanego z asystentem lub wiadomością. Generowane przez asystenta używa narzędzia "file_search" do wyszukiwania plików.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| end_index | liczba całkowita | No | ||
| file_citation | obiekt | No | ||
| └ file_id | ciąg | Identyfikator konkretnego pliku, z którego pochodzi cytat. | No | |
| └cudzysłów | ciąg | Konkretny cytat w pliku. | No | |
| indeks | liczba całkowita | Indeks adnotacji w części tekstowej. | Tak | |
| start_index | liczba całkowita | No | ||
| SMS | ciąg | Tekst w treści wiadomości, który trzeba wymienić. | No | |
| typ | ciąg | Zawsze file_citation. |
Tak |
type Enum: MessageDeltaContentTextAnnotationsFileCitationObjectType
| Wartość | Opis |
|---|---|
| file_citation |
messageDeltaContentTextAnnotationsFilePathObject
URL pliku, który został wygenerowany, gdy asystent użył code_interpreter narzędzia do wygenerowania pliku.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| end_index | liczba całkowita | No | ||
| file_path | obiekt | No | ||
| └ file_id | ciąg | ID wygenerowanego pliku. | No | |
| indeks | liczba całkowita | Indeks adnotacji w części tekstowej. | Tak | |
| start_index | liczba całkowita | No | ||
| SMS | ciąg | Tekst w treści wiadomości, który trzeba wymienić. | No | |
| typ | ciąg | Zawsze file_path. |
Tak |
type Enum: MessageDeltaContentTextAnnotationsFilePathObjectType
| Wartość | Opis |
|---|---|
| file_path |
runStepObject
Oznacza krok w wykonaniu przebiegu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| assistant_id | ciąg | ID asystenta powiązanego z krokiem biegu. | Tak | |
| anulowano_o | liczba całkowita | Znacznik czasu w Uniksie (w sekundach) oznaczający moment anulowania kroku uruchomienia. | Tak | |
| zakończono_o | liczba całkowita | Znacznik czasu w Uniksie (w sekundach) oznaczający zakończenie kroku uruchomienia. | Tak | |
| utworzono_o | liczba całkowita | Znacznik czasu w Uniksie (w sekundach) oznaczający moment utworzenia kroku uruchomienia. | Tak | |
| wygasło_o | liczba całkowita | Znacznik czasu w Uniksie (w sekundach) oznaczający moment wygaśnięcia kroku uruchomienia. Krok uważa się za wygasły, jeśli nadrzany run jest wygasły. | Tak | |
| nie powiodło się o | liczba całkowita | Znacznik czasu w Uniksie (w sekundach) oznaczający moment, gdy krok uruchomienia się nie powiódł. | Tak | |
| id | ciąg | Identyfikator kroku uruchomienia, który może być odwołany w końcowych punktach API. | Tak | |
| ostatni błąd | obiekt | Ostatni błąd związany z tym krokiem biegu. Będę null , jeśli nie ma błędów. |
Tak | |
| └─ kod | ciąg | Jeden z server_error lub rate_limit_exceeded. |
No | |
| └─ Komunikat | ciąg | Czytelny opis błędu. | No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
Tak | |
| obiekt | ciąg | Typ obiektu, który zawsze assistant.run.stepjest . |
Tak | |
| run_id | ciąg | ID biegu, którego jest częścią ten krok. | Tak | |
| stan | ciąg | Status ciągu może być albo in_progress, cancelled, failed, completed, lub expired. |
Tak | |
| step_details | runStepDetailsMessageCreationObject lub runStepDetailsToolCallsObject | Szczegóły kroku biegu. | Tak | |
| thread_id | ciąg | ID wątków, które zostały uruchomione. | Tak | |
| typ | ciąg | Typ kroku biegu, który może być albo message_creation albo tool_calls. |
Tak |
obiekt Enum: RunStepObjectType
| Wartość | Opis |
|---|---|
| assistant.run.step | Typ obiektu, który zawsze jest assistant.run.step |
typ Enum: RunStepObjectType
| Wartość | Opis |
|---|---|
| message_creation | Krok message_creation run |
| tool_calls | Krok tool_calls biegu |
Status Enum: RunStepObjectStatus
| Wartość | Opis |
|---|---|
| in_progress | Status in_progress run |
| cancelled | Status odwołanego kursu |
| niepowodzenie | Status odwołanego kursu |
| Zakończone | Status odwołanego kursu |
| Wygasłe | Status odwołanego kursu |
runStepDeltaObject
Reprezentuje delta kroku biegu, czyli wszelkie zmienione pola na kroku biegu podczas streamingu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| delta | obiekt | Delta zawierająca pola, które zmieniły się w kroku biegu. | Tak | |
| └─ szczegóły kroku | runStepDeltaStepDetailsMessageCreationObject,runStepDeltaStepDetailsToolCallsObject. | Szczegóły kroku biegu. | No | |
| id | ciąg | Identyfikator kroku uruchomienia, który może być odwołany w końcowych punktach API. | Tak | |
| obiekt | ciąg | Typ obiektu, który zawsze thread.run.step.deltajest . |
Tak |
obiekt Enum: RunStepDeltaObjectType
| Wartość | Opis |
|---|---|
| thread.run.step.delta |
listRunStepsResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | macierz | Tak | ||
| first_id | ciąg | Tak | ||
| zawiera_więcej | boolean | Tak | ||
| last_id | ciąg | Tak | ||
| obiekt | ciąg | Tak |
runStepDetailsMessageCreationObject
Szczegóły tworzenia wiadomości przez krok uruchomienia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| message_creation | obiekt | Tak | ||
| └ message_id | ciąg | ID wiadomości utworzonej przez ten krok uruchomienia. | No | |
| typ | ciąg | Zawsze message_creation. |
Tak |
type Enum: Typ obiektu tworzenia wiadomości szczegółów kroku wykonania
| Wartość | Opis |
|---|---|
| message_creation |
runStepDeltaStepDetailsMessageCreationObject
Szczegóły tworzenia wiadomości przez krok uruchomienia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| message_creation | obiekt | No | ||
| └ message_id | ciąg | ID wiadomości utworzonej przez ten krok uruchomienia. | No | |
| typ | ciąg | Zawsze message_creation. |
Tak |
typ Enum: RunStepDeltaStepDetailsMessageCreationObjectType
| Wartość | Opis |
|---|---|
| message_creation |
runStepDetailsToolCallsObject
Szczegóły wezwania narzędzi.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| tool_calls | macierz | Etap run był stosowany w wielu wywołaniach narzędzi. Można je kojarzyć z jednym z trzech typów narzędzi code_interpreter: , retrieval lub function. |
Tak | |
| typ | ciąg | Zawsze tool_calls. |
Tak |
type Enum: RunStepDetailsToolCallsObjectType
| Wartość | Opis |
|---|---|
| tool_calls |
runStepDeltaStepDetailsToolCallsObject
Szczegóły wezwania narzędzi.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| tool_calls | macierz | Etap run był stosowany w wielu wywołaniach narzędzi. Można je kojarzyć z jednym z trzech typów narzędzi code_interpreter: , file_search lub function. |
No | |
| typ | ciąg | Zawsze tool_calls. |
Tak |
type Enum: RunStepDeltaStepDetailsToolCallsObjectType
| Wartość | Opis |
|---|---|
| tool_calls |
runStepDetailsToolCallsCodeObject
Szczegóły narzędzia Code Interpreter nazywa się krokiem uruchomienia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| code_interpreter | obiekt | Definicja wywołania narzędzia Code Interpreter. | Tak | |
| └─ Wejście | ciąg | Wejście do wywołania narzędzia Code Interpreter. | No | |
| Dane wyjściowe └} | macierz | Wynik z narzędzia Code Interpreter. Code Interpreter może wygenerować jeden lub więcej elementów, w tym tekst (logs) lub obrazy (image). Każdy z nich jest reprezentowany przez inny typ obiektu. |
No | |
| id | ciąg | ID wywołania narzędzia. | Tak | |
| typ | ciąg | Rodzaj wezwania narzędzi. To zawsze będzie dotyczyć code_interpreter tego typu narzędzi. |
Tak |
type Enum: RunStepDetailsToolCallsCodeObjectType
| Wartość | Opis |
|---|---|
| code_interpreter |
runStepDeltaStepDetailsToolCallsCodeObject
Szczegóły narzędzia Code Interpreter nazywa się krokiem uruchomienia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| code_interpreter | obiekt | Definicja wywołania narzędzia Code Interpreter. | No | |
| └─ Wejście | ciąg | Wejście do wywołania narzędzia Code Interpreter. | No | |
| Dane wyjściowe └} | macierz | Wynik z narzędzia Code Interpreter. Code Interpreter może wygenerować jeden lub więcej elementów, w tym tekst (logs) lub obrazy (image). Każdy z nich jest reprezentowany przez inny typ obiektu. |
No | |
| id | ciąg | ID wywołania narzędzia. | No | |
| indeks | liczba całkowita | Indeks wywołania narzędzia w tablicy wywołań narzędzi. | Tak | |
| typ | ciąg | Rodzaj wezwania narzędzi. To zawsze będzie dotyczyć code_interpreter tego typu narzędzi. |
Tak |
typ wyliczeniowy Enum: RunStepDeltaStepDetailsToolCallsCodeObjectType
| Wartość | Opis |
|---|---|
| code_interpreter |
runStepDetailsToolCallsCodeOutputLogsObject
Tekst wywołany przez narzędzie Code Interpreter jako część kroku uruchomienia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dzienniki | ciąg | Tekst wychodzi z wywołania narzędzia Code Interpreter. | Tak | |
| typ | ciąg | Zawsze logs. |
Tak |
Typ Enum: RunStepDetailsToolCallsCodeOutputLogsObjectType
| Wartość | Opis |
|---|---|
| dzienniki |
runStepDeltaStepDetailsToolCallsCodeOutputLogsObject
Tekst wywołany przez narzędzie Code Interpreter jako część kroku uruchomienia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| indeks | liczba całkowita | Indeks wyjścia w tablicy outputów. | Tak | |
| dzienniki | ciąg | Tekst wychodzi z wywołania narzędzia Code Interpreter. | No | |
| typ | ciąg | Zawsze logs. |
Tak |
Step 2: Typ wyliczeniowy: Obiekt typu RunStepDeltaStepDetailsToolCallsCodeOutputLogs
| Wartość | Opis |
|---|---|
| dzienniki |
runStepDetailsToolCallsCodeOutputImageObject
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| obraz | obiekt | Tak | ||
| └ file_id | ciąg | Identyfikator pliku obrazu. | No | |
| typ | ciąg | Zawsze image. |
Tak |
type Enum: RunStepDetailsToolCallsCodeOutputImageObjectType
| Wartość | Opis |
|---|---|
| obraz |
runStepDeltaStepDetailsToolCallsCodeOutputImageObject
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| obraz | obiekt | No | ||
| └ file_id | ciąg | Identyfikator pliku obrazu. | No | |
| indeks | liczba całkowita | Indeks wyjścia w tablicy outputów. | Tak | |
| typ | ciąg | Zawsze image. |
Tak |
typ Enum: RunStepDeltaStepDetailsNarzędziaWywołaniaKodWynikowyObiektGraficzny
| Wartość | Opis |
|---|---|
| obraz |
runStepDetailsToolCallsFileSearchObject
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| file_search | obiekt | Na razie to zawsze będzie pusty obiekt. | Tak | |
| Wyniki └} | macierz | Wyniki wyszukiwania plików. | No | |
| id | ciąg | ID obiektu wywołania narzędzia. | Tak | |
| typ | ciąg | Rodzaj wezwania narzędzi. To zawsze będzie dotyczyć file_search tego typu narzędzi. |
Tak |
type Enum: RunStepDetailsToolCallsFileSearchObjectType
| Wartość | Opis |
|---|---|
| file_search |
runStepDetailsToolCallsFileSearchResultObject
Instancja wyników wyszukiwania plików.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | macierz | Treść znalezionego rezultatu. Treść jest dołączana tylko na żądanie za pomocą parametru zapytania include. | No | |
| identyfikator_pliku | ciąg | Identyfikacja pliku znaleziono w tym wyniku. | Tak | |
| nazwa_pliku | ciąg | Nazwa pliku, w którym znaleziono ten wynik. | Tak | |
| wynik | number | Wynik wyniku. Wszystkie wartości muszą mieć wartość zmiennoprzecinkową od 0 do 1. | Tak |
runStepDeltaStepDetailsToolCallsFileSearchObject
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| file_search | obiekt | Na razie to zawsze będzie pusty obiekt. | Tak | |
| id | ciąg | ID obiektu wywołania narzędzia. | No | |
| indeks | liczba całkowita | Indeks wywołania narzędzia w tablicy wywołań narzędzi. | Tak | |
| typ | ciąg | Rodzaj wezwania narzędzi. To zawsze będzie dotyczyć retrieval tego typu narzędzi. |
Tak |
type Enum: Typ obiektu wyszukiwania plików w narzędziu wywołań RunStepDeltaStepDetails
| Wartość | Opis |
|---|---|
| file_search |
runStepDetailsToolCallsFunctionObject
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| funkcja | obiekt | Definicja wywołanej funkcji. | Tak | |
| └─ Argumenty | ciąg | Argumenty przechodziły do funkcji. | No | |
| └─ nazwa | ciąg | Nazwa funkcji. | No | |
| └─ Dane wyjściowe | ciąg | Wyjście funkcji. Dotyczy to null sytuacji, gdy wyniki nie zostały jeszcze złożone. |
No | |
| id | ciąg | ID obiektu wywołania narzędzia. | Tak | |
| typ | ciąg | Rodzaj wezwania narzędzi. To zawsze będzie dotyczyć function tego typu narzędzi. |
Tak |
type Enum: RunStepDetailsToolCallsFunctionObjectType
| Wartość | Opis |
|---|---|
| funkcja |
runStepDeltaStepDetailsToolCallsFunctionObject
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| funkcja | obiekt | Definicja wywołanej funkcji. | No | |
| └─ Argumenty | ciąg | Argumenty przechodziły do funkcji. | No | |
| └─ nazwa | ciąg | Nazwa funkcji. | No | |
| └─ Dane wyjściowe | ciąg | Wyjście funkcji. Dotyczy to null sytuacji, gdy wyniki nie zostały jeszcze złożone. |
No | |
| id | ciąg | ID obiektu wywołania narzędzia. | No | |
| indeks | liczba całkowita | Indeks wywołania narzędzia w tablicy wywołań narzędzi. | Tak | |
| typ | ciąg | Rodzaj wezwania narzędzi. To zawsze będzie dotyczyć function tego typu narzędzi. |
Tak |
type Enum: RunStepDetailsToolCallsFunctionObjectType
| Wartość | Opis |
|---|---|
| funkcja |
vectorStoreExpirationAfter
Polityka wygaśnięcia sklepu wektorowego.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| kotwica | ciąg | Zakotwiczcie znacznik czasu, po którym obowiązuje polityka wygaśnięcia. Kotwicy podtrzymywane: last_active_at. |
Tak | |
| Dni | liczba całkowita | Liczba dni po upływie czasu kotwiczenia, w których magazyn wektorowy wygaśnie. | Tak |
Enum kotwiczenia: VectorStoreExpirationAfterAnchor
| Wartość | Opis |
|---|---|
| ostatnia_aktywność_w | Oznacza to znacznik czasu kotwicy, po którym obowiązuje polityka wygaśnięcia. |
vectorStoreObject
Magazyn wektorowy to zbiór przetworzonych plików, które narzędzie może wykorzystać file_search .
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| utworzono_o | liczba całkowita | Znacznik czasu w Unixie (w sekundach) oznaczający moment tworzenia pamięci wektorowej. | Tak | |
| wygasa po | vectorStoreExpirationAfter | Polityka wygaśnięcia sklepu wektorowego. | No | |
| wygasa_o | liczba całkowita | Znacznik czasu Uniksa (w sekundach) oznaczający wygaśnięcie pamięci wektorowej. | No | |
| liczba_plików | obiekt | Tak | ||
| └* anulowano | liczba całkowita | Liczba plików anulowana. | No | |
| └─ Ukończono | liczba całkowita | Liczba plików, które zostały pomyślnie przetworzone. | No | |
| └* nie powiodło się | liczba całkowita | Liczba plików, które nie zostały przetworzone. | No | |
| └─ w_toku | liczba całkowita | Liczba plików obecnie przetwarzanych. | No | |
| └─ suma | liczba całkowita | Całkowita liczba plików. | No | |
| id | ciąg | Identyfikator, do którego można się odwołać w końcowych punktach API. | Tak | |
| ostatnia_aktywność_w | liczba całkowita | Znacznik czasu Uniksa (w sekundach) oznaczający ostatni aktywny zapis wektorów. | Tak | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
Tak | |
| nazwa | ciąg | Nazwa magazynu wektorowego. | Tak | |
| obiekt | wyliczenie | Typ obiektu, który zawsze vector_storejest .Możliwe wartości: vector_store |
Tak | |
| stan | ciąg | Status magazynu wektorowego, który może być albo expired, in_progress, lub completed. Status oznacza completed , że magazyn wektorowy jest gotowy do użycia. |
Tak | |
| użycie_bajtów | liczba całkowita | Całkowita liczba bajtów używanych przez pliki w pamięci wektorowej. | Tak |
status Enum: VectorStoreObjectStatus
| Wartość | Opis |
|---|---|
| Wygasłe | |
| in_progress | |
| Zakończone |
createVectorStoreRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| chunking_strategy | autoChunkingStrategyRequestParam lub staticChunkingStrategyRequestParam | Strategia chunkingu używana do chunkowania plików. Jeśli nie jest ustawione, użyję tej strategii auto . Dotyczy tylko wtedy, gdy file_ids jest niepusty. |
No | |
| wygasa po | vectorStoreExpirationAfter | Polityka wygaśnięcia sklepu wektorowego. | No | |
| identyfikatory_plików | macierz | Lista identyfikatorów plików, których powinien używać magazyn wektorowy. Przydatne do takich narzędzi file_search do dostępu do plików. |
No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| nazwa | ciąg | Nazwa magazynu wektorowego. | No |
updateVectorStoreRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| wygasa po | vectorStoreExpirationAfter | Polityka wygaśnięcia sklepu wektorowego. | No | |
| metadane | obiekt | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie. Klucze mogą mieć maksymalnie 64 znaki, a wartości maksymalnie 512 znaków. |
No | |
| nazwa | ciąg | Nazwa magazynu wektorowego. | No |
listVectorStoresResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | macierz | Tak | ||
| first_id | ciąg | Tak | ||
| zawiera_więcej | boolean | Tak | ||
| last_id | ciąg | Tak | ||
| obiekt | ciąg | Tak |
deleteVectorStoreResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| usunięta | boolean | Tak | ||
| id | ciąg | Tak | ||
| obiekt | ciąg | Tak |
obiekt Enum: DeleteVectorStoreResponseObject
| Wartość | Opis |
|---|---|
| vector_store.deleted | Wektor usuwania przechowuje stan odpowiedzi obiektu |
vectorStoreFileObject
Lista plików dołączonych do magazynu wektorowego.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| chunking_strategy | autoChunkingStrategyRequestParam lub staticChunkingStrategyRequestParam | Strategia chunkingu używana do chunkowania plików. Jeśli nie jest ustawione, użyję tej strategii auto . Dotyczy tylko wtedy, gdy file_ids jest niepusty. |
No | |
| utworzono_o | liczba całkowita | Znacznik czasu Unixa (w sekundach) oznaczający moment tworzenia pliku pamięci wektorowej. | Tak | |
| id | ciąg | Identyfikator, do którego można się odwołać w końcowych punktach API. | Tak | |
| ostatni błąd | obiekt | Ostatni błąd związany z tym plikiem pamięci wektorowej. Będę null , jeśli nie ma błędów. |
Tak | |
| └─ kod | ciąg | Jeden z server_error lub invalid_file lub unsupported_file. |
No | |
| └─ Komunikat | ciąg | Czytelny opis błędu. | No | |
| obiekt | ciąg | Typ obiektu, który zawsze vector_store.filejest . |
Tak | |
| stan | ciąg | Status pliku pamięci wektorowej, który może być albo in_progress, completed, cancelled, lub failed. Status completed wskazuje, że plik pamięci wektorowej jest gotowy do użycia. |
Tak | |
| użycie_bajtów | liczba całkowita | Całkowite zużycie wektorów w bajtach. Należy zauważyć, że może to różnić się od oryginalnego rozmiaru pliku. | Tak | |
| identyfikator_magazynu_wektorów | ciąg | ID wektorowego przechowywania, do którego przypisany jest plik. | Tak |
obiekt Enum: VectorStoreFileObjectType
| Wartość | Opis |
|---|---|
| vector_store.file |
Status Enum: VectorStoreFileObjectStatus
| Wartość | Opis |
|---|---|
| in_progress | |
| Zakończone | |
| cancelled | |
| niepowodzenie |
otherChunkingStrategyResponseParam
Zwraca się to, gdy strategia dzielenia jest nieznana. Zazwyczaj wynika to z faktu, że plik został zindeksowany przed wprowadzeniem tego chunking_strategy pojęcia do API.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | ciąg | Zawsze other. |
Tak |
typ Enum: InneChunkingStrategiaOdpowiedźParamTyp
| Wartość | Opis |
|---|---|
| other |
staticChunkingStrategyResponseParam
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| statyczny | staticChunkingStrategy | Tak | ||
| typ | ciąg | Zawsze static. |
Tak |
typ Enum: StaticChunkingStrategyResponseParamType
| Wartość | Opis |
|---|---|
| statyczny |
staticChunkingStrategy
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| nakładanie się tokenów segmentu | liczba całkowita | Liczba żetonów nakładających się między chunkami. Domyślna wartość to 400.Należy zauważyć, że nakładanie się nie może przekraczać połowy . max_chunk_size_tokens |
Tak | |
| maksymalna_liczba_tokenów_w_kawałku | liczba całkowita | Maksymalna liczba żetonów w każdym chunku. Domyślna wartość to 800. Minimalna wartość to , 100 a maksymalna to 4096. |
Tak |
autoChunkingStrategyRequestParam
Domyślna strategia. Ta strategia obecnie wykorzystuje a max_chunk_size_tokens i 800chunk_overlap_tokens z 400.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | wyliczenie | Zawsze auto.Możliwe wartości: auto |
Tak |
staticChunkingStrategyRequestParam
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| statyczny | staticChunkingStrategy | Tak | ||
| typ | wyliczenie | Zawsze static.Możliwe wartości: static |
Tak |
fragmentingStrategyRequestParam
Strategia chunkingu używana do chunkowania plików. Jeśli nie jest ustawione, użyję tej strategii auto .
Ten składnik może być jednym z następujących elementów:
createVectorStoreFileRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| chunking_strategy | fragmentingStrategyRequestParam | Strategia chunkingu używana do chunkowania plików. Jeśli nie jest ustawione, użyję tej strategii auto . |
No | |
| identyfikator_pliku | ciąg | Identyfikator pliku, którego powinien używać magazyn wektorowy. Przydatne do takich narzędzi file_search do dostępu do plików. |
Tak |
listVectorStoreFilesResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | macierz | Tak | ||
| first_id | ciąg | Tak | ||
| zawiera_więcej | boolean | Tak | ||
| last_id | ciąg | Tak | ||
| obiekt | ciąg | Tak |
deleteVectorStoreFileResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| usunięta | boolean | Tak | ||
| id | ciąg | Tak | ||
| obiekt | ciąg | Tak |
obiekt Enum: DeleteVectorStoreFileResponseObject
| Wartość | Opis |
|---|---|
| vector_store.file.deleted |
vectorStoreFileBatchObject
Partia plików dołączonych do magazynu wektorowego.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| utworzono_o | liczba całkowita | Znacznik czasu Unixa (w sekundach) dla momentu tworzenia plików pamięci wektorowej wsadowo. | Tak | |
| liczba_plików | obiekt | Tak | ||
| └* anulowano | liczba całkowita | Liczba plików anulowana. | No | |
| └─ Ukończono | liczba całkowita | Liczba przetworzonych plików. | No | |
| └* nie powiodło się | liczba całkowita | Liczba plików, które nie zostały przetworzone. | No | |
| └─ w_toku | liczba całkowita | Liczba plików obecnie przetwarzanych. | No | |
| └─ suma | liczba całkowita | Całkowita liczba plików. | No | |
| id | ciąg | Identyfikator, do którego można się odwołać w końcowych punktach API. | Tak | |
| obiekt | ciąg | Typ obiektu, który zawsze vector_store.file_batchjest . |
Tak | |
| stan | ciąg | Status partii plików wektorowego, która może być albo , in_progresscompleted, cancelled lub failed. |
Tak | |
| identyfikator_magazynu_wektorów | ciąg | ID magazynu wektorowego, do którego przypisany jest plik. | Tak |
obiekt Enum: VectorStoreFileBatchObjectType
| Wartość | Opis |
|---|---|
| vector_store.files_batch |
status Enum: VectorStoreFileBatchObjectStatus
| Wartość | Opis |
|---|---|
| in_progress | |
| Zakończone | |
| cancelled | |
| niepowodzenie |
createVectorStoreFileBatchRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| chunking_strategy | fragmentingStrategyRequestParam | Strategia chunkingu używana do chunkowania plików. Jeśli nie jest ustawione, użyję tej strategii auto . |
No | |
| identyfikatory_plików | macierz | Lista identyfikatorów plików, których powinien używać magazyn wektorowy. Przydatne do takich narzędzi file_search do dostępu do plików. |
Tak |
assistantStreamEvent
Reprezentuje zdarzenie wyemitowane podczas streamowania Run.
Każde zdarzenie w strumieniu zdarzeń wysyłanych przez serwer ma właściwość event i data :
event: thread.created
data: {"id": "thread_123", "object": "thread", ...}
Emitujemy zdarzenia za każdym razem, gdy powstaje nowy obiekt, przechodzi do nowego stanu lub jest przesyłany strumieniowo w częściach (delty). Na przykład emitujemy przy thread.run.created tworzeniu nowego przebiegu, thread.run.completed jego zakończeniu i tak dalej. Gdy Asystent decyduje się utworzyć wiadomość podczas rozgrywki, emitujemy thread.message.created event, thread.message.in_progress zdarzenie, wiele thread.message.delta zdarzeń, a na końcu thread.message.completed zdarzenie.
Możemy dodawać kolejne zdarzenia z czasem, dlatego zalecamy delikatne obsługiwanie nieznanych zdarzeń w Twoim kodzie.
Ten składnik może być jednym z następujących elementów:
threadStreamEvent
Ten składnik może być jednym z następujących elementów:
thread.created
Występuje, gdy tworzony jest nowy wątek.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | threadObject | Reprezentuje wątek zawierający wiadomości. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: threadObject
Wyliczenie zdarzeń: ThreadStreamEventEnum
| Wartość | Opis |
|---|---|
| thread.created | Zdarzenie utworzone przez wątek |
runStreamEvent
Ten składnik może być jednym z następujących elementów:
thread.run.created
Dzieje się to, gdy tworzy się nowy przebieg.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runObject | Reprezentuje wykonanie wykonane na wątku. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: runObject
Wyliczenie zdarzeń: RunStreamEventCreated
| Wartość | Opis |
|---|---|
| thread.run.created |
thread.run.queued
Występuje, gdy przebieg przechodzi do statusu queued .
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runObject | Reprezentuje wykonanie wykonane na wątku. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: runObject
Wyliczenie zdarzeń: RunStreamEventQueued
| Wartość | Opis |
|---|---|
| thread.run.queued |
thread.run.in_progress
Występuje, gdy przebieg przechodzi do statusu in_progress .
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runObject | Reprezentuje wykonanie wykonane na wątku. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: runObject
Wydarzenie Enum: RunStreamEventInProgress
| Wartość | Opis |
|---|---|
| thread.run.in_progress |
thread.run.requires_action
Występuje, gdy przebieg przechodzi do statusu requires_action .
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runObject | Reprezentuje wykonanie wykonane na wątku. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: runObject
Event Enum: RunStreamEventRequires Action.
| Wartość | Opis |
|---|---|
| thread.run.requires_action |
thread.run.completed
Następuje po zakończeniu przebiegu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runObject | Reprezentuje wykonanie wykonane na wątku. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: runObject
Wydarzenie Enum: RunStreamEventCompleted
| Wartość | Opis |
|---|---|
| thread.run.completed |
thread.run.failed
Dzieje się, gdy przebieg się nie udaje.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runObject | Reprezentuje wykonanie wykonane na wątku. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: runObject
Wyliczenie zdarzeń: RunStreamEventFailed
| Wartość | Opis |
|---|---|
| thread.run.failed |
thread.run.cancelling
Występuje, gdy przebieg przechodzi do statusu cancelling .
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runObject | Reprezentuje wykonanie wykonane na wątku. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: runObject
Wydarzenie Enum: RunStreamEventCancelling
| Wartość | Opis |
|---|---|
| thread.run.cancelling |
thread.run.cancelled
Występuje, gdy przebieg zostaje anulowany.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runObject | Reprezentuje wykonanie wykonane na wątku. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: runObject
Wydarzenie Enum: RunStreamWydarzenieAnulowane
| Wartość | Opis |
|---|---|
| thread.run.cancelled |
thread.run.expired
Dzieje się to, gdy wygasa jeden run.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runObject | Reprezentuje wykonanie wykonane na wątku. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: runObject
Wydarzenie Enum: RunStreamEventExpired
| Wartość | Opis |
|---|---|
| thread.run.expired |
runStepStreamEvent
Ten składnik może być jednym z następujących elementów:
thread.run.step.created
Występuje, gdy zostanie utworzony krok uruchomienia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runStepObject | Oznacza krok w wykonaniu przebiegu. |
Tak | |
| wydarzenie | ciąg | Tak |
Dane: runStepObject
Wyliczenie zdarzeń: RunStepStreamEventCreated
| Wartość | Opis |
|---|---|
| thread.run.step.created |
thread.run.step.in_progress
Występuje, gdy krok przebiegu przechodzi do stanu in_progress .
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runStepObject | Oznacza krok w wykonaniu przebiegu. |
Tak | |
| wydarzenie | ciąg | Tak |
Dane: runStepObject
Wyliczenie zdarzeń: RunStepStreamEventInProgress
| Wartość | Opis |
|---|---|
| thread.run.step.in_progress |
thread.run.step.delta
Występuje, gdy części kroku run są przesyłane strumieniowo.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runStepDeltaObject | Reprezentuje delta kroku biegu, czyli wszelkie zmienione pola na kroku biegu podczas streamingu. |
Tak | |
| wydarzenie | ciąg | Tak |
Dane: runStepDeltaObject
Wydarzenie Enum: RunStepStreamEventDelta
| Wartość | Opis |
|---|---|
| thread.run.step.delta |
thread.run.step.completed
Występuje po zakończeniu kroku uruchomienia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runStepObject | Oznacza krok w wykonaniu przebiegu. |
Tak | |
| wydarzenie | ciąg | Tak |
Dane: runStepObject
Wydarzenie Enum: RunStepStreamWydarzenieUkończone
| Wartość | Opis |
|---|---|
| thread.run.step.completed |
thread.run.step.failed
Występuje, gdy krok uruchomienia nie zawodzi.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runStepObject | Oznacza krok w wykonaniu przebiegu. |
Tak | |
| wydarzenie | ciąg | Tak |
Dane: runStepObject
Wydarzenie Enum: RunStepStreamZdarzenieNieudane
| Wartość | Opis |
|---|---|
| thread.run.step.failed |
thread.run.step.cancelled
Występuje, gdy krok run zostaje anulowany.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runStepObject | Oznacza krok w wykonaniu przebiegu. |
Tak | |
| wydarzenie | ciąg | Tak |
Dane: runStepObject
Wydarzenie Enum: RunStepStreamWydarzenieOdwołane
| Wartość | Opis |
|---|---|
| thread.run.step.cancelled |
thread.run.step.expired
Występuje, gdy krok run wygasa.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | runStepObject | Oznacza krok w wykonaniu przebiegu. |
Tak | |
| wydarzenie | ciąg | Tak |
Dane: runStepObject
Wydarzenie Enum: RunStepStreamEventExpired
| Wartość | Opis |
|---|---|
| thread.run.step.expired |
messageStreamEvent
Ten składnik może być jednym z następujących elementów:
thread.message.created
Występuje, gdy wiadomość jest tworzona.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | messageObject | Reprezentuje wiadomość w wątkach. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: messageObject
Event Enum: MessageStreamEventCreatedCreated
| Wartość | Opis |
|---|---|
| thread.message.created |
thread.message.in_progress
Występuje, gdy wiadomość przechodzi do in_progress określonego stanu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | messageObject | Reprezentuje wiadomość w wątkach. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: messageObject
Wyliczenie zdarzeń: MessageStreamEventInProgress
| Wartość | Opis |
|---|---|
| thread.message.in_progress |
thread.message.delta
Występuje, gdy części wiadomości są przesyłane strumieniowo.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | messageDeltaObject | Reprezentuje delta wiadomości, czyli wszelkie zmienione pola w wiadomości podczas streamingu. |
Tak | |
| wydarzenie | ciąg | Tak |
Dane: messageDeltaObject
Wyliczenie zdarzeń: MessageStreamEventDelta
| Wartość | Opis |
|---|---|
| thread.message.delta |
thread.message.completed
Występuje po zakończeniu wiadomości.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | messageObject | Reprezentuje wiadomość w wątkach. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: messageObject
Wyliczenie zdarzeń: MessageStreamEventCompleted
| Wartość | Opis |
|---|---|
| thread.message.completed |
thread.message.incomplete
Występuje, gdy wiadomość kończy się przed jej zakończeniem.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | messageObject | Reprezentuje wiadomość w wątkach. | Tak | |
| wydarzenie | ciąg | Tak |
Dane: messageObject
Wyliczenie zdarzeń: MessageStreamEventIncomplete
| Wartość | Opis |
|---|---|
| thread.message.incomplete |
Adnotacja
Ten składnik może być jednym z następujących elementów:
Kliknij pozycję
Kliknięcie.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| przycisk | wyliczenie | Wskazuje, który przycisk myszy został naciśnięty podczas kliknięcia. Jeden z left, right, wheel, back, lub forward.Możliwe wartości: left, right, wheel, , backforward |
Tak | |
| typ | wyliczenie | Określa typ zdarzenia. Dla akcji kliknięcia ta właściwość jest zawsze ustawiona na .clickMożliwe wartości: click |
Tak | |
| x | liczba całkowita | Współrzędna x, gdzie nastąpił klik. |
Tak | |
| Y | liczba całkowita | Współrzędna y, w której nastąpiło kliknięcie. |
Tak |
CodeInterpreterFileOutput
Wywołanie narzędzia interpretera kodu, które jest plikiem.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| Pliki | macierz | Tak | ||
| typ | wyliczenie | Typ wyjścia pliku interpretera kodu. Zawsze files.Możliwe wartości: files |
Tak |
CodeInterpreterTextOutput
Wynik wywołania narzędzia interpretera kodu, czyli tekst.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dzienniki | ciąg | Logi narzędzia interpretera kodu. |
Tak | |
| typ | wyliczenie | Rodzaj tekstu interpretera kodu wyjściowego. Zawsze logs.Możliwe wartości: logs |
Tak |
CodeInterpreterTool
Narzędzie, które uruchamia kod.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| identyfikatory_plików | macierz | ID plików, na których można uruchomić kod. |
Tak | |
| typ | wyliczenie | Typ narzędzia do interpretera kodu. Zawsze code_interpreter.Możliwe wartości: code_interpreter |
Tak |
CodeInterpreterToolCall
Wywołanie narzędzia do uruchamiania kodu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| kod | ciąg | Kod do uruchomienia. |
Tak | |
| id | ciąg | Unikalny identyfikator wywołania narzędzia interpretera kodu. |
Tak | |
| results | macierz | Wyniki wywołania narzędzia interpretera kodu. |
Tak | |
| stan | wyliczenie | Status wywołania narzędzia interpretera kodu. Możliwe wartości: in_progress, interpreting, completed |
Tak | |
| typ | wyliczenie | Rodzaj wywołania narzędzia interpretera kodu. Zawsze code_interpreter_call.Możliwe wartości: code_interpreter_call |
Tak |
CodeInterpreterToolOutput
Ten składnik może być jednym z następujących elementów:
ComparisonFilter
Filtr używany do porównania określonego klucza atrybutu z daną wartością za pomocą zdefiniowanej operacji porównania.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| klucz | ciąg | Kluczem jest porównanie z wartością. | Tak | |
| typ | wyliczenie | Określa operator porównawczy: eq, ne, gt, gte, , lt. lte- eq: równa się- ne: nie równe- gt: większe niż- gte: większe lub równe- lt: mniej niż- lte: mniej niż lub równeMożliwe wartości: eq, ne, gt, , gte, lt, lte |
Tak | |
| wartość | ciąg lub liczba lub boolean | Wartość do porównania z kluczem atrybutu; obsługuje typy ciągowe, liczbowe lub booleowskie. | Tak |
CompoundFilter
Połącz wiele filtrów za pomocą and lub or.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| filters | macierz | Zestaw filtrów do połączenia. Elementy mogą być lub ComparisonFilterCompoundFilter. |
Tak | |
| typ | wyliczenie | Typ operacji: and lub or.Możliwe wartości: and, or |
Tak |
ComputerAction
Ten składnik może być jednym z następujących elementów:
ComputerScreenshotImage
Zrzut ekranu komputera używany za pomocą narzędzia do korzystania z komputera.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| identyfikator_pliku | ciąg | Identyfikator przesłanego pliku, który zawiera zrzut ekranu. | No | |
| image_url | ciąg | URL ze zdjęcia zrzutu ekranu. | No | |
| typ | wyliczenie | Określa typ zdarzenia. Dla zrzutu ekranu komputera ta właściwość jest zawsze ustawiona na .computer_screenshotMożliwe wartości: computer_screenshot |
Tak |
ComputerTool
Narzędzie, które steruje wirtualnym komputerem.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| wysokość ekranu | number | Wysokość wyświetlacza komputera. |
Tak | |
| szerokość_wyświetlacza | number | Szerokość wyświetlacza komputerowego. |
Tak | |
| środowisko | wyliczenie | Rodzaj środowiska komputerowego do kontrolowania. Możliwe wartości: mac, windows, , ubuntubrowser |
Tak | |
| typ | wyliczenie | Rodzaj narzędzia do korzystania z komputera. Zawsze computer_use_preview.Możliwe wartości: computer-use-preview |
Tak |
ComputerToolCall
Narzędzie do korzystania z narzędzia komputerowego.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| akcja | ComputerAction | Tak | ||
| call_id | ciąg | Identyfikator używany podczas reagowania na wywołanie narzędzia z wyjściem. |
Tak | |
| id | ciąg | Unikalne ID połączenia komputerowego. | Tak | |
| pending_safety_checks | macierz | Nadchodzące sprawdzenia bezpieczeństwa związane z połączeniem komputerowym. |
Tak | |
| stan | wyliczenie | Status przedmiotu. Jeden z in_progress, completed, lub incomplete. Wypełniane po zwróceniu elementów przez API.Możliwe wartości: in_progress, completed, incomplete |
Tak | |
| typ | wyliczenie | Rodzaj połączenia komputerowego. Zawsze computer_call.Możliwe wartości: computer_call |
Tak |
ComputerToolCallOutput
Wynik wywołania narzędzia komputerowego.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| acknowledged_safety_checks | macierz | Kontrole bezpieczeństwa zgłaszane przez API, które zostały zatwierdzone przez dewelopera. |
No | |
| call_id | ciąg | ID wywołania narzędzia komputerowego, które wygenerowało wynik. |
Tak | |
| id | ciąg | ID wywołania narzędzia komputerowego na wyjściu. |
No | |
| We/Wy | ComputerScreenshotImage | Zrzut ekranu komputera używany za pomocą narzędzia do korzystania z komputera. |
Tak | |
| stan | wyliczenie | Status wejścia wiadomości. Jeden z in_progress, completed, lub incomplete. Wypełniane, gdy elementy wejściowe są zwracane przez API.Możliwe wartości: in_progress, completed, incomplete |
No | |
| typ | wyliczenie | Rodzaj narzędzia komputerowego wywołuje wyjście. Zawsze computer_call_output.Możliwe wartości: computer_call_output |
Tak |
ComputerToolCallOutputResource
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| acknowledged_safety_checks | macierz | Kontrole bezpieczeństwa zgłaszane przez API, które zostały zatwierdzone przez dewelopera. |
No | |
| call_id | ciąg | ID wywołania narzędzia komputerowego, które wygenerowało wynik. |
Tak | |
| id | ciąg | Unikalny identyfikator wyjścia narzędzia wywołania komputera. |
Tak | |
| We/Wy | ComputerScreenshotImage | Zrzut ekranu komputera używany za pomocą narzędzia do korzystania z komputera. |
Tak | |
| stan | wyliczenie | Status wejścia wiadomości. Jeden z in_progress, completed, lub incomplete. Wypełniane, gdy elementy wejściowe są zwracane przez API.Możliwe wartości: in_progress, completed, incomplete |
No | |
| typ | wyliczenie | Rodzaj narzędzia komputerowego wywołuje wyjście. Zawsze computer_call_output.Możliwe wartości: computer_call_output |
Tak |
ComputerToolCallSafetyCheck
Czeka się kontrola bezpieczeństwa dla rozmowy komputerowej.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| kod | ciąg | Rodzaj nadchodzącej kontroli bezpieczeństwa. | Tak | |
| id | ciąg | Identyfikacja oczekującej kontroli bezpieczeństwa. | Tak | |
| komunikat | ciąg | Szczegóły dotyczące nadchodzącej kontroli bezpieczeństwa. | Tak |
Zawartość
Wielomodalne treści wejściowe i wyjściowe.
Ten składnik może być jednym z następujących elementów:
Współrzędnych
Para współrzędnych x/y, np. { x: 100, y: 200 }.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| x | liczba całkowita | Współrzędna x. |
Tak | |
| Y | liczba całkowita | Współrzędna y. |
Tak |
CreateModelResponseProperties
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| metadane | Metadata | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie oraz do zapytań o obiekty za pomocą API lub pulpitu. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków. |
No | |
| model | ciąg | Model używany do generowania odpowiedzi. | No | |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. Zazwyczaj zalecamy modyfikację tego lub top_p nie obu tych rzeczy. |
No | 1 |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy modyfikację tego lub temperature nie obu tych rzeczy. |
No | 1 |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który może pomóc OpenAI monitorować i wykrywać nadużycia. . |
No |
createResponse
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| include | macierz | {"$ref": "#/components/schemas/includable/description"} | No | |
| dane wejściowe | ciąg lub tablica | Tekst, obraz lub plik wejściowy do modelu, używany do generowania odpowiedzi. | Tak | |
| instructions | ciąg | Wprowadza komunikat systemowy (lub deweloperski) jako pierwszy element w kontekście modelu. Używając razem z previous_response_id, instrukcje z poprzedniej odpowiedzi nie zostaną przeniesione do następnej odpowiedzi. Ułatwia to zamianę komunikatów systemowych (lub deweloperskich) w nowych odpowiedziach. |
No | |
| max_output_tokens | liczba całkowita | Górna granica liczby tokenów, które mogą być generowane dla odpowiedzi, w tym widocznych tokenów wyjściowych i tokenów rozumowania. |
No | |
| wywołania_narzędzia_równoległe | boolean | Czy pozwolić modelu na wykonywanie wywołań narzędzi równolegle. |
No | True |
| previous_response_id | ciąg | Unikalne ID poprzedniej odpowiedzi na model. Wykorzystaj to do tworzenia wieloturowych rozmów. | No | |
| reasoning | Reasoning | Opcje konfiguracyjne modeli rozumowania. | No | |
| przechowywać | boolean | Czy przechowywać wygenerowaną odpowiedź modelu do późniejszego pobrania za pomocą API. |
No | True |
| odtwarzać strumieniowo | boolean | Jeśli ustawiono na true, dane odpowiedzi modelu będą przesyłane do klienta w momencie generowania za pomocą zdarzeń wysyłanych przez serwer. | No | Nieprawda |
| SMS | obiekt | Opcje konfiguracyjne odpowiedzi tekstowej z modelu. Może to być tekst zwykły lub ustrukturyzowane dane JSON. Więcej informacji: - wejścia i wyjścia tekstowe - Strukturalne wyniki |
No | |
| Format └─ | TextResponseFormatConfiguration | Obiekt określający format, który model musi wyprowadzać. Konfiguracja { "type": "json_schema" } umożliwia Structured Outputs, co zapewnia, że model odpowiada dostarczonemu schematowi JSON. Domyślny format to { "type": "text" } brak dodatkowych opcji.Nie zaleca się dla modeli GPT-4O i nowszych: Ustawienie na { "type": "json_object" } włączenie starszego trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON. Preferowane jest używanie json_schema w modelach, które go obsługują. |
No | |
| tool_choice | ToolChoiceOptions,ToolChoiceTypes lub ToolChoiceFunction | Jak model powinien wybierać, którego narzędzia (lub narzędzi) użyć podczas generowania odpowiedzi. Zobacz parametr, tools aby zobaczyć, jak określić, które narzędzia model może wywołać. |
No | |
| Narzędzia | macierz | Zestaw narzędzi, które model może wywołać podczas generowania odpowiedzi. Możesz określić, którego narzędzia użyć, ustawiając parametr.tool_choiceDwie kategorie narzędzi, które możesz udostępnić modelowi, to: - Narzędzia wbudowane |
No | |
| truncation | wyliczenie | Strategia obcięcia do wykorzystania w odpowiedzi modelu. - auto: Jeśli kontekst tej odpowiedzi i poprzednich przekroczy rozmiar okna kontekstowego modelu, model obcina Odpowiedź, aby dopasować się do okna kontekstu, wyrzucając elementy wejściowe w środku rozmowy. - disabled (domyślnie): Jeśli odpowiedź modelu przekroczy rozmiar okna kontekstowego dla modelu, żądanie nie zostanie zadane z błędem 400.Możliwe wartości: auto, disabled |
No |
DoubleClick
Akcja podwójnego kliknięcia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | wyliczenie | Określa typ zdarzenia. Dla akcji podwójnego kliknięcia ta właściwość jest zawsze ustawiona na .double_clickMożliwe wartości: double_click |
Tak | |
| x | liczba całkowita | Współrzędna x, gdzie wystąpił podwójny klik. |
Tak | |
| Y | liczba całkowita | Współrzędna y, gdzie wystąpił podwójny klik. |
Tak |
Drag
Akcja drag.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| ścieżka | macierz | Tablica współrzędnych reprezentujących ścieżkę działania ociągania. Współrzędne pojawiają się jako tablica obiektów, np.[{ x: 100, y: 200 }, { x: 200, y: 300 }] |
Tak | |
| typ | wyliczenie | Określa typ zdarzenia. Dla działania przeciągania ta własność jest zawsze ustawiona na .dragMożliwe wartości: drag |
Tak |
EasyInputMessage
Wiadomość wejściowa do modelu z rolą wskazującą hierarchię po instrukcji. Instrukcje przekazywane rolą developer lub system mają pierwszeństwo przed instrukcjami przekazywanymi w roli user . Przyjmuje się, że wiadomości z rolą assistant zostały wygenerowane przez model w poprzednich interakcjach.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | string lub InputMessageContentList | Tekst, obraz lub dźwięk wejściowy do modelu używany do generowania odpowiedzi. Może też zawierać wcześniejsze odpowiedzi asystentów. |
Tak | |
| rola | wyliczenie | Rola wprowadzania wiadomości. Jeden z user, assistant, system, lub developer.Możliwe wartości: user, assistant, , systemdeveloper |
Tak | |
| typ | wyliczenie | Rodzaj wejścia wiadomości. Zawsze message.Możliwe wartości: message |
No |
FileCitation
Cytat do akt.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| identyfikator_pliku | ciąg | Identyfikator pliku. |
Tak | |
| indeks | liczba całkowita | Indeks pliku na liście plików. |
Tak | |
| typ | wyliczenie | Rodzaj cytowania pliku. Zawsze file_citation.Możliwe wartości: file_citation |
Tak |
FilePath
Ścieżka do pliku.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| identyfikator_pliku | ciąg | Identyfikator pliku. |
Tak | |
| indeks | liczba całkowita | Indeks pliku na liście plików. |
Tak | |
| typ | wyliczenie | Typ ścieżki pliku. Zawsze file_path.Możliwe wartości: file_path |
Tak |
FileSearchRanker
Ranker do wyszukiwania plików. Jeśli nie jest to określone, użyję rankera auto .
| Majątek | Wartość |
|---|---|
| Opis | Ranker do wyszukiwania plików. Jeśli nie jest to określone, użyję rankera auto . |
| Typ | ciąg |
| Wartości | autodefault_2024_08_21 |
FileSearchTool
Narzędzie, które wyszukuje istotne treści z przesłanych plików.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| filters | ComparisonFilter lub CompoundFilter | Filtr do stosowania na podstawie atrybutów pliku. | No | |
| maks_liczba_wyników | liczba całkowita | Maksymalna liczba wyników do zwrócenia. Ta liczba powinna mieścić się w zakresie od 1 do 50 włącznie. |
No | |
| opcje rankingu | obiekt | Opcje rankingu w wyszukiwarce. | No | |
| └} ranker | wyliczenie | Ranker do wyszukiwania plików. Możliwe wartości: auto, default-2024-11-15 |
No | |
| └─ próg_punktowy | number | Próg punktowy dla wyszukiwania plików, to liczba od 0 do 1. Liczby bliższe 1 będą próbowały zwrócić tylko najbardziej istotne wyniki, ale mogą dawać mniej wyników. |
No | 0 |
| typ | wyliczenie | Typ narzędzia do wyszukiwania plików. Zawsze file_search.Możliwe wartości: file_search |
Tak | |
| identyfikatory_sklepu_wektorów | macierz | ID wektora zapisują do wyszukiwania. |
Tak |
FileSearchToolCall
Wyniki wywołania narzędzia do wyszukiwania plików.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| id | ciąg | Unikalny identyfikator narzędzia do wyszukiwania plików. |
Tak | |
| queries | macierz | Zapytania używane do wyszukiwania plików. |
Tak | |
| results | macierz | Wyniki wyszukiwania narzędzi do wyszukiwania plików. |
No | |
| stan | wyliczenie | Status wywołania narzędzia do wyszukiwania plików. Jeden z in_progress, searching, incomplete lub failed,Możliwe wartości: in_progress, searching, completed, , incompletefailed |
Tak | |
| typ | wyliczenie | Rodzaj wywołania narzędzia do wyszukiwania plików. Zawsze file_search_call.Możliwe wartości: file_search_call |
Tak |
FunctionTool
Definiuje funkcję w twoim własnym kodzie, którą model może wybrać, by wywołać.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| opis | ciąg | Opis funkcji. Używany przez model do określenia, czy wywołać funkcję. |
No | |
| nazwa | ciąg | Nazwa funkcji, którą trzeba wywołać. |
Tak | |
| parameters | obiekt | Obiekt schematu JSON opisujący parametry funkcji. |
Tak | |
| surowy | boolean | Czy wymusić ścisłą walidację parametrów. Domyślnie true. |
Tak | |
| typ | wyliczenie | Typ narzędzia funkcji. Zawsze function.Możliwe wartości: function |
Tak |
FunctionToolCall
Wywołanie narzędzia do uruchomienia funkcji.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| arguments | ciąg | Ciąg JSON argumentów do przekazania do funkcji. |
Tak | |
| call_id | ciąg | Unikalny identyfikator wywołania narzędzia funkcji wygenerowanego przez model. |
Tak | |
| id | ciąg | Unikalny identyfikator wywołania narzędzia funkcji. |
Tak | |
| nazwa | ciąg | Nazwa funkcji, którą trzeba uruchomić. |
Tak | |
| stan | wyliczenie | Status przedmiotu. Jeden z in_progress, completed, lub incomplete. Wypełniane po zwróceniu elementów przez API.Możliwe wartości: in_progress, completed, incomplete |
No | |
| typ | wyliczenie | Typ funkcji wywołanej narzędziem. Zawsze function_call.Możliwe wartości: function_call |
Tak |
FunctionToolCallOutput
Wynik wywołania narzędzia funkcji.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| call_id | ciąg | Unikalny identyfikator wywołania narzędzia funkcji wygenerowanego przez model. |
Tak | |
| id | ciąg | Unikalny identyfikator funkcji wywołania narzędzia output. Wypełnia się, gdy ten element zostanie zwrócony przez API. |
No | |
| We/Wy | ciąg | Ciąg JSON z wywołania narzędzia funkcji. |
Tak | |
| stan | wyliczenie | Status przedmiotu. Jeden z in_progress, completed, lub incomplete. Wypełniane po zwróceniu elementów przez API.Możliwe wartości: in_progress, completed, incomplete |
No | |
| typ | wyliczenie | Typ funkcji wywołania narzędzia output. Zawsze function_call_output.Możliwe wartości: function_call_output |
Tak |
FunctionToolCallOutputResource
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| call_id | ciąg | Unikalny identyfikator wywołania narzędzia funkcji wygenerowanego przez model. |
Tak | |
| id | ciąg | Unikalny identyfikator funkcji wywołanej jako narzędzie wyjściowe. |
Tak | |
| We/Wy | ciąg | Ciąg JSON z wywołania narzędzia funkcji. |
Tak | |
| stan | wyliczenie | Status przedmiotu. Jeden z in_progress, completed, lub incomplete. Wypełniane po zwróceniu elementów przez API.Możliwe wartości: in_progress, completed, incomplete |
No | |
| typ | wyliczenie | Typ funkcji wywołania narzędzia output. Zawsze function_call_output.Możliwe wartości: function_call_output |
Tak |
includable
Określ dodatkowe dane wyjściowe, które mają zostać uwzględnione w odpowiedzi modelu. Obecnie wspierane wartości to:
-
file_search_call.results: Dołącz wyniki wyszukiwania wywołania narzędzia do wyszukiwania plików. -
message.input_image.image_url: Uwzględnij URL obrazów z wiadomości wejściowej. -
computer_call_output.output.image_url: Uwzględnij URL obrazów z wyjścia wywołań komputerowych.
| Majątek | Wartość |
|---|---|
| Opis | Określ dodatkowe dane wyjściowe, które mają zostać uwzględnione w odpowiedzi modelu. Obecnie wspierane wartości to: - file_search_call.results: Dołącz wyniki wyszukiwania wywołania narzędzia do wyszukiwania plików.- message.input_image.image_url: Uwzględnij URL obrazów z wiadomości wejściowej.- computer_call_output.output.image_url: Uwzględnij URL obrazów z wyjścia wywołań komputerowych. |
| Typ | ciąg |
| Wartości | file_search_call.resultsmessage.input_image.image_urlcomputer_call_output.output.image_url |
InputAudio
Wejście audio do modelu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | ciąg | Dane audio kodowane w Base64. |
Tak | |
| format | wyliczenie | Format danych audio. Obecnie obsługiwane formaty to mp3 oraz wav.Możliwe wartości: mp3, wav |
Tak | |
| typ | wyliczenie | Rodzaj elementu wejściowego. Zawsze input_audio.Możliwe wartości: input_audio |
Tak |
InputContent
Ten składnik może być jednym z następujących elementów:
InputFile
Plik wejściowy do modelu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| file_data | ciąg | Treść pliku do wysłania do modelu. |
No | |
| identyfikator_pliku | ciąg | ID pliku do wysłania modelowi. |
No | |
| filename | ciąg | Nazwa pliku do wysłania modelowi. |
No | |
| typ | wyliczenie | Rodzaj elementu wejściowego. Zawsze input_file.Możliwe wartości: input_file |
Tak |
InputImage
Obraz wejściowy do modelu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| detail | wyliczenie | Poziom szczegółowości obrazu, który ma być przesłany modelowi. Jeden z high, low, lub auto. Domyślnie przyjmuje .autoMożliwe wartości: high, low, auto |
Tak | |
| identyfikator_pliku | ciąg | ID pliku do wysłania modelowi. |
No | |
| image_url | ciąg | URL obrazu, który ma zostać wysłany do modelu. W pełni kwalifikowany adres URL lub obraz zakodowany w base64 w adresie URL danych. |
No | |
| typ | wyliczenie | Rodzaj elementu wejściowego. Zawsze input_image.Możliwe wartości: input_image |
Tak |
InputItem
Ten składnik może być jednym z następujących elementów:
WiadomośćWejściowa
Wiadomość wejściowa do modelu z rolą wskazującą hierarchię po instrukcji. Instrukcje przekazywane rolą developer lub system mają pierwszeństwo przed instrukcjami przekazywanymi w roli user .
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | InputMessageContentList | Lista jednego lub wielu elementów wejściowych do modelu, zawierających różne treści types. |
Tak | |
| rola | wyliczenie | Rola wprowadzania wiadomości. Jeden z user, system, lub developer.Możliwe wartości: user, system, developer |
Tak | |
| stan | wyliczenie | Status przedmiotu. Jeden z in_progress, completed, lub incomplete. Wypełniane po zwróceniu elementów przez API.Możliwe wartości: in_progress, completed, incomplete |
No | |
| typ | wyliczenie | Rodzaj wejścia wiadomości. Zawsze ustawione na message.Możliwe wartości: message |
No |
InputMessageContentList
Lista jednego lub wielu elementów wejściowych do modelu, zawierająca różne typy zawartości.
Nie ma zdefiniowanych właściwości dla tego komponentu.
InputMessageResource
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | InputMessageContentList | Lista jednego lub wielu elementów wejściowych do modelu, zawierających różne treści types. |
Tak | |
| id | ciąg | Unikalny identyfikator wejścia wiadomości. |
Tak | |
| rola | wyliczenie | Rola wprowadzania wiadomości. Jeden z user, system, lub developer.Możliwe wartości: user, system, developer |
Tak | |
| stan | wyliczenie | Status przedmiotu. Jeden z in_progress, completed, lub incomplete. Wypełniane po zwróceniu elementów przez API.Możliwe wartości: in_progress, completed, incomplete |
No | |
| typ | wyliczenie | Rodzaj wejścia wiadomości. Zawsze ustawione na message.Możliwe wartości: message |
No |
Tekst wejściowy
Tekst wejściowy do modelu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| SMS | ciąg | Tekst wejściowy do modelu. |
Tak | |
| typ | wyliczenie | Rodzaj elementu wejściowego. Zawsze input_text.Możliwe wartości: input_text |
Tak |
Produkt
Element treści używany do generowania odpowiedzi.
Ten składnik może być jednym z następujących elementów:
- InputMessage
- OutputMessage
- FileSearchToolCall
- ComputerToolCall
- ComputerToolCallOutput
- FunctionToolCall
- FunctionToolCallOutput
- ReasoningItem
ItemReference
Wewnętrzny identyfikator dla elementu do odniesienia.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| id | ciąg | Identyfikator przedmiotu do odniesienia. |
Tak | |
| typ | wyliczenie | Rodzaj przedmiotu, do którego warto się odwołać. Zawsze item_reference.Możliwe wartości: item_reference |
Tak |
ItemResource
Element treści używany do generowania odpowiedzi.
Ten składnik może być jednym z następujących elementów:
- InputMessageResource
- OutputMessage
- FileSearchToolCall
- ComputerToolCall
- ComputerToolCallOutputResource
- FunctionToolCall
- FunctionToolCallOutputResource
KeyPress
Zbiór naciśnięcia klawiszy, które model chciałby wykonać.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| keys | macierz | Kombinacja klawiszy, które model żąda do naciśnięcia. Jest to tablica ciągów znaków, z których każdy reprezentuje klucz. |
Tak | |
| typ | wyliczenie | Określa typ zdarzenia. Dla akcji naciśnięcia klawisza ta właściwość jest zawsze ustawiona na .keypressMożliwe wartości: keypress |
Tak |
Metadane
Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie oraz do zapytań o obiekty za pomocą API lub pulpitu.
Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków.
Nie ma zdefiniowanych właściwości dla tego komponentu.
ModelResponseProperties
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| metadane | Metadata | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie oraz do zapytań o obiekty za pomocą API lub pulpitu. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków. |
No | |
| model | ciąg | Model używany do generowania odpowiedzi. | No | |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. Zazwyczaj zalecamy modyfikację tego lub top_p nie obu tych rzeczy. |
No | 1 |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy modyfikację tego lub temperature nie obu tych rzeczy. |
No | 1 |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który może pomóc OpenAI monitorować i wykrywać nadużycia. . |
No |
Przenieś
Akcja ruchu myszką.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | wyliczenie | Określa typ zdarzenia. Dla akcji ruchu ta własność jest zawsze ustawiona na .moveMożliwe wartości: move |
Tak | |
| x | liczba całkowita | Współrzędna x, do której należy się przesunąć. |
Tak | |
| Y | liczba całkowita | Współrzędna y do przejścia. |
Tak |
OutputAudio
Wyjście audio z modelu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | ciąg | Dane audio zakodowane w Base64 z modelu. |
Tak | |
| transkrypcja | ciąg | Transkrypcja danych audio z modelu. |
Tak | |
| typ | wyliczenie | Rodzaj dźwięku wyjściowego. Zawsze output_audio.Możliwe wartości: output_audio |
Tak |
OutputContent
Ten składnik może być jednym z następujących elementów:
OutputItem
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| akcja | ComputerAction | Tak | ||
| arguments | ciąg | Ciąg JSON argumentów do przekazania do funkcji. |
Tak | |
| call_id | ciąg | Identyfikator używany podczas reagowania na wywołanie narzędzia z wyjściem. |
Tak | |
| zawartość | macierz | Rozumowanie treści tekstu. |
Tak | |
| id | ciąg | Unikalny identyfikator treści rozumowania. |
Tak | |
| nazwa | ciąg | Nazwa funkcji, którą trzeba uruchomić. |
Tak | |
| pending_safety_checks | macierz | Nadchodzące sprawdzenia bezpieczeństwa związane z połączeniem komputerowym. |
Tak | |
| queries | macierz | Zapytania używane do wyszukiwania plików. |
Tak | |
| results | macierz | Wyniki wyszukiwania narzędzi do wyszukiwania plików. |
No | |
| rola | wyliczenie | Rola komunikatu wyjściowego. Zawsze assistant.Możliwe wartości: assistant |
Tak | |
| stan | wyliczenie | Status przedmiotu. Jeden z in_progress, completed, lub incomplete. Wypełniane po zwróceniu elementów przez API.Możliwe wartości: in_progress, completed, incomplete |
Tak | |
| typ | wyliczenie | Typ przedmiotu. Zawsze reasoning.Możliwe wartości: reasoning |
Tak |
OutputMessage
Komunikat wyjściowy z modelu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | macierz | Treść komunikatu wyjściowego. |
Tak | |
| id | ciąg | Unikalny identyfikator wiadomości wyjściowej. |
Tak | |
| rola | wyliczenie | Rola komunikatu wyjściowego. Zawsze assistant.Możliwe wartości: assistant |
Tak | |
| stan | wyliczenie | Status wejścia wiadomości. Jeden z in_progress, completed, lub incomplete. Wypełniane, gdy elementy wejściowe są zwracane przez API.Możliwe wartości: in_progress, completed, incomplete |
Tak | |
| typ | wyliczenie | Typ wiadomości wyjściowej. Zawsze message.Możliwe wartości: message |
Tak |
OutputText
Tekst wychodzący z modelu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| annotations | macierz | Adnotacje w wyjściu tekstowym. |
Tak | |
| SMS | ciąg | Tekst wychodzi z modelu. |
Tak | |
| typ | wyliczenie | Typ tekstu wyjściowego. Zawsze output_text.Możliwe wartości: output_text |
Tak |
RealtimeSessionCreateRequest
Konfiguracja obiektu sesji w czasie rzeczywistym.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| input_audio_format | wyliczenie | Format dźwięku wejściowego. Opcje to pcm16, g711_ulaw, lub g711_alaw.Dla pcm16, dźwięk wejściowy musi być 16-bitowy PCM przy częstotliwości próbkowania 24kHz, jednokanałowy (mono) i w rzędzie bajtów little-endian.Możliwe wartości: pcm16, g711_ulaw, g711_alaw |
No | |
| input_audio_noise_reduction | obiekt | Konfiguracja redukcji szumów audio wejściowych. Można to ustawić na null wyłączenie.Redukcja szumów filtruje dźwięk dodawany do bufora audio wejściowego przed wysłaniem do VAD i modelu. Filtrowanie dźwięku może poprawić dokładność wykrywania VAD i skrętów (zmniejszając liczbę fałszywych alarmów) oraz modelować wydajność poprzez lepszą percepcję dźwięku wejściowego. |
No | |
| └typ | wyliczenie | Rodzaj redukcji szumów.
near_field jest dla mikrofonów do bliskiego rozmowy, takich jak słuchawki, jest dla mikrofonów dalekiego pola, far_field takich jak laptopy lub mikrofony konferencyjne.Możliwe wartości: near_field, far_field |
No | |
| input_audio_transcription | obiekt | Konfiguracja transkrypcji audio wejściowej domyślnie jest wyłączona i można ustawić null na wyłączenie po włączeniu. Transkrypcja audio wejściowego nie jest natywna dla modelu, ponieważ model konsumuje dźwięk bezpośrednio. Transkrypcja działa asynchronicznie przez punkt końcowy Transcriptions i powinna być traktowana jako wskazówka dla treści audio wejściowej, a nie dokładnie to, co model usłyszał. Klient może opcjonalnie ustawić język i prompt transkrypcji, co zapewnia dodatkowe wskazówki dla usługi transkrypcji. |
No | |
| └* język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np.) enpoprawia dokładność i opóźnienia. |
No | |
| └─ Model | ciąg | Model do transkrypcji, obecnie dostępne opcje to gpt-4o-transcribe, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, oraz whisper-1. |
No | |
| Zachęta └* | ciąg | Opcjonalny tekst wskazujący styl modelu lub kontynuujący wcześniejszy segment audio. Dla whisper-1, prompt to lista słów kluczowych.W modelach gpt-4o-transcribe prompt to wolny ciąg tekstowy, na przykład "expect words related to technology". |
No | |
| instructions | ciąg | Domyślne instrukcje systemowe (czyli komunikat systemowy) były dołączane do wywołań modelu. To pole pozwala klientowi kierować modelem na żądane odpowiedzi. Model można pouczać na temat treści i formatu odpowiedzi (np. "bądź bardzo zwięzły", "zachowuj się przyjaźnie", "oto przykłady dobrych odpowiedzi") oraz zachowania audio (np. "mów szybko", "wprowadź emocje do głosu", "często się śmiej"). Instrukcje nie są gwarantowane przez model przestrzegania, ale dostarczają mu wskazówek dotyczących pożądanego zachowania. Należy zauważyć, że serwer ustawia domyślne instrukcje, które będą używane, jeśli to pole nie jest ustawione i są widoczne w zdarzeniu session.created na początku sesji. |
No | |
| max_response_output_tokens | liczba całkowita lub ciąg tekstu | Maksymalna liczba tokenów wyjściowych dla jednej odpowiedzi asystenta, wliczając wywołania narzędzi. Podaj liczbę całkowitą od 1 do 4096, aby ograniczyć tokeny wyjściowe lub inf dla maksymalnej dostępności tokenów dla danego modelu. Domyślnie przyjmuje .inf |
No | |
| Sposoby | Zestaw modalności, z którymi model może reagować. Aby wyłączyć dźwięk, ustaw to na ["text"]. |
No | ||
| model | ciąg | Nazwa wdrożenia użytego podczas tej sesji. |
No | |
| output_audio_format | wyliczenie | Format dźwięku wyjściowego. Opcje to pcm16, g711_ulaw, lub g711_alaw.Dla pcm16, dźwięk wyjściowy jest próbkowany z częstotliwością 24kHz.Możliwe wartości: pcm16, g711_ulaw, g711_alaw |
No | |
| temperatura | number | Temperatura próbkowania dla modelu ograniczona do [0.6, 1.2]. W przypadku modeli audio zaleca się temperaturę 0,8 dla najlepszej wydajności. |
No | 0.8 |
| tool_choice | ciąg | Jak model wybiera narzędzia. Opcje to auto, none, required, lub określ funkcję. |
No | samochód |
| Narzędzia | macierz | Narzędzia (funkcje) dostępne dla modelu. | No | |
| turn_detection | obiekt | Konfiguracja wykrywania tur, np. Server VAD lub Semantic VAD. Można to ustawić na null wyłączenie, w takim przypadku klient musi ręcznie wywołać odpowiedź modelu.Server VAD oznacza, że model wykrywa początek i koniec mowy na podstawie głośności dźwięku i odpowiada na końcu wypowiedzi użytkownika. Semantyczny VAD jest bardziej zaawansowany i wykorzystuje model wykrywania skrętów (we współpracy z VAD), aby semantycznie oszacować, czy użytkownik skończył mówić, a następnie dynamicznie ustawia limit czasu na podstawie tego prawdopodobieństwa. Na przykład, jeśli dźwięk użytkownika kończy się na , uhhmmodel uzyska niskie prawdopodobieństwo zakończenia tury i dłużej czeka, aż użytkownik będzie kontynuował mówienie. Może to być przydatne przy bardziej naturalnych rozmowach, ale może mieć wyższe opóźnienia. |
No | |
| └create_response | boolean | Czy automatycznie generować odpowiedź, gdy wystąpi zdarzenie VAD stop. |
No | True |
| └* gotowość | wyliczenie | Używany tylko w semantic_vad trybie pracy. Chęć modelu do odpowiedzi.
low poczeka dłużej, aż użytkownik będzie kontynuował mówienie, odpowiada high szybciej.
autojest domyślnym i jest równoważny .mediumMożliwe wartości: low, medium, , highauto |
No | |
| └reakcja_na_przerwanie | boolean | Czy automatycznie przerwać każdą bieżącą odpowiedź z wyjściem do domyślnej rozmowy (czyli conversation z), autogdy wystąpi zdarzenie startowe VAD. |
No | True |
| └─prefix_padding_ms | liczba całkowita | Używany tylko w server_vad trybie pracy. Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Domyślnie ustawione jest 300ms. |
No | |
| └czas_trwania_ciszy_ms | liczba całkowita | Używany tylko w server_vad trybie pracy. Czas trwania ciszy do wykrycia zatrzymania mowy (w milisekundach). Domyślnie ustawione jest 500ms. Przy krótszych wartościach model odpowiada szybciej, ale może wtrącać się na krótkie przerwy użytkownika. |
No | |
| └* próg | number | Używany tylko w server_vad trybie pracy. Próg aktywacji dla VAD (0,0 do 1,0), domyślnie wynosi 0,5. Wyższy próg wymaga głośniejszego dźwięku do aktywacji modelu, dlatego może działać lepiej w hałaśliwym środowisku. |
No | |
| └typ | wyliczenie | Rodzaj wykrywania skrętów. Możliwe wartości: server_vad, semantic_vad |
No | |
| voice | VoiceIdsShared | No |
RealtimeSessionCreateResponse
Nowa konfiguracja sesji w czasie rzeczywistym, z efemerycznym kluczem. Domyślny TTL dla klawiszy to jedna minuta.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| client_secret | obiekt | Klucz efemeryczny zwracany przez API. | Tak | |
| └─ wygasa_o | liczba całkowita | Znacznik czasu wygaśnięcia tokena. Obecnie wszystkie tokeny wygasają po jednej minucie. |
No | |
| └─ wartość | ciąg | Klucz efemeryczny możliwy do uwierzytelniania połączeń z API czasu rzeczywistego w środowiskach klienckich. Używaj tego w środowiskach po stronie klienta, a nie standardowego tokena API, który powinien być używany tylko po stronie serwera. |
No | |
| input_audio_format | ciąg | Format dźwięku wejściowego. Opcje to pcm16, g711_ulaw, lub g711_alaw. |
No | |
| input_audio_transcription | obiekt | Konfiguracja transkrypcji audio wejściowej domyślnie jest wyłączona i można ustawić null na wyłączenie po włączeniu. Transkrypcja audio wejściowego nie jest natywna dla modelu, ponieważ model konsumuje dźwięk bezpośrednio. Transkrypcja działa asynchronicznie przez Whisper i powinna być traktowana jako przybliżone wskazówki, a nie jako reprezentacja rozumiana przez model. |
No | |
| └─ Model | ciąg | Model używany do transkrypcji whisper-1 jest jedynym obecnie obsługiwanym modelem. |
No | |
| instructions | ciąg | Domyślne instrukcje systemowe (czyli komunikat systemowy) były dołączane do wywołań modelu. To pole pozwala klientowi kierować modelem na żądane odpowiedzi. Model można instruować na temat treści i formatu odpowiedzi (np. "bądź bardzo zwięzły", "zachowuj się przyjaźnie", "oto przykłady dobrych odpowiedzi") oraz zachowania audio (np. "mów szybko", "wprowadź emocje do głosu", "często się śmiej"). Instrukcje nie są gwarantowane przez model przestrzegania, ale dostarczają mu wskazówek dotyczących pożądanego zachowania. Należy zauważyć, że serwer ustawia domyślne instrukcje, które będą używane, jeśli to pole nie jest ustawione i są widoczne w zdarzeniu session.created na początku sesji. |
No | |
| max_response_output_tokens | liczba całkowita lub ciąg tekstu | Maksymalna liczba tokenów wyjściowych dla jednej odpowiedzi asystenta, wliczając wywołania narzędzi. Podaj liczbę całkowitą od 1 do 4096, aby ograniczyć tokeny wyjściowe lub inf dla maksymalnej dostępności tokenów dla danego modelu. Domyślnie przyjmuje .inf |
No | |
| Sposoby | Zestaw modalności, z którymi model może reagować. Aby wyłączyć dźwięk, ustaw to na ["text"]. |
No | ||
| output_audio_format | ciąg | Format dźwięku wyjściowego. Opcje to pcm16, g711_ulaw, lub g711_alaw. |
No | |
| temperatura | number | Temperatura próbkowania dla modelu ograniczona do [0.6, 1.2]. Domyślnie ustawia się na 0,8. |
No | |
| tool_choice | ciąg | Jak model wybiera narzędzia. Opcje to auto, none, required, lub określ funkcję. |
No | |
| Narzędzia | macierz | Narzędzia (funkcje) dostępne dla modelu. | No | |
| turn_detection | obiekt | Konfiguracja wykrywania skrętów. Można ustawić na null wyłączenie. Server VAD oznacza, że model wykrywa początek i koniec mowy na podstawie głośności dźwięku i odpowiada na końcu wypowiedzi użytkownika. |
No | |
| └─prefix_padding_ms | liczba całkowita | Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Domyślnie ustawione jest 300ms. |
No | |
| └czas_trwania_ciszy_ms | liczba całkowita | Czas trwania ciszy do wykrycia zatrzymania mowy (w milisekundach). Domyślnie ustawione jest 500ms. Przy krótszych wartościach model odpowiada szybciej, ale może wtrącać się na krótkie przerwy użytkownika. |
No | |
| └* próg | number | Próg aktywacji dla VAD (0,0 do 1,0), domyślnie wynosi 0,5. Wyższy próg wymaga głośniejszego dźwięku do aktywacji modelu, dlatego może działać lepiej w hałaśliwym środowisku. |
No | |
| └typ | ciąg | Obecnie wspierany jest tylko rodzaj wykrywania server_vad skrętów. |
No | |
| voice | VoiceIdsShared | No |
RealtimeTranscriptionSessionCreateRequest
Konfiguracja obiektu sesji transkrypcji w czasie rzeczywistym.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| include | macierz | Zestaw elementów do uwzględnienia w transkrypcji. Obecnie dostępne przedmioty to: - item.input_audio_transcription.logprobs |
No | |
| input_audio_format | wyliczenie | Format dźwięku wejściowego. Opcje to pcm16, g711_ulaw, lub g711_alaw.Dla pcm16, dźwięk wejściowy musi być 16-bitowy PCM przy częstotliwości próbkowania 24kHz, jednokanałowy (mono) i w rzędzie bajtów little-endian.Możliwe wartości: pcm16, g711_ulaw, g711_alaw |
No | |
| input_audio_noise_reduction | obiekt | Konfiguracja redukcji szumów audio wejściowych. Można to ustawić na null wyłączenie.Redukcja szumów filtruje dźwięk dodawany do bufora audio wejściowego przed wysłaniem do VAD i modelu. Filtrowanie dźwięku może poprawić dokładność wykrywania VAD i skrętów (zmniejszając liczbę fałszywych alarmów) oraz modelować wydajność poprzez lepszą percepcję dźwięku wejściowego. |
No | |
| └typ | wyliczenie | Rodzaj redukcji szumów.
near_field jest dla mikrofonów do bliskiego rozmowy, takich jak słuchawki, jest dla mikrofonów dalekiego pola, far_field takich jak laptopy lub mikrofony konferencyjne.Możliwe wartości: near_field, far_field |
No | |
| input_audio_transcription | obiekt | Konfiguracja do transkrypcji audio wejściowej. Klient może opcjonalnie ustawić język i prompt transkrypcji, co zapewnia dodatkowe wskazówki dla usługi transkrypcji. |
No | |
| └* język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np.) enpoprawia dokładność i opóźnienia. |
No | |
| └─ Model | wyliczenie | Model do transkrypcji, obecnie dostępne opcje to gpt-4o-transcribe, gpt-4o-transcribe-diarize, gpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, oraz whisper-1.Możliwe wartości: gpt-4o-transcribe, gpt-4o-transcribe-diarize, gpt-4o-mini-transcribe, , gpt-4o-mini-transcribe-2025-12-15whisper-1 |
No | |
| Zachęta └* | ciąg | Opcjonalny tekst wskazujący styl modelu lub kontynuujący wcześniejszy segment audio. Dla whisper-1, prompt to lista słów kluczowych.W modelach gpt-4o-transcribe prompt to wolny ciąg tekstowy, na przykład "expect words related to technology". |
No | |
| Sposoby | Zestaw modalności, z którymi model może reagować. Aby wyłączyć dźwięk, ustaw to na ["text"]. |
No | ||
| turn_detection | obiekt | Konfiguracja wykrywania tur, np. Server VAD lub Semantic VAD. Można to ustawić na null wyłączenie, w takim przypadku klient musi ręcznie wywołać odpowiedź modelu.Server VAD oznacza, że model wykrywa początek i koniec mowy na podstawie głośności dźwięku i odpowiada na końcu wypowiedzi użytkownika. Semantyczny VAD jest bardziej zaawansowany i wykorzystuje model wykrywania skrętów (we współpracy z VAD), aby semantycznie oszacować, czy użytkownik skończył mówić, a następnie dynamicznie ustawia limit czasu na podstawie tego prawdopodobieństwa. Na przykład, jeśli dźwięk użytkownika kończy się na , uhhmmodel uzyska niskie prawdopodobieństwo zakończenia tury i dłużej czeka, aż użytkownik będzie kontynuował mówienie. Może to być przydatne przy bardziej naturalnych rozmowach, ale może mieć wyższe opóźnienia. |
No | |
| └create_response | boolean | Czy automatycznie generować odpowiedź, gdy wystąpi zdarzenie VAD stop. Niedostępne podczas sesji transkrypcji. |
No | True |
| └* gotowość | wyliczenie | Używany tylko w semantic_vad trybie pracy. Chęć modelu do odpowiedzi.
low poczeka dłużej, aż użytkownik będzie kontynuował mówienie, odpowiada high szybciej.
autojest domyślnym i jest równoważny .mediumMożliwe wartości: low, medium, , highauto |
No | |
| └reakcja_na_przerwanie | boolean | Czy automatycznie przerwać każdą bieżącą odpowiedź z wyjściem do domyślnej rozmowy (czyli conversation z), autogdy wystąpi zdarzenie startowe VAD. Niedostępne podczas sesji transkrypcji. |
No | True |
| └─prefix_padding_ms | liczba całkowita | Używany tylko w server_vad trybie pracy. Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Domyślnie ustawione jest 300ms. |
No | |
| └czas_trwania_ciszy_ms | liczba całkowita | Używany tylko w server_vad trybie pracy. Czas trwania ciszy do wykrycia zatrzymania mowy (w milisekundach). Domyślnie ustawione jest 500ms. Przy krótszych wartościach model odpowiada szybciej, ale może wtrącać się na krótkie przerwy użytkownika. |
No | |
| └* próg | number | Używany tylko w server_vad trybie pracy. Próg aktywacji dla VAD (0,0 do 1,0), domyślnie wynosi 0,5. Wyższy próg wymaga głośniejszego dźwięku do aktywacji modelu, dlatego może działać lepiej w hałaśliwym środowisku. |
No | |
| └typ | wyliczenie | Rodzaj wykrywania skrętów. Możliwe wartości: server_vad, semantic_vad |
No |
RealtimeTranscriptionSessionCreateResponse
Nowa konfiguracja sesji transkrypcji w czasie rzeczywistym.
Gdy sesja jest tworzona na serwerze za pomocą REST API, obiekt sesji zawiera również klucz efemeryczny. Domyślny TTL dla klawiszy to jedna minuta. Ta właściwość nie występuje, gdy sesja jest aktualizowana za pomocą API WebSocket.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| client_secret | obiekt | Klucz efemeryczny zwracany przez API. Występuje tylko wtedy, gdy sesja jest tworzona na serwerze przez REST API. |
Tak | |
| └─ wygasa_o | liczba całkowita | Znacznik czasu wygaśnięcia tokena. Obecnie wszystkie tokeny wygasają po jednej minucie. |
No | |
| └─ wartość | ciąg | Klucz efemeryczny możliwy do uwierzytelniania połączeń z API czasu rzeczywistego w środowiskach klienckich. Używaj tego w środowiskach po stronie klienta, a nie standardowego tokena API, który powinien być używany tylko po stronie serwera. |
No | |
| input_audio_format | ciąg | Format dźwięku wejściowego. Opcje to pcm16, g711_ulaw, lub g711_alaw. |
No | |
| input_audio_transcription | obiekt | Konfiguracja modelu transkrypcji. |
No | |
| └* język | ciąg | Język wejściowego dźwięku. Dostarczanie języka wejściowego w formacie ISO-639-1 (np.) enpoprawia dokładność i opóźnienia. |
No | |
| └─ Model | wyliczenie | Model do transkrypcji. Może być , gpt-4o-transcribegpt-4o-mini-transcribe, gpt-4o-mini-transcribe-2025-12-15, lub whisper-1.Możliwe wartości: gpt-4o-transcribe, gpt-4o-mini-transcribe, , gpt-4o-mini-transcribe-2025-12-15whisper-1 |
No | |
| Zachęta └* | ciąg | Opcjonalny tekst wskazujący styl modelu lub kontynuujący wcześniejszy segment audio. Prompt powinien odpowiadać językowi dźwięku. |
No | |
| Sposoby | Zestaw modalności, z którymi model może reagować. Aby wyłączyć dźwięk, ustaw to na ["text"]. |
No | ||
| turn_detection | obiekt | Konfiguracja wykrywania skrętów. Można ustawić na null wyłączenie. Server VAD oznacza, że model wykrywa początek i koniec mowy na podstawie głośności dźwięku i odpowiada na końcu wypowiedzi użytkownika. |
No | |
| └─prefix_padding_ms | liczba całkowita | Ilość dźwięku do uwzględnienia przed wykryciem mowy przez VAD (w milisekundach). Domyślnie ustawione jest 300ms. |
No | |
| └czas_trwania_ciszy_ms | liczba całkowita | Czas trwania ciszy do wykrycia zatrzymania mowy (w milisekundach). Domyślnie ustawione jest 500ms. Przy krótszych wartościach model odpowiada szybciej, ale może wtrącać się na krótkie przerwy użytkownika. |
No | |
| └* próg | number | Próg aktywacji dla VAD (0,0 do 1,0), domyślnie wynosi 0,5. Wyższy próg wymaga głośniejszego dźwięku do aktywacji modelu, dlatego może działać lepiej w hałaśliwym środowisku. |
No | |
| └typ | ciąg | Obecnie wspierany jest tylko rodzaj wykrywania server_vad skrętów. |
No |
Reasoning
Opcje konfiguracyjne modeli rozumowania.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| nakład pracy | ReasoningEffort | Ogranicza wysiłek związany z rozumowaniem dla modeli rozumowania. Obecnie obsługiwane wartości to low, medium, oraz high. Zmniejszenie wysiłku rozumowania może skutkować szybszymi odpowiedziami i mniejszą liczbą tokenów używanych do rozumowania w odpowiedzi. |
Tak | nośnik |
| podsumowanie | wyliczenie | Podsumowanie rozumowania przeprowadzonego przez model. Może to być przydatne do debugowania i zrozumienia procesu rozumowania modelu. Jeden z concise lub detailed.Możliwe wartości: concise, detailed |
No |
ReasoningItem
Opis łańcucha myślenia używanego przez model rozumowania podczas generowania odpowiedzi.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| zawartość | macierz | Rozumowanie treści tekstu. |
Tak | |
| id | ciąg | Unikalny identyfikator treści rozumowania. |
Tak | |
| stan | wyliczenie | Status przedmiotu. Jeden z in_progress, completed, lub incomplete. Wypełniane po zwróceniu elementów przez API.Możliwe wartości: in_progress, completed, incomplete |
No | |
| typ | wyliczenie | Typ przedmiotu. Zawsze reasoning.Możliwe wartości: reasoning |
Tak |
Refusal
Odmowa ze strony modelki.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| refusal | ciąg | Wyjaśnienie odmowy ze strony modelki. |
Tak | |
| typ | wyliczenie | Rodzaj odmowy. Zawsze refusal.Możliwe wartości: refusal |
Tak |
response
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| utworzono_o | number | Znacznik czasu Uniksa (w sekundach) od momentu utworzenia tej odpowiedzi. |
Tak | |
| błąd | ResponseError | Obiekt błędu zwracany, gdy model nie generuje odpowiedzi. |
Tak | |
| id | ciąg | Unikalny identyfikator tej odpowiedzi. |
Tak | |
| incomplete_details | obiekt | Szczegóły wyjaśniające, dlaczego odpowiedź jest niepełna. |
Tak | |
| └* przyczyna | wyliczenie | Powód, dla którego odpowiedź jest niepełna. Możliwe wartości: max_output_tokens, content_filter |
No | |
| instructions | ciąg | Wprowadza komunikat systemowy (lub deweloperski) jako pierwszy element w kontekście modelu. Używając razem z previous_response_id, instrukcje z poprzedniej odpowiedzi nie zostaną przeniesione do następnej odpowiedzi. Ułatwia to zamianę komunikatów systemowych (lub deweloperskich) w nowych odpowiedziach. |
Tak | |
| max_output_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować dla odpowiedzi, w tym widocznych tokenów wyjściowych i stanu rozmowy. |
No | |
| metadane | Metadata | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie oraz do zapytań o obiekty za pomocą API lub pulpitu. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków. |
Tak | |
| model | ciąg | Model używany do generowania odpowiedzi. | Tak | |
| obiekt | wyliczenie | Typ obiektu tego zasobu – zawsze ustawiony na .responseMożliwe wartości: response |
Tak | |
| We/Wy | macierz | Zestaw elementów treści generowanych przez model. - Długość i kolejność elementów w tablicy output zależy od odpowiedzi modelu.- Zamiast uzyskiwać dostęp do pierwszego elementu w tablicy output i zakładać, że jest assistant to komunikat z treścią generowaną przez model, możesz rozważyć użycie tej output_text właściwości tam, gdzie jest to obsługiwane w SDK. |
Tak | |
| output_text | ciąg | Właściwość wygody tylko SDK, która zawiera zagregowany tekst wyjściowy ze wszystkich output_text elementów w tablicy output , jeśli w ogóle są obecne. Obsługiwane w SDK Python i JavaScript. |
No | |
| wywołania_narzędzia_równoległe | boolean | Czy pozwolić modelu na wykonywanie wywołań narzędzi równolegle. |
Tak | True |
| previous_response_id | ciąg | Unikalne ID poprzedniej odpowiedzi na model. Wykorzystaj to do tworzenia wieloturowych rozmów. | No | |
| reasoning | Reasoning | Opcje konfiguracyjne modeli rozumowania. |
No | |
| stan | wyliczenie | Status generowania odpowiedzi. Jeden z completed, failed, in_progress, lub incomplete.Możliwe wartości: completed, failed, , in_progressincomplete |
No | |
| temperatura | number | Jakiej temperatury próbkowania użyć, między 0 a 2. Wyższe wartości, takie jak 0,8, sprawią, że wynik będzie bardziej losowy, podczas gdy niższe, jak 0,2, sprawią, że będzie bardziej skupiony i deterministyczny. Zazwyczaj zalecamy modyfikację tego lub top_p nie obu tych rzeczy. |
Tak | 1 |
| SMS | obiekt | Opcje konfiguracyjne odpowiedzi tekstowej z modelu. Może to być tekst zwykły lub ustrukturyzowane dane JSON. Więcej informacji: - wejścia i wyjścia tekstowe - Strukturalne wyniki |
No | |
| Format └─ | TextResponseFormatConfiguration | Obiekt określający format, który model musi wyprowadzać. Konfiguracja { "type": "json_schema" } umożliwia Structured Outputs, co zapewnia, że model odpowiada dostarczonemu schematowi JSON. Domyślny format to { "type": "text" } brak dodatkowych opcji.Nie zaleca się dla modeli GPT-4O i nowszych: Ustawienie na { "type": "json_object" } włączenie starszego trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON. Preferowane jest używanie json_schema w modelach, które go obsługują. |
No | |
| tool_choice | ToolChoiceOptions,ToolChoiceTypes lub ToolChoiceFunction | Jak model powinien wybierać, którego narzędzia (lub narzędzi) użyć podczas generowania odpowiedzi. Zobacz parametr, tools aby zobaczyć, jak określić, które narzędzia model może wywołać. |
Tak | |
| Narzędzia | macierz | Zestaw narzędzi, które model może wywołać podczas generowania odpowiedzi. Możesz określić, którego narzędzia użyć, ustawiając parametr.tool_choiceDwie kategorie narzędzi, które możesz udostępnić modelowi, to: - Narzędzia wbudowane |
Tak | |
| top_p | number | Alternatywą dla próbkowania za pomocą temperatury, zwaną próbkowaniem jądrowym, gdzie model uwzględnia wyniki tokenów o top_p masie prawdopodobieństwa. Zatem 0,1 oznacza, że rozważane są tylko tokeny tworzące 10 najwyższych% masy prawdopodobieństwa. Zazwyczaj zalecamy modyfikację tego lub temperature nie obu tych rzeczy. |
Tak | 1 |
| truncation | wyliczenie | Strategia obcięcia do wykorzystania w odpowiedzi modelu. - auto: Jeśli kontekst tej odpowiedzi i poprzednich przekroczy rozmiar okna kontekstowego modelu, model obcina odpowiedź, aby dopasowała się do okna kontekstu, rezygnując z elementów wejściowych w trakcie rozmowy. - disabled (domyślnie): Jeśli odpowiedź modelu przekroczy rozmiar okna kontekstowego dla modelu, żądanie nie zostanie zadane z błędem 400.Możliwe wartości: auto, disabled |
No | |
| użycie | ResponseUsage | Reprezentuje szczegóły dotyczące użycia tokenów, w tym tokeny wejściowe, tokeny wyjściowe, podział tokenów wyjściowych oraz łączną liczbę użytych tokenów. |
No | |
| użytkownik | ciąg | Unikalny identyfikator reprezentujący użytkownika końcowego, który może pomóc OpenAI monitorować i wykrywać nadużycia. . |
No |
ResponseAudioDeltaEvent
Emitowany jest przy częściowej odpowiedzi dźwiękowej.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| delta | ciąg | Fragment bajtów audio zakodowanych w Base64. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.audio.delta.Możliwe wartości: response.audio.delta |
Tak |
ResponseAudioDoneEvent
Emitowany po zakończeniu odpowiedzi audio.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.audio.done.Możliwe wartości: response.audio.done |
Tak |
ResponseAudioTranscriptDeltaEvent
Emitowany jest wtedy, gdy istnieje częściowy zapis audio.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| delta | ciąg | Częściowa transkrypcja odpowiedzi audio. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.audio.transcript.delta.Możliwe wartości: response.audio.transcript.delta |
Tak |
ResponseAudioTranscriptDoneEvent
Emitowany po ukończeniu pełnej transkrypcji audio.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.audio.transcript.done.Możliwe wartości: response.audio.transcript.done |
Tak |
ResponseCodeInterpreterCallCodeDeltaEvent
Emitowany po dodaniu częściowego fragmentu kodu przez interpreter kodu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| delta | ciąg | Częściowy fragment kodu dodany przez interpretera kodu. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który wywołuje interpreter kodu, jest w trakcie działania. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.code_interpreter_call.code.delta.Możliwe wartości: response.code_interpreter_call.code.delta |
Tak |
ResponseCodeInterpreterCallCodeDoneEvent
Emitowany po finalizacji fragmentu kodu przez interpreter kodu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| kod | ciąg | Ostateczny fragment kodu wychodzący przez interpretera kodu. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który wywołuje interpreter kodu, jest w trakcie działania. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.code_interpreter_call.code.done.Możliwe wartości: response.code_interpreter_call.code.done |
Tak |
ResponseCodeInterpreterCallCompletedEvent
Emitowany po zakończeniu wywołania interpretera kodu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| code_interpreter_call | CodeInterpreterToolCall | Wywołanie narzędzia do uruchamiania kodu. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który wywołuje interpreter kodu, jest w trakcie działania. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.code_interpreter_call.completed.Możliwe wartości: response.code_interpreter_call.completed |
Tak |
ResponseCodeInterpreterCallInProgressEvent
Emitowany podczas wywołania interpretera kodu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| code_interpreter_call | CodeInterpreterToolCall | Wywołanie narzędzia do uruchamiania kodu. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który wywołuje interpreter kodu, jest w trakcie działania. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.code_interpreter_call.in_progress.Możliwe wartości: response.code_interpreter_call.in_progress |
Tak |
ResponseCodeInterpreterCallInterpretingEvent
Emitowany jest, gdy interpreter kodu aktywnie interpretuje fragment kodu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| code_interpreter_call | CodeInterpreterToolCall | Wywołanie narzędzia do uruchamiania kodu. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który wywołuje interpreter kodu, jest w trakcie działania. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.code_interpreter_call.interpreting.Możliwe wartości: response.code_interpreter_call.interpreting |
Tak |
ResponseCompletedEvent
Emitowany po zakończeniu odpowiedzi modelu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| response | response | Tak | ||
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.completed.Możliwe wartości: response.completed |
Tak |
ResponseContentPartAddedEvent
Emitowany jest po dodaniu nowej części zawartości.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| content_index | liczba całkowita | Indeks części zawartości, która została dodana. |
Tak | |
| item_id | ciąg | ID elementu wyjściowego, do którego dodano część zawartości. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, do którego dodano część zawartości. |
Tak | |
| część | OutputContent | Tak | ||
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.content_part.added.Możliwe wartości: response.content_part.added |
Tak |
ResponseContentPartDoneEvent
Emitowany po zakończeniu części treści.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| content_index | liczba całkowita | Indeks części treści, która jest wykonana. |
Tak | |
| item_id | ciąg | ID elementu wyjściowego, do którego dodano część zawartości. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, do którego dodano część zawartości. |
Tak | |
| część | OutputContent | Tak | ||
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.content_part.done.Możliwe wartości: response.content_part.done |
Tak |
ResponseCreatedEvent
Zdarzenie, które jest emitowane podczas tworzenia odpowiedzi.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| response | response | Tak | ||
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.created.Możliwe wartości: response.created |
Tak |
ResponseError
Obiekt błędu zwracany, gdy model nie generuje odpowiedzi.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| kod | ResponseErrorCode | Kod błędu odpowiedzi. |
Tak | |
| komunikat | ciąg | Czytelny opis błędu. |
Tak |
ResponseErrorCode
Kod błędu odpowiedzi.
| Majątek | Wartość |
|---|---|
| Opis | Kod błędu odpowiedzi. |
| Typ | ciąg |
| Wartości | server_errorrate_limit_exceededinvalid_promptvector_store_timeoutinvalid_imageinvalid_image_formatinvalid_base64_imageinvalid_image_urlimage_too_largeimage_too_smallimage_parse_errorimage_content_policy_violationinvalid_image_modeimage_file_too_largeunsupported_image_media_typeempty_image_filefailed_to_download_imageimage_file_not_found |
ResponseErrorEvent
Emitowany po wystąpieniu błędu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| kod | ciąg | Kod błędu. |
Tak | |
| komunikat | ciąg | Komunikat o błędzie. |
Tak | |
| param | ciąg | Parametr błędu. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze error.Możliwe wartości: error |
Tak |
ResponseFailedEvent
Zdarzenie, które jest emitowane, gdy odpowiedź nie zadziała.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| response | response | Tak | ||
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.failed.Możliwe wartości: response.failed |
Tak |
ResponseFileSearchCallCompletedEvent
Emitowany po zakończeniu wywołania wyszukiwania plików (znaleziono wyniki).
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| item_id | ciąg | ID elementu wyjściowego, który jest inicjowany przez wyszukiwanie plików. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który jest inicjowany przez wyszukiwanie plików. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.file_search_call.completed.Możliwe wartości: response.file_search_call.completed |
Tak |
ResponseFileSearchCallInProgressEvent
Emitowany podczas inicjowania wywołania wyszukiwania plików.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| item_id | ciąg | ID elementu wyjściowego, który jest inicjowany przez wyszukiwanie plików. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który jest inicjowany przez wyszukiwanie plików. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.file_search_call.in_progress.Możliwe wartości: response.file_search_call.in_progress |
Tak |
ResponseFileSearchCallSearchingEvent
Emitowany podczas aktualnego wyszukiwania plików.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| item_id | ciąg | ID elementu wyjściowego, który jest inicjowany przez wyszukiwanie plików. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, który wywołuje wyszukiwanie plików. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.file_search_call.searching.Możliwe wartości: response.file_search_call.searching |
Tak |
ResponseFunctionCallArgumentsDeltaEvent
Emitowany, gdy istnieje częściowa delta argumentów wywołania funkcji.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| delta | ciąg | Argumenty wywołania funkcji są dodawane. |
Tak | |
| item_id | ciąg | ID elementu wyjściowego, do którego dodaje się delta argumentów wywołania funkcji. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, do którego dodawany jest delta argumentów wywołania funkcji. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.function_call_arguments.delta.Możliwe wartości: response.function_call_arguments.delta |
Tak |
ResponseFunctionCallArgumentsDoneEvent
Emitowany podczas finalizacji argumentów wywołania funkcji.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| arguments | ciąg | Argumenty wywołania funkcji. | Tak | |
| item_id | ciąg | Identyfikacja przedmiotu. | Tak | |
| output_index | liczba całkowita | Indeks pozycji wyjściowej. | Tak | |
| typ | wyliczenie | Możliwe wartości: response.function_call_arguments.done |
Tak |
ResponseInProgressEvent
Emitowany podczas trwania odpowiedzi.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| response | response | Tak | ||
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.in_progress.Możliwe wartości: response.in_progress |
Tak |
ResponseIncompleteEvent
Zdarzenie emitowane, gdy odpowiedź kończy się jako niepełna.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| response | response | Tak | ||
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.incomplete.Możliwe wartości: response.incomplete |
Tak |
responseItemList
Lista zadań odpowiedzi.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | macierz | Lista elementów użytych do wygenerowania tej odpowiedzi. | Tak | |
| first_id | ciąg | ID pierwszego elementu na liście. | Tak | |
| zawiera_więcej | boolean | Czy dostępnych jest więcej przedmiotów. | Tak | |
| last_id | ciąg | ID ostatniego elementu na liście. | Tak | |
| obiekt | wyliczenie | Typ zwróconego obiektu musi być .listMożliwe wartości: list |
Tak |
ResponseModalities
Typy wyników, które chcesz, aby model generował. Większość modeli potrafi generować tekst, co jest domyślne:
["text"]
Model ten gpt-4o-audio-preview może być również używany do generowania dźwięku. Aby poprosić ten model o generowanie zarówno odpowiedzi tekstowych, jak i audio, możesz użyć:
["text", "audio"]
Nie ma zdefiniowanych właściwości dla tego komponentu.
ResponseModalitiesTextOnly
Typy wyników, które chcesz, aby model generował. Większość modeli potrafi generować tekst, co jest domyślne:
["text"]
To API wkrótce będzie wspierać inne modalności wyjściowe, w tym dźwięk i obrazy.
Nie ma zdefiniowanych właściwości dla tego komponentu.
ResponseOutputItemAddedEvent
Emitowany jest po dodaniu nowego elementu wyjściowego.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| element | OutputItem | Tak | ||
| output_index | liczba całkowita | Indeks dodanego elementu wyjściowego. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.output_item.added.Możliwe wartości: response.output_item.added |
Tak |
ResponseOutputItemDoneEvent
Emitowane, gdy element wyjściowy jest oznaczony jako zakończony.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| element | OutputItem | Tak | ||
| output_index | liczba całkowita | Indeks pozycji wyjściowej, która została oznaczona jako wykonana. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.output_item.done.Możliwe wartości: response.output_item.done |
Tak |
ResponseProperties
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| instructions | ciąg | Wprowadza komunikat systemowy (lub deweloperski) jako pierwszy element w kontekście modelu. Używając razem z previous_response_id, instrukcje z poprzedniej odpowiedzi nie zostaną przeniesione do następnej odpowiedzi. Ułatwia to zamianę komunikatów systemowych (lub deweloperskich) w nowych odpowiedziach. |
No | |
| max_output_tokens | liczba całkowita | Górna granica liczby tokenów, które można wygenerować dla odpowiedzi, w tym widocznych tokenów wyjściowych i stanu rozmowy. |
No | |
| previous_response_id | ciąg | Unikalne ID poprzedniej odpowiedzi na model. Wykorzystaj to do tworzenia wieloturowych rozmów. | No | |
| reasoning | Reasoning | Opcje konfiguracyjne modeli rozumowania. |
No | |
| SMS | obiekt | Opcje konfiguracyjne odpowiedzi tekstowej z modelu. Może to być tekst zwykły lub ustrukturyzowane dane JSON. Więcej informacji: - wejścia i wyjścia tekstowe - Strukturalne wyniki |
No | |
| Format └─ | TextResponseFormatConfiguration | Obiekt określający format, który model musi wyprowadzać. Konfiguracja { "type": "json_schema" } umożliwia Structured Outputs, co zapewnia, że model odpowiada dostarczonemu schematowi JSON. Domyślny format to { "type": "text" } brak dodatkowych opcji.Nie zaleca się dla modeli GPT-4O i nowszych: Ustawienie na { "type": "json_object" } włączenie starszego trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON. Preferowane jest używanie json_schema w modelach, które go obsługują. |
No | |
| tool_choice | ToolChoiceOptions,ToolChoiceTypes lub ToolChoiceFunction | Jak model powinien wybierać, którego narzędzia (lub narzędzi) użyć podczas generowania odpowiedzi. Zobacz parametr, tools aby zobaczyć, jak określić, które narzędzia model może wywołać. |
No | |
| Narzędzia | macierz | Zestaw narzędzi, które model może wywołać podczas generowania odpowiedzi. Możesz określić, którego narzędzia użyć, ustawiając parametr.tool_choiceDwie kategorie narzędzi, które możesz udostępnić modelowi, to: - Narzędzia wbudowane |
No | |
| truncation | wyliczenie | Strategia obcięcia do wykorzystania w odpowiedzi modelu. - auto: Jeśli kontekst tej odpowiedzi i poprzednich przekroczy rozmiar okna kontekstowego modelu, model obcina odpowiedź, aby dopasowała się do okna kontekstu, rezygnując z elementów wejściowych w trakcie rozmowy. - disabled (domyślnie): Jeśli odpowiedź modelu przekroczy rozmiar okna kontekstowego dla modelu, żądanie nie zostanie zadane z błędem 400.Możliwe wartości: auto, disabled |
No |
ResponseRefusalDeltaEvent
Emitowany jest przy częściowej odmowie.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| content_index | liczba całkowita | Indeks części treści, do której dodany jest tekst odmowy. |
Tak | |
| delta | ciąg | Tekst odmowy, który jest dodawany. |
Tak | |
| item_id | ciąg | ID elementu wyjściowego, do którego dodany jest tekst odmowy. |
Tak | |
| output_index | liczba całkowita | Indeks pozycji wyjściowej, do której dodawany jest tekst odmowy. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.refusal.delta.Możliwe wartości: response.refusal.delta |
Tak |
ResponseRefusalDoneEvent
Emitowany jest, gdy tekst odmowy jest finalizowany.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| content_index | liczba całkowita | Indeks części treści, w której tekst odmowy jest finalizowany. |
Tak | |
| item_id | ciąg | ID pozycji wyjściowej, którą tekst odmowy jest finalizowany. |
Tak | |
| output_index | liczba całkowita | Indeks pozycji wyjściowej, w której tekst odmowy jest finalizowany. |
Tak | |
| refusal | ciąg | Tekst odmowy, który jest finalizowany. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.refusal.done.Możliwe wartości: response.refusal.done |
Tak |
responseStreamEvent
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| adnotacja | Annotation | Tak | ||
| annotation_index | liczba całkowita | Indeks dodanej adnotacji. |
Tak | |
| arguments | ciąg | Argumenty wywołania funkcji. | Tak | |
| kod | ciąg | Kod błędu. |
Tak | |
| code_interpreter_call | CodeInterpreterToolCall | Wywołanie narzędzia do uruchamiania kodu. |
Tak | |
| content_index | liczba całkowita | Indeks części treści, w której tekst jest finalizowany. |
Tak | |
| delta | ciąg | Dodana delta tekstu. |
Tak | |
| element | OutputItem | Element wyjściowy, który został oznaczony jako gotowy. |
Tak | |
| item_id | ciąg | ID elementu wyjściowego, którego treść tekstu jest finalizowana. |
Tak | |
| komunikat | ciąg | Komunikat o błędzie. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, którego treść tekstu jest finalizowana. |
Tak | |
| param | ciąg | Parametr błędu. |
Tak | |
| część | OutputContent | Część dotycząca treści jest już załatwiona. |
Tak | |
| refusal | ciąg | Tekst odmowy, który jest finalizowany. |
Tak | |
| response | response | Odpowiedź była niepełna. |
Tak | |
| SMS | ciąg | Treść tekstu, która jest finalizowana. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.output_text.done.Możliwe wartości: response.output_text.done |
Tak |
ResponseTextAnnotationDeltaEvent
Emitowany jest przy dodawaniu adnotacji tekstowej.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| adnotacja | Annotation | Tak | ||
| annotation_index | liczba całkowita | Indeks dodanej adnotacji. |
Tak | |
| content_index | liczba całkowita | Indeks części treści, do której dodano adnotację tekstową. |
Tak | |
| item_id | ciąg | ID elementu wyjściowego, do którego dodano adnotację tekstową. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, do którego dodano adnotację tekstową. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.output_text.annotation.added.Możliwe wartości: response.output_text.annotation.added |
Tak |
ResponseTextDeltaEvent
Emitowany jest, gdy pojawia się dodatkowa delta tekstu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| content_index | liczba całkowita | Indeks części treści, do której dodano delta tekstu. |
Tak | |
| delta | ciąg | Dodana delta tekstu. |
Tak | |
| item_id | ciąg | ID elementu wyjściowego, do którego dodano delta tekstu. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, do którego dodano delta tekstu. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.output_text.delta.Możliwe wartości: response.output_text.delta |
Tak |
ResponseTextDoneEvent
Emitowany podczas finalizacji treści tekstowej.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| content_index | liczba całkowita | Indeks części treści, w której tekst jest finalizowany. |
Tak | |
| item_id | ciąg | ID elementu wyjściowego, którego treść tekstu jest finalizowana. |
Tak | |
| output_index | liczba całkowita | Indeks elementu wyjściowego, którego treść tekstu jest finalizowana. |
Tak | |
| SMS | ciąg | Treść tekstu, która jest finalizowana. |
Tak | |
| typ | wyliczenie | Rodzaj wydarzenia. Zawsze response.output_text.done.Możliwe wartości: response.output_text.done |
Tak |
ResponseUsage
Reprezentuje szczegóły dotyczące użycia tokenów, w tym tokeny wejściowe, tokeny wyjściowe, podział tokenów wyjściowych oraz łączną liczbę użytych tokenów.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| input_tokens | liczba całkowita | Liczba tokenów wejściowych. | Tak | |
| output_tokens | liczba całkowita | Liczba tokenów wyjściowych. | Tak | |
| output_tokens_details | obiekt | Szczegółowy podział tokenów wyjściowych. | Tak | |
| └─ tokeny_rozumowania | liczba całkowita | Liczba tokenów rozumowania. | No | |
| total_tokens | liczba całkowita | Całkowita liczba użytych żetonów. | Tak |
Screenshot
Akcja zrzutu ekranu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | wyliczenie | Określa typ zdarzenia. Dla akcji zrzutu ekranu ta właściwość jest zawsze ustawiona na .screenshotMożliwe wartości: screenshot |
Tak |
Scroll
Akcja przewijania.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| scroll_x | liczba całkowita | Odległość przewijania pozioma. |
Tak | |
| scroll_y | liczba całkowita | Pionowy przewijanie. |
Tak | |
| typ | wyliczenie | Określa typ zdarzenia. Dla akcji przewijania ta właściwość jest zawsze ustawiona na .scrollMożliwe wartości: scroll |
Tak | |
| x | liczba całkowita | Współrzędna x, gdzie powstał zwój. |
Tak | |
| Y | liczba całkowita | Współrzędna y, gdzie powstał zwój. |
Tak |
StopConfiguration
Do 4 sekwencji, w których API przestaje generować kolejne tokeny. Zwrócony tekst nie będzie zawierał sekwencji stop.
Ten składnik może być jednym z następujących elementów:
TextResponseFormatConfiguration
Obiekt określający format, który model musi wyprowadzać.
Konfiguracja { "type": "json_schema" } umożliwia Structured Outputs, które zapewniają, że model odpowiada dostarczonemu schematowi JSON.
Domyślny format to { "type": "text" } brak dodatkowych opcji.
Nie zaleca się dla modeli GPT-4O i nowszych:
Ustawienie na { "type": "json_object" } włączenie starszego trybu JSON, który zapewnia, że komunikat generowany przez model jest poprawny w JSON. Preferowane jest używanie json_schema w modelach, które go obsługują.
Ten składnik może być jednym z następujących elementów:
TextResponseFormatJsonSchema
Format odpowiedzi JSON Schema. Używany do generowania ustrukturyzowanych odpowiedzi JSON. Dowiedz się więcej o Structured Outputs.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| opis | ciąg | Opis formatu odpowiedzi, używany przez model do określenia, jak odpowiedzieć w formacie. |
No | |
| nazwa | ciąg | Nazwa formatu odpowiedzi. Musi być od A do Z, A-Z, 0-9 lub zawierać podkreślenia i kreski, a maksymalna długość to 64. |
No | |
| schemat | ResponseFormatJsonSchemaSchema | Schemat formatu odpowiedzi, opisany jako obiekt schematu JSON. | Tak | |
| surowy | boolean | Czy należy umożliwić ścisłe przestrzeganie schematu podczas generowania wyniku. Jeśli ustawimy na true, model zawsze będzie podążał za dokładnym schematem zdefiniowanym schema w polu. Obsługiwany jest tylko podzbiór schematu JSON, gdy strict jest .true |
No | Nieprawda |
| typ | wyliczenie | Rodzaj formatu odpowiedzi, który jest definiowany. Zawsze json_schema.Możliwe wartości: json_schema |
Tak |
Narzędzie
Ten składnik może być jednym z następujących elementów:
ToolChoiceFunction
Użyj tej opcji, aby wymusić wywołanie konkretnej funkcji w modelu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| nazwa | ciąg | Nazwa funkcji, którą trzeba wywołać. | Tak | |
| typ | wyliczenie | Dla wywoływania funkcji typ zawsze jest .functionMożliwe wartości: function |
Tak |
ToolChoiceOptions
Kontroluje, które (jeśli w ogóle) narzędzie jest wywoływane przez model.
none oznacza to, że model nie wywołuje żadnego narzędzia, lecz generuje komunikat.
auto oznacza to, że model może wybrać między generowaniem wiadomości a wywołaniem jednego lub więcej narzędzi.
required oznacza, że model musi wywołać jedno lub więcej narzędzi.
| Majątek | Wartość |
|---|---|
| Opis | Kontroluje, które (jeśli w ogóle) narzędzie jest wywoływane przez model.none oznacza to, że model nie wywołuje żadnego narzędzia, lecz generuje komunikat.auto oznacza to, że model może wybrać między generowaniem wiadomości a wywołaniem jednego lub więcej narzędzi.required oznacza, że model musi wywołać jedno lub więcej narzędzi. |
| Typ | ciąg |
| Wartości | noneautorequired |
ToolChoiceTypes
Wskazuje, że model powinien używać wbudowanego narzędzia do generowania odpowiedzi.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | wyliczenie | Typ narzędzia hostowanego, którego model powinien używać. Dozwolone wartości to: - file_search- computer_use_previewMożliwe wartości: file_search, computer_use_preview |
Tak |
Typ
To akcja wpisywania tekstu.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| SMS | ciąg | Tekst do wpisania. |
Tak | |
| typ | wyliczenie | Określa typ zdarzenia. Dla działania typu ta własność jest zawsze ustawiona na .typeMożliwe wartości: type |
Tak |
UpdateVectorStoreFileAttributesRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| attributes | VectorStoreFileAttributes | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie oraz do zapytań o obiekty za pomocą API lub pulpitu. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków, wartości boole lub liczby. |
Tak |
UrlCitation
Cytowanie dla zasobu internetowego używanego do generowania odpowiedzi modelowej.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| end_index | liczba całkowita | Indeks ostatniego znaku cytowania URL w wiadomości. |
Tak | |
| start_index | liczba całkowita | Indeks pierwszego znaku cytowania URL w wiadomości. |
Tak | |
| tytuł | ciąg | Tytuł zasobu internetowego. |
Tak | |
| typ | wyliczenie | Rodzaj cytowania URL. Zawsze url_citation.Możliwe wartości: url_citation |
Tak | |
| Adres url | ciąg | URL zasobu internetowego. |
Tak |
VectorStoreFileAttributes
Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie oraz do zapytań o obiekty za pomocą API lub pulpitu. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków, wartości boole lub liczby.
Nie ma zdefiniowanych właściwości dla tego komponentu.
VectorStoreFileContentResponse
Reprezentuje analizę zawartości pliku pamięci wektorowej.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | macierz | Przeanalizowałem zawartość pliku. | Tak | |
| zawiera_więcej | boolean | Wskazuje, czy jest więcej stron z treścią do pobrania. | Tak | |
| next_page | ciąg | Żeton na następną stronę, jeśli taki jest. | Tak | |
| obiekt | wyliczenie | Typ obiektu, który zawsze jest vector_store.file_content.pageMożliwe wartości: vector_store.file_content.page |
Tak |
VectorStoreSearchRequest
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| filters | ComparisonFilter lub CompoundFilter | Filtr do stosowania na podstawie atrybutów pliku. | No | |
| maks_liczba_wyników | liczba całkowita | Maksymalna liczba wyników do zwrócenia. Ta liczba powinna mieścić się w zakresie od 1 do 50 włącznie. | No | 10 |
| kwerenda | ciąg lub tablica | Ciąg zapytania do wyszukiwania | Tak | |
| opcje rankingu | obiekt | Opcje rankingu w wyszukiwarce. | No | |
| └} ranker | wyliczenie | Możliwe wartości: auto, default-2024-11-15 |
No | |
| └─ próg_punktowy | number | No | 0 | |
| rewrite_query | boolean | Czy przepisać zapytanie w języku naturalnym dla wyszukiwania wektorowego. | No | Nieprawda |
VectorStoreSearchResultContentObject
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| SMS | ciąg | Treść tekstu wróciła z wyszukiwania. | Tak | |
| typ | wyliczenie | Rodzaj treści. Możliwe wartości: text |
Tak |
VectorStoreSearchResultItem
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| attributes | VectorStoreFileAttributes | Zestaw 16 par klucz-wartość, które można przypisać do obiektu. Może to być przydatne do przechowywania dodatkowych informacji o obiekcie w uporządkowanym formacie oraz do zapytań o obiekty za pomocą API lub pulpitu. Klucze to ciągi o maksymalnej długości 64 znaków. Wartości to ciągi o maksymalnej długości 512 znaków, wartości boole lub liczby. |
Tak | |
| zawartość | macierz | Fragmenty zawartości z pliku. | Tak | |
| identyfikator_pliku | ciąg | ID pliku pamięci wektorowej. | Tak | |
| filename | ciąg | Nazwa pliku pamięci wektorowej. | Tak | |
| wynik | number | Ocena podobieństwa do efektu. | Tak |
VectorStoreSearchResultsPage
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | macierz | Lista wyników wyszukiwania. | Tak | |
| zawiera_więcej | boolean | Wskazuje, czy jest więcej wyników do pobrania. | Tak | |
| next_page | ciąg | Żeton na następną stronę, jeśli taki jest. | Tak | |
| obiekt | wyliczenie | Typ obiektu, który zawsze jest vector_store.search_results.pageMożliwe wartości: vector_store.search_results.page |
Tak | |
| search_query | macierz | Tak |
VoiceIdsShared
Nie ma zdefiniowanych właściwości dla tego komponentu.
Wait
Akcja czekania.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| typ | wyliczenie | Określa typ zdarzenia. Dla akcji oczekiwania ta właściwość jest zawsze ustawiona na .waitMożliwe wartości: wait |
Tak |
ReasoningEffort
Ogranicza wysiłek związany z rozumowaniem dla modeli rozumowania. Obecnie obsługiwane wartości to low, medium, oraz high. Zmniejszenie wysiłku rozumowania może skutkować szybszymi odpowiedziami i mniejszą liczbą tokenów używanych do rozumowania w odpowiedzi.
| Majątek | Wartość |
|---|---|
| Opis | Ogranicza wysiłek związany z rozumowaniem dla modeli rozumowania. Obecnie obsługiwane wartości to low, medium, oraz high. Zmniejszenie wysiłku rozumowania może skutkować szybszymi odpowiedziami i mniejszą liczbą tokenów używanych do rozumowania w odpowiedzi. |
| Typ | ciąg |
| Wartość domyślna | nośnik |
| Wartości | lowmediumhigh |
errorEvent
Występuje, gdy pojawia się błąd. Może się to zdarzyć z powodu wewnętrznego błędu serwera lub przerwy czasowej.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | error | Tak | ||
| wydarzenie | ciąg | Tak |
event Enum: ErrorEventEnum
| Wartość | Opis |
|---|---|
| błąd |
doneEvent
Dzieje się, gdy strumień się kończy.
| Name | Typ | Opis | Obowiązkowy | Wartość domyślna |
|---|---|---|---|---|
| dane | ciąg | Tak | ||
| wydarzenie | ciąg | Tak |
event Enum: DoneEventEnum
| Wartość | Opis |
|---|---|
| Gotowe |
data Enum: DoneEventDataEnum
| Wartość | Opis |
|---|---|
| [GOTOWE] |
Następne kroki
Dowiedz się o modelach i dopracowywaniu z API REST. Dowiedz się więcej na temat modeli underlying, które zasilają Azure OpenAI.