@azure/ai-voicelive package
Klasy
| VoiceLiveAuthenticationError |
Klasa błędu uwierzytelniania dla operacji Voice Live |
| VoiceLiveClient |
Klient VoiceLive zapewnia zarządzanie sesjami dla możliwości konwersacyjnej AI w czasie rzeczywistym. Ten klient działa jako fabryka do tworzenia instancji VoiceLiveSession, które obsługują rzeczywiste połączenia WebSocket oraz interakcje w czasie rzeczywistym z usługą. |
| VoiceLiveConnectionError |
Podstawowa klasa błędu dla operacji Voice Live WebSocket |
| VoiceLiveError |
Ogólna klasa błędu Voice Live |
| VoiceLiveProtocolError |
Klasa błędu protokołu dla operacji wiadomości na żywo w Voice Live |
| VoiceLiveSession |
Reprezentuje sesję opartą na WebSocket do komunikacji głosowej w czasie rzeczywistym z usługą Azure VoiceLive. Ten kurs zarządza połączeniem, obsługuje komunikację w czasie rzeczywistym i zapewnia dostęp do wszystkich interaktywnych funkcji, w tym streamingu audio, zarządzania rozmowami oraz kontroli awatarów. |
Interfejsów
| AgentConfig |
Konfiguracja dla agenta. |
| AgentSessionConfig |
Konfiguracja tworzenia sesji z agentem jako głównym aktorem AI. Podczas korzystania z sesji agenta konfiguracja agenta (narzędzia, instrukcje, temperatura itp.) jest zarządzana w portalu Foundry, a nie w kodzie sesji. |
| Animation |
Konfiguracja wyjść animacji, w tym metadane blendshape'ów i wizemów. |
| AssistantMessageItem |
Wiadomość asystenta w ramach rozmowy. |
| AudioEchoCancellation |
Konfiguracja anulowania echa na potrzeby przetwarzania dźwięku po stronie serwera. |
| AudioInputTranscriptionOptions |
Konfiguracja transkrypcji dźwięku wejściowego. |
| AudioNoiseReduction |
Konfiguracja redukcji szumu dźwięku wejściowego. |
| AudioStreamOptions | |
| AvatarConfig |
Konfiguracja streamingu awatara oraz zachowanie podczas sesji. |
| AzureCustomVoice |
Azure custom voice configuration. |
| AzurePersonalVoice |
Konfiguracja osobistego głosu platformy Azure. |
| AzureSemanticDetection |
Wykrywanie końca wypowiedzi platformy Azure (ustawienie domyślne). |
| AzureSemanticDetectionEn |
Azure semantic end-of-utterance detection (English-optimized). |
| AzureSemanticDetectionMultilingual |
Azure semantic end-of-utterance detection (multilingual). |
| AzureSemanticVad |
Server Speech Detection (Azure semantic VAD, domyślny wariant). |
| AzureSemanticVadEn |
Server Speech Detection (Azure semantic VAD, tylko po angielsku). |
| AzureSemanticVadMultilingual |
Server Speech Detection (Azure semantic VAD). |
| AzureStandardVoice |
Standardowa konfiguracja głosu platformy Azure. |
| AzureVoice |
Podstawowe informacje na potrzeby konfiguracji głosowych platformy Azure. |
| Background |
Definiuje tło wideo, zarówno w jednolitym kolorze, jak i w postaci URL obrazu (wzajemnie wykluczające się). |
| CachedTokenDetails |
Szczegóły dotyczące wykorzystania tokenów wyjściowych. |
| ClientEvent |
Wydarzenie dla klienta Voicelive. |
| ClientEventConversationItemCreate |
Dodaj nowy element do kontekstu rozmowy, w tym wiadomości, wywołania funkcji oraz odpowiedzi na wywołania funkcji. To zdarzenie może być używane zarówno do wypełniania "historii" rozmowy, jak i do dodawania nowych elementów w trakcie transmisji, ale ma obecne ograniczenie, że nie może wypełniać komunikatów audio asystenta.
Jeśli zakończy się sukcesem, serwer odpowie zdarzeniem |
| ClientEventConversationItemDelete |
Wyślij to zdarzenie, gdy chcesz usunąć dowolny element z historii rozmów. Serwer odpowie zdarzeniem |
| ClientEventConversationItemRetrieve |
Wyślij to zdarzenie, gdy chcesz odzyskać reprezentację serwera konkretnego elementu w historii rozmów. Jest to przydatne na przykład do inspekcji dźwięku użytkownika po redukcji szumów i VAD.
Serwer odpowie zdarzeniem |
| ClientEventConversationItemTruncate |
Wyślij to zdarzenie, aby skrócić dźwięk poprzedniej wiadomości asystenta. Serwer generuje dźwięk szybciej niż voicelive, więc to zdarzenie jest przydatne, gdy użytkownik przerywa dźwięk, który już został wysłany do klienta, ale jeszcze nie został odtworzony. To zsynchronizuje rozumienie dźwięku przez serwer z odtwarzaniem klienta.
Skracanie dźwięku usuwa transkrypcję tekstu po stronie serwera, aby upewnić się, że nie ma tekstu w kontekście, który nie został usłyszany przez użytkownika.
Jeśli się powiedzie, serwer odpowie zdarzeniem |
| ClientEventInputAudioBufferAppend |
Wyślij to zdarzenie, aby dodać bajty audio do bufora audio wejściowego. Bufor audio jest magazynem tymczasowym, do którego można zapisywać dane, a następnie zatwierdzać. W trybie serwera VAD bufor audio służy do wykrywania mowy, a serwer decyduje, kiedy zatwierdzić mowę. Gdy VAD serwera jest wyłączony, musisz ręcznie zatwierdzać bufor audio. Klient może wybrać, ile dźwięku umieścić w każdym zdarzeniu do maksymalnie 15 MiB, na przykład przesyłanie mniejszych fragmentów z klienta może pozwolić VAD-owi być bardziej responsywnym. W przeciwieństwie do innych utworzonych zdarzeń klienckich, serwer nie wysyła odpowiedzi potwierdzającej na to zdarzenie. |
| ClientEventInputAudioBufferClear |
Wyślij to zdarzenie, aby usunąć bajty audio w buforze. Serwer odpowie zdarzeniem |
| ClientEventInputAudioBufferCommit |
Wyślij to zdarzenie, aby zatwierdzać bufor audio wejściowy użytkownika, co utworzy nowy element wiadomości użytkownika w rozmowie. To zdarzenie wywoła błąd, jeśli bufor audio wejściowy jest pusty. W trybie serwera VAD klient nie musi wysyłać tego zdarzenia, serwer automatycznie zatwierdza bufor audio.
Zatwierdzenie bufora audio wejściowego wywoła transkrypcję audio wejściowej (jeśli jest włączona w konfiguracji sesji), ale nie generuje odpowiedzi z modelu. Serwer odpowie zdarzeniem |
| ClientEventInputAudioClear |
Usuwa cały dźwięk wejściowy, który jest obecnie streamowany. |
| ClientEventInputAudioTurnAppend |
Dodaje dane audio do trwającej tury wejściowej. |
| ClientEventInputAudioTurnCancel |
Anuluje toczący się ruch audio wejściowy. |
| ClientEventInputAudioTurnEnd |
Oznacza koniec tury wejścia audio. |
| ClientEventInputAudioTurnStart |
Oznacza początek nowego zwrotu wejścia audio. |
| ClientEventResponseCancel |
Wyślij to zdarzenie, aby anulować odpowiedź w trakcie trwania. Serwer odpowie zdarzeniem |
| ClientEventResponseCreate |
To zdarzenie instruuje serwer do utworzenia odpowiedzi, co oznacza wywołanie wnioskowania modelu. W trybie VAD serwera serwer automatycznie tworzy odpowiedzi.
Odpowiedź będzie zawierać co najmniej jeden Przedmiot, a może mieć dwa, w takim przypadku drugi będzie wywołaniem funkcji. Te elementy zostaną dołączone do historii rozmów.
Serwer odpowie |
| ClientEventSessionAvatarConnect |
Wysyłane, gdy klient łączy się i dostarcza swój SDP (Session Description Protocol) Do negocjacji medialnych związanych z Avatarem. |
| ClientEventSessionUpdate |
Wyślij to zdarzenie, aby zaktualizować domyślną konfigurację sesji.
Klient może wysłać to zdarzenie w dowolnym momencie, aby zaktualizować dowolne pole, z wyjątkiem |
| ConnectOptions | |
| ConnectedEventArgs |
Argumenty podawane po nawiązaniu połączenia |
| ConnectionContext |
Informacje kontekstowe przekazywane obsługiwaczom powiązanym z połączeniem |
| ContentPart |
Podstawa dla każdej części zawartości; rozróżnione przez |
| ConversationItemBase |
Element, który ma zostać dodany do konwersacji. |
| ConversationRequestItem |
Podstawa dla każdego przedmiotu odpowiedzi; rozróżnione przez |
| CreateSessionOptions | |
| DisconnectedEventArgs |
Argumenty dostarczane po utracie połączenia |
| EouDetection |
Konfiguracja detekcji semantycznej na poziomie najwyższego poziomu dla detekcji semantycznej na końcu wypowiedzi (EOU). |
| ErrorEventArgs |
Argumenty dostarczane w przypadku błędu |
| ErrorResponse |
Standardowa obwiednia odpowiedzi na błędy. |
| FunctionCallItem |
Element wywołania funkcji w rozmowie. |
| FunctionCallOutputItem |
Wywołanie funkcji wywołuje element wyjściowy w ramach rozmowy. |
| FunctionTool |
Definicja narzędzia funkcji używanego przez endpoint voicelive. |
| IceServer |
Konfiguracja serwera ICE na potrzeby negocjacji połączenia WebRTC. |
| InputAudioContentPart |
Część dotycząca wprowadzania treści audio. |
| InputTextContentPart |
Część dotycząca wprowadzania tekstu. |
| InputTokenDetails |
Szczegóły dotyczące wykorzystania tokenów wejściowych. |
| InterimResponseConfigBase |
Podstawowy model konfiguracji interim response. |
| LlmInterimResponseConfig |
Konfiguracja do generowania tymczasowych odpowiedzi opartych na LLM. Wykorzystuje LLM do generowania kontekstowo świadomych odpowiedzi tymczasowych, gdy spełniony jest dowolny warunek wyzwalający. |
| LogProbProperties |
Pojedynczy log prawdopodobieństwa dla tokena. |
| MCPApprovalResponseRequestItem |
Element żądania reprezentujący odpowiedź na wniosek o zatwierdzenie MCP. |
| MCPServer |
Definicja serwera MCP używanego przez punkt końcowy voicelive. |
| MCPTool |
Reprezentuje definicję narzędzia mcp. |
| MessageContentPart |
Podstawa dla każdej części treści przekazu; rozróżnione przez |
| MessageItem |
Wiadomość w rozmowie. |
| OpenAIVoice |
Konfiguracja głosu OpenAI z jawnym polem typu. Zapewnia to zunifikowany interfejs dla głosów OpenAI, uzupełniający istniejący OAIVoice oparty na łańcuchach znaków pod względem kompatybilności wstecznej. |
| OutputTextContentPart |
Część z tekstem wyjściowym. |
| OutputTokenDetails |
Szczegóły dotyczące wykorzystania tokenów wyjściowych. |
| RequestAudioContentPart |
Część z treścią audio na prośbę. Jest to obsługiwane wyłącznie przez modele czasu rzeczywistego (np. gpt-realtime). Dla modeli tekstowych użyj |
| RequestImageContentPart |
Część dotycząca wprowadzania treści obrazowych. |
| RequestSession |
Podstawa do konfiguracji sesji współdzielonej między żądaniem a odpowiedzią. |
| RequestTextContentPart |
Część tekstowa na prośbę. |
| Response |
Zasób odpowiedzi. |
| ResponseAudioContentPart |
Fragment treści audio jako odpowiedź. |
| ResponseCancelledDetails |
Szczegóły dotyczące anulowanej odpowiedzi. |
| ResponseCreateParams |
Stwórz nową odpowiedź VoiceLive z tymi parametrami |
| ResponseFailedDetails |
Szczegóły po nieudanej odpowiedzi. |
| ResponseFunctionCallItem |
Element wywołania funkcji w rozmowie. |
| ResponseFunctionCallOutputItem |
Wywołanie funkcji wywołuje element wyjściowy w ramach rozmowy. |
| ResponseIncompleteDetails |
Szczegóły w przypadku niepełnej odpowiedzi. |
| ResponseItem |
Podstawa dla każdego przedmiotu odpowiedzi; rozróżnione przez |
| ResponseMCPApprovalRequestItem |
Element odpowiedzi reprezentujący żądanie zatwierdzenia wywołania narzędzia MCP. |
| ResponseMCPApprovalResponseItem |
Element odpowiedzi reprezentujący odpowiedź na wniosek o zatwierdzenie MCP. |
| ResponseMCPCallItem |
Element odpowiedzi reprezentujący wywołanie do narzędzia MCP. |
| ResponseMCPListToolItem |
Element odpowiedzi, który wymienia narzędzia dostępne na serwerze MCP. |
| ResponseMessageItem |
Podstawowy typ wiadomości w rozmowie. |
| ResponseSession |
Podstawa konfiguracji sesji w odpowiedzi. |
| ResponseStatusDetails |
Baza do wszystkich szczegółów odpowiedzi bez sukcesu. |
| ResponseTextContentPart |
Część tekstowa jako odpowiedź. |
| SendEventOptions | |
| ServerEvent |
Wydarzenie serwera VoiceLive. |
| ServerEventConversationItemCreated |
Zwraca się, gdy zostanie utworzony element rozmowy. Istnieje kilka scenariuszy, które generują to zdarzenie:
|
| ServerEventConversationItemDeleted |
Zwraca się, gdy klient usuwa element w rozmowie z wydarzeniem |
| ServerEventConversationItemInputAudioTranscriptionCompleted |
To zdarzenie jest wyjściem transkrypcji audio dla użytkownika zapisanego do bufora audio użytkownika. Transkrypcja rozpoczyna się, gdy wejściowy bufor audio jest zatwierdzany przez klienta lub serwer (w |
| ServerEventConversationItemInputAudioTranscriptionDelta |
Zwraca się, gdy wartość tekstowa części transkrypcji audio wejściowej jest aktualizowana. |
| ServerEventConversationItemInputAudioTranscriptionFailed |
Zwraca się, gdy transkrypcja audio wejściowa zostanie skonfigurowana, a żądanie transkrypcji wiadomości użytkownika zakończy się niepowodzeniem. Te zdarzenia są oddzielne od innych |
| ServerEventConversationItemRetrieved |
Zwracane, gdy element rozmowy zostanie pobrany z . |
| ServerEventConversationItemTruncated |
Zwraca się, gdy wcześniejszy element wiadomości audio asystenta jest skracany przez klienta zdarzeniem |
| ServerEventError |
Zwraca się, gdy wystąpi błąd, który może być problemem klienta lub serwera. Większość błędów jest do odzyskania, a sesja pozostanie otwarta; zalecamy implementatorom domyślne monitorowanie i logowanie komunikatów o błędach. |
| ServerEventErrorDetails |
Szczegóły błędu. |
| ServerEventInputAudioBufferCleared |
Zwraca się, gdy klient wyczyści bufor audio za pomocą zdarzenia. |
| ServerEventInputAudioBufferCommitted |
Zwracany po zatwierdzeniu bufora audio wejściowego, czy to przez klienta, czy automatycznie w trybie serwera VAD. Właściwością |
| ServerEventInputAudioBufferSpeechStarted |
Wysyłane przez serwer w trybie działania |
| ServerEventInputAudioBufferSpeechStopped |
Wraca w tryb, |
| ServerEventMcpListToolsCompleted |
Komunikat o ukończeniu listy narzędzi MCP. |
| ServerEventMcpListToolsFailed |
Komunikat o niepowodzeniu na liście narzędzi MCP. |
| ServerEventMcpListToolsInProgress |
MCP lista narzędzi w trakcie rozgrywek. |
| ServerEventResponseAnimationBlendshapeDelta |
Reprezentuje delta aktualizację klatek animacji blendshape dla konkretnego wyjścia odpowiedzi. |
| ServerEventResponseAnimationBlendshapeDone |
Oznacza zakończenie przetwarzania animacji blendshape dla konkretnego wyjścia odpowiedzi. |
| ServerEventResponseAnimationVisemeDelta |
Oznacza aktualizację delty identyfikatora viseme dla animacji opartej na dźwięku. |
| ServerEventResponseAnimationVisemeDone |
Oznacza zakończenie dostarczenia animacji wizemy dla odpowiedzi. |
| ServerEventResponseAudioDelta |
Zwraca się po aktualizacji dźwięku generowanego przez model. |
| ServerEventResponseAudioDone |
Zwraca się, gdy dźwięk generowany przez model jest gotowy. Emitowane są także wtedy, gdy odpowiedź jest przerwana, niepełna lub anulowana. |
| ServerEventResponseAudioTimestampDelta |
Oznacza delta czasu na poziomie słów audio dla odpowiedzi. |
| ServerEventResponseAudioTimestampDone |
Oznacza zakończenie dostarczania czasu dźwięku na odpowiedź. |
| ServerEventResponseAudioTranscriptDelta |
Zwracane po aktualizacji transkrypcji wydanych dźwięków generowanych przez model. |
| ServerEventResponseAudioTranscriptDone |
Zwracane, gdy wygenerowana przez model transkrypcja wyjścia audio zakończy się strumieniowaniem. Emitowane są także wtedy, gdy odpowiedź jest przerwana, niepełna lub anulowana. |
| ServerEventResponseContentPartAdded |
Zwraca, gdy nowa część treści jest dodawana do elementu wiadomości asystenta podczas generowania odpowiedzi. |
| ServerEventResponseContentPartDone |
Zwraca się, gdy część treści zakończy transmisję w elemencie wiadomości asystenta. Emitowane są także wtedy, gdy odpowiedź jest przerwana, niepełna lub anulowana. |
| ServerEventResponseCreated |
Zwraca się, gdy utworzono nową odpowiedź. Pierwsze zdarzenie tworzenia odpowiedzi, gdzie odpowiedź znajduje się w stanie początkowym . |
| ServerEventResponseDone |
Zwraca się, gdy odpowiedź zakończy streamowanie. Zawsze emitowane, bez względu na ostateczny stan. Obiekt Response zawarty |
| ServerEventResponseFunctionCallArgumentsDelta |
Zwraca się, gdy argumenty wywołań funkcji generowanych przez model są aktualizowane. |
| ServerEventResponseFunctionCallArgumentsDone |
Zwraca się, gdy argumenty wywołania funkcji generowanych przez model zakończą streaming. Emitowane są także wtedy, gdy odpowiedź jest przerwana, niepełna lub anulowana. |
| ServerEventResponseMcpCallArgumentsDelta |
Reprezentuje aktualizację delty argumentów dla wywołania narzędzia MCP. |
| ServerEventResponseMcpCallArgumentsDone |
Oznacza zakończenie argumentów dla wywołania narzędzia MCP. |
| ServerEventResponseMcpCallCompleted |
Oznacza, że połączenie MCP zostało zakończone. |
| ServerEventResponseMcpCallFailed |
Wskazuje, że połączenie MCP się nie powiodło. |
| ServerEventResponseMcpCallInProgress |
Wskazuje, że połączenie MCP jest w trakcie. |
| ServerEventResponseOutputItemAdded |
Zwracany, gdy podczas generowania Odpowiedzi powstaje nowy Przedmiot. |
| ServerEventResponseOutputItemDone |
Zwraca się, gdy przedmiot zakończy streaming. Emitowane są także wtedy, gdy odpowiedź jest przerwana, niepełna lub anulowana. |
| ServerEventResponseTextDelta |
Zwraca się, gdy wartość tekstowa części "tekstowej" zostaje zaktualizowana. |
| ServerEventResponseTextDone |
Zwraca się, gdy wartość tekstowa części "tekstowej" zakończy transmisję. Emitowane są także wtedy, gdy odpowiedź jest przerwana, niepełna lub anulowana. |
| ServerEventSessionAvatarConnecting |
Wysyłany podczas nawiązywania połączenia medialnego z awatarem przez serwer i udziela odpowiedzi SDP. |
| ServerEventSessionCreated |
Zwraca się po utworzeniu sesji. Emitowane automatycznie po nawiązaniu nowego połączenia jako pierwsze zdarzenie serwera. To zdarzenie będzie zawierać domyślną konfigurację sesji. |
| ServerEventSessionUpdated |
Zwraca się, gdy sesja zostanie zaktualizowana o |
| ServerVad |
Podstawowy model wykrywania skrętów oparty na VAD. |
| SessionBase |
Konfiguracja obiektu sesji VoiceLive. |
| SessionContext |
Informacje kontekstowe udostępniane obsługiwaczom związanym z sesją |
| StartSessionOptions | |
| StaticInterimResponseConfig |
Konfiguracja statycznego generowania odpowiedzi tymczasowych. Losowo wybiera spośród skonfigurowanych tekstów po spełnieniu dowolnego warunku wyzwalacza. |
| SystemMessageItem |
Element wiadomości systemowej w ramach rozmowy. |
| TokenUsage |
Ogólne statystyki użycia odpowiedzi. |
| Tool |
Podstawowa reprezentacja definicji narzędzia voicelive. |
| ToolChoiceFunctionSelection |
Reprezentacja voicelive tool_choice wybór nazwanego narzędzia funkcji. |
| ToolChoiceSelection |
Podstawowa reprezentacja dla VoiceLive tool_choice wybierania nazwanego narzędzia. |
| TurnDetection |
Najwyższy poziom unii konfiguracji wykrywania skrętów. |
| TurnOptions | |
| UserMessageItem |
Element wiadomości użytkownika w ramach rozmowy. |
| VideoCrop |
Definiuje prostokąt wideo za pomocą współrzędnych lewego górnego i prawego dołu. |
| VideoParams |
Parametry przesyłania strumieniowego wideo dla awatara. |
| VideoResolution |
Rozdzielczość strumienia wideo w pikselach. |
| VoiceLiveClientOptions | |
| VoiceLiveErrorDetails |
Obiekt błędu zwracany w przypadku awarii API. |
| VoiceLiveSessionHandlers |
Funkcje handlera dla zdarzeń sesji VoiceLive według wzorców Azure SDK. WSZYSTKIE opiekunki są opcjonalne – implementuj tylko te wydarzenia, na których ci zależy! Każdy handler otrzymuje silnie wpisane dane zdarzeń oraz informacje kontekstowe. |
| VoiceLiveSessionOptions | |
| VoiceLiveSubscription |
Oznacza aktywną subskrypcję wydarzeń sesji VoiceLive |
Aliasy typu
| AnimationOutputType |
Określa typy danych animacji do wygenerowania. Znane wartości obsługiwane przez usługę
blendshapes: Typ wyjścia blendshapes. |
| AudioTimestampType |
Typy sygnatur czasowych danych wyjściowych obsługiwane w zawartości odpowiedzi audio. Znane wartości obsługiwane przez usługęsłowo: Znaczniki czasu na słowo w audio wyjściowym. |
| AvatarConfigTypes |
Typy konfiguracji awatara Znane wartości obsługiwane przez usługę
wideo-awatar: awatar wideo |
| AvatarOutputProtocol |
Protokoły wyjściowe konfiguracji awatara Znane wartości obsługiwane przez usługę
webRTC: protokół WebRTC, przesyła strumienie audio/wideo przez WebRTC |
| AzureVoiceType |
Połączenie wszystkich obsługiwanych typów głosu Azure. Znane wartości obsługiwane przez usługę
azure-custom: Azure custom voice. |
| AzureVoiceUnion |
Alias dla AzureVoiceUnion |
| ClientEventType |
Typy zdarzeń klientów używane w protokole VoiceLive. Znane wartości obsługiwane przez usługę
session.update |
| ClientEventUnion |
Alias dla ClientEventUnion |
| ContentPartType |
Typ treściCzęść |
| ContentPartUnion |
Alias dla ContentPartUnion |
| ConversationRequestItemUnion |
Alias dla ConversationRequestItemUnion |
| EouDetectionUnion |
Alias dla EouDetectionUnion |
| EouThresholdLevel |
Ustawienia progowe dla semantycznego wykrywania końcowej wypowiedzi w Azure. Znane wartości obsługiwane przez usługę
niski: Niski próg czułości. |
| InputAudioFormat |
Obsługiwane typy formatów audio wejściowych. Znane wartości obsługiwane przez usługę
pcm16: 16-bitowy format audio PCM z domyślną częstotliwością próbkowania (24kHz) |
| InterimResponseConfig |
Suma konfiguracji konfiguracji tymczasowych odpowiedzi. |
| InterimResponseConfigBaseUnion |
Alias for InterimResponseConfigBaseUnion |
| InterimResponseConfigType |
Typy konfiguracji interim. Znane wartości obsługiwane przez usługę
static_interim_response: Statyczny typ konfiguracji odpowiedzi tymczasowej. |
| InterimResponseTrigger |
Wyzwalacze, które mogą aktywować tymczasowe generowanie odpowiedzi. Znane wartości obsługiwane przez usługę
Opóźnienia: Wyzwalanie odpowiedzi tymczasowej, gdy opóźnienie przekroczy próg. |
| ItemParamStatus |
Wskazuje status przetwarzania elementu lub parametru. Znane wartości obsługiwane przez usługę
ukończone: Element lub parametr jest nadal przetwarzany. |
| ItemType |
Typ elementu |
| MCPApprovalType |
Dostępny zestaw typów zatwierdzeń MCP. Znane wartości obsługiwane przez usługę
nigdy: Zgoda nigdy nie jest wymagana. |
| MessageContentPartUnion |
Alias dla MessageContentPartUnion |
| MessageItemUnion |
Alias dla MessageItemUnion |
| MessageRole |
Typ MessageRole |
| Modality |
Wspierane metody sesji. Znane wartości obsługiwane przez usługę
tekst: Formacja tekstowa. |
| OAIVoice |
Obsługiwane nazwy głosowe OpenAI (enum stringów). Znane wartości obsługiwane przez usługę
Alloy: Głos Alloy. |
| OutputAudioFormat |
Obsługiwane typy formatów audio wyjściowych. Znane wartości obsługiwane przez usługę
pcm16: 16-bitowy format audio PCM z domyślną częstotliwością próbkowania (24kHz) |
| PersonalVoiceModels |
Modele PersonalVoice Znane wartości obsługiwane przez usługę
DragonLatestNeural: Użyj najnowszego modelu Dragon. |
| PhotoAvatarBaseModes |
Tryby bazowe foto awatara Znane wartości obsługiwane przez usługęVasa-1: Model VASA-1 |
| ReasoningEffort |
Ogranicza nakład pracy na rozumowanie modeli rozumowania. Zapoznaj się z dokumentacją modelu pod kątem obsługiwanych wartości dla każdego modelu.
Zmniejszenie nakładu pracy w zakresie rozumowania może spowodować szybsze reagowanie i mniej tokenów używanych podczas rozumowania w odpowiedzi. Znane wartości obsługiwane przez usługę
Brak: Brak próby rozumowania. |
| RequestImageContentPartDetail |
Określa poziom szczegółowości obrazu. Może to być wartość "auto", "niska", "wysoka" lub nieznana wartość przyszła. Znane wartości obsługiwane przez usługę
auto: Automatycznie wybierz odpowiedni poziom szczegółów. |
| ResponseItemStatus |
Wskazuje status przetwarzania elementu odpowiedzi. Znane wartości obsługiwane przez usługę
in_progress: Przedmiot w trakcie realizacji. |
| ResponseItemUnion |
Alias dla ResponseItemUnion |
| ResponseStatus |
Status terminalny odpowiedzi. Znane wartości obsługiwane przez usługę
Zakończone |
| ResponseStatusDetailsUnion |
Alias dla ResponseStatusDetailsUnion |
| ServerEventType |
Typy zdarzeń serwerowych używane w protokole VoiceLive. Znane wartości obsługiwane przez usługę
błąd |
| ServerEventUnion |
Alias dla ServerEventUnion |
| SessionTarget |
Target dla sesji Voice Live, określając model lub agenta. Zastosowanie Przykład Sesja skoncentrowana na modelu
Przykład Sesja skoncentrowana na agencie
|
| ToolChoice |
Zestaw dostępnych reprezentacji dla parametru tool_choice voicelive, obejmujący zarówno literalne opcje ciągów łańcuchowych, takie jak 'auto', jak i ustrukturyzowane odwołania do zdefiniowanych narzędzi. |
| ToolChoiceLiteral |
Dostępny zestaw opcji tool_choice na poziomie trybu, literalnych łańcuchów dla endpointu voicelive. Znane wartości obsługiwane przez usługę
auto: Określa, że model powinien swobodnie decydować, które narzędzie lub narzędzia, jeśli w ogóle, wywołać. |
| ToolChoiceSelectionUnion |
Alias dla ToolChoiceSelectionUnion |
| ToolType |
Obsługiwane narzędzia typu dyskryminatory dla narzędzi voicelive.
Obecnie obsługiwane są tylko narzędzia "function". Znane wartości obsługiwane przez usługę
funkcja |
| ToolUnion |
Alias dla ToolUnion |
| TurnDetectionType |
Typ wykrywania zwrotu |
| TurnDetectionUnion |
Alias dla TurnDetectionUnion |
| Voice |
Unii wszystkich obsługiwanych konfiguracji głosowych. |
Enums
| ConnectionState |
Enumeracja stanu połączenia dla zarządzania cyklem życia |
| KnownAnimationOutputType |
Określa typy danych animacji do wygenerowania. |
| KnownAudioTimestampType |
Typy sygnatur czasowych danych wyjściowych obsługiwane w zawartości odpowiedzi audio. |
| KnownAvatarConfigTypes |
Typy konfiguracji awatara |
| KnownAvatarOutputProtocol |
Protokoły wyjściowe konfiguracji awatara |
| KnownAzureVoiceType |
Połączenie wszystkich obsługiwanych typów głosu Azure. |
| KnownClientEventType |
Typy zdarzeń klientów używane w protokole VoiceLive. |
| KnownContentPartType |
Znane wartości ContentPartType akceptowane przez usługę. |
| KnownEouThresholdLevel |
Ustawienia progowe dla semantycznego wykrywania końcowej wypowiedzi w Azure. |
| KnownInputAudioFormat |
Obsługiwane typy formatów audio wejściowych. |
| KnownInterimResponseConfigType |
Typy konfiguracji interim. |
| KnownInterimResponseTrigger |
Wyzwalacze, które mogą aktywować tymczasowe generowanie odpowiedzi. |
| KnownItemParamStatus |
Wskazuje status przetwarzania elementu lub parametru. |
| KnownItemType |
Znane wartości ItemType akceptowane przez usługę. |
| KnownMCPApprovalType |
Dostępny zestaw typów zatwierdzeń MCP. |
| KnownMessageRole |
Znane wartości MessageRole , które usługa akceptuje. |
| KnownModality |
Wspierane metody sesji. |
| KnownOAIVoice |
Obsługiwane nazwy głosowe OpenAI (enum stringów). |
| KnownOutputAudioFormat |
Obsługiwane typy formatów audio wyjściowych. |
| KnownPersonalVoiceModels |
Modele PersonalVoice |
| KnownPhotoAvatarBaseModes |
Tryby bazowe foto awatara |
| KnownReasoningEffort |
Ogranicza nakład pracy na rozumowanie modeli rozumowania. Zapoznaj się z dokumentacją modelu pod kątem obsługiwanych wartości dla każdego modelu. Zmniejszenie nakładu pracy w zakresie rozumowania może spowodować szybsze reagowanie i mniej tokenów używanych podczas rozumowania w odpowiedzi. |
| KnownRequestImageContentPartDetail |
Określa poziom szczegółowości obrazu. Może to być wartość "auto", "niska", "wysoka" lub nieznana wartość przyszła. |
| KnownResponseItemStatus |
Wskazuje status przetwarzania elementu odpowiedzi. |
| KnownResponseStatus |
Status terminalny odpowiedzi. |
| KnownServerEventType |
Typy zdarzeń serwerowych używane w protokole VoiceLive. |
| KnownToolChoiceLiteral |
Dostępny zestaw opcji tool_choice na poziomie trybu, literalnych łańcuchów dla endpointu voicelive. |
| KnownToolType |
Obsługiwane narzędzia typu dyskryminatory dla narzędzi voicelive. Obecnie obsługiwane są tylko narzędzia "function". |
| KnownTurnDetectionType |
Znane wartości TurnDetectionType akceptowane przez usługę. |
| VoiceLiveErrorCodes |
Kody błędów dla operacji Voice Live WebSocket |
Functions
| classify |
Klasyfikacja błędów połączenia |
| classify |
Klasyfikacja błędów protokołu |
| is |
Typ guard sprawdzi, czy SessionTarget określa sesję agenta. |
| is |
Typ guard sprawdzi, czy SessionTarget określa sesję modelową. |
Szczegóły funkcji
classifyConnectionError(unknown)
Klasyfikacja błędów połączenia
function classifyConnectionError(error: unknown): VoiceLiveConnectionError
Parametry
- error
-
unknown
Zwraca
classifyProtocolError(Error, string)
Klasyfikacja błędów protokołu
function classifyProtocolError(error: Error, messageType: string): VoiceLiveProtocolError
Parametry
- error
-
Error
- messageType
-
string
Zwraca
isAgentSessionTarget(SessionTarget)
Typ guard sprawdzi, czy SessionTarget określa sesję agenta.
function isAgentSessionTarget(target: SessionTarget): target
Parametry
- target
- SessionTarget
Cel sesji do sprawdzenia
Zwraca
target
Prawdziwe, jeśli cel określa sesję agenta
isModelSessionTarget(SessionTarget)
Typ guard sprawdzi, czy SessionTarget określa sesję modelową.
function isModelSessionTarget(target: SessionTarget): target
Parametry
- target
- SessionTarget
Cel sesji do sprawdzenia
Zwraca
target
Prawdziwe, jeśli cel określa sesję modelu