Uwaga
Dostęp do tej strony wymaga autoryzacji. Może spróbować zalogować się lub zmienić katalogi.
Dostęp do tej strony wymaga autoryzacji. Możesz spróbować zmienić katalogi.
Jeśli używasz mowy do tekstu i musisz otworzyć zgłoszenie do pomocy technicznej, często musisz podać identyfikator sesji lub identyfikator transkrypcji problematycznych transkrypcji w celu debugowania problemu. W tym artykule wyjaśniono, jak uzyskać te identyfikatory.
Uwaga
- Identyfikator sesji jest używany w przetwarzaniu mowy na tekst w czasie rzeczywistym i tłumaczeniu mowy.
- Identyfikator transkrypcji jest używany w transkrypcji wsadowej.
Uzyskiwanie identyfikatora sesji
Zamiana mowy w czasie rzeczywistym na tekst i tłumaczenie mowy wykorzystuje Speech SDK lub interfejs API REST do krótkiej mowy.
Aby uzyskać identyfikator sesji, w przypadku korzystania z zestawu SDK musisz:
- Włącz rejestrowanie aplikacji.
- Znajdź identyfikator sesji w dzienniku.
Jeśli używasz zestawu SPEECH SDK dla języka JavaScript, pobierz identyfikator sesji zgodnie z opisem w tej sekcji.
Jeśli używasz Speech CLI (interfejsu wiersza polecenia usługi Mowa), możesz również interaktywnie pobrać identyfikator sesji. Zobacz szczegóły w tej sekcji.
W przypadku interfejsu API REST zamiany mowy na tekst dla krótkiego dźwięku należy uwzględnić informacje o sesji w żądaniach. Zobacz szczegóły w tej sekcji.
Włącz rejestrowanie w SDK Mowy
Włącz rejestrowanie aplikacji zgodnie z opisem w tym artykule.
Pobieranie identyfikatora sesji z dziennika
Otwórz plik dziennika utworzony przez aplikację i poszukaj pliku SessionId:
. Numer, który nastąpi, to potrzebny identyfikator sesji. W poniższym fragmencie dziennika 0b734c41faf8430380d493127bd44632
jest identyfikator sesji.
[874193]: 218ms SPX_DBG_TRACE_VERBOSE: audio_stream_session.cpp:1238 [0000023981752A40]CSpxAudioStreamSession::FireSessionStartedEvent: Firing SessionStarted event: SessionId: 0b734c41faf8430380d493127bd44632
Uzyskiwanie identyfikatora sesji przy użyciu języka JavaScript
Jeśli używasz Speech SDK dla języka JavaScript, otrzymasz identyfikator sesji za pomocą sessionStarted
zdarzenia z klasy Recognizer.
Zobacz przykład pobierania identyfikatora sesji przy użyciu języka JavaScript w tym przykładzie. Szukaj recognizer.sessionStarted = onSessionStarted;
, a następnie znajdź function onSessionStarted
.
Uzyskaj identyfikator sesji przy użyciu interfejsu wiersza poleceń Mowy
Jeśli używasz Speech CLI, zobaczysz identyfikator sesji w komunikatach konsoli SESSION STARTED
i SESSION STOPPED
.
Możesz również włączyć rejestrowanie sesji i pobrać identyfikator sesji z pliku dziennika zgodnie z opisem w tej sekcji. Uruchom odpowiednie polecenie interfejsu wiersza polecenia usługi Mowa, aby uzyskać informacje dotyczące korzystania z dzienników:
spx help recognize log
spx help translate log
Podaj identyfikator sesji przy użyciu interfejsu API REST dla krótkiego dźwięku
W przeciwieństwie do zestawu Speech SDK, REST API zamiany mowy na tekst dla krótkich nagrań nie generuje automatycznie identyfikatora sesji. Musisz wygenerować go samodzielnie i podać go w żądaniu REST.
Wygeneruj identyfikator GUID wewnątrz kodu lub użyj dowolnego standardowego narzędzia. Użyj wartości identyfikatora GUID bez kreski lub innych separatorów. Jako przykład używamy elementu 9f4ffa5113a846eba289aa98b28e766f
.
W ramach żądania REST użyj X-ConnectionId=<GUID>
wyrażenia . W naszym przykładzie przykładowe żądanie wygląda następująco:
https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?language=en-US&X-ConnectionId=9f4ffa5113a846eba289aa98b28e766f
9f4ffa5113a846eba289aa98b28e766f
to identyfikator sesji.
Ostrzeżenie
Wartość parametru X-ConnectionId
powinna być w formacie identyfikatora GUID bez kreski lub innych separatorów. Wszystkie inne formaty nie są obsługiwane i zostaną odrzucone przez usługę.
Przykład. Jeśli żądanie zawiera wyrażenia podobne do następujących:
-
X-ConnectionId=9f4ffa51-13a8-46eb-a289-aa98b28e766f
(Identyfikator GUID z separatorami) -
X-ConnectionId=Request9f4ffa5113a846eba289aa98b28e766f
(bez identyfikatora GUID - Global Unique Identifier) -
X-ConnectionId=5948f700d2a811ee
(bez identyfikatora GUID - Global Unique Identifier)
wartość X-ConnectionId
nie zostanie zaakceptowana przez system, a sesja nie zostanie znaleziona w dziennikach.
Uzyskiwanie identyfikatora transkrypcji dla transkrypcji wsadowej
API transkrypcji wsadowej jest częścią API REST zamiany mowy na tekst.
Wymagany identyfikator transkrypcji to wartość identyfikatora GUID zawarta w głównym self
elemencie treści odpowiedzi zwracanej przez żądania, takie jak Transkrypcje — Przesyłanie.
Poniżej znajduje się przykładowa treść odpowiedzi na żądanie transkrypcji - prześlij. Wartość 537216f8-0620-4a10-ae2d-00bdb423b36f
identyfikatora GUID znaleziona w pierwszym self
elememencie to identyfikator transkrypcji.
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/537216f8-0620-4a10-ae2d-00bdb423b36f",
"model": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/824bd685-2d45-424d-bb65-c3fe99e32927"
},
"links": {
"files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/537216f8-0620-4a10-ae2d-00bdb423b36f/files"
},
"properties": {
"diarizationEnabled": false,
"wordLevelTimestampsEnabled": false,
"channels": [
0,
1
],
"punctuationMode": "DictatedAndAutomatic",
"profanityFilterMode": "Masked"
},
"lastActionDateTime": "2021-11-19T14:09:51Z",
"status": "NotStarted",
"createdDateTime": "2021-11-19T14:09:51Z",
"locale": "ru-RU",
"displayName": "transcriptiontest"
}
Uwaga
Użyj tej samej techniki, aby określić różne identyfikatory wymagane do debugowania problemów związanych z rozpoznawaniem mowy niestandardowej, takich jak przekazywanie zestawu danych przy użyciu żądania Datasets_Create .
Uwaga
Możesz również wyświetlić wszystkie istniejące transkrypcje i ich identyfikatory dla danego zasobu mowy, wysyłając żądanie Transkrypcje - Pobierz.