Udostępnij za pośrednictwem


Jak uzyskać identyfikator sesji dla konwersji mowy na tekst i identyfikator transkrypcji

Jeśli używasz mowy do tekstu i musisz otworzyć zgłoszenie do pomocy technicznej, często musisz podać identyfikator sesji lub identyfikator transkrypcji problematycznych transkrypcji w celu debugowania problemu. W tym artykule wyjaśniono, jak uzyskać te identyfikatory.

Uwaga

Uzyskiwanie identyfikatora sesji

Zamiana mowy w czasie rzeczywistym na tekst i tłumaczenie mowy wykorzystuje Speech SDK lub interfejs API REST do krótkiej mowy.

Aby uzyskać identyfikator sesji, w przypadku korzystania z zestawu SDK musisz:

  1. Włącz rejestrowanie aplikacji.
  2. Znajdź identyfikator sesji w dzienniku.

Jeśli używasz zestawu SPEECH SDK dla języka JavaScript, pobierz identyfikator sesji zgodnie z opisem w tej sekcji.

Jeśli używasz Speech CLI (interfejsu wiersza polecenia usługi Mowa), możesz również interaktywnie pobrać identyfikator sesji. Zobacz szczegóły w tej sekcji.

W przypadku interfejsu API REST zamiany mowy na tekst dla krótkiego dźwięku należy uwzględnić informacje o sesji w żądaniach. Zobacz szczegóły w tej sekcji.

Włącz rejestrowanie w SDK Mowy

Włącz rejestrowanie aplikacji zgodnie z opisem w tym artykule.

Pobieranie identyfikatora sesji z dziennika

Otwórz plik dziennika utworzony przez aplikację i poszukaj pliku SessionId:. Numer, który nastąpi, to potrzebny identyfikator sesji. W poniższym fragmencie dziennika 0b734c41faf8430380d493127bd44632 jest identyfikator sesji.

[874193]: 218ms SPX_DBG_TRACE_VERBOSE:  audio_stream_session.cpp:1238 [0000023981752A40]CSpxAudioStreamSession::FireSessionStartedEvent: Firing SessionStarted event: SessionId: 0b734c41faf8430380d493127bd44632

Uzyskiwanie identyfikatora sesji przy użyciu języka JavaScript

Jeśli używasz Speech SDK dla języka JavaScript, otrzymasz identyfikator sesji za pomocą sessionStarted zdarzenia z klasy Recognizer.

Zobacz przykład pobierania identyfikatora sesji przy użyciu języka JavaScript w tym przykładzie. Szukaj recognizer.sessionStarted = onSessionStarted;, a następnie znajdź function onSessionStarted.

Uzyskaj identyfikator sesji przy użyciu interfejsu wiersza poleceń Mowy

Jeśli używasz Speech CLI, zobaczysz identyfikator sesji w komunikatach konsoli SESSION STARTED i SESSION STOPPED.

Możesz również włączyć rejestrowanie sesji i pobrać identyfikator sesji z pliku dziennika zgodnie z opisem w tej sekcji. Uruchom odpowiednie polecenie interfejsu wiersza polecenia usługi Mowa, aby uzyskać informacje dotyczące korzystania z dzienników:

spx help recognize log
spx help translate log

Podaj identyfikator sesji przy użyciu interfejsu API REST dla krótkiego dźwięku

W przeciwieństwie do zestawu Speech SDK, REST API zamiany mowy na tekst dla krótkich nagrań nie generuje automatycznie identyfikatora sesji. Musisz wygenerować go samodzielnie i podać go w żądaniu REST.

Wygeneruj identyfikator GUID wewnątrz kodu lub użyj dowolnego standardowego narzędzia. Użyj wartości identyfikatora GUID bez kreski lub innych separatorów. Jako przykład używamy elementu 9f4ffa5113a846eba289aa98b28e766f.

W ramach żądania REST użyj X-ConnectionId=<GUID> wyrażenia . W naszym przykładzie przykładowe żądanie wygląda następująco:

https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?language=en-US&X-ConnectionId=9f4ffa5113a846eba289aa98b28e766f

9f4ffa5113a846eba289aa98b28e766f to identyfikator sesji.

Ostrzeżenie

Wartość parametru X-ConnectionId powinna być w formacie identyfikatora GUID bez kreski lub innych separatorów. Wszystkie inne formaty nie są obsługiwane i zostaną odrzucone przez usługę.

Przykład. Jeśli żądanie zawiera wyrażenia podobne do następujących:

  • X-ConnectionId=9f4ffa51-13a8-46eb-a289-aa98b28e766f (Identyfikator GUID z separatorami)
  • X-ConnectionId=Request9f4ffa5113a846eba289aa98b28e766f (bez identyfikatora GUID - Global Unique Identifier)
  • X-ConnectionId=5948f700d2a811ee (bez identyfikatora GUID - Global Unique Identifier)

wartość X-ConnectionId nie zostanie zaakceptowana przez system, a sesja nie zostanie znaleziona w dziennikach.

Uzyskiwanie identyfikatora transkrypcji dla transkrypcji wsadowej

API transkrypcji wsadowej jest częścią API REST zamiany mowy na tekst.

Wymagany identyfikator transkrypcji to wartość identyfikatora GUID zawarta w głównym self elemencie treści odpowiedzi zwracanej przez żądania, takie jak Transkrypcje — Przesyłanie.

Poniżej znajduje się przykładowa treść odpowiedzi na żądanie transkrypcji - prześlij. Wartość 537216f8-0620-4a10-ae2d-00bdb423b36f identyfikatora GUID znaleziona w pierwszym self elememencie to identyfikator transkrypcji.

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/537216f8-0620-4a10-ae2d-00bdb423b36f",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/824bd685-2d45-424d-bb65-c3fe99e32927"
  },
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/537216f8-0620-4a10-ae2d-00bdb423b36f/files"
  },
  "properties": {
    "diarizationEnabled": false,
    "wordLevelTimestampsEnabled": false,
    "channels": [
      0,
      1
    ],
    "punctuationMode": "DictatedAndAutomatic",
    "profanityFilterMode": "Masked"
  },
  "lastActionDateTime": "2021-11-19T14:09:51Z",
  "status": "NotStarted",
  "createdDateTime": "2021-11-19T14:09:51Z",
  "locale": "ru-RU",
  "displayName": "transcriptiontest"
}

Uwaga

Użyj tej samej techniki, aby określić różne identyfikatory wymagane do debugowania problemów związanych z rozpoznawaniem mowy niestandardowej, takich jak przekazywanie zestawu danych przy użyciu żądania Datasets_Create .

Uwaga

Możesz również wyświetlić wszystkie istniejące transkrypcje i ich identyfikatory dla danego zasobu mowy, wysyłając żądanie Transkrypcje - Pobierz.