Freigeben über


Abrufen der Sitzungs-ID und Transkriptions-ID der Spracherkennung

Wenn Sie die Spracherkennung verwenden und einen Supportfall öffnen müssen, werden Sie oft dazu aufgefordert, die Sitzungs-ID oder Transkriptions-ID der fehlerhaften Transkriptionen anzugeben, um das Problem zu beheben. In diesem Artikel wird erklärt, wie Sie diese IDs abrufen.

Hinweis

Abrufen der Sitzungs-ID

Echtzeit-Spracherkennung und Sprachübersetzung verwenden entweder das Speech SDK oder die REST-API für kurze Audiodaten.

Gehen Sie wie folgt vor, um bei der Verwendung des SDK die Sitzungs-ID abzurufen:

  1. Aktivieren Sie die Anwendungsprotokollierung.
  2. Suchen Sie die Sitzungs-ID im Protokoll.

Wenn Sie das Speech SDK für JavaScript verwenden, rufen Sie die Sitzungs-ID ab, wie in diesem Abschnitt beschrieben.

Wenn Sie die Speech-CLI verwenden, können Sie die Sitzungs-ID auch interaktiv abrufen. Details finden Sie in diesem Abschnitt.

Bei der Spracherkennungs-REST-API für kurze Audiodaten müssen Sie die Sitzungsinformationen in den Anforderungen „injizieren“. Details finden Sie in diesem Abschnitt.

Aktivieren der Protokollierung im Speech SDK

Aktivieren Sie die Protokollierung für Ihre Anwendung, wie in diesem Artikel beschrieben.

Abrufen der Sitzungs-ID aus dem Protokoll

Öffnen Sie die Protokolldatei, die Ihre Anwendung erstellt hat, und suchen Sie nach SessionId:. Die darauf folgende Nummer ist die benötigte Sitzungs-ID. Im folgenden Beispielauszug aus einem Protokoll ist 0b734c41faf8430380d493127bd44632 die Sitzungs-ID.

[874193]: 218ms SPX_DBG_TRACE_VERBOSE:  audio_stream_session.cpp:1238 [0000023981752A40]CSpxAudioStreamSession::FireSessionStartedEvent: Firing SessionStarted event: SessionId: 0b734c41faf8430380d493127bd44632

Abrufen der Sitzungs-ID mit JavaScript

Wenn Sie das Speech SDK für JavaScript verwenden, rufen Sie die Sitzungs-ID mit dem Ereignis sessionStarted aus der Recognizer-Klasse ab.

Ein Beispiel für das Abrufen der Sitzungs-ID mithilfe von JavaScript finden Sie in diesem Beispiel. Suchen Sie nach recognizer.sessionStarted = onSessionStarted; und dann nach function onSessionStarted.

Abrufen der Sitzungs-ID mit der Speech-CLI

Wenn Sie die Speech-CLI verwenden, wird die Sitzungs-ID in den Konsolenmeldungen SESSION STARTED und SESSION STOPPED angezeigt.

Sie können auch die Protokollierung für Ihre Sitzungen aktivieren und die Sitzungs-ID, wie in diesem Abschnitt beschrieben, aus der Protokolldatei abrufen. Führen Sie den entsprechenden Speech-CLI-Befehl aus, um die Informationen zur Verwendung von Protokollen abzurufen:

spx help recognize log
spx help translate log

Bereitstellen der Sitzungs-ID mit der REST-API für kurze Audiodaten

Im Gegensatz zum Speech SDK erzeugt die Spracherkennungs-REST-API für kurze Audiodaten nicht automatisch eine Sitzungs-ID. Sie müssen sie selbst generieren und in der REST-Anforderung bereitstellen.

Generieren Sie eine GUID in Ihrem Code oder verwenden Sie ein Standardtool. Verwenden Sie den GUID-Wert ohne Bindestriche oder andere Trennzeichen. Für unser Beispiel verwenden wir 9f4ffa5113a846eba289aa98b28e766f.

Verwenden Sie als Teil Ihrer REST-Anforderung den X-ConnectionId=<GUID>-Ausdruck. In unserem Beispiel sieht eine Beispielanforderung wie folgt aus:

https://eastus.stt.speech.microsoft.com/speech/recognition/conversation/cognitiveservices/v1?language=en-US&X-ConnectionId=9f4ffa5113a846eba289aa98b28e766f

9f4ffa5113a846eba289aa98b28e766f ist Ihre Sitzungs-ID.

Warnung

Der Wert des Parameters X-ConnectionId sollte im Format der grafischen Benutzeroberfläche (GUID) ohne Bindestriche oder andere Trennlinien vorliegen. Alle anderen Formate werden nicht unterstützt und vom Dienst verworfen.

Beispiel: Wenn die Anforderung Ausdrücke wie die folgenden enthält:

  • X-ConnectionId=9f4ffa51-13a8-46eb-a289-aa98b28e766f (GUID mit Trennzeichen)
  • X-ConnectionId=Request9f4ffa5113a846eba289aa98b28e766f (nicht GUID)
  • X-ConnectionId=5948f700d2a811ee (nicht GUID)

wird der Wert von X-ConnectionId vom System nicht akzeptiert, und die Sitzung wird nicht in den Protokollen gefunden.

Abrufen der Transkriptions-ID für die Batch-Transkription

Die Batchtranskriptions-API ist Teil der SPRACH-ZU-Text-REST-API.

Die benötigte Transkription-ID ist der GUID-Wert im self-Hauptelement des Antworttexts, der von Anforderungen zurückgegeben wird, z. B. Transcriptions_Create.

Im Folgenden finden Sie einen Beispielantworttext einer Transkriptionen – Senden-Anforderung. Der GUID-Wert 537216f8-0620-4a10-ae2d-00bdb423b36f im ersten self-Element ist die Transkriptions-ID.

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/537216f8-0620-4a10-ae2d-00bdb423b36f",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/824bd685-2d45-424d-bb65-c3fe99e32927"
  },
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/537216f8-0620-4a10-ae2d-00bdb423b36f/files"
  },
  "properties": {
    "diarizationEnabled": false,
    "wordLevelTimestampsEnabled": false,
    "channels": [
      0,
      1
    ],
    "punctuationMode": "DictatedAndAutomatic",
    "profanityFilterMode": "Masked"
  },
  "lastActionDateTime": "2021-11-19T14:09:51Z",
  "status": "NotStarted",
  "createdDateTime": "2021-11-19T14:09:51Z",
  "locale": "ru-RU",
  "displayName": "transcriptiontest"
}

Hinweis

Verwenden Sie dieselbe Methode, um die verschiedenen IDs zu identifizieren, die für das Debuggen von Problemen im Zusammenhang mit Custom Speech benötigt werden, z. B. das Hochladen eines Datasets mit der Anforderung Datasets_Create.

Hinweis

Sie können auch alle vorhandenen Transkriptionen und deren Transkriptions-IDs für eine bestimmte Sprachressource mithilfe von Transkriptionen anzeigen – Anforderung abrufen .