Megosztás a következőn keresztül:


Kötegelt átírási eredmények lekérése

Az átírási eredmények lekéréséhez először ellenőrizze az átírási feladat állapotát . Ha a feladat befejeződött, lekérheti az átiratokat és az átírási jelentést.

Átírás állapotának lekérése

Az átírási feladat állapotának lekéréséhez hívja meg a Speech to text REST API Transcriptions_Get műveletét.

Fontos

A kötegelt átírási feladatok ütemezése a legjobb munkamennyiség alapján történik. Csúcsidőben akár 30 perc vagy több időt is igénybe vehet, amíg egy átírási feladat elkezdi a feldolgozást. A végrehajtás során a legtöbb esetben az átírás állapota lesz Running. Ennek az az oka, hogy a feladat a kötegelt átírás háttérrendszerére való áthelyezés pillanatában kap Running állapotot. Az alapmodell használata esetén ez a hozzárendelés szinte azonnal megtörténik; az egyéni modellek esetében kissé lassabb. Így az átírási feladatok által az Running állapotban töltött idő nem felel meg a tényleges átírási időnek, hanem a belső üzenetsorokban való várakozási időt is magában foglalja.

Http GET-kérés létrehozása az URI használatával az alábbi példában látható módon. Cserélje le YourTranscriptionId az átírási azonosítót, cserélje le YourSubscriptionKey a Speech erőforráskulcsára, és cserélje le YourServiceRegion a Speech erőforrásrégiójára.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/YourTranscriptionId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

A válasz törzsének a következő formátumban kell érkeznie:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/base/aaa321e9-5a4e-4db1-88a2-f251bbe7b555"
  },
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files"
  },
  "properties": {
    "diarizationEnabled": false,
    "wordLevelTimestampsEnabled": false,
    "displayFormWordLevelTimestampsEnabled": true,
    "channels": [
      0,
      1
    ],
    "punctuationMode": "DictatedAndAutomatic",
    "profanityFilterMode": "Masked",
    "duration": "PT3S",
    "languageIdentification": {
      "candidateLocales": [
        "en-US",
        "de-DE",
        "es-ES"
      ]
    }
  },
  "lastActionDateTime": "2024-05-10T18:39:09Z",
  "status": "Succeeded",
  "createdDateTime": "2024-05-10T18:39:07Z",
  "locale": "en-US",
  "displayName": "My Transcription"
}

A status tulajdonság az átiratok aktuális állapotát jelzi. Az átírási és átírási jelentés akkor érhető el, ha az átírás állapota .Succeeded

Fontos

A kötegelt átírási feladatok ütemezése a legjobb munkamennyiség alapján történik. Csúcsidőben akár 30 perc vagy több időt is igénybe vehet, amíg egy átírási feladat elkezdi a feldolgozást. A végrehajtás során a legtöbb esetben az átírás állapota lesz Running. Ennek az az oka, hogy a feladat a kötegelt átírás háttérrendszerére való áthelyezés pillanatában kap Running állapotot. Az alapmodell használata esetén ez a hozzárendelés szinte azonnal megtörténik; az egyéni modellek esetében kissé lassabb. Így az átírási feladatok által az Running állapotban töltött idő nem felel meg a tényleges átírási időnek, hanem a belső üzenetsorokban való várakozási időt is magában foglalja.

Az átírási feladat állapotának lekéréséhez használja a spx batch transcription status parancsot. A kérelemparamétereket az alábbi utasítások szerint hozhatja létre:

  • Állítsa a paramétert transcription a lekérni kívánt átirat azonosítójára.

Íme egy példa a Speech CLI parancsra az átírás állapotának lekéréséhez:

spx batch transcription status --api-version v3.2 --transcription YourTranscriptionId

A válasz törzsének a következő formátumban kell érkeznie:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/base/aaa321e9-5a4e-4db1-88a2-f251bbe7b555"
  },
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files"
  },
  "properties": {
    "diarizationEnabled": false,
    "wordLevelTimestampsEnabled": false,
    "displayFormWordLevelTimestampsEnabled": true,
    "channels": [
      0,
      1
    ],
    "punctuationMode": "DictatedAndAutomatic",
    "profanityFilterMode": "Masked",
    "duration": "PT3S"
  },
  "lastActionDateTime": "2024-05-10T18:39:09Z",
  "status": "Succeeded",
  "createdDateTime": "2024-05-10T18:39:07Z",
  "locale": "en-US",
  "displayName": "My Transcription"
}

A status tulajdonság az átiratok aktuális állapotát jelzi. Az átírási és átírási jelentés akkor érhető el, ha az átírás állapota .Succeeded

A Speech CLI átiratokkal kapcsolatos súgójához futtassa a következő parancsot:

spx help batch transcription

Átírási eredmények lekérése

A Transcriptions_ListFiles művelet visszaadja az átirat eredményfájljainak listáját. Minden elküldött kötegátírási feladathoz egy átírási jelentésfájl tartozik. Emellett minden sikeresen átírt hangfájlhoz egy átiratfájlt (a végeredményt) is biztosítunk.

HTTP GET kérést kezdeményezhet az előző válasz törzsének "files" URI-jának használatával. Cserélje le YourTranscriptionId az átírási azonosítót, cserélje le YourSubscriptionKey a Speech erőforráskulcsára, és cserélje le YourServiceRegion a Speech erőforrásrégiójára.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/YourTranscriptionId/files" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

A válasz törzsének a következő formátumban kell érkeznie:

{
  "values": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/2dd180a1-434e-4368-a1ac-37350700284f",
      "name": "contenturl_0.json",
      "kind": "Transcription",
      "properties": {
        "size": 3407
      },
      "createdDateTime": "2024-05-10T18:39:09Z",
      "links": {
        "contentUrl": "YourTranscriptionUrl"
      }
    },
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/c027c6a9-2436-4303-b64b-e98e3c9fc2e3",
      "name": "contenturl_1.json",
      "kind": "Transcription",
      "properties": {
        "size": 8233
      },
      "createdDateTime": "2024-05-10T18:39:09Z",
      "links": {
        "contentUrl": "YourTranscriptionUrl"
      }
    },
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/faea9a41-c95c-4d91-96ff-e39225def642",
      "name": "report.json",
      "kind": "TranscriptionReport",
      "properties": {
        "size": 279
      },
      "createdDateTime": "2024-05-10T18:39:09Z",
      "links": {
        "contentUrl": "YourTranscriptionReportUrl"
      }
    }
  ]
}

Az egyes átírási és átírási jelentésfájlok helye további részletekkel a válasz törzsében lesz visszaadva. A contentUrl tulajdonság tartalmazza az átírási ("kind": "Transcription") vagy átírási jelentés ("kind": "TranscriptionReport") fájl URL-címét.

Ha nem adott meg tárolót az destinationContainerUrl átírási kérelem tulajdonságában, az eredmények a Microsoft által felügyelt tárolóban lesznek tárolva. Az átírási feladat törlésekor az átírás eredményadatai is törlődnek.

A spx batch transcription list parancs visszaadja az átírás eredményfájljainak listáját. Minden elküldött kötegátírási feladathoz egy átírási jelentésfájl tartozik. Emellett minden sikeresen átírt hangfájlhoz egy átiratfájlt (a végeredményt) is biztosítunk.

  • Állítsa be a szükséges files jelzőt.
  • Állítsa be a szükséges transcription paramétert a naplók lekéréséhez használni kívánt átirat azonosítójára.

Íme egy példa Speech CLI-parancsra, amely lekéri az átírás eredményfájljainak listáját:

spx batch transcription list --api-version v3.2 --files --transcription YourTranscriptionId

A válasz törzsének a következő formátumban kell érkeznie:

{
  "values": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/2dd180a1-434e-4368-a1ac-37350700284f",
      "name": "contenturl_0.json",
      "kind": "Transcription",
      "properties": {
        "size": 3407
      },
      "createdDateTime": "2024-05-10T18:39:09Z",
      "links": {
        "contentUrl": "YourTranscriptionUrl"
      }
    },
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/c027c6a9-2436-4303-b64b-e98e3c9fc2e3",
      "name": "contenturl_1.json",
      "kind": "Transcription",
      "properties": {
        "size": 8233
      },
      "createdDateTime": "2024-05-10T18:39:09Z",
      "links": {
        "contentUrl": "YourTranscriptionUrl"
      }
    },
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/faea9a41-c95c-4d91-96ff-e39225def642",
      "name": "report.json",
      "kind": "TranscriptionReport",
      "properties": {
        "size": 279
      },
      "createdDateTime": "2024-05-10T18:39:09Z",
      "links": {
        "contentUrl": "YourTranscriptionReportUrl"
      }
    }
  ]
}

Az egyes átírási és átírási jelentésfájlok helye további részletekkel a válasz törzsében lesz visszaadva. A contentUrl tulajdonság tartalmazza az átírási ("kind": "Transcription") vagy átírási jelentés ("kind": "TranscriptionReport") fájl URL-címét.

Az eredmények alapértelmezés szerint a Microsoft által felügyelt tárolóban vannak tárolva. Az átírási feladat törlésekor az átírás eredményadatai is törlődnek.

Átírási jelentésfájl

Minden elküldött kötegelt átírási feladathoz egy átírási jelentésfájl tartozik.

Az egyes átírási eredményfájlok tartalma JSON formátumban van formázva, ahogyan az ebben a példában is látható.

{
  "successfulTranscriptionsCount": 2,
  "failedTranscriptionsCount": 0,
  "details": [
    {
      "source": "https://crbn.us/hello.wav",
      "status": "Succeeded"
    },
    {
      "source": "https://crbn.us/whatstheweatherlike.wav",
      "status": "Succeeded"
    }
  ]
}

Átirat eredményfájlja

Minden sikeresen átírt hangfájlhoz egy átírási eredményfájl tartozik.

Az egyes átírási eredményfájlok tartalma JSON formátumban van formázva, ahogyan az ebben a példában is látható.

{
  "source": "...",
  "timestamp": "2023-07-10T14:28:16Z",
  "durationInTicks": 25800000,
  "duration": "PT2.58S",
  "combinedRecognizedPhrases": [
    {
      "channel": 0,
      "lexical": "hello world",
      "itn": "hello world",
      "maskedITN": "hello world",
      "display": "Hello world."
    }
  ],
  "recognizedPhrases": [
    {
      "recognitionStatus": "Success",
      "channel": 0,
      "offset": "PT0.76S",
      "duration": "PT1.32S",
      "offsetInTicks": 7600000.0,
      "durationInTicks": 13200000.0,
      "nBest": [
        {
          "confidence": 0.5643338,
          "lexical": "hello world",
          "itn": "hello world",
          "maskedITN": "hello world",
          "display": "Hello world.",
          "displayWords": [
            {
              "displayText": "Hello",
              "offset": "PT0.76S",
              "duration": "PT0.76S",
              "offsetInTicks": 7600000.0,
              "durationInTicks": 7600000.0
            },
            {
              "displayText": "world.",
              "offset": "PT1.52S",
              "duration": "PT0.56S",
              "offsetInTicks": 15200000.0,
              "durationInTicks": 5600000.0
            }
          ]
        },
        {
          "confidence": 0.1769063,
          "lexical": "helloworld",
          "itn": "helloworld",
          "maskedITN": "helloworld",
          "display": "helloworld"
        },
        {
          "confidence": 0.49964225,
          "lexical": "hello worlds",
          "itn": "hello worlds",
          "maskedITN": "hello worlds",
          "display": "hello worlds"
        },
        {
          "confidence": 0.4995761,
          "lexical": "hello worm",
          "itn": "hello worm",
          "maskedITN": "hello worm",
          "display": "hello worm"
        },
        {
          "confidence": 0.49418187,
          "lexical": "hello word",
          "itn": "hello word",
          "maskedITN": "hello word",
          "display": "hello word"
        }
      ]
    }
  ]
}

Az átírási feladat létrehozásakor beállított kérelemparamétertől függően az átírási fájl a következő eredménytulajdonságokat tartalmazhatja.

Tulajdonság Leírás
channel Az eredmények csatornaszáma. A sztereó hangstreamek esetében a bal és a jobb csatornák az átirat során meg vannak osztva. Minden bemeneti hangfájlhoz létrejön egy JSON-eredményfájl.
combinedRecognizedPhrases A csatorna összes kifejezésének összefűzött eredményei.
confidence A felismerés megbízhatósági értéke.
display A felismert szöveg megjelenítési formája. A hozzáadott írásjelek és a nagybetűsítés is szerepel benne.
displayWords Az átírás minden egyes szava időbélyege. A displayFormWordLevelTimestampsEnabled kérelem tulajdonságot be kell állítani, truekülönben ez a tulajdonság nincs jelen.

Megjegyzés: Ez a tulajdonság csak a Speech to text REST API 3.1-es és újabb verziójával érhető el.
duration A hang időtartama. Az érték iso 8601 kódolású időtartam.
durationInTicks A hang időtartama kullancsokban (egy pipa 100 nanoszekundum).
itn A felismert szöveg inverz szöveg normalizált (ITN) formája. A program olyan rövidítéseket alkalmaz, mint a "Doctor Smith" és a "Dr Smith", a telefonszámok és más átalakítások.
lexical A ténylegesen felismert szavak.
locale A hang bemenetéből azonosított területi beállítás. A languageIdentification kérelem tulajdonságot be kell állítani, ellenkező esetben ez a tulajdonság nincs jelen.

Megjegyzés: Ez a tulajdonság csak a Speech to text REST API 3.1-es és újabb verziójával érhető el.
maskedITN Az ITN-űrlap trágár maszkolással.
nBest Az aktuális kifejezés lehetséges átiratainak listája megbízhatósággal.
offset A kifejezés hangjának eltolása. Az érték iso 8601 kódolású időtartam.
offsetInTicks A kifejezés hangjának eltolása kullancsokban (egy pipa 100 nanoszekundum).
recognitionStatus A felismerés állapota. Például: "Siker" vagy "Hiba".
recognizedPhrases Az egyes kifejezések eredményeinek listája.
source A bemeneti hangforrásként megadott URL-cím. A forrás megfelel az contentUrls or contentContainerUrl request tulajdonságnak. A source tulajdonság az egyetlen módja annak, hogy megerősítse az átirat hangbemenetét.
speaker Az azonosított beszélő. A diarization és diarizationEnabled a kérelem tulajdonságait be kell állítani, különben ez a tulajdonság nincs jelen.
timestamp Az átírás létrehozásának dátuma és időpontja. Az érték egy ISO 8601 kódolású időbélyeg.
words Az eredmények listája a kifejezés minden egyes szavához lexikális szöveggel. A wordLevelTimestampsEnabled kérelem tulajdonságot be kell állítani, truekülönben ez a tulajdonság nincs jelen.

Következő lépések