Kötegelt átírási eredmények lekérése
Az átírási eredmények lekéréséhez először ellenőrizze az átírási feladat állapotát . Ha a feladat befejeződött, lekérheti az átiratokat és az átírási jelentést.
Átírás állapotának lekérése
Az átírási feladat állapotának lekéréséhez hívja meg a Speech to text REST API Transcriptions_Get műveletét.
Fontos
A kötegelt átírási feladatok ütemezése a legjobb munkamennyiség alapján történik. Csúcsidőben akár 30 perc vagy több időt is igénybe vehet, amíg egy átírási feladat elkezdi a feldolgozást. A végrehajtás során a legtöbb esetben az átírás állapota lesz Running
. Ennek az az oka, hogy a feladat a kötegelt átírás háttérrendszerére való áthelyezés pillanatában kap Running
állapotot. Az alapmodell használata esetén ez a hozzárendelés szinte azonnal megtörténik; az egyéni modellek esetében kissé lassabb. Így az átírási feladatok által az Running
állapotban töltött idő nem felel meg a tényleges átírási időnek, hanem a belső üzenetsorokban való várakozási időt is magában foglalja.
Http GET-kérés létrehozása az URI használatával az alábbi példában látható módon. Cserélje le YourTranscriptionId
az átírási azonosítót, cserélje le YourSubscriptionKey
a Speech erőforráskulcsára, és cserélje le YourServiceRegion
a Speech erőforrásrégiójára.
curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/YourTranscriptionId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"
A válasz törzsének a következő formátumban kell érkeznie:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3",
"model": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/base/aaa321e9-5a4e-4db1-88a2-f251bbe7b555"
},
"links": {
"files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files"
},
"properties": {
"diarizationEnabled": false,
"wordLevelTimestampsEnabled": false,
"displayFormWordLevelTimestampsEnabled": true,
"channels": [
0,
1
],
"punctuationMode": "DictatedAndAutomatic",
"profanityFilterMode": "Masked",
"duration": "PT3S",
"languageIdentification": {
"candidateLocales": [
"en-US",
"de-DE",
"es-ES"
]
}
},
"lastActionDateTime": "2024-05-10T18:39:09Z",
"status": "Succeeded",
"createdDateTime": "2024-05-10T18:39:07Z",
"locale": "en-US",
"displayName": "My Transcription"
}
A status
tulajdonság az átiratok aktuális állapotát jelzi. Az átírási és átírási jelentés akkor érhető el, ha az átírás állapota .Succeeded
Fontos
A kötegelt átírási feladatok ütemezése a legjobb munkamennyiség alapján történik. Csúcsidőben akár 30 perc vagy több időt is igénybe vehet, amíg egy átírási feladat elkezdi a feldolgozást. A végrehajtás során a legtöbb esetben az átírás állapota lesz Running
. Ennek az az oka, hogy a feladat a kötegelt átírás háttérrendszerére való áthelyezés pillanatában kap Running
állapotot. Az alapmodell használata esetén ez a hozzárendelés szinte azonnal megtörténik; az egyéni modellek esetében kissé lassabb. Így az átírási feladatok által az Running
állapotban töltött idő nem felel meg a tényleges átírási időnek, hanem a belső üzenetsorokban való várakozási időt is magában foglalja.
Az átírási feladat állapotának lekéréséhez használja a spx batch transcription status
parancsot. A kérelemparamétereket az alábbi utasítások szerint hozhatja létre:
- Állítsa a paramétert
transcription
a lekérni kívánt átirat azonosítójára.
Íme egy példa a Speech CLI parancsra az átírás állapotának lekéréséhez:
spx batch transcription status --api-version v3.2 --transcription YourTranscriptionId
A válasz törzsének a következő formátumban kell érkeznie:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3",
"model": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/base/aaa321e9-5a4e-4db1-88a2-f251bbe7b555"
},
"links": {
"files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files"
},
"properties": {
"diarizationEnabled": false,
"wordLevelTimestampsEnabled": false,
"displayFormWordLevelTimestampsEnabled": true,
"channels": [
0,
1
],
"punctuationMode": "DictatedAndAutomatic",
"profanityFilterMode": "Masked",
"duration": "PT3S"
},
"lastActionDateTime": "2024-05-10T18:39:09Z",
"status": "Succeeded",
"createdDateTime": "2024-05-10T18:39:07Z",
"locale": "en-US",
"displayName": "My Transcription"
}
A status
tulajdonság az átiratok aktuális állapotát jelzi. Az átírási és átírási jelentés akkor érhető el, ha az átírás állapota .Succeeded
A Speech CLI átiratokkal kapcsolatos súgójához futtassa a következő parancsot:
spx help batch transcription
Átírási eredmények lekérése
A Transcriptions_ListFiles művelet visszaadja az átirat eredményfájljainak listáját. Minden elküldött kötegátírási feladathoz egy átírási jelentésfájl tartozik. Emellett minden sikeresen átírt hangfájlhoz egy átiratfájlt (a végeredményt) is biztosítunk.
HTTP GET kérést kezdeményezhet az előző válasz törzsének "files" URI-jának használatával. Cserélje le YourTranscriptionId
az átírási azonosítót, cserélje le YourSubscriptionKey
a Speech erőforráskulcsára, és cserélje le YourServiceRegion
a Speech erőforrásrégiójára.
curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/YourTranscriptionId/files" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"
A válasz törzsének a következő formátumban kell érkeznie:
{
"values": [
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/2dd180a1-434e-4368-a1ac-37350700284f",
"name": "contenturl_0.json",
"kind": "Transcription",
"properties": {
"size": 3407
},
"createdDateTime": "2024-05-10T18:39:09Z",
"links": {
"contentUrl": "YourTranscriptionUrl"
}
},
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/c027c6a9-2436-4303-b64b-e98e3c9fc2e3",
"name": "contenturl_1.json",
"kind": "Transcription",
"properties": {
"size": 8233
},
"createdDateTime": "2024-05-10T18:39:09Z",
"links": {
"contentUrl": "YourTranscriptionUrl"
}
},
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/faea9a41-c95c-4d91-96ff-e39225def642",
"name": "report.json",
"kind": "TranscriptionReport",
"properties": {
"size": 279
},
"createdDateTime": "2024-05-10T18:39:09Z",
"links": {
"contentUrl": "YourTranscriptionReportUrl"
}
}
]
}
Az egyes átírási és átírási jelentésfájlok helye további részletekkel a válasz törzsében lesz visszaadva. A contentUrl
tulajdonság tartalmazza az átírási ("kind": "Transcription"
) vagy átírási jelentés ("kind": "TranscriptionReport"
) fájl URL-címét.
Ha nem adott meg tárolót az destinationContainerUrl
átírási kérelem tulajdonságában, az eredmények a Microsoft által felügyelt tárolóban lesznek tárolva. Az átírási feladat törlésekor az átírás eredményadatai is törlődnek.
A spx batch transcription list
parancs visszaadja az átírás eredményfájljainak listáját. Minden elküldött kötegátírási feladathoz egy átírási jelentésfájl tartozik. Emellett minden sikeresen átírt hangfájlhoz egy átiratfájlt (a végeredményt) is biztosítunk.
- Állítsa be a szükséges
files
jelzőt. - Állítsa be a szükséges
transcription
paramétert a naplók lekéréséhez használni kívánt átirat azonosítójára.
Íme egy példa Speech CLI-parancsra, amely lekéri az átírás eredményfájljainak listáját:
spx batch transcription list --api-version v3.2 --files --transcription YourTranscriptionId
A válasz törzsének a következő formátumban kell érkeznie:
{
"values": [
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/2dd180a1-434e-4368-a1ac-37350700284f",
"name": "contenturl_0.json",
"kind": "Transcription",
"properties": {
"size": 3407
},
"createdDateTime": "2024-05-10T18:39:09Z",
"links": {
"contentUrl": "YourTranscriptionUrl"
}
},
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/c027c6a9-2436-4303-b64b-e98e3c9fc2e3",
"name": "contenturl_1.json",
"kind": "Transcription",
"properties": {
"size": 8233
},
"createdDateTime": "2024-05-10T18:39:09Z",
"links": {
"contentUrl": "YourTranscriptionUrl"
}
},
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/faea9a41-c95c-4d91-96ff-e39225def642",
"name": "report.json",
"kind": "TranscriptionReport",
"properties": {
"size": 279
},
"createdDateTime": "2024-05-10T18:39:09Z",
"links": {
"contentUrl": "YourTranscriptionReportUrl"
}
}
]
}
Az egyes átírási és átírási jelentésfájlok helye további részletekkel a válasz törzsében lesz visszaadva. A contentUrl
tulajdonság tartalmazza az átírási ("kind": "Transcription"
) vagy átírási jelentés ("kind": "TranscriptionReport"
) fájl URL-címét.
Az eredmények alapértelmezés szerint a Microsoft által felügyelt tárolóban vannak tárolva. Az átírási feladat törlésekor az átírás eredményadatai is törlődnek.
Átírási jelentésfájl
Minden elküldött kötegelt átírási feladathoz egy átírási jelentésfájl tartozik.
Az egyes átírási eredményfájlok tartalma JSON formátumban van formázva, ahogyan az ebben a példában is látható.
{
"successfulTranscriptionsCount": 2,
"failedTranscriptionsCount": 0,
"details": [
{
"source": "https://crbn.us/hello.wav",
"status": "Succeeded"
},
{
"source": "https://crbn.us/whatstheweatherlike.wav",
"status": "Succeeded"
}
]
}
Átirat eredményfájlja
Minden sikeresen átírt hangfájlhoz egy átírási eredményfájl tartozik.
Az egyes átírási eredményfájlok tartalma JSON formátumban van formázva, ahogyan az ebben a példában is látható.
{
"source": "...",
"timestamp": "2023-07-10T14:28:16Z",
"durationInTicks": 25800000,
"duration": "PT2.58S",
"combinedRecognizedPhrases": [
{
"channel": 0,
"lexical": "hello world",
"itn": "hello world",
"maskedITN": "hello world",
"display": "Hello world."
}
],
"recognizedPhrases": [
{
"recognitionStatus": "Success",
"channel": 0,
"offset": "PT0.76S",
"duration": "PT1.32S",
"offsetInTicks": 7600000.0,
"durationInTicks": 13200000.0,
"nBest": [
{
"confidence": 0.5643338,
"lexical": "hello world",
"itn": "hello world",
"maskedITN": "hello world",
"display": "Hello world.",
"displayWords": [
{
"displayText": "Hello",
"offset": "PT0.76S",
"duration": "PT0.76S",
"offsetInTicks": 7600000.0,
"durationInTicks": 7600000.0
},
{
"displayText": "world.",
"offset": "PT1.52S",
"duration": "PT0.56S",
"offsetInTicks": 15200000.0,
"durationInTicks": 5600000.0
}
]
},
{
"confidence": 0.1769063,
"lexical": "helloworld",
"itn": "helloworld",
"maskedITN": "helloworld",
"display": "helloworld"
},
{
"confidence": 0.49964225,
"lexical": "hello worlds",
"itn": "hello worlds",
"maskedITN": "hello worlds",
"display": "hello worlds"
},
{
"confidence": 0.4995761,
"lexical": "hello worm",
"itn": "hello worm",
"maskedITN": "hello worm",
"display": "hello worm"
},
{
"confidence": 0.49418187,
"lexical": "hello word",
"itn": "hello word",
"maskedITN": "hello word",
"display": "hello word"
}
]
}
]
}
Az átírási feladat létrehozásakor beállított kérelemparamétertől függően az átírási fájl a következő eredménytulajdonságokat tartalmazhatja.
Tulajdonság | Leírás |
---|---|
channel |
Az eredmények csatornaszáma. A sztereó hangstreamek esetében a bal és a jobb csatornák az átirat során meg vannak osztva. Minden bemeneti hangfájlhoz létrejön egy JSON-eredményfájl. |
combinedRecognizedPhrases |
A csatorna összes kifejezésének összefűzött eredményei. |
confidence |
A felismerés megbízhatósági értéke. |
display |
A felismert szöveg megjelenítési formája. A hozzáadott írásjelek és a nagybetűsítés is szerepel benne. |
displayWords |
Az átírás minden egyes szava időbélyege. A displayFormWordLevelTimestampsEnabled kérelem tulajdonságot be kell állítani, true különben ez a tulajdonság nincs jelen.Megjegyzés: Ez a tulajdonság csak a Speech to text REST API 3.1-es és újabb verziójával érhető el. |
duration |
A hang időtartama. Az érték iso 8601 kódolású időtartam. |
durationInTicks |
A hang időtartama kullancsokban (egy pipa 100 nanoszekundum). |
itn |
A felismert szöveg inverz szöveg normalizált (ITN) formája. A program olyan rövidítéseket alkalmaz, mint a "Doctor Smith" és a "Dr Smith", a telefonszámok és más átalakítások. |
lexical |
A ténylegesen felismert szavak. |
locale |
A hang bemenetéből azonosított területi beállítás. A languageIdentification kérelem tulajdonságot be kell állítani, ellenkező esetben ez a tulajdonság nincs jelen.Megjegyzés: Ez a tulajdonság csak a Speech to text REST API 3.1-es és újabb verziójával érhető el. |
maskedITN |
Az ITN-űrlap trágár maszkolással. |
nBest |
Az aktuális kifejezés lehetséges átiratainak listája megbízhatósággal. |
offset |
A kifejezés hangjának eltolása. Az érték iso 8601 kódolású időtartam. |
offsetInTicks |
A kifejezés hangjának eltolása kullancsokban (egy pipa 100 nanoszekundum). |
recognitionStatus |
A felismerés állapota. Például: "Siker" vagy "Hiba". |
recognizedPhrases |
Az egyes kifejezések eredményeinek listája. |
source |
A bemeneti hangforrásként megadott URL-cím. A forrás megfelel az contentUrls or contentContainerUrl request tulajdonságnak. A source tulajdonság az egyetlen módja annak, hogy megerősítse az átirat hangbemenetét. |
speaker |
Az azonosított beszélő. A diarization és diarizationEnabled a kérelem tulajdonságait be kell állítani, különben ez a tulajdonság nincs jelen. |
timestamp |
Az átírás létrehozásának dátuma és időpontja. Az érték egy ISO 8601 kódolású időbélyeg. |
words |
Az eredmények listája a kifejezés minden egyes szavához lexikális szöveggel. A wordLevelTimestampsEnabled kérelem tulajdonságot be kell állítani, true különben ez a tulajdonság nincs jelen. |