الحصول على نتائج النسخ الدفعي
للحصول على نتائج النسخ، تحقق أولا من حالة مهمة النسخ. إذا اكتملت المهمة، يمكنك استرداد النسخ وتقرير النسخ.
الحصول على حالة النسخ
للحصول على حالة مهمة النسخ، استدع Transcriptions_Get تشغيل Speech to text REST API.
هام
مهام كتابة النص الدفعي تتم جدولتها على أساس أفضل جهد. في ساعات الذروة، قد يستغرق الأمر ما يصل إلى 30 دقيقة أو أكثر حتى تبدأ مهمة النسخ في المعالجة. في معظم الأحيان أثناء التنفيذ ستكون Running
حالة النسخ . وذلك لأن المهمة يتم Running
تعيين الحالة في اللحظة التي تنتقل فيها إلى نظام النسخ الخلفي للدفعة. عند استخدام النموذج الأساسي، يحدث هذا التعيين على الفور تقريبا؛ إنه أبطأ قليلا للنماذج المخصصة. وبالتالي، فإن مقدار الوقت الذي تقضيه مهمة النسخ في Running
الحالة لا يتوافق مع وقت النسخ الفعلي ولكنه يتضمن أيضا وقت الانتظار في قوائم الانتظار الداخلية.
قم بإجراء طلب HTTP GET باستخدام URI كما هو موضح في المثال التالي. استبدل YourTranscriptionId
بمعرف النسخ الخاص بك، واستبدل YourSubscriptionKey
بمفتاح مورد الكلام، واستبدل YourServiceRegion
بمنطقة مورد الكلام.
curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/YourTranscriptionId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"
يجب أن تتلقى نص الاستجابة بالتنسيق التالي:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3",
"model": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/base/aaa321e9-5a4e-4db1-88a2-f251bbe7b555"
},
"links": {
"files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files"
},
"properties": {
"diarizationEnabled": false,
"wordLevelTimestampsEnabled": false,
"displayFormWordLevelTimestampsEnabled": true,
"channels": [
0,
1
],
"punctuationMode": "DictatedAndAutomatic",
"profanityFilterMode": "Masked",
"duration": "PT3S",
"languageIdentification": {
"candidateLocales": [
"en-US",
"de-DE",
"es-ES"
]
}
},
"lastActionDateTime": "2024-05-10T18:39:09Z",
"status": "Succeeded",
"createdDateTime": "2024-05-10T18:39:07Z",
"locale": "en-US",
"displayName": "My Transcription"
}
status
تشير الخاصية إلى الحالة الحالية للنسخ. يتوفر تقرير النسخ والنسخ عندما تكون Succeeded
حالة النسخ هي .
هام
مهام كتابة النص الدفعي تتم جدولتها على أساس أفضل جهد. في ساعات الذروة، قد يستغرق الأمر ما يصل إلى 30 دقيقة أو أكثر حتى تبدأ مهمة النسخ في المعالجة. في معظم الأحيان أثناء التنفيذ ستكون Running
حالة النسخ . وذلك لأن المهمة يتم Running
تعيين الحالة في اللحظة التي تنتقل فيها إلى نظام النسخ الخلفي للدفعة. عند استخدام النموذج الأساسي، يحدث هذا التعيين على الفور تقريبا؛ إنه أبطأ قليلا للنماذج المخصصة. وبالتالي، فإن مقدار الوقت الذي تقضيه مهمة النسخ في Running
الحالة لا يتوافق مع وقت النسخ الفعلي ولكنه يتضمن أيضا وقت الانتظار في قوائم الانتظار الداخلية.
للحصول على حالة مهمة النسخ، استخدم spx batch transcription status
الأمر . أنشئ عمليات الطلب وفقاً للتعليمات التالية:
- قم بتعيين المعلمة
transcription
إلى معرف النسخ الذي تريد الحصول عليه.
فيما يلي مثال على أمر Speech CLI للحصول على حالة النسخ:
spx batch transcription status --api-version v3.2 --transcription YourTranscriptionId
يجب أن تتلقى نص الاستجابة بالتنسيق التالي:
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3",
"model": {
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/models/base/aaa321e9-5a4e-4db1-88a2-f251bbe7b555"
},
"links": {
"files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files"
},
"properties": {
"diarizationEnabled": false,
"wordLevelTimestampsEnabled": false,
"displayFormWordLevelTimestampsEnabled": true,
"channels": [
0,
1
],
"punctuationMode": "DictatedAndAutomatic",
"profanityFilterMode": "Masked",
"duration": "PT3S"
},
"lastActionDateTime": "2024-05-10T18:39:09Z",
"status": "Succeeded",
"createdDateTime": "2024-05-10T18:39:07Z",
"locale": "en-US",
"displayName": "My Transcription"
}
status
تشير الخاصية إلى الحالة الحالية للنسخ. يتوفر تقرير النسخ والنسخ عندما تكون Succeeded
حالة النسخ هي .
للحصول على تعليمات Speech CLI في النسخ، قم بتشغيل الأمر التالي:
spx help batch transcription
احصل على نتائج كتابة الحديث
ترجع عملية Transcriptions_ListFiles قائمة بملفات النتائج للنسخ. يتم توفير ملف تقرير النسخ لكل مهمة نسخ دفعي تم إرسالها. بالإضافة إلى ذلك، يتم توفير ملف نسخ واحد (النتيجة النهائية) لكل ملف صوتي تم نسخه بنجاح.
قم بإجراء طلب HTTP GET باستخدام URI "الملفات" من نص الاستجابة السابق. استبدل YourTranscriptionId
بمعرف النسخ الخاص بك، واستبدل YourSubscriptionKey
بمفتاح مورد الكلام، واستبدل YourServiceRegion
بمنطقة مورد الكلام.
curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/YourTranscriptionId/files" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"
يجب أن تتلقى نص الاستجابة بالتنسيق التالي:
{
"values": [
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/2dd180a1-434e-4368-a1ac-37350700284f",
"name": "contenturl_0.json",
"kind": "Transcription",
"properties": {
"size": 3407
},
"createdDateTime": "2024-05-10T18:39:09Z",
"links": {
"contentUrl": "YourTranscriptionUrl"
}
},
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/c027c6a9-2436-4303-b64b-e98e3c9fc2e3",
"name": "contenturl_1.json",
"kind": "Transcription",
"properties": {
"size": 8233
},
"createdDateTime": "2024-05-10T18:39:09Z",
"links": {
"contentUrl": "YourTranscriptionUrl"
}
},
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/faea9a41-c95c-4d91-96ff-e39225def642",
"name": "report.json",
"kind": "TranscriptionReport",
"properties": {
"size": 279
},
"createdDateTime": "2024-05-10T18:39:09Z",
"links": {
"contentUrl": "YourTranscriptionReportUrl"
}
}
]
}
يتم إرجاع موقع كل نسخ وملفات تقرير النسخ مع مزيد من التفاصيل في نص الاستجابة. contentUrl
تحتوي الخاصية على عنوان URL لملف النسخ ("kind": "Transcription"
) أو تقرير النسخ ("kind": "TranscriptionReport"
).
إذا لم تحدد حاوية في destinationContainerUrl
خاصية طلب النسخ، يتم تخزين النتائج في حاوية تديرها Microsoft. عند حذف مهمة النسخ، يتم أيضا حذف بيانات نتيجة النسخ.
يقوم spx batch transcription list
الأمر بإرجاع قائمة بملفات النتائج للنسخ. يتم توفير ملف تقرير النسخ لكل مهمة نسخ دفعي تم إرسالها. بالإضافة إلى ذلك، يتم توفير ملف نسخ واحد (النتيجة النهائية) لكل ملف صوتي تم نسخه بنجاح.
- تعيين العلامة المطلوبة
files
. - تعيين المعلمة المطلوبة
transcription
إلى معرف النسخ الذي تريد الحصول على سجلات.
فيما يلي مثال على أمر Speech CLI الذي يحصل على قائمة بملفات النتائج للنسخ:
spx batch transcription list --api-version v3.2 --files --transcription YourTranscriptionId
يجب أن تتلقى نص الاستجابة بالتنسيق التالي:
{
"values": [
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/2dd180a1-434e-4368-a1ac-37350700284f",
"name": "contenturl_0.json",
"kind": "Transcription",
"properties": {
"size": 3407
},
"createdDateTime": "2024-05-10T18:39:09Z",
"links": {
"contentUrl": "YourTranscriptionUrl"
}
},
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/c027c6a9-2436-4303-b64b-e98e3c9fc2e3",
"name": "contenturl_1.json",
"kind": "Transcription",
"properties": {
"size": 8233
},
"createdDateTime": "2024-05-10T18:39:09Z",
"links": {
"contentUrl": "YourTranscriptionUrl"
}
},
{
"self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.2/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/faea9a41-c95c-4d91-96ff-e39225def642",
"name": "report.json",
"kind": "TranscriptionReport",
"properties": {
"size": 279
},
"createdDateTime": "2024-05-10T18:39:09Z",
"links": {
"contentUrl": "YourTranscriptionReportUrl"
}
}
]
}
يتم إرجاع موقع كل نسخ وملفات تقرير النسخ مع مزيد من التفاصيل في نص الاستجابة. contentUrl
تحتوي الخاصية على عنوان URL لملف النسخ ("kind": "Transcription"
) أو تقرير النسخ ("kind": "TranscriptionReport"
).
بشكل افتراضي، يتم تخزين النتائج في حاوية تديرها Microsoft. عند حذف مهمة النسخ، يتم أيضا حذف بيانات نتيجة النسخ.
ملف تقرير النسخ
يتم توفير ملف تقرير نسخ واحد لكل مهمة كتابة دفعية تم إرسالها.
يتم تنسيق محتويات كل ملف نتيجة كتابة ك JSON، كما هو موضح في هذا المثال.
{
"successfulTranscriptionsCount": 2,
"failedTranscriptionsCount": 0,
"details": [
{
"source": "https://crbn.us/hello.wav",
"status": "Succeeded"
},
{
"source": "https://crbn.us/whatstheweatherlike.wav",
"status": "Succeeded"
}
]
}
ملف نتيجة النسخ
يتم توفير ملف نتيجة كتابة واحد لكل ملف صوتي تم نسخه بنجاح.
يتم تنسيق محتويات كل ملف نتيجة كتابة ك JSON، كما هو موضح في هذا المثال.
{
"source": "...",
"timestamp": "2023-07-10T14:28:16Z",
"durationInTicks": 25800000,
"duration": "PT2.58S",
"combinedRecognizedPhrases": [
{
"channel": 0,
"lexical": "hello world",
"itn": "hello world",
"maskedITN": "hello world",
"display": "Hello world."
}
],
"recognizedPhrases": [
{
"recognitionStatus": "Success",
"channel": 0,
"offset": "PT0.76S",
"duration": "PT1.32S",
"offsetInTicks": 7600000.0,
"durationInTicks": 13200000.0,
"nBest": [
{
"confidence": 0.5643338,
"lexical": "hello world",
"itn": "hello world",
"maskedITN": "hello world",
"display": "Hello world.",
"displayWords": [
{
"displayText": "Hello",
"offset": "PT0.76S",
"duration": "PT0.76S",
"offsetInTicks": 7600000.0,
"durationInTicks": 7600000.0
},
{
"displayText": "world.",
"offset": "PT1.52S",
"duration": "PT0.56S",
"offsetInTicks": 15200000.0,
"durationInTicks": 5600000.0
}
]
},
{
"confidence": 0.1769063,
"lexical": "helloworld",
"itn": "helloworld",
"maskedITN": "helloworld",
"display": "helloworld"
},
{
"confidence": 0.49964225,
"lexical": "hello worlds",
"itn": "hello worlds",
"maskedITN": "hello worlds",
"display": "hello worlds"
},
{
"confidence": 0.4995761,
"lexical": "hello worm",
"itn": "hello worm",
"maskedITN": "hello worm",
"display": "hello worm"
},
{
"confidence": 0.49418187,
"lexical": "hello word",
"itn": "hello word",
"maskedITN": "hello word",
"display": "hello word"
}
]
}
]
}
اعتمادا جزئيا على معلمات الطلب التي تم تعيينها عند إنشاء مهمة النسخ، يمكن أن يحتوي ملف النسخ على خصائص النتيجة التالية.
الخاصية | الوصف |
---|---|
channel |
رقم قناة النتائج. بالنسبة لتدفقات الصوت الاستريو، يتم تقسيم القنوات اليمنى واليسرى أثناء كتابة النص. يتم إنشاء ملف نتيجة JSON لكل ملف صوت إدخال. |
combinedRecognizedPhrases |
النتائج المتسلسلة لجميع العبارات الخاصة بالقناة. |
confidence |
قيمة الثقة للتعرف. |
display |
نموذج عرض النص الذي تم التعرف عليه. علامات الترقيم والأحرف الكبيرة المضافة يتم تضمينها. |
displayWords |
الطوابع الزمنية لكل كلمة من النسخ. displayFormWordLevelTimestampsEnabled يجب تعيين خاصية الطلب إلى true ، وإلا فإن هذه الخاصية غير موجودة.ملاحظة: تتوفر هذه الخاصية فقط مع Speech to text REST API الإصدار 3.1 والإصدارات الأحدث. |
duration |
مدة الصوت. القيمة هي مدة ترميز ISO 8601. |
durationInTicks |
مدة الصوت في علامات التجزئة (علامة واحدة هي 100 نانو ثانية). |
itn |
النص العكسي الذي تمت تسويته (ITN) للنص الذي تم التعرف عليه. يتم تطبيق اختصارات مثل "الدكتور سميث" إلى "الدكتور سميث"، وأرقام الهواتف، وغيرها من التحويلات. |
lexical |
تم التعرف على الكلمات الفعلية. |
locale |
اللغة المحددة من إدخال الصوت. languageIdentification يجب تعيين خاصية الطلب، وإلا فإن هذه الخاصية غير موجودة.ملاحظة: تتوفر هذه الخاصية فقط مع Speech to text REST API الإصدار 3.1 والإصدارات الأحدث. |
maskedITN |
نموذج ITN مع تطبيق إخفاء الألفاظ النابية. |
nBest |
قائمة بالنسخ الممكنة للعبارة الحالية بثقة. |
offset |
الإزاحة في الصوت لهذه العبارة. القيمة هي مدة ترميز ISO 8601. |
offsetInTicks |
الإزاحة في الصوت لهذه العبارة في علامات التجزئة (علامة واحدة هي 100 نانو ثانية). |
recognitionStatus |
حالة التعرف. على سبيل المثال: "نجاح" أو "فشل". |
recognizedPhrases |
قائمة النتائج لكل عبارة. |
source |
عنوان URL الذي تم توفيره كمصدر صوت الإدخال. يتوافق المصدر مع contentUrls خاصية أو contentContainerUrl طلب. source الخاصية هي الطريقة الوحيدة لتأكيد إدخال الصوت للنسخ. |
speaker |
المتحدث المحدد. diarization يجب تعيين خصائص الطلب وdiarizationEnabled ، وإلا فإن هذه الخاصية غير موجودة. |
timestamp |
تاريخ ووقت إنشاء النسخ. القيمة هي طابع زمني مرمز ISO 8601. |
words |
قائمة بالنتائج مع نص معجمي لكل كلمة من العبارة. wordLevelTimestampsEnabled يجب تعيين خاصية الطلب إلى true ، وإلا فإن هذه الخاصية غير موجودة. |
الخطوات التالية
الملاحظات
https://aka.ms/ContentUserFeedback.
قريبًا: خلال عام 2024، سنتخلص تدريجيًا من GitHub Issues بوصفها آلية إرسال ملاحظات للمحتوى ونستبدلها بنظام ملاحظات جديد. لمزيد من المعلومات، راجعإرسال الملاحظات وعرضها المتعلقة بـ