الحصول على نتائج النسخ الدفعي

للحصول على نتائج النسخ، تحقق أولا من حالة مهمة النسخ. إذا اكتملت المهمة، يمكنك استرداد النسخ وتقرير النسخ.

الحصول على حالة النسخ

للحصول على حالة مهمة النسخ، استدع Transcriptions_Get تشغيل Speech to text REST API.

هام

مهام كتابة النص الدفعي تتم جدولتها على أساس أفضل جهد. في ساعات الذروة، قد يستغرق الأمر ما يصل إلى 30 دقيقة أو أكثر حتى تبدأ مهمة النسخ في المعالجة. في معظم الأحيان أثناء التنفيذ ستكون Runningحالة النسخ . وذلك لأن المهمة يتم Running تعيين الحالة في اللحظة التي تنتقل فيها إلى نظام النسخ الخلفي للدفعة. عند استخدام النموذج الأساسي، يحدث هذا التعيين على الفور تقريبا؛ إنه أبطأ قليلا للنماذج المخصصة. وبالتالي، فإن مقدار الوقت الذي تقضيه مهمة النسخ في Running الحالة لا يتوافق مع وقت النسخ الفعلي ولكنه يتضمن أيضا وقت الانتظار في قوائم الانتظار الداخلية.

قم بإجراء طلب HTTP GET باستخدام URI كما هو موضح في المثال التالي. استبدل YourTranscriptionId بمعرف النسخ الخاص بك، واستبدل YourSubscriptionKey بمفتاح مورد الكلام، واستبدل YourServiceRegion بمنطقة مورد الكلام.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/YourTranscriptionId" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

يجب أن تتلقى نص الاستجابة بالتنسيق التالي:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/aaa321e9-5a4e-4db1-88a2-f251bbe7b555"
  },
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files"
  },
  "properties": {
    "diarizationEnabled": false,
    "wordLevelTimestampsEnabled": false,
    "displayFormWordLevelTimestampsEnabled": true,
    "channels": [
      0,
      1
    ],
    "punctuationMode": "DictatedAndAutomatic",
    "profanityFilterMode": "Masked",
    "duration": "PT3S",
    "languageIdentification": {
      "candidateLocales": [
        "en-US",
        "de-DE",
        "es-ES"
      ]
    }
  },
  "lastActionDateTime": "2022-09-10T18:39:09Z",
  "status": "Succeeded",
  "createdDateTime": "2022-09-10T18:39:07Z",
  "locale": "en-US",
  "displayName": "My Transcription"
}

status تشير الخاصية إلى الحالة الحالية للنسخ. يتوفر تقرير النسخ والنسخ عندما تكون Succeededحالة النسخ هي .

هام

مهام كتابة النص الدفعي تتم جدولتها على أساس أفضل جهد. في ساعات الذروة، قد يستغرق الأمر ما يصل إلى 30 دقيقة أو أكثر حتى تبدأ مهمة النسخ في المعالجة. في معظم الأحيان أثناء التنفيذ ستكون Runningحالة النسخ . وذلك لأن المهمة يتم Running تعيين الحالة في اللحظة التي تنتقل فيها إلى نظام النسخ الخلفي للدفعة. عند استخدام النموذج الأساسي، يحدث هذا التعيين على الفور تقريبا؛ إنه أبطأ قليلا للنماذج المخصصة. وبالتالي، فإن مقدار الوقت الذي تقضيه مهمة النسخ في Running الحالة لا يتوافق مع وقت النسخ الفعلي ولكنه يتضمن أيضا وقت الانتظار في قوائم الانتظار الداخلية.

للحصول على حالة مهمة النسخ، استخدم spx batch transcription status الأمر . أنشئ عمليات الطلب وفقاً للتعليمات التالية:

  • قم بتعيين المعلمة transcription إلى معرف النسخ الذي تريد الحصول عليه.

فيما يلي مثال على أمر Speech CLI للحصول على حالة النسخ:

spx batch transcription status --api-version v3.1 --transcription YourTranscriptionId

يجب أن تتلقى نص الاستجابة بالتنسيق التالي:

{
  "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3",
  "model": {
    "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/models/base/aaa321e9-5a4e-4db1-88a2-f251bbe7b555"
  },
  "links": {
    "files": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files"
  },
  "properties": {
    "diarizationEnabled": false,
    "wordLevelTimestampsEnabled": false,
    "displayFormWordLevelTimestampsEnabled": true,
    "channels": [
      0,
      1
    ],
    "punctuationMode": "DictatedAndAutomatic",
    "profanityFilterMode": "Masked",
    "duration": "PT3S"
  },
  "lastActionDateTime": "2022-09-10T18:39:09Z",
  "status": "Succeeded",
  "createdDateTime": "2022-09-10T18:39:07Z",
  "locale": "en-US",
  "displayName": "My Transcription"
}

status تشير الخاصية إلى الحالة الحالية للنسخ. يتوفر تقرير النسخ والنسخ عندما تكون Succeededحالة النسخ هي .

للحصول على تعليمات Speech CLI في النسخ، قم بتشغيل الأمر التالي:

spx help batch transcription

احصل على نتائج كتابة الحديث

ترجع عملية Transcriptions_ListFiles قائمة بملفات النتائج للنسخ. يتم توفير ملف تقرير النسخ لكل مهمة نسخ دفعي تم إرسالها. بالإضافة إلى ذلك، يتم توفير ملف نسخ واحد (النتيجة النهائية) لكل ملف صوتي تم نسخه بنجاح.

قم بإجراء طلب HTTP GET باستخدام URI "الملفات" من نص الاستجابة السابق. استبدل YourTranscriptionId بمعرف النسخ الخاص بك، واستبدل YourSubscriptionKey بمفتاح مورد الكلام، واستبدل YourServiceRegion بمنطقة مورد الكلام.

curl -v -X GET "https://YourServiceRegion.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/YourTranscriptionId/files" -H "Ocp-Apim-Subscription-Key: YourSubscriptionKey"

يجب أن تتلقى نص الاستجابة بالتنسيق التالي:

{
  "values": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/2dd180a1-434e-4368-a1ac-37350700284f",
      "name": "contenturl_0.json",
      "kind": "Transcription",
      "properties": {
        "size": 3407
      },
      "createdDateTime": "2022-09-10T18:39:09Z",
      "links": {
        "contentUrl": "https://spsvcprodeus.blob.core.windows.net/bestor-c6e3ae79-1b48-41bf-92ff-940bea3e5c2d/TranscriptionData/637d9333-6559-47a6-b8de-c7d732c1ddf3_0_0.json?sv=2021-08-06&st=2022-09-10T18%3A36%3A01Z&se=2022-09-11T06%3A41%3A01Z&sr=b&sp=rl&sig=AobsqO9DH9CIOuGC5ifFH3QpkQay6PjHiWn5G87FcIg%3D"
      }
    },
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/c027c6a9-2436-4303-b64b-e98e3c9fc2e3",
      "name": "contenturl_1.json",
      "kind": "Transcription",
      "properties": {
        "size": 8233
      },
      "createdDateTime": "2022-09-10T18:39:09Z",
      "links": {
        "contentUrl": "https://spsvcprodeus.blob.core.windows.net/bestor-c6e3ae79-1b48-41bf-92ff-940bea3e5c2d/TranscriptionData/637d9333-6559-47a6-b8de-c7d732c1ddf3_1_0.json?sv=2021-08-06&st=2022-09-10T18%3A36%3A01Z&se=2022-09-11T06%3A41%3A01Z&sr=b&sp=rl&sig=wO3VxbhLK4PhT3rwLpJXBYHYQi5EQqyl%2Fp1lgjNvfh0%3D"
      }
    },
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/faea9a41-c95c-4d91-96ff-e39225def642",
      "name": "report.json",
      "kind": "TranscriptionReport",
      "properties": {
        "size": 279
      },
      "createdDateTime": "2022-09-10T18:39:09Z",
      "links": {
        "contentUrl": "https://spsvcprodeus.blob.core.windows.net/bestor-c6e3ae79-1b48-41bf-92ff-940bea3e5c2d/TranscriptionData/637d9333-6559-47a6-b8de-c7d732c1ddf3_report.json?sv=2021-08-06&st=2022-09-10T18%3A36%3A01Z&se=2022-09-11T06%3A41%3A01Z&sr=b&sp=rl&sig=gk1k%2Ft5qa1TpmM45tPommx%2F2%2Bc%2FUUfsYTX5FoSa1u%2FY%3D"
      }
    }
  ]
}

يتم إرجاع موقع كل نسخ وملفات تقرير النسخ مع مزيد من التفاصيل في نص الاستجابة. contentUrl تحتوي الخاصية على عنوان URL لملف النسخ ("kind": "Transcription") أو تقرير النسخ ("kind": "TranscriptionReport").

إذا لم تحدد حاوية في destinationContainerUrl خاصية طلب النسخ، يتم تخزين النتائج في حاوية تديرها Microsoft. عند حذف مهمة النسخ، يتم أيضا حذف بيانات نتيجة النسخ.

يقوم spx batch transcription list الأمر بإرجاع قائمة بملفات النتائج للنسخ. يتم توفير ملف تقرير النسخ لكل مهمة نسخ دفعي تم إرسالها. بالإضافة إلى ذلك، يتم توفير ملف نسخ واحد (النتيجة النهائية) لكل ملف صوتي تم نسخه بنجاح.

  • تعيين العلامة المطلوبة files .
  • تعيين المعلمة المطلوبة transcription إلى معرف النسخ الذي تريد الحصول على سجلات.

فيما يلي مثال على أمر Speech CLI الذي يحصل على قائمة بملفات النتائج للنسخ:

spx batch transcription list --api-version v3.1 --files --transcription YourTranscriptionId

يجب أن تتلقى نص الاستجابة بالتنسيق التالي:

{
  "values": [
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/2dd180a1-434e-4368-a1ac-37350700284f",
      "name": "contenturl_0.json",
      "kind": "Transcription",
      "properties": {
        "size": 3407
      },
      "createdDateTime": "2022-09-10T18:39:09Z",
      "links": {
        "contentUrl": "https://spsvcprodeus.blob.core.windows.net/bestor-c6e3ae79-1b48-41bf-92ff-940bea3e5c2d/TranscriptionData/637d9333-6559-47a6-b8de-c7d732c1ddf3_0_0.json?sv=2021-08-06&st=2022-09-10T18%3A36%3A01Z&se=2022-09-11T06%3A41%3A01Z&sr=b&sp=rl&sig=AobsqO9DH9CIOuGC5ifFH3QpkQay6PjHiWn5G87FcIg%3D"
      }
    },
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/c027c6a9-2436-4303-b64b-e98e3c9fc2e3",
      "name": "contenturl_1.json",
      "kind": "Transcription",
      "properties": {
        "size": 8233
      },
      "createdDateTime": "2022-09-10T18:39:09Z",
      "links": {
        "contentUrl": "https://spsvcprodeus.blob.core.windows.net/bestor-c6e3ae79-1b48-41bf-92ff-940bea3e5c2d/TranscriptionData/637d9333-6559-47a6-b8de-c7d732c1ddf3_1_0.json?sv=2021-08-06&st=2022-09-10T18%3A36%3A01Z&se=2022-09-11T06%3A41%3A01Z&sr=b&sp=rl&sig=wO3VxbhLK4PhT3rwLpJXBYHYQi5EQqyl%2Fp1lgjNvfh0%3D"
      }
    },
    {
      "self": "https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/637d9333-6559-47a6-b8de-c7d732c1ddf3/files/faea9a41-c95c-4d91-96ff-e39225def642",
      "name": "report.json",
      "kind": "TranscriptionReport",
      "properties": {
        "size": 279
      },
      "createdDateTime": "2022-09-10T18:39:09Z",
      "links": {
        "contentUrl": "https://spsvcprodeus.blob.core.windows.net/bestor-c6e3ae79-1b48-41bf-92ff-940bea3e5c2d/TranscriptionData/637d9333-6559-47a6-b8de-c7d732c1ddf3_report.json?sv=2021-08-06&st=2022-09-10T18%3A36%3A01Z&se=2022-09-11T06%3A41%3A01Z&sr=b&sp=rl&sig=gk1k%2Ft5qa1TpmM45tPommx%2F2%2Bc%2FUUfsYTX5FoSa1u%2FY%3D"
      }
    }
  ]
}

يتم إرجاع موقع كل نسخ وملفات تقرير النسخ مع مزيد من التفاصيل في نص الاستجابة. contentUrl تحتوي الخاصية على عنوان URL لملف النسخ ("kind": "Transcription") أو تقرير النسخ ("kind": "TranscriptionReport").

بشكل افتراضي، يتم تخزين النتائج في حاوية تديرها Microsoft. عند حذف مهمة النسخ، يتم أيضا حذف بيانات نتيجة النسخ.

ملف تقرير النسخ

يتم توفير ملف تقرير نسخ واحد لكل مهمة كتابة دفعية تم إرسالها.

يتم تنسيق محتويات كل ملف نتيجة كتابة ك JSON، كما هو موضح في هذا المثال.

{
  "successfulTranscriptionsCount": 2,
  "failedTranscriptionsCount": 0,
  "details": [
    {
      "source": "https://crbn.us/hello.wav",
      "status": "Succeeded"
    },
    {
      "source": "https://crbn.us/whatstheweatherlike.wav",
      "status": "Succeeded"
    }
  ]
}

ملف نتيجة النسخ

يتم توفير ملف نتيجة كتابة واحد لكل ملف صوتي تم نسخه بنجاح.

يتم تنسيق محتويات كل ملف نتيجة كتابة ك JSON، كما هو موضح في هذا المثال.

{
  "source": "...",
  "timestamp": "2023-07-10T14:28:16Z",
  "durationInTicks": 25800000,
  "duration": "PT2.58S",
  "combinedRecognizedPhrases": [
    {
      "channel": 0,
      "lexical": "hello world",
      "itn": "hello world",
      "maskedITN": "hello world",
      "display": "Hello world."
    }
  ],
  "recognizedPhrases": [
    {
      "recognitionStatus": "Success",
      "channel": 0,
      "offset": "PT0.76S",
      "duration": "PT1.32S",
      "offsetInTicks": 7600000.0,
      "durationInTicks": 13200000.0,
      "nBest": [
        {
          "confidence": 0.5643338,
          "lexical": "hello world",
          "itn": "hello world",
          "maskedITN": "hello world",
          "display": "Hello world.",
          "displayWords": [
            {
              "displayText": "Hello",
              "offset": "PT0.76S",
              "duration": "PT0.76S",
              "offsetInTicks": 7600000.0,
              "durationInTicks": 7600000.0
            },
            {
              "displayText": "world.",
              "offset": "PT1.52S",
              "duration": "PT0.56S",
              "offsetInTicks": 15200000.0,
              "durationInTicks": 5600000.0
            }
          ]
        },
        {
          "confidence": 0.1769063,
          "lexical": "helloworld",
          "itn": "helloworld",
          "maskedITN": "helloworld",
          "display": "helloworld"
        },
        {
          "confidence": 0.49964225,
          "lexical": "hello worlds",
          "itn": "hello worlds",
          "maskedITN": "hello worlds",
          "display": "hello worlds"
        },
        {
          "confidence": 0.4995761,
          "lexical": "hello worm",
          "itn": "hello worm",
          "maskedITN": "hello worm",
          "display": "hello worm"
        },
        {
          "confidence": 0.49418187,
          "lexical": "hello word",
          "itn": "hello word",
          "maskedITN": "hello word",
          "display": "hello word"
        }
      ]
    }
  ]
}

اعتمادا جزئيا على معلمات الطلب التي تم تعيينها عند إنشاء مهمة النسخ، يمكن أن يحتوي ملف النسخ على خصائص النتيجة التالية.

الخاصية ‏‏الوصف
channel رقم قناة النتائج. بالنسبة لتدفقات الصوت الاستريو، يتم تقسيم القنوات اليمنى واليسرى أثناء كتابة النص. يتم إنشاء ملف نتيجة JSON لكل ملف صوت إدخال.
combinedRecognizedPhrases النتائج المتسلسلة لجميع العبارات الخاصة بالقناة.
confidence قيمة الثقة للتعرف.
display نموذج عرض النص الذي تم التعرف عليه. علامات الترقيم والأحرف الكبيرة المضافة يتم تضمينها.
displayWords الطوابع الزمنية لكل كلمة من النسخ. displayFormWordLevelTimestampsEnabled يجب تعيين خاصية الطلب إلى true، وإلا فإن هذه الخاصية غير موجودة.

ملاحظة: تتوفر هذه الخاصية فقط مع Speech to text REST API الإصدار 3.1.
duration مدة الصوت. القيمة هي مدة ترميز ISO 8601.
durationInTicks مدة الصوت في علامات التجزئة (علامة واحدة هي 100 نانو ثانية).
itn النص العكسي الذي تمت تسويته (ITN) للنص الذي تم التعرف عليه. يتم تطبيق اختصارات مثل "الدكتور سميث" إلى "الدكتور سميث"، وأرقام الهواتف، وغيرها من التحويلات.
lexical تم التعرف على الكلمات الفعلية.
locale اللغة المحددة من إدخال الصوت. languageIdentification يجب تعيين خاصية الطلب، وإلا فإن هذه الخاصية غير موجودة.

ملاحظة: تتوفر هذه الخاصية فقط مع Speech to text REST API الإصدار 3.1.
maskedITN نموذج ITN مع تطبيق إخفاء الألفاظ النابية.
nBest قائمة بالنسخ الممكنة للعبارة الحالية بثقة.
offset الإزاحة في الصوت لهذه العبارة. القيمة هي مدة ترميز ISO 8601.
offsetInTicks الإزاحة في الصوت لهذه العبارة في علامات التجزئة (علامة واحدة هي 100 نانو ثانية).
recognitionStatus حالة التعرف. على سبيل المثال: "نجاح" أو "فشل".
recognizedPhrases قائمة النتائج لكل عبارة.
source عنوان URL الذي تم توفيره كمصدر صوت الإدخال. يتوافق المصدر مع contentUrls خاصية أو contentContainerUrl طلب. source الخاصية هي الطريقة الوحيدة لتأكيد إدخال الصوت للنسخ.
speaker المتحدث المحدد. diarization يجب تعيين خصائص الطلب وdiarizationEnabled، وإلا فإن هذه الخاصية غير موجودة.
timestamp تاريخ ووقت إنشاء النسخ. القيمة هي طابع زمني مرمز ISO 8601.
words قائمة بالنتائج مع نص معجمي لكل كلمة من العبارة. wordLevelTimestampsEnabled يجب تعيين خاصية الطلب إلى true، وإلا فإن هذه الخاصية غير موجودة.

الخطوات التالية