استخدام مورد الكلام إحضار مساحة التخزين الخاصة بك (BYOS) لتحويل الكلام إلى نص

يمكن استخدام إحضار التخزين الخاص بك (BYOS) في الكلام التالي إلى سيناريوهات النص:

  • كتابة حديث دُفعة
  • النسخ في الوقت الحقيقي مع تمكين تسجيل نتائج الصوت والنسخ
  • الكلام المخصص

يمكن استخدام مورد Speech واحد لإقران حساب التخزين لجميع السيناريوهات في وقت واحد.

تشرح هذه المقالة بعمق كيفية استخدام مورد الكلام الممكن بواسطة BYOS في جميع سيناريوهات الكلام إلى النص. تشير المقالة إلى أن لديك مورد Speech تم تكوينه بالكامل بواسطة BYOS وحساب التخزين المقترن.

تخزين البيانات.

عند استخدام BYOS، لا تحتفظ خدمة الكلام بأي بيانات اصطناعية للعميل بعد اكتمال معالجة البيانات (النسخ والتدريب النموذجي واختبار النموذج). ومع ذلك، يتم تخزين بعض بيانات التعريف غير المشتقة من محتوى المستخدم داخل أماكن خدمة الكلام. على سبيل المثال، في سيناريو الكلام المخصص، تحتفظ الخدمة بمعلومات معينة حول نقاط النهاية المخصصة، مثل النماذج التي يستخدمونها.

يخزن حساب التخزين المرتبط ب BYOS البيانات التالية:

إشعار

اختياري في هذا القسم يعني أنه من الممكن، ولكن ليس مطلوبا لتخزين البيانات الاصطناعية المعينة في حساب التخزين المرتبط ب BYOS. إذا لزم الأمر، يمكن تخزينها في مكان آخر.

النسخ الدفعي

  • الصوت المصدر (اختياري)
  • نتائج النسخ الدفعي

النسخ في الوقت الحقيقي مع تمكين تسجيل نتائج الصوت والنسخ

  • سجلات نتائج الصوت والنسخ

الكلام المخصص

  • الملفات المصدر لمجموعات البيانات لتدريب النموذج واختباره (اختياري)
  • جميع البيانات وبيانات التعريف المتعلقة بالنماذج المخصصة التي يستضيفها مورد الكلام الممكن بواسطة BYOS (بما في ذلك نسخ من مجموعات البيانات لتدريب النموذج واختباره)

كتابة حديث دُفعة

يتم استخدام النسخ الدفعي لنسخ كمية كبيرة من البيانات الصوتية في التخزين. إذا لم تكن معتادا على النسخ الدفعي، فشاهد هذه المقالة أولا.

نفذ هذه الخطوات لتنفيذ النسخ الدفعي باستخدام مورد الكلام الممكن بواسطة BYOS:

  1. ابدأ النسخ الدفعي كما هو موضح في هذا الدليل.

    هام

    لا تستخدم destinationContainerUrl المعلمة في طلب النسخ. إذا كنت تستخدم BYOS، يتم تخزين نتائج النسخ في حساب التخزين المرتبط ب BYOS تلقائيا.

    إذا كنت تستخدم destinationContainerUrl المعلمة، فإنها ستعمل، ولكنها توفر أمانا أقل بكثير لبياناتك، بسبب استخدام SAS المخصص. راجع التفاصيل هنا.

  2. عند اكتمال النسخ، احصل على نتائج النسخ وفقا لهذا الدليل. ضع في اعتبارك استخدام sasValidityInSeconds المعلمة (راجع القسم التالي).

تستخدم customspeech-artifacts خدمة الكلام حاوية Blob في حساب التخزين المرتبط ب BYOS لتخزين نتائج النسخ المتوسطة والنهائية.

تنبيه

تعتمد خدمة الكلام على مسارات حاوية Blob المعرفة مسبقا وأسماء الملفات لوحدة النسخ الدفعي لتعمل بشكل صحيح. لا تقم بنقل محتويات الحاوية أو إعادة تسميتها أو تغييرها بأي شكل من customspeech-artifacts الأشكال.

من المحتمل جدا أن يؤدي الفشل في القيام بذلك إلى تصحيح أخطاء الخدمة 4xx و5xx.

استخدم الأدوات القياسية للتفاعل مع النسخ الدفعي. راجع التفاصيل في قسم النسخ الدفعي.

الحصول على نتائج النسخ الدفعي عبر واجهة برمجة تطبيقات REST

يدعم Speech to text REST API موارد الكلام الممكنة بواسطة BYOS بشكل كامل. ومع ذلك، نظرا لأنه يتم تخزين البيانات الآن داخل حساب التخزين الممكن بواسطة BYOS، فإن طلبات مثل الحصول على ملفات النسخ تتفاعل مع تخزين Blob لحساب التخزين المرتبط ب BYOS، بدلا من موارد خدمة الكلام الداخلية. يسمح باستخدام نفس التعليمات البرمجية المستندة إلى واجهة برمجة تطبيقات REST لكل من موارد الكلام "العادية" والممكنة بواسطة BYOS.

للحصول على أقصى قدر من الأمان، استخدم المعلمة sasValidityInSeconds مع القيمة المعينة إلى 0 في الطلبات، التي ترجع عناوين URL لملف البيانات، مثل طلب الحصول على ملفات النسخ. فيما يلي مثال على عنوان URL للطلب:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/transcriptions/3b24ca19-2eb1-4a2a-b964-35d89eca486b/files?sasValidityInSeconds=0

يقوم مثل هذا الطلب بإرجاع عناوين URL لحساب التخزين المباشر إلى ملفات البيانات (بدون SAS أو إضافات أخرى). على سبيل المثال:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/TranscriptionData/3b24ca19-2eb1-4a2a-b964-35d89eca486b_0_0.json"
      }

يضمن عنوان URL لهذا التنسيق أن هويات Microsoft Entra فقط (المستخدمين، وكيانات الخدمة، والهويات المدارة) التي لها حقوق وصول كافية (مثل دور Storage Blob Data Reader ) يمكنها الوصول إلى البيانات من عنوان URL.

تحذير

إذا sasValidityInSeconds تم حذف المعلمة في طلب Get Transcription Files أو تلك المشابهة، فسيتم إنشاء SAS لتفويض المستخدم مع صلاحية 5 أيام لكل عنوان URL لملف بيانات يتم إرجاعه. يتم توقيع SAS هذا بواسطة الهوية المدارة المعينة من قبل النظام لمورد الكلام الذي يدعم BYOS. وبسبب ذلك، يسمح SAS بالوصول إلى البيانات، حتى إذا تم تعطيل الوصول إلى مفتاح حساب التخزين. راجع التفاصيل هنا.

النسخ في الوقت الحقيقي مع تمكين تسجيل نتائج الصوت والنسخ

يمكنك تمكين التسجيل لكل من إدخال الصوت والكلام المتعرف عليه عند استخدام ترجمة الكلام إلى نص أو كلام. راجع الوصف الكامل في هذه المقالة.

إذا كنت تستخدم BYOS، فستجد السجلات في customspeech-audiologs حاوية Blob في حساب التخزين المرتبط ب BYOS.

تحذير

يتم الاحتفاظ ببيانات التسجيل لمدة 5 أيام. بعد هذه الفترة، يتم حذف السجلات تلقائيا. هذا صالح لموارد الكلام الممكنة بواسطة BYOS أيضا. إذا كنت تريد الاحتفاظ بالسجلات لفترة أطول، فانسخ الملفات والمجلدات المراسلة من customspeech-audiologs حاوية Blob مباشرة أو استخدم REST API.

الحصول على سجلات النسخ في الوقت الحقيقي عبر واجهة برمجة تطبيقات REST

يدعم Speech to text REST API موارد الكلام الممكنة بواسطة BYOS بشكل كامل. ومع ذلك، نظرا لأنه يتم تخزين البيانات الآن داخل حساب التخزين الممكن بواسطة BYOS، فإن طلبات مثل الحصول على سجلات النموذج الأساسي تتفاعل مع تخزين Blob لحساب التخزين المرتبط ب BYOS، بدلا من موارد خدمة الكلام الداخلية. يسمح باستخدام نفس التعليمات البرمجية المستندة إلى واجهة برمجة تطبيقات REST لكل من موارد الكلام "العادية" والممكنة بواسطة BYOS.

للحصول على أقصى قدر من الأمان، استخدم المعلمة sasValidityInSeconds مع تعيين القيمة إلى 0 في الطلبات، التي ترجع عناوين URL لملف البيانات، مثل طلب Get Base Model Logs . فيما يلي مثال على عنوان URL للطلب:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/endpoints/base/en-US/files/logs?sasValidityInSeconds=0

يقوم مثل هذا الطلب بإرجاع عناوين URL لحساب التخزين المباشر إلى ملفات البيانات (بدون SAS أو إضافات أخرى). على سبيل المثال:

"links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-audiologs/be172190e1334399852185c0addee9d6/en-US/2023-07-06/152339_fcf52189-0d3f-4415-becd-5f639fd7fd6b.v2.json"
      }

يضمن عنوان URL لهذا التنسيق أن هويات Microsoft Entra فقط (المستخدمين، وكيانات الخدمة، والهويات المدارة) التي لها حقوق وصول كافية (مثل دور Storage Blob Data Reader ) يمكنها الوصول إلى البيانات من عنوان URL.

تحذير

إذا sasValidityInSeconds تم حذف المعلمة في طلب Get Base Model Logs أو ما شابه ذلك، فسيتم إنشاء SAS لتفويض المستخدم مع صلاحية 5 أيام لكل عنوان URL لملف بيانات يتم إرجاعه. يتم توقيع SAS هذا بواسطة الهوية المدارة المعينة من قبل النظام لمورد الكلام الذي يدعم BYOS. وبسبب ذلك، يسمح SAS بالوصول إلى البيانات، حتى إذا تم تعطيل الوصول إلى مفتاح حساب التخزين. راجع التفاصيل هنا.

الكلام المخصص

باستخدام الكلام المخصص، يمكنك تقييم وتحسين دقة التعرف على الكلام لتطبيقاتك ومنتجاتك. يمكن استخدام نموذج كلام مخصص لتحويل الكلام في الوقت الحقيقي إلى نص وترجمة الكلام والنسخ الدفعي. لمزيد من المعلومات، راجع نظرة عامة على الكلام المخصص.

لا يوجد شيء محدد حول كيفية استخدام الكلام المخصص مع مورد الكلام الممكن بواسطة BYOS. الفرق الوحيد هو المكان الذي يتم فيه تخزين جميع البيانات ذات الصلة بالنموذج المخصص، والتي تجمعها خدمة Speech وتنتجها لك. يتم تخزين البيانات في حاويات Blob التالية لحساب التخزين المرتبط ب BYOS:

  • customspeech-models - موقع نماذج الكلام المخصصة
  • customspeech-artifacts - موقع جميع البيانات المخصصة الأخرى المتعلقة بالكلام

يتم توفير بنية حاوية Blob لمعلوماتك فقط وتخضع للتغيير دون إشعار.

تنبيه

تعتمد خدمة الكلام على مسارات حاوية Blob المعرفة مسبقا وأسماء الملفات لوحدة الكلام المخصصة لتعمل بشكل صحيح. لا تقم بنقل محتويات customspeech-models الحاوية ومجلدات الحاويات المخصصة ذات الصلة بالكلام أو إعادة تسميتها أو تغييرها بأي شكل من customspeech-artifacts الأشكال.

من المحتمل جدا أن يؤدي الفشل في القيام بذلك إلى أخطاء يصعب تصحيحها وقد يؤدي إلى ضرورة إعادة تدريب النموذج المخصص.

استخدم أدوات قياسية، مثل REST API و Speech Studio للتفاعل مع البيانات المخصصة المتعلقة بالكلام. راجع التفاصيل في قسم الكلام المخصص.

استخدام واجهة برمجة تطبيقات REST مع الكلام المخصص

يدعم Speech to text REST API موارد الكلام الممكنة بواسطة BYOS بشكل كامل. ومع ذلك، نظرا لأنه يتم تخزين البيانات الآن داخل حساب التخزين الذي يدعم BYOS، فإن طلبات مثل Datasets_ListFiles تتفاعل مع تخزين Blob لحساب التخزين المرتبط ب BYOS، بدلا من موارد خدمة الكلام الداخلية. يسمح باستخدام نفس التعليمات البرمجية المستندة إلى واجهة برمجة تطبيقات REST لكل من موارد الكلام "العادية" والممكنة بواسطة BYOS.

للحصول على أقصى قدر من الأمان، استخدم المعلمة sasValidityInSeconds مع تعيين القيمة إلى 0 في الطلبات، التي ترجع عناوين URL لملف البيانات، مثل طلب الحصول على ملفات مجموعة البيانات. فيما يلي مثال على عنوان URL للطلب:

https://eastus.api.cognitive.microsoft.com/speechtotext/v3.1/datasets/8427b92a-cb50-4cda-bf04-964ea1b1781b/files?sasValidityInSeconds=0

يقوم مثل هذا الطلب بإرجاع عناوين URL لحساب التخزين المباشر إلى ملفات البيانات (بدون SAS أو إضافات أخرى). على سبيل المثال:

 "links": {
        "contentUrl": "https://<BYOS_storage_account_name>.blob.core.windows.net/customspeech-artifacts/AcousticData/8427b92a-cb50-4cda-bf04-964ea1b1781b/4a61ddac-5b1c-4c21-b87d-22001b0f18ab.zip"
      }

يضمن عنوان URL لهذا التنسيق أن هويات Microsoft Entra فقط (المستخدمين، وكيانات الخدمة، والهويات المدارة) التي لها حقوق وصول كافية (مثل دور Storage Blob Data Reader ) يمكنها الوصول إلى البيانات من عنوان URL.

تحذير

إذا sasValidityInSeconds تم حذف المعلمة في طلب الحصول على ملفات مجموعة البيانات أو تلك المشابهة، فسيتم إنشاء SAS لتفويض المستخدم مع صلاحية 5 أيام لكل عنوان URL لملف بيانات يتم إرجاعه. يتم توقيع SAS هذا بواسطة الهوية المدارة المعينة من قبل النظام لمورد الكلام الذي يدعم BYOS. وبسبب ذلك، يسمح SAS بالوصول إلى البيانات، حتى إذا تم تعطيل الوصول إلى مفتاح حساب التخزين. راجع التفاصيل هنا.

الخطوات التالية