ترجمة الكلام إلى نص

مكتمل

يشبه نمط ترجمة الكلام باستخدام Azure الذكاء الاصطناعي Speech SDK التعرف على الكلام، مع إضافة معلومات حول اللغات المصدر والهدف للترجمة:

A TranslationRecognizer object is created from a SpeechConfig, TranslationConfig, and AudioConfig; and its RecognizeOnceAsync method is used to call the Speech API.

  1. استخدم كائن SpeechTranslationConfig لتغليف المعلومات المطلوبة للاتصال بمورد Azure الذكاء الاصطناعي Speech. على وجه التحديد، موقعها ومفتاحها.

  2. يستخدم كائن SpeechTranslationConfig أيضا لتحديد لغة التعرف على الكلام (اللغة التي يتحدث بها كلام الإدخال) واللغات المستهدفة التي يجب ترجمتها إليها.

  3. اختياريًا، استخدم AudioConfig لتعريف مصدر الإدخال للصوت الذي سيتم نسخه. بشكل افتراضي، هذا هو ميكروفون النظام الافتراضي، ولكن يمكنك أيضًا تحديد ملف صوتي.

  4. استخدم SpeechTranslationConfig و AudioConfigلإنشاء كائن TranslationRecognizer. هذا الكائن هو عميل وكيل لواجهة برمجة تطبيقات ترجمة الكلام الذكاء الاصطناعي Azure.

  5. استخدم أساليب كائن TranslationRecognizer لاستدعاء دالات API الأساسية. على سبيل المثال، يستخدم الأسلوب RecognizeOnceAsync() خدمة Azure الذكاء الاصطناعي Speech لترجمة كلمة منطوقة واحدة بشكل غير متزامن.

  6. معالجة الاستجابة من Azure الذكاء الاصطناعي Speech. في حالة الأسلوب RecognizeOnceAsync()، تكون النتيجة كائن SpeechRecognitionResult يتضمن الخصائص التالية:

    • المدة
    • OffsetInTicks
    • خصائص
    • السبب
    • ResultId
    • النص
    • الترجمات

إذا كانت العملية ناجحة، تحتوي الخاصية Reason على القيمة تعداد RecognizedSpeech، تحتوي الخاصية Text على النسخ باللغة الأصلية. يمكنك أيضا الوصول إلى خاصية Translations التي تحتوي على قاموس للترجمات (باستخدام رمز لغة ISO المكون من حرفين، مثل "en" للغة الإنجليزية، كمفتاح).