ما المقصود بنسخ الاجتماع؟ معاينة

مقالة
01/21/2024

كتابة الحديث عن الاجتماع هو حل تحويل الكلام إلى نص يوفر كتابة الحديث في الوقت الحقيقي أو غير المتزامن لأي اجتماع. تجمع هذه الميزة، الموجودة حاليا في المعاينة، بين التعرف على الكلام وتحديد المتحدث وإسناد الجملة لتحديد من قال ماذا ومتى في اجتماع.

هام

تتم إعادة تسمية سيناريو "كتابة المحادثة" السابق إلى "نسخ الاجتماع". على سبيل المثال، استخدم MeetingTranscriber بدلا من ConversationTranscriber، واستخدم CreateMeetingAsync بدلا من CreateConversationAsync. يتم إصدار ميزة "كتابة المحادثة" الجديدة دون استخدام ملفات تعريف المستخدم والتوقيعات الصوتية. لمزيد من المعلومات، راجع ملاحظات الإصدار.

الميزات الأساسية

قد تجد الميزات التالية لكتابة الحديث للاجتماع مفيدة:

الطوابع الزمنية: يحتوي كل كلام متكلم على طابع زمني، بحيث يمكنك بسهولة العثور على عندما قيلت عبارة.
النسخ المكتوبة القابلة للقراءة: تمت إضافة التنسيق وعلامات الترقيم تلقائيًا للنسخ لضمان تطابق النص بشكل وثيق مع ما كان يقال.
ملفات تعريف المستخدمين: يتم إنشاء ملفات تعريف المستخدمين عن طريق جمع عينات صوت المستخدم وإرسالها إلى إنشاء التوقيع.
تعريف المتحدث: يتم تحديد السماعات باستخدام ملفات تعريف المستخدمين، ويتم تعيين معرف مكبر الصوت لكل منها.
يوميات متعددة المتحدثين: حدد من قال ماذا عن طريق تركيب دفق الصوت مع كل معرف مكبر صوت.
النسخ في الوقت الحقيقي: قدم نصوصا مباشرة لمن يقول ماذا ومتى، أثناء انعقاد الاجتماع.
النسخ غير المتزامن: توفير نصوص بدقة أعلى باستخدام دفق صوتي متعدد القنوات.

ملاحظة

على الرغم من أن كتابة الحديث عن الاجتماع لا يضع حدا لعدد المتكلمين في القاعة، إلا أنه محسن ل 2-10 متحدثين لكل جلسة.

الشروع في العمل

راجع التشغيل السريع لنسخ الاجتماع في الوقت الحقيقي للبدء.

حالات الاستخدام

لجعل الاجتماعات شاملة للجميع، مثل المشاركين الذين يعانون من الصمم وضعاف السمع، من المهم أن يكون النسخ في الوقت الحقيقي. يأخذ كتابة الحديث عن الاجتماع في الوقت الحقيقي صوت الاجتماع ويحدد من يقول ما، مما يسمح لجميع المشاركين في الاجتماع بمتابعة النسخة المكتوبة والمشاركة في الاجتماع، دون تأخير.

يمكن للمشاركين في الاجتماع التركيز على الاجتماع وترك تدوين الملاحظات على نسخة الاجتماع. يمكن للمشاركين المشاركة بنشاط في الاجتماع ومتابعة الخطوات التالية بسرعة، باستخدام النص بدلًا من تدوين الملاحظات ومن المحتمل أن يفتقدوا شيئًا ما في أثناء الاجتماع.

كيف تعمل هذه الميزة

يُوضح الرسم البياني التالي نظرة عامة رفيعة المستوى على كيف تعمل الميزة.

رسم تخطيطي يوضح العلاقات بين أجزاء مختلفة من حل كتابة الحديث للاجتماع.

المدخلات المتوقعة

يستخدم نسخ الاجتماع نوعين من المدخلات:

دفق الصوت متعدد القنوات: للحصول على تفاصيل المواصفات والتصميم، راجع توصيات صفيف الميكروفون.
عينات صوت المستخدم: يحتاج كتابة الحديث في الاجتماع إلى ملفات تعريف المستخدم قبل المحادثة لتحديد المتحدث. اجمع التسجيلات الصوتية من كل مستخدم، ثم أرسل التسجيلات إلى خدمة إنشاء التوقيع للتحقق من صحة الصوت وإنشاء ملفات تعريف المستخدم.

ملاحظة

يتوفر حاليا تكوين صوت القناة الواحدة لكتابة الحديث للاجتماع فقط في المعاينة الخاصة.

مطلوب عينات صوت المستخدم للتواقيع الصوتية لتحديد المتحدث. يتم التعرف على السماعات التي ليس لديها عينات صوتية على أنها مجهولة الهوية. لا يزال من الممكن تمييز السماعات غير المحددة عند تمكين الخاصية DifferentiateGuestSpeakers (راجع المثال التالي). ثم يظهر إخراج النسخ السماعات على أنها، على سبيل المثال، Guest_0Guest_1، بدلًا من التعرف عليها كأسماء مكبرات صوت محددة مسجلة مسبقًا.

config.SetProperty("DifferentiateGuestSpeakers", "true");

في الوقت الحقيقي مقابل غير متزامن

توفر الأقسام التالية المزيد من التفاصيل حول أوضاع النسخ التي يمكنك اختيارها.

الوقت الفعلي

تتم معالجة البيانات الصوتية مباشرة لإرجاع معرف السماعة والنسخة المكتوبة. حدد هذا الوضع إذا كان شرط حل كتابة الحديث الخاص بك هو تزويد المشاركين في الاجتماع بعرض مباشر للنسخة المكتوبة لاجتماعهم المستمر. على سبيل المثال، يعد إنشاء تطبيق لجعل الاجتماعات أكثر سهولة للمشاركين الذين يعانون من فقدان السمع أو الصمم حالة استخدام مثالية للنسخ في الوقت الحقيقي.

غير متزامن

تتم معالجة البيانات الصوتية دفعة لإرجاع معرف السماعة والنسخة المكتوبة. حدد هذا الوضع إذا كان شرط حل النسخ الخاص بك هو توفير دقة أعلى، دون عرض النص المباشر. على سبيل المثال، إذا كنت تريد إنشاء تطبيق للسماح للمشاركين في الاجتماع بمتابعة الاجتماعات الفائتة بسهولة، فاستخدم وضع النسخ غير المتزامن للحصول على نتائج كتابة عالية الدقة.

في الوقت الحقيقي بالإضافة إلى غير متزامن

تتم معالجة البيانات الصوتية مباشرة لإرجاع معرف السماعة والنسخة المكتوبة، بالإضافة إلى ذلك، تطلب نسخة عالية الدقة من خلال المعالجة غير المتزامنة. حدد هذا الوضع إذا كان التطبيق الخاص بك بحاجة إلى كتابة الحديث في الوقت الحقيقي، ويتطلب أيضا نسخة دقة أعلى للاستخدام بعد حدوث الاجتماع.

دعم اللغة

حاليا، يدعم كتابة الحديث للاجتماع جميع لغات الكلام إلى النص في المناطق التالية: centralus، ، eastasia، eastuswesteurope.

الخطوات التالية

التشغيل السريع: كتابة الحديث عن الاجتماع في الوقت الحقيقي

مشاركة عبر