عرض تنسيق النص مع تحويل الكلام إلى نص

يوفر تحويل الكلام إلى نص صفيفا من ميزات التنسيق للتأكد من أن النص المنسوخ واضح وقابل للنطق. راجع الأقسام أدناه للحصول على نظرة عامة حول كيفية استخدام كل ميزة لتحسين الوضوح العام لإخراج النص النهائي.

ITN

تسوية النص العكسي (ITN) هي عملية تحول الكلمات المنطوقة إلى شكلها المكتوب. على سبيل المثال، يتم تحويل الكلمة المنطوقة "أربعة" إلى النموذج المكتوب "4". تكمل خدمة تحويل الكلام إلى نص هذه العملية وهي غير قابلة للتكوين. تتضمن بعض تنسيقات النص المعتمدة التواريخ والأوقات والأعداد العشرية والعملات والعناوين ورسائل البريد الإلكتروني وأرقام الهواتف. يمكنك التحدث بشكل طبيعي، وتنسيق الخدمة للنص كما هو متوقع. يعرض الجدول التالي قواعد ITN المطبقة على إخراج النص.

الكلام المعترف به عرض النص
that will cost nine hundred dollars That will cost $900.
my phone number is one eight hundred, four five six, eight nine ten My phone number is 1-800-456-8910.
the time is six forty five p m The time is 6:45 PM.
I live on thirty five lexington avenue I live on 35 Lexington Ave.
the answer is six point five The answer is 6.5.
send it to support at help dot com Send it to support@help.com.

الرأس مالية

تتعرف نماذج الكلام إلى النص على الكلمات التي يجب رسمها بأحرف كبيرة لتحسين قابلية القراءة والدقة والتدقيق النحوي. على سبيل المثال، تقوم خدمة الكلام تلقائيا بأحرف كبيرة من الأسماء والكلمات المناسبة في بداية الجملة. يتم عرض بعض الأمثلة في هذا الجدول.

الكلام المعترف به عرض النص
i got an x l t shirt I got an XL t-shirt.
my name is jennifer smith My name is Jennifer Smith.
i want to visit new york city I want to visit New York City.

إزالة الرغيف

عند التحدث، من الشائع أن يتلعثم شخص ما، ويكرر الكلمات، ويقول كلمات الحشو مثل "uhm" أو "uh". يمكن أن يتعرف الكلام إلى النص على حالات عدم الارتباك هذه ويزيلها من نص العرض. تعد إزالة الرغيف رائعة لنسخ الخطب الحية غير المكتوبة لقراءتها مرة أخرى لاحقا. يتم عرض بعض الأمثلة في هذا الجدول.

الكلام المعترف به عرض النص
i uh said that we can go to the uhmm movies I said that we can go to the movies.
its its not that big of uhm a deal It's not that big of a deal.
umm i think tomorrow should work I think tomorrow should work.

علامات الترقيم

يوثق الكلام إلى نص النص تلقائيا لتحسين الوضوح. علامات الترقيم مفيدة لإعادة قراءة المكالمات أو نسخ المحادثة. يتم عرض بعض الأمثلة في هذا الجدول.

الكلام المعترف به عرض النص
how are you How are you?
we can go to the mall park or beach We can go to the mall, park, or beach.

عند استخدام الكلام إلى نص مع التعرف المستمر، يمكنك تكوين خدمة الكلام للتعرف على علامات الترقيم الصريحة. ثم يمكنك التحدث بعلامات الترقيم بصوت عال لجعل النص أكثر وضوحا. هذا مفيد بشكل خاص في حالة تريد فيها استخدام علامات الترقيم المعقدة دون الحاجة إلى دمجها لاحقا. يتم عرض بعض الأمثلة في هذا الجدول.

الكلام المعترف به عرض النص
they entered the room dot dot dot They entered the room...
i heart emoji you period I <3 you.
the options are apple forward slash banana forward slash orange period The options are apple/banana/orange.
are you sure question mark Are you sure?

استخدم Speech SDK لتمكين وضع الإملاء عند استخدام الكلام إلى نص مع التعرف المستمر. يتسبب هذا الوضع في أن يفسر مثيل تكوين الكلام أوصاف الكلمات لهياكل الجملة مثل علامات الترقيم.

speechConfig.EnableDictation();
speechConfig->EnableDictation();
speechConfig.EnableDictation()
speechConfig.enableDictation();
speechConfig.enableDictation();
[self.speechConfig enableDictation];
self.speechConfig!.enableDictation()
speech_config.enable_dictation()

عامل تصفية الألفاظ النابية

يمكنك تحديد ما إذا كنت تريد إخفاء الألفاظ النابية أو إزالتها أو إظهارها في النص النهائي المنسوخ. يستبدل الإخفاء الكلمات النابية بأحرف نجمية (*) بحيث يمكنك الحفاظ على التوجه الأصلي للنص مع جعله أكثر ملاءمة لحالات معينة

إشعار

تحتفظ Microsoft أيضاً بالحق في إخفاء أي كلمة تعتبر غير مناسبة أو إزالتها. لن يتم إرجاع هذه الكلمات بواسطة خدمة الكلام، سواء قمت بتمكين تصفية الألفاظ النابية أم لا.

خيارات عامل تصفية الألفاظ النابية هي:

  • Masked: يستبدل الأحرف بالكلمات النابية بأحرف نجمية (*). المقنع هو الخيار الافتراضي.
  • Raw: قم بتضمين الكلمات النابية حرفياً.
  • Removed: يزيل الكلمات النابية.

على سبيل المثال، لإزالة الكلمات النابية من نتيجة التعرف على الكلام، قم بتعيين عامل تصفية الألفاظ النابية إلى Removed كما هو موضح هنا:

speechConfig.SetProfanity(ProfanityOption.Removed);
speechConfig->SetProfanity(ProfanityOption::Removed);
speechConfig.SetProfanity(common.Removed)
speechConfig.setProfanity(ProfanityOption.Removed);
speechConfig.setProfanity(sdk.ProfanityOption.Removed);
[self.speechConfig setProfanityOptionTo:SPXSpeechConfigProfanityOption.SPXSpeechConfigProfanityOption_ProfanityRemoved];
self.speechConfig!.setProfanityOptionTo(SPXSpeechConfigProfanityOption_ProfanityRemoved)
speech_config.set_profanity(speechsdk.ProfanityOption.Removed)
spx recognize --file caption.this.mp4 --format any --profanity masked --output vtt file - --output srt file -

يتم تطبيق عامل تصفية الألفاظ النابية على النتيجة Text والخصائص MaskedNormalizedForm. لا يتم تطبيق عامل تصفية الألفاظ النابية على النتيجة LexicalForm والخصائص NormalizedForm. لا يتم تطبيق عامل التصفية على نتائج مستوى الكلمة.

الخطوات التالية