تسجيل عينات الصوت للصوت المخصص

2025-05-20

توفر لك هذه المقالة أفضل الممارسات حول إعداد عينات صوتية عالية الجودة لضبط الصوت الاحترافي. لفهم كيفية معالجة البيانات والحد الأدنى لمتطلبات قبول البيانات، يرجى الرجوع إلى تحميل بياناتك.

إن إنشاء صوت احترافي عالي الجودة من البداية ليس عملا عارضا. المكون المركزي للصوت المخصص هو مجموعة كبيرة من العينات الصوتية للكلام البشري. من الضروري أن تكون هذه التسجيلات الصوتية ذات جودة عالية. اختر موهبة صوتية لديها خبرة في صنع هذه الأنواع من التسجيلات، وقم بتسجيلها من قبل مهندس تسجيل باستخدام معدات احترافية.

قبل أن تتمكن من إجراء هذه التسجيلات، على الرغم من ذلك، تحتاج إلى برنامج نصي: يتم التحدث بالكلمات بواسطة موهبتك الصوتية لإنشاء عينات الصوت.

العديد من التفاصيل الصغيرة ولكن الهامة تذهب إلى إنشاء تسجيل صوتي احترافي. هذا الدليل هو خارطة طريق لعملية من شأنها أن تساعدك على الحصول على نتائج جيدة ومتسقة.

تلميحات لإعداد البيانات للحصول على صوت عالي الجودة

يعتمد الصوت المخصص الطبيعي للغاية على عدة عوامل، مثل جودة وحجم بيانات التدريب الخاصة بك.

تعد جودة بيانات التدريب الخاصة بك عاملا أساسيا. على سبيل المثال، في نفس مجموعة التدريب، يعد الحجم المتسق ومعدل التحدث وأسلوب التحدث وأسلوب التحدث أمرا ضروريا لإنشاء صوت مخصص عالي الجودة. يجب أيضا تجنب الضوضاء الخلفية في التسجيل والتأكد من تطابق البرنامج النصي والتسجيل. لضمان جودة بياناتك، تحتاج إلى اتباع معايير تحديد البرنامج النصي ومتطلبات التسجيل.

فيما يتعلق بحجم بيانات التدريب، في معظم الحالات يمكنك إنشاء صوت مخصص معقول مع 300 كلمة. وفقا لاختباراتنا، فإن إضافة المزيد من بيانات التدريب في معظم اللغات لا يحسن بالضرورة طبيعية الصوت نفسه (تم اختباره باستخدام درجة MOS)، ومع ذلك، مع المزيد من بيانات التدريب التي تغطي المزيد من مثيلات الكلمات، لديك إمكانية أعلى لتقليل نسبة الأجزاء غير المرضية من الكلام للصوت، مثل الخلل. لسماع ما تبدو عليه الأجزاء غير المرضية من الكلام، راجع أمثلة GitHub.

في بعض الحالات، قد تحتاج إلى شخصية صوتية ذات خصائص فريدة. على سبيل المثال، تحتاج شخصية الرسوم المتحركة إلى صوت بنمط نطق خاص، أو صوت ديناميكي في التجسيد. بالنسبة لمثل هذه الحالات، نوصي بإعداد ما لا يقل عن 1000 تعبير (ويفضل أن يكون 2000)، وتسجيلها في استوديو تسجيل احترافي. لمعرفة المزيد حول كيفية تحسين جودة نموذج الصوت، راجع الخصائص والقيود لاستخدام الصوت المخصص.

أدوار التسجيل الصوتي

هناك أربعة أدوار أساسية في مشروع تسجيل صوتي مخصص:

الدور	الغرض
موهبة الصوت	يشكل صوت هذا الشخص أساس الصوت المخصص.
مهندس تسجيل	الإشراف على الجوانب الفنية للتسجيل وتشغيل معدات التسجيل.
مدير	يعد البرنامج النصي ويدرب أداء المواهب الصوتية.
المحرر	إنهاء الملفات الصوتية وإعدادها للتحميل إلى خدمة الكلام.

يمكن للفرد ملء أكثر من دور واحد. يفترض هذا الدليل أنك تقوم بملء دور المدير وتوظيف كل من موهبة الصوت ومهندس التسجيل. إذا كنت تريد إجراء التسجيلات بنفسك، فإن هذه المقالة تتضمن بعض المعلومات حول دور مهندس التسجيل. لا يلزم دور المحرر إلا بعد جلسة التسجيل. في هذه الأثناء، يمكن للمدير أو مهندس التسجيل ملء هذا الدور.

اختيار موهبتك الصوتية

إن الممثلين ذوي الخبرة في voiceover أو عمل الشخصية الصوتية أو الإعلان أو قراءة الأخبار يجعلون المواهب الصوتية جيدة. اختر موهبة الصوت التي يعجبك صوتها الطبيعي. من الممكن إنشاء أصوات "شخصية" فريدة، ولكن من الصعب على معظم المواهب أداءها باستمرار، ويمكن أن يسبب الجهد إجهادا صوتيا. العامل الوحيد الأكثر أهمية لاختيار المواهب الصوتية هو الاتساق. يجب أن تبدو جميع التسجيلات الخاصة بك لنفس النمط الصوتي كما لو تم إجراؤها في نفس اليوم في نفس الغرفة. يمكنك التعامل مع هذا المثالي من خلال ممارسات التسجيل الجيدة والهندسة.

يجب أن تكون موهبتك الصوتية قادرة على التحدث بمعدل ثابت ومستوى الصوت والصوت والنغمة بإملاء واضح. كما أنهم بحاجة إلى أن يكونوا قادرين على التحكم في تباين العرض التقديمي والتأثير العاطفي وآداب الكلام. يمكن أن يكون تسجيل العينات الصوتية أكثر إثارة للاهتمام من الأنواع الأخرى من العمل الصوتي، لذلك يمكن لمعظم المواهب الصوتية التسجيل لمدة ساعتين أو ثلاث ساعات فقط في اليوم. حدد جلسات العمل بثلاثة أو أربعة أيام في الأسبوع، مع يوم عطلة بينهما إن أمكن.

اعمل مع موهبتك الصوتية لتطوير شخصية تحدد الصوت العام والنبرة العاطفية للصوت المخصص. حدد أنماط التحدث للشخصية واطلب من موهبة الصوت قراءة البرنامج النصي بطريقة تتوافق مع الأنماط التي تريدها. تأكد من أن نمط التحدث يظل متسقا طوال التسجيلات لمجموعة من بيانات التدريب.

على سبيل المثال، شخصية ذات شخصية متفائلة بشكل طبيعي تحمل ملاحظة تفاؤل في صوتها. ومع ذلك، ينبغي التعبير عن هذه الشخصية باستمرار عبر جميع التسجيلات لمجموعة من بيانات التدريب. استمع إلى الأصوات الموجودة للتعرف على ما تهدف إليه.

تلميح

عادة، ستحتاج إلى امتلاك التسجيلات الصوتية التي تجريها. يجب أن تكون موهبتك الصوتية قابلة لتعاقد العمل مقابل التوظيف للمشروع.

إنشاء برنامج نصي

نقطة البداية لأي جلسة تسجيل صوتي مخصصة هي البرنامج النصي، الذي يحتوي على الألفاظ التي سيتم التحدث بها من قبل موهبتك الصوتية. يشمل مصطلح "التعبيرات" الجمل الكاملة والعبارات الأقصر. يتطلب بناء صوت مخصص ما لا يقل عن 300 كلمة مسجلة كبيانات تدريب.

يمكن أن تأتي الألفاظ في البرنامج النصي الخاص بك من أي مكان: الخيال، وغير الخيال، ونصوص الخطابات، والتقارير الإخبارية، وأي شيء آخر متاح في شكل مطبوع. للحصول على مناقشة موجزة للقضايا القانونية المحتملة، راجع قسم "القانونية". يمكنك أيضا كتابة النص الخاص بك.

لا تحتاج أقوالك إلى أن تأتي من نفس المصدر، أو نفس نوع المصدر، أو أن يكون لها أي علاقة ببعضها البعض. ومع ذلك، إذا كنت تستخدم عبارات معينة (على سبيل المثال، "لقد قمت بتسجيل الدخول بنجاح") في تطبيق الكلام، فتأكد من تضمينها في البرنامج النصي الخاص بك. فهو يعطي صوتك المخصص فرصة أفضل لنطق تلك العبارات بشكل جيد.

نوصي بأن تتضمن البرامج النصية للتسجيل كلا من الجمل العامة والجمل الخاصة بالمجال. على سبيل المثال، إذا كنت تخطط لتسجيل 2000 جملة، فقد تكون 1000 جملة منها عبارة عن جمل عامة، وقد يكون 1000 جملة أخرى منها عبارة عن جمل من المجال المستهدف أو حالة استخدام التطبيق الخاص بك.

نحن نقدم نماذج من البرامج النصية في مجالات "عام" و"دردشة" و"خدمة العملاء" لكل لغة لمساعدتك في إعداد البرامج النصية للتسجيل. يمكنك استخدام هذه البرامج النصية المشتركة من Microsoft لتسجيلاتك مباشرة أو استخدامها كمرجع لإنشاء برامجك الخاصة.

معايير تحديد البرنامج النصي

فيما يلي بعض الإرشادات العامة التي يمكنك اتباعها لإنشاء مجموعة جيدة (عينات صوتية مسجلة) لضبط الصوت الاحترافي.

بالنسبة لمعظم حالات الاستخدام، يوصى بأن تتراوح مدة الجمل بين ثانيتين و15 ثانية، وتحتوي على 5 إلى 30 كلمة للغات اللاتينية أو 4 إلى 80 كلمة للغات غير اللاتينية. هدف إلى تحقيق التوازن بين البرنامج النصي الخاص بك لتضمين مجموعة متنوعة من أنواع الجمل والأطوال. تأكد من أن البرنامج النصي الخاص بك لا يتضمن أي جمل مكررة.

إذا كانت حالة الاستخدام تتطلب تركيزا كبيرا على الأسئلة أو التعجبات أو مزيجا من الجمل الطويلة والقصارة بشكل خاص، فمن المستحسن تضمين جزء كبير من الجمل كأسئلة أو تعجبات، إلى جانب عبارات قصيرة جدا وعبارات أطول يصل طولها إلى 20 ثانية.

لمعرفة كيفية موازنة أنواع الجمل المختلفة، راجع الجدول التالي:

أنواع الجمل	التغطية
جمل العبارة	يجب أن تكون جملة الجمل من 70 إلى 80% من البرنامج النصي.
كلمة/عبارة قصيرة	يجب أن تكون البرامج النصية القصيرة للكلمات/العبارات حوالي 10% من إجمالي الألفاظ، مع 5 إلى 7 كلمات لكل حالة. يجب فصل الكلمات أو العبارات القصيرة بفواصل للمساعدة في تذكير المواهب الصوتية بالتوقف لفترة قصيرة أثناء القراءة.
جمل الأسئلة (اختياري)	يجب أن تكون جمل الأسئلة حوالي 10%-20% من البرنامج النصي للمجال الخاص بك، بما في ذلك 5%-10% من الارتفاع و5%-10% من النغمات الهابطة. هذه الجمل مطلوبة إذا كنت تريد أن ينقل الصوت الذي تم إنشاؤه الأسئلة بدقة.
جمل التعجب (اختياري)	يجب أن تكون جمل التعجب حوالي 10%-20% من البرنامج النصي الخاص بك. هذه الجمل مطلوبة إذا كنت تريد أن ينقل الصوت الذي تم إنشاؤه التعجب بدقة.

ملاحظه

يمكنك تقدير عدد الكلمات في جملة عن طريق افتراض معدل الكلام بالكلمات في الثانية استنادا إلى لغتك.

وتشمل أفضل الممارسات ما يلي:

تغطية متوازنة لأجزاء الكلام، مثل الأفعال والأسماء والصفات وما إلى ذلك.
تغطية متوازنة للنطق. قم بتضمين جميع الأحرف من A إلى Z حتى يتعلم محرك النص إلى الكلام كيفية نطق كل حرف في نمطك.
البرامج النصية القابلة للقراءة والمفهومة والحس السليم للمتحدث للقراءة.
تجنب الكثير من الأنماط المماثلة للكلمات/العبارات، مثل "سهل" و"أسهل".
تضمين تنسيقات مختلفة من الأرقام: العنوان والوحدة والهاتف والكمية والتاريخ وما إلى ذلك، في جميع أنواع الجمل.
قم بتضمين الجمل الإملائية إذا كان شيئا سيقرأه صوتك المخصص. على سبيل المثال، "إملاء Apple هو A P P L E".

ملاحظه

بالنسبة إلى وضع المعالجة السياقية، الذي يوفر تجويدات أكثر طبيعية وقدرات محادثة أفضل:

استخدم نصا على مستوى الفقرة بدلا من نص على مستوى الجملة للتسجيلات. يساعد هذا النهج على التقاط تدفق الكلام الطبيعي بين الجمل ويحافظ على المعلومات السياقية.
من الناحية المثالية، يجب أن يكون كل تسجيل أطول من 30 ثانية (يحتوي على أكثر من 60 كلمة للغات اللاتينية أو 160 كلمة للغات غير اللاتينية).
يمكن استخدام مجموعة تدريب سياقية مع أكثر من 30 دقيقة من إجمالي الصوت أو 300 كلمة لتدريب صوت مخصص.

لا تضع جملا متعددة في سطر واحد/كلمة واحدة. فصل كل سطر حسب النطق.
تأكد من أن الجملة نظيفة. بشكل عام، لا تقم بتضمين عدد كبير جدا من الكلمات غير المتوافقة مثل الأرقام أو الاختصارات حيث يصعب قراءتها. قد تتطلب بعض التطبيقات قراءة العديد من الأرقام أو الاختصارات. في هذه الحالات، يمكنك تضمين هذه الكلمات، ولكن تطبيعها في شكلها المنطوق.

فيما يلي بعض أفضل الممارسات على سبيل المثال:
- بالنسبة للأسطر ذات الاختصارات، بدلا من "BTW"، اكتب "بالمناسبة".
- بالنسبة للأسطر ذات الأرقام، بدلا من "911"، اكتب "تسعة واحدة".
- بالنسبة للأسطر ذات الاختصارات، بدلا من "ABC"، اكتب "A B C".
مع ذلك، تأكد من أن موهبتك الصوتية تنطق هذه الكلمات بطريقة متوقعة. حافظ على مطابقة البرنامج النصي والتسجيلات أثناء عملية التدريب.
يجب أن يتضمن البرنامج النصي الخاص بك العديد من الكلمات والجمل المختلفة مع أنواع مختلفة من أطوال الجمل والهياكل والمزاج.
تحقق من البرنامج النصي بعناية بحثا عن الأخطاء. إذا كان ذلك ممكنا، فادع شخصا آخر يتحقق منها أيضا. عند تشغيل البرنامج النصي مع موهبتك الصوتية، قد تلتقط المزيد من الأخطاء.

الفرق بين البرنامج النصي للمواهب الصوتية والبرنامج النصي للتدريب

يمكن أن يختلف البرنامج النصي للتدريب عن البرنامج النصي للمواهب الصوتية، خاصة بالنسبة إلى البرامج النصية التي تحتوي على أرقام ورموز واختصارات وتاريخ ووقت. يجب أن تتبع البرامج النصية المعدة لموهبة الصوت اصطلاحات القراءة الأصلية، مثل 50% و45 دولارا. يجب تطبيع البرامج النصية المستخدمة للتدريب لمطابقة التسجيل الصوتي، مثل 50 بالمائةوخمسة وأربعين دولارا.

ملاحظه

نقدم بعض أمثلة البرامج النصية للموهبة الصوتية على GitHub. لاستخدام أمثلة البرامج النصية للتدريب، يجب عليك تطبيعها وفقا لتسجيلات موهبتك الصوتية قبل تحميل الملف.

يوضح الجدول التالي الفرق بين البرامج النصية للمواهب الصوتية والبرنامج النصي الذي تمت تسويته للتدريب.

الفئة	مثال على البرنامج النصي لمواهب الصوت	مثال البرنامج النصي للتدريب (تمت تسويته)
ارقام	123	100 و23
الرموز	50%	50 في المئة
الاختصار	اسرع مايمكن	في أسرع وقت ممكن
التاريخ والوقت	3 مارس الساعة 5:00 مساء	الثالث من مارس الساعة الخامسة مساء

العيوب النموذجية للبرنامج النصي

يمكن أن تؤثر جودة البرنامج النصي السيئة سلبا على نتائج التدريب. لتحقيق نتائج تدريبية عالية الجودة، من الضروري تجنب العيوب.

تندرج عيوب البرنامج النصي بشكل عام في الفئات التالية:

الفئة	مثال
محتوى بلا معنى.	"أفكار خضراء عديمة اللون تنام بغضب."
جمل غير مكتملة.	- "كانت هذه عشيتي الأخيرة" (لا موضوع، لا معنى محدد) -- "انهم مضحك بالفعل (لا علامة اقتباس في النهاية ، انها ليست جملة كاملة)
اكتب في الجمل.	- البدء بأحرف صغيرة - لا نهاية لعلامات الترقيم إذا لزم الأمر -املائيا - عدم وجود علامات الترقيم: لا توجد فترة في النهاية (باستثناء عنوان الأخبار) - ينتهي بالرموز، باستثناء الفاصلة والسؤال والتعجب - تنسيق خاطئ، مثل: - 45$ (يجب أن يكون 45 دولارا) - لا توجد مسافة أو مسافة زائدة بين الكلمة/علامات الترقيم
التكرار في تنسيق مماثل، واحد لكل نمط كاف.	- "الآن هو 1 مساء في نيويورك" - "الآن الساعة 2 مساء في نيويورك" - "الآن هو 3 مساء في نيويورك" - "الآن الساعة 1 مساء في سياتل" "الآن الساعة 1 مساء في واشنطن العاصمة"
الكلمات الأجنبية غير المألوفة: الكلمات الخارجية شائعة الاستخدام فقط مقبولة في البرنامج النصي.	في اللغة الإنجليزية قد يستخدم المرء الكلمة الفرنسية "فو" في الكلام المشترك، ولكن التعبير الفرنسي مثل "coincer la bulle" سيكون غير شائع.
رموز المشاعر أو أي رموز أخرى غير شائعة

تنسيق البرنامج النصي

البرنامج النصي للاستخدام أثناء جلسات التسجيل، بحيث يمكنك إعداده بأي طريقة تجد من السهل العمل معها. إنشاء الملف النصي المطلوب بواسطة Speech Studio بشكل منفصل.

يحتوي تنسيق البرنامج النصي الأساسي على ثلاثة أعمدة:

عدد الألفاظ، بدءا من 1. يجعل الترقيم من السهل على كل شخص في الاستوديو الرجوع إلى تعبير معين ("دعونا نحاول الرقم 356 مرة أخرى"). يمكنك استخدام ميزة ترقيم الفقرات في Microsoft Word لتعداد صفوف الجدول تلقائيا.
عمود فارغ حيث تكتب رمز الوقت أو الرقم الذي يستغرقه كل تعبير لمساعدتك في العثور عليه في التسجيل النهائي.
نص التعبير نفسه.

نموذج البرنامج النصي

ملاحظه

تسجل معظم الاستوديوهات في مقاطع قصيرة تعرف باسم "يأخذ". يحتوي كل أخذ عادة على 10 إلى 24 تعبيرا. مجرد ملاحظة عدد اتخاذ كافية للعثور على كلمة في وقت لاحق. إذا كنت تقوم بالتسجيل في استوديو يفضل إجراء تسجيلات أطول، فسترغب في ملاحظة رمز الوقت بدلا من ذلك. سيكون للاستوديو عرض زمني بارز.

اترك مساحة كافية بعد كل صف لكتابة الملاحظات. تأكد من عدم تقسيم أي تعبير بين الصفحات. قم برقم الصفحات، واطبع البرنامج النصي على جانب واحد من الورقة.

اطبع ثلاث نسخ من البرنامج النصي: واحدة للموهبة الصوتية، وواحدة لمهندس التسجيل، وواحدة للمخرج (أنت). استخدام قصاصة ورقية بدلا من التدبيس: يقوم فنان صوت من ذوي الخبرة بفصل الصفحات لتجنب حدوث ضوضاء أثناء تشغيل الصفحات.

بيان المواهب الصوتية

لتدريب صوت عصبي، يجب عليك إنشاء ملف تعريف المواهب الصوتية مع ملف صوتي مسجل من قبل المواهب الصوتية الموافقة على استخدام بيانات الكلام الخاصة بهم لضبط نموذج صوت احترافي. عند إعداد البرنامج النصي للتسجيل، تأكد من تضمين جملة العبارة.

الشؤون القانونية

وبموجب قانون حقوق الطبع والنشر، قد تكون قراءة الفاعل للنص المحمي بحقوق الطبع والنشر بمثابة أداء ينبغي تعويض مؤلف المصنف من أجله. لن يمكن التعرف على هذا الأداء في المنتج النهائي، الصوت المخصص. ومع ذلك، فإن شرعية استخدام عمل محمي بحقوق الطبع والنشر لهذا الغرض غير راسخة. لا يمكن لشركة Microsoft تقديم المشورة القانونية بشأن هذه المشكلة؛ استشر مستشارك القانوني الخاص.

لحسن الحظ، من الممكن تجنب هذه المشكلات بالكامل. هناك العديد من مصادر النص التي يمكنك استخدامها دون إذن أو ترخيص.

مصدر النص	وصف
مجموعة CMU في القطب الشمالي	حوالي 1100 جملة تم اختيارها من خارج حقوق النشر تعمل خصيصا للاستخدام في مشاريع تركيب الكلام. نقطة انطلاق ممتازة.
لم يعد يعمل ضمن حقوق النشر	عادة ما يتم نشره قبل عام 1923. بالنسبة للغة الإنجليزية، يقدم Project Gutenberg عشرات الآلاف من هذه الأعمال. قد ترغب في التركيز على الأعمال الأحدث، حيث إن اللغة أقرب إلى اللغة الإنجليزية الحديثة.
أعمال الحكومة	الأعمال التي أنشأتها حكومة الولايات المتحدة ليست محمية بحقوق النشر في الولايات المتحدة، على الرغم من أن الحكومة يمكنها المطالبة بحقوق النشر في بلدان/مناطق أخرى.
المجال العام	يعمل من أجله حقوق النشر التي يتم إخلاء المسؤولية عنها صراحة أو تخصيصها للملك العام. قد لا يكون من الممكن التنازل عن حق المؤلف بالكامل في بعض الولايات القضائية.
الأعمال المرخصة بشكل مسموح به	يتم توزيعه بموجب ترخيص مثل Creative Commons أو رخصة وثائق GNU المجانية (GFDL). يستخدم ويكيبيديا GFDL. ومع ذلك، قد تفرض بعض التراخيص قيودا على أداء المحتوى المرخص الذي قد يؤثر على إنشاء نموذج صوتي مخصص، لذا اقرأ الترخيص بعناية.

تسجيل البرنامج النصي الخاص بك

سجل البرنامج النصي الخاص بك في استوديو تسجيل احترافي متخصص في العمل الصوتي. لديهم كشك تسجيل والمعدات المناسبة والأشخاص المناسبين لتشغيله. من المستحسن عدم التبخل على التسجيل.

ناقش مشروعك مع مهندس التسجيل في الاستوديو واستمع إلى نصائحهم. يجب أن يحتوي التسجيل على ضغط نطاق ديناميكي ضئيل أو معدوم (بحد أقصى 4:1). من المهم أن يحتوي الصوت على مستوى صوت ثابت ونسبة عالية من الإشارة إلى الضوضاء، مع خلوه من الأصوات غير المرغوب فيها.

متطلبات التسجيل

لتحقيق نتائج تدريبية عالية الجودة، اتبع المتطلبات التالية أثناء التسجيل أو إعداد البيانات:

واضح وجيد الوضوح
السرعة الطبيعية: ليست بطيئة جدا أو سريعة جدا بين الملفات الصوتية.
الحجم المناسب، prosody و break: ثابت داخل نفس الجملة أو بين الجمل، فاصل صحيح لعلامات الترقيم.
لا توجد ضوضاء أثناء التسجيل
ملاءمة تصميم الشخصية
لا توجد تشكيلة خاطئة: تناسب التصميم الهدف
لا يوجد نطق خاطئ

يمكنك الرجوع إلى المواصفات أدناه للتحضير لعينات الصوت كأفضل ممارسة.

الخاصية	القيمة
تنسيق المِلَف	*.wav، Mono
معدل أخذ العينات	24 كيلوهرتز
تنسيق العينة	16 بت، PCM
مستويات مستوى الصوت القصوى	-3 ديسيبل إلى -6 ديسيبل
SNR	> 35 ديسيبل
صمت	- يجب أن يكون هناك بعض الصمت (يوصي 100 مللي ثانية) في البداية والنهاية، ولكن لا يزيد عن 200 مللي ثانية - الصمت بين الكلمات أو العبارات < -30 dB - الصمت في الموجة بعد الكلمة الأخيرة منطوقة <-60 ديسيبل
ضوضاء البيئة أو الصدى	- مستوى الضوضاء في بداية الموجة قبل التحدث < -70 dB

ملاحظه

يمكنك التسجيل بمعدل أخذ عينات أعلى وعمق بت، على سبيل المثال بتنسيق 48 كيلوهرتز 24 بت PCM. أثناء ضبط الصوت الاحترافي، سننزل عينة منه إلى 24 كيلوهرتز 16 بت PCM تلقائيا.

تشير نسبة الإشارة إلى الضوضاء (SNR) الأعلى إلى انخفاض الضوضاء في الصوت. يمكنك عادة الوصول إلى 35+ SNR عن طريق التسجيل في استوديوهات احترافية. يمكن أن يؤدي الصوت مع SNR أقل من 20 إلى ضوضاء واضحة في صوتك الذي تم إنشاؤه.

ضع في اعتبارك إعادة تسجيل أي تعبيرات ذات درجات نطق منخفضة أو نسب إشارة إلى ضوضاء رديئة. إذا لم تتمكن من إعادة التسجيل، ففكر في استبعاد هذه التعبيرات من بياناتك.

أخطاء صوتية نموذجية

للحصول على نتائج تدريب عالية الجودة، يوصى بشدة بتجنب الأخطاء الصوتية. عادة ما تكون الأخطاء الصوتية ضمن الفئات التالية:

لا يتطابق اسم الملف الصوتي مع معرف البرنامج النصي.
يحتوي ملف WAR على تنسيق غير صحيح ولا يمكن قراءته.
معدل أخذ عينات الصوت أقل من 16 كيلوهرتز. يوصى بأن يكون معدل أخذ عينات ملف .wav مساويا أو أعلى من 24 كيلوهرتز للصوت العصبي عالي الجودة.
لا تقع ذروة الحجم ضمن نطاق -3 dB (70% الحد الأقصى للحجم) إلى -6 dB (50%).
تجاوز شكل الموجة: يتم قطع شكل الموجة عند قيمته القصوى وبالتالي لا يكتمل.
الأجزاء الصامتة من التسجيل غير نظيفة؛ يمكنك سماع أصوات مثل الضوضاء المحيطة وضوضاء الفم والصدى.

على سبيل المثال، يحتوي الصوت أدناه على ضوضاء البيئة بين الخطب.

يحتوي النموذج أدناه على علامات إزاحة DC أو الصدى.
الحجم الإجمالي منخفض جدا. يتم وضع علامة على بياناتك كمشكلة إذا كانت وحدة التخزين أقل من -18 dB (10% من الحد الأقصى للحجم). تأكد من أن جميع الملفات الصوتية يجب أن تكون متسقة في نفس مستوى الصوت.
لا صمت قبل الكلمة الأولى أو بعد الكلمة الأخيرة. أيضا، يجب ألا يكون صمت البدء أو النهاية أطول من 200 مللي ثانية أو أقصر من 100 مللي ثانية.

قم بذلك بنفسك

إذا كنت ترغب في إجراء التسجيل بنفسك، بدلا من الدخول إلى استوديو التسجيل، فإليك تمهيد قصير. بفضل ظهور التسجيل المنزلي والبودكاست، أصبح العثور على نصائح وموارد تسجيل جيدة عبر الإنترنت أسهل من أي وقت مضى.

يجب أن يكون "كشك التسجيل" الخاص بك غرفة صغيرة بدون صدى ملحوظ أو "نغمة غرفة". يجب أن يكون هادئا وعازلا للصوت قدر الإمكان. يمكن استخدام الستائر على الجدران للحد من الصدى وتحييد أو "فتاكة" صوت الغرفة.

استخدم ميكروفون مكثف استوديو عالي الجودة ("ميكروفون" باختصار) مخصص لتسجيل الصوت. يمكن أن يؤدي Sennheiser وAKG وحتى ميكروفونات Zoom الأحدث إلى نتائج جيدة. يمكنك شراء ميكروفون، أو استئجار ميكروفون من شركة تأجير صوت وبصرية محلية. ابحث عن واحدة بواجهة USB. يجمع هذا النوع من الميكروفون بشكل ملائم بين عنصر الميكروفون والطوابع المسبقة والمحول التناظري إلى الرقمي في حزمة واحدة، ما يبسط الوصلة.

يمكنك أيضا استخدام ميكروفون تمثيلي. العديد من المنازل الإيجار تقدم "خمر" الميكروفونات المعروفة لحرف الصوت. يستخدم الترس التناظري الاحترافي موصلات XLR متوازنة، بدلا من قابس 1/4 بوصة المستخدم في معدات المستهلك. إذا ذهبت تمثيليا، فستحتاج أيضا إلى طابع مسبق وواجهة صوت كمبيوتر مع هذه الموصلات.

ثبت الميكروفون على حامل أو ازدهار، وقم بتثبيت عامل تصفية البوب أمام الميكروفون لإزالة الضوضاء من الساكنات "المنحرفة" مثل "p" و"b". تأتي بعض الميكروفونات مع تركيب تعليق يعزلها عن الاهتزازات في الحامل، وهو أمر مفيد.

يجب أن تبقى موهبة الصوت على مسافة متسقة من الميكروفون. استخدم الشريط على الأرض لوضع علامة على المكان الذي يجب أن يقفوا فيه. إذا كانت الموهبة تفضل الجلوس، فاحرص على مراقبة مسافة الميكروفون وتجنب ضوضاء الكرسي.

استخدم حاملا للاحتفاظ بالبرنامج النصي. تجنب تشابك الحامل بحيث يمكن أن يعكس الصوت باتجاه الميكروفون.

يجب أن يكون الشخص الذي يشغل معدات التسجيل - مهندس التسجيل - في غرفة منفصلة عن الموهبة، مع طريقة للتحدث إلى المواهب في كشك التسجيل ( دائرة talkback).

يجب أن يحتوي التسجيل على أقل قدر ممكن من الضوضاء، بهدف -80 dB.

استمع عن كثب إلى تسجيل الصمت في "كشكك"، ومعرفة من أين تأتي أي ضوضاء، والقضاء على السبب. مصادر الضوضاء الشائعة هي فتحات التهوية، والمصابيح الضوئية الفلورية، وحركة المرور على الطرق القريبة، ومراوح المعدات (حتى أجهزة الكمبيوتر المحمولة قد تحتوي على مراوح). يمكن للميكروفونات والكابلات التقاط الضوضاء الكهربائية من أسلاك التيار المتردد القريبة، وعادة ما تكون دندنة أو ضجة. يمكن أن يكون سبب الطنانة أيضا حلقة أرضية، والتي تنتج عن وجود معدات متصلة بأكثر من دائرة كهربائية واحدة.

تلميح

في بعض الحالات، قد تتمكن من استخدام معادل أو مكون إضافي لبرنامج الحد من الضوضاء للمساعدة في إزالة الضوضاء من التسجيلات الخاصة بك، على الرغم من أنه من الأفضل دائما إيقافه في مصدره.

قم بتعيين المستويات بحيث يتم استخدام معظم النطاق الديناميكي المتاح للتسجيل الرقمي دون إفراط في التنشيط. وهذا يعني تعيين الصوت بصوت عال، ولكن ليس بصوت عال بحيث يصبح مشوها. يظهر مثال على شكل موجي لتسجيل جيد في الصورة التالية:

شكل موجي لتسجيل جيد

هنا، يتم استخدام معظم النطاق (الارتفاع)، ولكن أعلى قمم الإشارة لا تصل إلى أعلى النافذة أو أسفلها. يمكنك أيضا أن ترى أن الصمت في التسجيل يقترب من خط أفقي رفيع، مما يشير إلى أرضية منخفضة الضوضاء. يحتوي هذا التسجيل على نطاق ديناميكي مقبول ونسبة الإشارة إلى الضوضاء.

سجل مباشرة في الكمبيوتر عبر واجهة صوت عالية الجودة أو منفذ USB، اعتمادا على الميكروفون الذي تستخدمه. بالنسبة للتناظرية، حافظ على بساطة سلسلة الصوت: الميكروفون، والطوابع المسبقة، وواجهة الصوت، والكمبيوتر. يمكنك ترخيص كل من أدوات Avid Pro و Adobe Audition شهريا بتكلفة معقولة. إذا كانت ميزانيتك ضيقة للغاية، فجرب الجرأة المجانية.

سجل في 44.1 كيلوهرتز أحادي 16 بت (جودة القرص المضغوط) أو أفضل. تبلغ الحالة الحديثة الحالية 48 كيلوهرتز 24 بت، إذا كانت معداتك تدعمها. ستقوم بنسخ عينة من الصوت إلى 24 كيلوهرتز 16 بت قبل إرساله إلى Speech Studio. ومع ذلك، فإنه يدفع للحصول على تسجيل أصلي عالي الجودة في حالة الحاجة إلى عمليات التحرير.

من الناحية المثالية، يكون هناك أشخاص مختلفون يعملون في أدوار المدير والمهندس والموهبة. لا تحاول أن تفعل كل شيء بنفسك. في التصغير، يمكن لشخص واحد أن يكون المدير والمهندس على حد سواء.

قبل الجلسة

لتجنب إضاعة وقت الاستوديو، قم بتشغيل البرنامج النصي باستخدام موهبتك الصوتية قبل جلسة التسجيل. في حين أن المواهب الصوتية تصبح مألوفة مع النص، فإنها يمكن أن توضح نطق أي كلمات غير مألوفة.

ملاحظه

تقدم معظم استوديوهات التسجيل عرضا إلكترونيا للنصوص في كشك التسجيل. في هذه الحالة، اكتب ملاحظات التشغيل مباشرة في مستند البرنامج النصي. ومع ذلك، ستظل بحاجة إلى نسخة ورقية لتدوين الملاحظات عليها أثناء الجلسة. سيرغب معظم المهندسين في الحصول على نسخة م ثابتة أيضا. وستظل تريد نسخة مطبوعة ثالثة كنسخة احتياطية للمواهب في حالة تعطل الكمبيوتر.

قد تسأل موهبتك الصوتية عن الكلمة التي تريد التأكيد عليها في تعبير ("الكلمة المنطوقة"). أخبرهم أنك تريد قراءة طبيعية بدون تركيز معين. يمكن إضافة التوكيد عند تركيب الكلام؛ لا ينبغي أن يكون جزءا من التسجيل الأصلي.

توجيه الموهبة لنطق الكلمات بشكل واضح. يجب أن تنطق كل كلمة من النص كما هو مكتوب. لا ينبغي حذف الأصوات أو تكبيرها معا، كما هو شائع في الكلام العرضي، ما لم تكن قد كتبت بهذه الطريقة في البرنامج النصي.

نص مكتوب	النطق العرضي غير المرغوب فيه
لن يتخلى عنك أبدا	لن يتخلى عنك أبدا
هناك أربعة أضواء	هناك أربعة أضواء
كيف هو الطقس اليوم	كيف هو الطقس اليوم
قل مرحبا لصديقي الصغير	قل مرحبا لصديقي في lil

يجب ألا تضيف الموهبة مسافة مؤقتة مميزة بين الكلمات. وينبغي أن الجملة لا تزال تتدفق بشكل طبيعي، حتى في حين تبدو رسمية قليلا. قد يتطلب هذا التمييز الدقيق ممارسة للوصول إلى ما هو صحيح.

جلسة التسجيل

إنشاء تسجيل مرجعي أو مطابقة ملف لفظ نموذجي في بداية الجلسة. اطلب من الموهبة تكرار هذا السطر في كل صفحة أو نحو ذلك. في كل مرة، قارن التسجيل الجديد بالمرجع. تساعد هذه الممارسة الموهبة على البقاء متسقة في الحجم، والإيقاع، والنغمة، والتجميع. وفي الوقت نفسه، يمكن للمهندس استخدام ملف المطابقة كمرجع للمستويات والاتساق العام للصوت.

يعد ملف المطابقة مهما بشكل خاص عند استئناف التسجيل بعد استراحة أو في يوم آخر. العبها عدة مرات للموهبة وا وجعلهم يكررونها في كل مرة حتى يتطابقوا بشكل جيد.

لتسجيل مجموعة بنمط معين، اختر بعناية البرامج النصية التي تعرض النمط المطلوب. أثناء التسجيل، تأكد من أن الموهبة الصوتية تحافظ على اتساقها في الحجم والإيقاع والنبرة لتحقيق التسجيلات التي تجسد النمط المقصود.

مدرب موهبتك لالتقاط نفس عميق وإيقاف لحظة قبل كل تعبير. سجل بضع ثوان من الصمت بين التعبيرات. يجب نطق الكلمات بنفس الطريقة في كل مرة تظهر فيها، مع مراعاة السياق. على سبيل المثال، يتم نطق "السجل" كفعل بشكل مختلف عن "السجل" باعتباره اسما.

سجل حوالي خمس ثوان من الصمت قبل التسجيل الأول لالتقاط "نغمة الغرفة". تساعد هذه الممارسة Speech Studio على تعويض الضوضاء في التسجيلات.

تلميح

كل ما تحتاج إلى التقاطه هو موهبة الصوت، حتى تتمكن من إجراء تسجيل أحادي الصوت (قناة واحدة) لخطوطهم فقط. ومع ذلك، إذا قمت بالتسجيل في الاستريو، يمكنك استخدام القناة الثانية لتسجيل الثرثرة في غرفة التحكم لالتقاط مناقشة خطوط معينة أو يأخذ. قم بإزالة هذا المسار من الإصدار الذي تم تحميله إلى Speech Studio.

استمع عن كثب، باستخدام سماعات الرأس، إلى أداء موهبة الصوت. أنت تبحث عن نطق جيد ولكن طبيعي، ونطق صحيح، وعدم وجود أصوات غير مرغوب فيها. لا تتردد في طلب موهبتك لإعادة تسجيل تعبير لا يفي بهذه المعايير.

تلميح

إذا كنت تستخدم عددا كبيرا من الألفاظ، فقد لا يكون لفظ واحد تأثير ملحوظ على الصوت المخصص الناتج. قد يكون من الأفضل ملاحظة أي تعبيرات تتعلق بالمشكلات، واستبعادها من مجموعة البيانات الخاصة بك، ومعرفة كيفية ظهور صوتك المخصص. يمكنك دائما العودة إلى الاستوديو وتسجيل العينات الفائتة لاحقا.

لاحظ رمز أخذ رقم أو وقت على البرنامج النصي الخاص بك لكل تعبير. اطلب من المهندس وضع علامة على كل تعبير في بيانات التعريف الخاصة بالتسجيل أو ورقة إشارة أيضا.

خذ فترات راحة منتظمة وقم بتوفير مشروب لمساعدة موهبة صوتك في الحفاظ على صوتهم في حالة جيدة.

بعد الجلسة

يتم تشغيل استوديوهات التسجيل الحديثة على أجهزة الكمبيوتر. في نهاية الجلسة، تتلقى ملفا صوتيا واحدا أو أكثر، وليس شريطا. من المحتمل أن تكون هذه الملفات بتنسيق WAV أو AIFF بجودة قرص مضغوط (44.1 كيلوهرتز 16 بت) أو أفضل. 24 كيلوهرتز 16 بت شائع ومرغوب فيه. معدل أخذ العينات الافتراضي للصوت المخصص هو 24 كيلوهرتز. يوصى باستخدام معدل عينة يبلغ 24 كيلوهرتز وأعلى لبيانات التدريب الخاصة بك. لا يلزم عادة ارتفاع معدلات أخذ العينات، مثل 96 كيلوهرتز.

يتطلب Speech Studio أن يكون كل تعبير متوفر في ملفه الخاص. يحتوي كل ملف صوتي يتم تسليمه بواسطة الاستوديو على عدة تعبيرات. لذا فإن المهمة الأساسية بعد الإنتاج هي تقسيم التسجيلات وإعدادها لتقديمها. ربما وضع مهندس التسجيل علامات في الملف (أو قدم ورقة إشارة منفصلة) للإشارة إلى مكان بدء كل تعبير.

استخدم ملاحظاتك للعثور على ما تريده بالضبط، ثم استخدم أداة تحرير الصوت، مثل أدوات Avid Pro أو Adobe Audition أو الجرأة المجانية، لنسخ كل تعبير إلى ملف جديد.

استمع إلى كل ملف بعناية. في هذه المرحلة، يمكنك تحرير الأصوات الصغيرة غير المرغوب فيها التي فاتك أثناء التسجيل، مثل صفعة شفاه خفيفة قبل السطر، ولكن يجب الحرص على عدم إزالة أي كلام فعلي. إذا لم تتمكن من إصلاح ملف، فقم بإزالته من مجموعة البيانات ولاحظ أنك قمت بذلك.

تحويل كل ملف إلى 16 بت ومعدل عينة من 24 كيلوهرتز وأعلى قبل الحفظ وإذا قمت بتسجيل ثرثرة الاستوديو، قم بإزالة القناة الثانية. احفظ كل ملف بتنسيق WAV، مع تسمية الملفات برقم النطق من البرنامج النصي الخاص بك.

وأخيرا، قم بإنشاء النسخة المكتوبة التي تربط كل ملف WAV بإصدار نصي من التعبير المقابل. تدريب النموذج الصوتي الخاص بك يتضمن تفاصيل التنسيق المطلوب. يمكنك نسخ النص مباشرة من البرنامج النصي الخاص بك. ثم قم بإنشاء ملف Zip لملفات WAV والنص المكتوب.

أرشفة التسجيلات الأصلية في مكان آمن في حال كنت بحاجة إليها لاحقا. احتفظ بالبرنامج النصي والملاحظات أيضا.

الخطوات التالية

أنت مستعد لتحميل تسجيلاتك وإنشاء صوتك المخصص.

تدريب نموذج الصوت الخاص بك

مشاركة عبر

تسجيل عينات الصوت للصوت المخصص

تلميحات لإعداد البيانات للحصول على صوت عالي الجودة

أدوار التسجيل الصوتي

اختيار موهبتك الصوتية

إنشاء برنامج نصي

معايير تحديد البرنامج النصي

الفرق بين البرنامج النصي للمواهب الصوتية والبرنامج النصي للتدريب

العيوب النموذجية للبرنامج النصي

تنسيق البرنامج النصي

بيان المواهب الصوتية

الشؤون القانونية

تسجيل البرنامج النصي الخاص بك

متطلبات التسجيل

أخطاء صوتية نموذجية

قم بذلك بنفسك

قبل الجلسة

جلسة التسجيل

بعد الجلسة

الخطوات التالية

الملاحظات

الموارد الإضافية