نموذج المصدر والمرشح (Source-Filter Model)

مقدمة

نموذج المصدر والمرشح هو نموذج رياضي يصف كيفية إنتاج الكلام البشري. يقوم هذا النموذج بفصل عملية إنتاج الكلام إلى مرحلتين متميزتين: مرحلة المصدر ومرحلة المرشح. يمثل المصدر الصوت الأولي الذي يتم إنشاؤه في الحنجرة (أو في مكان آخر في الجهاز الصوتي) ، بينما يمثل المرشح شكل الجهاز الصوتي الذي يقوم بتشكيل هذا الصوت.

ببساطة، يمكننا تشبيه الأمر بمكبر صوت. المصدر هو الميكروفون الذي يلتقط الصوت، والمرشح هو مكبر الصوت الذي يقوم بتعديل وتضخيم هذا الصوت. في حالة الكلام، المصدر هو اهتزاز الأحبال الصوتية، والمرشح هو تجويف الفم والأنف والحلق.

يُستخدم نموذج المصدر والمرشح على نطاق واسع في مجالات معالجة الكلام، وتوليد الكلام، والتعرف على الكلام، وعلم الصوتيات. يوفر هذا النموذج إطارًا مفيدًا لفهم كيفية إنتاج الكلام وتحليله وتعديله.

مكونات نموذج المصدر والمرشح

يتكون نموذج المصدر والمرشح من عنصرين رئيسيين:

  • المصدر: يمثل المصدر الصوت الأولي الذي يتم إنشاؤه في الجهاز الصوتي. يمكن أن يكون هذا المصدر دوريًا (مثل صوت العلة) أو غير دوري (مثل صوت الاحتكاك). بالنسبة للأصوات المجهورة، يكون المصدر هو اهتزاز الأحبال الصوتية. بالنسبة للأصوات المهموسة، يكون المصدر هو اضطراب الهواء الذي يمر عبر الحنجرة أو مكان آخر في الجهاز الصوتي.
  • المرشح: يمثل المرشح شكل الجهاز الصوتي. يقوم الجهاز الصوتي بتشكيل الصوت الناتج عن المصدر من خلال سلسلة من الرنينات. تتغير هذه الرنينات حسب شكل الجهاز الصوتي، والذي يتغير بدوره حسب حركة اللسان والشفاه والفك.

تمثيل المصدر

يتم تمثيل المصدر عادةً بإحدى طريقتين:

  • الوظيفة الدورية: يتم استخدام هذه الوظيفة لتمثيل الأصوات المجهورة، مثل أصوات العلة. تعتمد الوظيفة الدورية على تردد الصوت الأساسي (pitch) وشكله. يمكن تمثيل شكل الوظيفة الدورية باستخدام سلسلة فورييه.
  • الضوضاء العشوائية: يتم استخدام هذه الوظيفة لتمثيل الأصوات المهموسة، مثل أصوات الاحتكاك. تمثل الضوضاء العشوائية اضطراب الهواء الذي يمر عبر الجهاز الصوتي.

تمثيل المرشح

يتم تمثيل المرشح عادةً باستخدام دالة نقل. تصف دالة النقل كيفية تعديل المرشح للصوت الناتج عن المصدر. يمكن تمثيل دالة النقل باستخدام مجموعة من المعاملات، مثل معاملات التنبؤ الخطي (LPC). تحدد معاملات LPC شكل الجهاز الصوتي وبالتالي الرنينات التي ينتجها. يتم تقدير معاملات LPC من إشارة الكلام باستخدام تقنيات مختلفة.

يمكن تصور المرشح كأنبوب له شكل معين. يغير هذا الشكل خصائص الصوت الذي يمر عبره. على سبيل المثال، إذا كان الأنبوب ضيقًا في مكان ما، فإنه سيؤدي إلى تضخيم الترددات المقابلة لهذا الجزء الضيق.

تطبيقات نموذج المصدر والمرشح

يُستخدم نموذج المصدر والمرشح في مجموعة واسعة من التطبيقات، بما في ذلك:

  • معالجة الكلام: يُستخدم نموذج المصدر والمرشح لتحليل إشارات الكلام واستخراج المعلومات ذات الصلة، مثل تردد الصوت الأساسي وشكل الجهاز الصوتي. يمكن استخدام هذه المعلومات في مجموعة متنوعة من التطبيقات، مثل التعرف على المتحدث والتعرف على اللغة.
  • توليد الكلام: يُستخدم نموذج المصدر والمرشح لتوليد إشارات كلام اصطناعية. يمكن استخدام هذه الإشارات في مجموعة متنوعة من التطبيقات، مثل تركيب الكلام والمساعدين الصوتيين.
  • التعرف على الكلام: يُستخدم نموذج المصدر والمرشح كجزء من أنظمة التعرف على الكلام. يساعد النموذج في تحديد الأصوات المختلفة في الكلام وتمييزها عن بعضها البعض.
  • علم الصوتيات: يُستخدم نموذج المصدر والمرشح كأداة لفهم كيفية إنتاج الكلام. يساعد النموذج الباحثين على دراسة العلاقة بين شكل الجهاز الصوتي وخصائص الصوت الناتج.
  • ترميز الكلام: يساعد نموذج المصدر والمرشح في تطوير خوارزميات فعالة لضغط إشارات الكلام، مما يقلل من حجم البيانات المطلوبة لتخزين أو نقل الكلام مع الحفاظ على جودته.
  • تصحيح عيوب النطق: يمكن استخدام النموذج لتحليل الكلام لدى الأشخاص الذين يعانون من مشاكل في النطق، وتحديد المناطق التي تحتاج إلى تحسين، وتطوير تمارين لعلاج هذه المشاكل.

مثال على استخدام نموذج المصدر والمرشح

لنفترض أننا نريد تحليل صوت العلة “آ”. باستخدام نموذج المصدر والمرشح، يمكننا تمثيل هذا الصوت على النحو التالي:

  • المصدر: وظيفة دورية بتردد أساسي يبلغ 120 هرتز (على سبيل المثال).
  • المرشح: دالة نقل ذات ثلاثة رنينات رئيسية عند 700 هرتز و 1200 هرتز و 2500 هرتز (على سبيل المثال).

تمثل هذه الرنينات شكل الجهاز الصوتي عند نطق صوت العلة “آ”. يمكننا استخدام هذه المعلومات لتوليد صوت “آ” اصطناعي أو للتعرف على هذا الصوت في إشارة كلام. يمكن تغيير خصائص المصدر (مثل التردد الأساسي) لتوليد أصوات مختلفة، ويمكن تغيير خصائص المرشح لتوليد أصوات علة مختلفة.

قيود نموذج المصدر والمرشح

على الرغم من أن نموذج المصدر والمرشح هو أداة قوية، إلا أنه له بعض القيود:

  • التبسيط الزائد: يفترض النموذج أن المصدر والمرشح مستقلان تمامًا عن بعضهما البعض، وهو ليس صحيحًا دائمًا. في الواقع، هناك تفاعل معقد بين المصدر والمرشح. على سبيل المثال، يمكن أن يؤثر شكل الجهاز الصوتي على تردد الصوت الأساسي.
  • الخطية: يفترض النموذج أن المرشح خطي، مما يعني أن استجابته للصوت لا تعتمد على سعة الصوت. ومع ذلك، في الواقع، يمكن أن يكون الجهاز الصوتي غير خطي، خاصة عند مستويات الصوت العالية.
  • عدم مراعاة الجوانب غير الصوتية: يركز النموذج بشكل أساسي على الجوانب الصوتية لإنتاج الكلام ويتجاهل الجوانب الأخرى مثل تعابير الوجه وحركات الجسم التي تساهم أيضًا في التواصل.

على الرغم من هذه القيود، يظل نموذج المصدر والمرشح أداة مفيدة لفهم إنتاج الكلام. يتم استخدامه على نطاق واسع في مجموعة متنوعة من التطبيقات، وغالبًا ما يتم دمجه مع نماذج أخرى لمعالجة القيود المذكورة أعلاه.

التطورات الحديثة

مع التقدم في مجال معالجة الإشارات والتعلم الآلي، تم تطوير نماذج أكثر تعقيدًا ودقة لإنتاج الكلام. تشمل هذه النماذج:

  • الشبكات العصبية العميقة: يمكن استخدام الشبكات العصبية العميقة لنمذجة العلاقة المعقدة بين شكل الجهاز الصوتي والصوت الناتج.
  • نماذج ماركوف المخفية: يمكن استخدام نماذج ماركوف المخفية لنمذجة التغيرات الزمنية في شكل الجهاز الصوتي.

ومع ذلك، لا يزال نموذج المصدر والمرشح بمثابة نقطة انطلاق مهمة لفهم هذه النماذج الأكثر تعقيدًا.

خاتمة

نموذج المصدر والمرشح هو نموذج أساسي في مجال معالجة الكلام يوفر إطارًا لفهم كيفية إنتاج الكلام. على الرغم من وجود بعض القيود، إلا أنه لا يزال أداة قوية تستخدم على نطاق واسع في مجموعة متنوعة من التطبيقات. مع استمرار التطورات في مجال معالجة الإشارات والتعلم الآلي، من المرجح أن يظل نموذج المصدر والمرشح ذا صلة، إما كنموذج قائم بذاته أو كجزء من نماذج أكثر تعقيدًا.

المراجع