مصفوفة بلوسم (BLOSUM)

تاريخ وتطور مصفوفة بلوسم

تم تطوير مصفوفة بلوسم بواسطة ستيفن هندرسون وزملاؤه في عام 1992. استند عملهم إلى تحليل مكثف لقواعد بيانات البروتينات المتوفرة آنذاك، وتحديدًا مجموعة من كتل البروتينات (Blocks) التي تمثل مناطق محفوظة من تسلسلات البروتينات. استخدم الباحثون هذه الكتل لإنشاء مصفوفة تمثل احتمالية استبدال الأحماض الأمينية. اسم “BLOSUM” هو اختصار لعبارة “BLOcks SUbstitution Matrix” (مصفوفة استبدال الكتل)، في إشارة إلى البيانات التي استخدمت في إنشائها.

آلية عمل مصفوفة بلوسم

تعتمد آلية عمل مصفوفة بلوسم على فكرة أن الأحماض الأمينية التي تتكرر استبدالاتها في تسلسلات البروتينات المتشابهة وراثيًا، تكون أكثر عرضة للاستبدال ببعضها البعض في البروتينات ذات الصلة. يتم حساب قيم المصفوفة بناءً على:

  • تجميع تسلسلات البروتينات: يتم تجميع مجموعات من تسلسلات البروتينات المتشابهة وراثيًا في قواعد البيانات.
  • تحديد الكتل: يتم تحديد كتل البروتينات، وهي مناطق محفوظة من التسلسلات.
  • حساب تكرار الاستبدالات: يتم تحليل الكتل لتحديد عدد مرات استبدال كل حمض أميني بآخر.
  • حساب النقاط: بناءً على تكرار الاستبدالات، يتم تعيين نقاط لكل استبدال. النقاط الموجبة تشير إلى الاستبدالات الشائعة، في حين تشير النقاط السالبة إلى الاستبدالات غير الشائعة.

تختلف مصفوفات بلوسم بناءً على مستوى التشابه بين التسلسلات المستخدمة في إنشائها. على سبيل المثال، مصفوفة بلوسم 62 (BLOSUM62) شائعة الاستخدام، وتستند إلى تحليل تسلسلات بروتينات ذات تشابه لا يقل عن 62%. توجد أيضًا مصفوفات أخرى مثل بلوسم 45 وبلوسم 80، والتي تستخدم لمستويات مختلفة من التشابه. اختيار المصفوفة المناسبة يعتمد على طبيعة البحث وتسلسلات البروتينات التي يتم تحليلها.

أهمية مصفوفة بلوسم في تحليل تسلسل البروتينات

تلعب مصفوفة بلوسم دورًا حيويًا في العديد من التطبيقات في المعلوماتية الحيوية، بما في ذلك:

  • محاذاة التسلسلات: تستخدم مصفوفة بلوسم في خوارزميات محاذاة التسلسلات لتحديد أوجه التشابه بين تسلسلات البروتينات. تساعد هذه المحاذاة في تحديد العلاقات التطورية بين البروتينات، وتحديد المناطق الوظيفية المحفوظة، والتنبؤ بوظيفة البروتين.
  • البحث عن التشابه: تُستخدم مصفوفة بلوسم في قواعد بيانات البروتينات للبحث عن تسلسلات بروتينية مماثلة لتسلسل معين.
  • بناء الأشجار التطورية: تساعد مصفوفة بلوسم في بناء الأشجار التطورية التي تمثل العلاقات التطورية بين البروتينات المختلفة.
  • التنبؤ ببنية البروتين: يمكن استخدام مصفوفة بلوسم في التنبؤ ببنية البروتين ثلاثية الأبعاد.

أنواع مصفوفات بلوسم

توجد العديد من مصفوفات بلوسم المختلفة، والتي تختلف بناءً على مستوى التشابه بين التسلسلات التي استخدمت في إنشائها. تشمل بعض الأنواع الأكثر شيوعًا:

  • BLOSUM80: تستخدم لتسلسلات البروتينات الأكثر تشابهًا (أعلى من 80%).
  • BLOSUM62: تعتبر الأكثر استخدامًا، وتعمل بشكل جيد مع مجموعة واسعة من تسلسلات البروتينات.
  • BLOSUM45: تستخدم لتسلسلات البروتينات الأقل تشابهًا (أقل من 45%).

يعتمد اختيار المصفوفة المناسبة على طبيعة البيانات التي يتم تحليلها. بالنسبة للمقارنات بين البروتينات ذات الصلة الوثيقة، قد تكون بلوسم 80 هي الأنسب. أما بالنسبة للمقارنات بين البروتينات الأقل تشابهًا، فقد تكون بلوسم 45 أكثر ملاءمة. بلوسم 62 هي خيار جيد للعديد من التطبيقات.

مقارنة مصفوفة بلوسم بمصفوفة PAM

بالإضافة إلى مصفوفة بلوسم، هناك مصفوفة أخرى شائعة الاستخدام في تحليل تسلسل البروتينات وهي مصفوفة PAM (Point Accepted Mutation). تختلف مصفوفة PAM عن مصفوفة بلوسم في طريقة إنشائها. تعتمد مصفوفة PAM على تحليل التغيرات في تسلسلات البروتينات المتطورة، في حين تعتمد مصفوفة بلوسم على تحليل كتل البروتينات المحفوظة.

  • PAM: تحسب بناءً على التغيرات التي تحدث بمرور الوقت في سلسلة البروتين (تطور). تعبر PAM1 عن تغييرات بنسبة 1% في سلسلة البروتين.
  • BLOSUM: تحسب بناءً على مقارنة مجموعات من سلاسل البروتين المتشابهة، وتظهر مدى احتمالية استبدال حمض أميني بآخر.

بشكل عام، تعتبر مصفوفة بلوسم أكثر ملاءمة لتحليل تسلسلات البروتينات ذات التشابه المحدود، في حين قد تكون مصفوفة PAM أكثر ملاءمة لتحليل تسلسلات البروتينات ذات الصلة الوثيقة. ومع ذلك، فإن بلوسم 62 أصبحت المعيار في العديد من التطبيقات.

استخدام مصفوفة بلوسم في برامج تحليل التسلسل

تُدمج مصفوفة بلوسم في العديد من برامج تحليل التسلسل المستخدمة في المعلوماتية الحيوية. تسمح هذه البرامج للمستخدمين بمحاذاة تسلسلات البروتينات، والبحث عن التشابه، وتحليل العلاقات التطورية. تشمل بعض البرامج الشائعة:

  • BLAST: أداة بحث عن التشابه تستخدم مصفوفات مثل بلوسم لتقييم التشابه بين التسلسلات.
  • ClustalW/Clustal Omega: برامج تستخدم لمواءمة تسلسلات البروتينات.
  • MUSCLE: برنامج آخر يستخدم لمواءمة التسلسلات.

تتيح هذه البرامج للمستخدمين تحديد مصفوفة بلوسم التي يرغبون في استخدامها، مما يتيح لهم تخصيص عملية التحليل وفقًا لمتطلبات بحثهم.

العوامل المؤثرة في اختيار مصفوفة بلوسم

عند اختيار مصفوفة بلوسم، يجب مراعاة عدة عوامل:

  • مستوى التشابه بين التسلسلات: إذا كانت التسلسلات متشابهة جدًا، فقد تكون مصفوفة بلوسم 80 هي الأنسب. إذا كانت التسلسلات أقل تشابهًا، فقد تكون مصفوفة بلوسم 45 أكثر ملاءمة.
  • طول التسلسلات: يمكن أن تؤثر أطوال التسلسلات على نتائج التحليل.
  • جودة البيانات: يجب التأكد من جودة البيانات المستخدمة في التحليل، حيث يمكن أن تؤثر الأخطاء في البيانات على النتائج.
  • هدف التحليل: تحديد هدف التحليل يساعد في اختيار المصفوفة المناسبة. على سبيل المثال، إذا كان الهدف هو تحديد المناطق المحفوظة في البروتينات، فقد تكون مصفوفة بلوسم 62 مناسبة.

قيود مصفوفة بلوسم

على الرغم من أهميتها، فإن مصفوفة بلوسم لديها بعض القيود:

  • تعتمد على البيانات: تعتمد المصفوفة على البيانات المستخدمة في إنشائها، وقد لا تكون مناسبة لجميع أنواع البروتينات.
  • قد لا تعكس جميع التغيرات: لا يمكن للمصفوفة أن تعكس جميع أنواع التغيرات التي تحدث في تسلسلات البروتينات.
  • التحيز: قد يكون هناك تحيز في البيانات المستخدمة في إنشاء المصفوفة، مما قد يؤثر على النتائج.

التطورات المستقبلية في مجال مصفوفات الاستبدال

يشهد مجال المعلوماتية الحيوية تطورات مستمرة في مجال مصفوفات الاستبدال. يعمل الباحثون على تطوير مصفوفات جديدة تأخذ في الاعتبار:

  • بيانات جديدة: استخدام قواعد بيانات أكبر وأكثر تنوعًا لإنشاء مصفوفات جديدة.
  • التقنيات الحديثة: دمج التقنيات الحديثة مثل التعلم الآلي لتحسين دقة المصفوفات.
  • المعلومات الهيكلية: دمج المعلومات الهيكلية للبروتينات لتحسين دقة التنبؤات.

خاتمة

تعتبر مصفوفة بلوسم أداة أساسية في تحليل تسلسل البروتينات، حيث تساعد في تحديد التشابه بين التسلسلات، وبناء الأشجار التطورية، والتنبؤ بوظيفة البروتين. يعتمد اختيار المصفوفة المناسبة على مستوى التشابه بين التسلسلات والهدف من التحليل. على الرغم من وجود بعض القيود، فإن مصفوفة بلوسم لا تزال أداة حيوية في مجال المعلوماتية الحيوية، وتستمر في التطور مع التقدم في هذا المجال.

المراجع