دالة التوزيع التراكمي (Cumulative Distribution Function)

تعريف دالة التوزيع التراكمي

رياضياً، تُعرَّف دالة التوزيع التراكمي FX(x) للمتغير العشوائي X على النحو التالي:

FX(x) = P(X ≤ x)

حيث:

  • FX(x) هي دالة التوزيع التراكمي للمتغير العشوائي X.
  • x هو عدد حقيقي.
  • P(X ≤ x) هو احتمال أن يكون المتغير العشوائي X أقل من أو يساوي x.

مثال:

لنفترض أن لدينا متغيرًا عشوائيًا يمثل نتيجة رمي حجر نرد منتظم. يمكن أن تأخذ النتيجة قيمًا من 1 إلى 6، وكل قيمة لها احتمال متساوٍ قدره 1/6. إذن، يمكن حساب دالة التوزيع التراكمي لهذا المتغير العشوائي كما يلي:

  • FX(1) = P(X ≤ 1) = 1/6
  • FX(2) = P(X ≤ 2) = 1/6 + 1/6 = 1/3
  • FX(3) = P(X ≤ 3) = 1/6 + 1/6 + 1/6 = 1/2
  • FX(4) = P(X ≤ 4) = 1/6 + 1/6 + 1/6 + 1/6 = 2/3
  • FX(5) = P(X ≤ 5) = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 5/6
  • FX(6) = P(X ≤ 6) = 1/6 + 1/6 + 1/6 + 1/6 + 1/6 + 1/6 = 1

خصائص دالة التوزيع التراكمي

تتميز دالة التوزيع التراكمي بعدة خصائص مهمة، منها:

  • غير متناقصة: FX(x) هي دالة غير متناقصة، بمعنى أنه إذا كان a < b، فإن FX(a) ≤ FX(b).
  • الحدود: 0 ≤ FX(x) ≤ 1 لكل قيم x.
  • اليمين مستمرة: FX(x) هي دالة مستمرة من اليمين، بمعنى أن:

    limh→0+ FX(x + h) = FX(x)

  • القيم الحدية:

    limx→-∞ FX(x) = 0

    limx→+∞ FX(x) = 1

أنواع المتغيرات العشوائية ودوال التوزيع التراكمي

تختلف صيغة دالة التوزيع التراكمي باختلاف نوع المتغير العشوائي:

المتغيرات العشوائية المتقطعة

إذا كان المتغير العشوائي X متقطعًا، فإن دالة التوزيع التراكمي الخاصة به تكون دالة متدرجة (step function). يتم حساب قيمة الدالة عند نقطة معينة عن طريق جمع احتمالات جميع القيم التي تقل عن أو تساوي تلك النقطة.

رياضيًا، إذا كان X يأخذ القيم x1, x2, x3, … باحتمالات p1, p2, p3, … على التوالي، فإن دالة التوزيع التراكمي تُعطى بالصيغة:

FX(x) = Σxi ≤ x pi

مثال:

في مثال رمي حجر النرد أعلاه، المتغير العشوائي متقطع، ودالة التوزيع التراكمي هي دالة متدرجة.

المتغيرات العشوائية المستمرة

إذا كان المتغير العشوائي X مستمرًا، فإن دالة التوزيع التراكمي الخاصة به تكون دالة مستمرة. يمكن الحصول على دالة التوزيع التراكمي عن طريق تكامل دالة الكثافة الاحتمالية (PDF) الخاصة بالمتغير العشوائي.

رياضيًا، إذا كانت fX(x) هي دالة الكثافة الاحتمالية للمتغير العشوائي X، فإن دالة التوزيع التراكمي تُعطى بالصيغة:

FX(x) = ∫x-∞ fX(t) dt

مثال:

التوزيع الطبيعي (Normal Distribution) هو مثال على توزيع مستمر. دالة التوزيع التراكمي للتوزيع الطبيعي لا يمكن التعبير عنها بصيغة رياضية بسيطة، وعادة ما يتم حسابها باستخدام جداول أو برامج إحصائية.

أهمية دالة التوزيع التراكمي

تعتبر دالة التوزيع التراكمي أداة أساسية في نظرية الاحتمالات والإحصاء، حيث توفر وصفًا كاملاً لتوزيع الاحتمالات لمتغير عشوائي. تستخدم في العديد من التطبيقات، بما في ذلك:

  • حساب الاحتمالات: يمكن استخدام دالة التوزيع التراكمي لحساب احتمال أن يأخذ المتغير العشوائي قيمة في نطاق معين. على سبيل المثال، يمكن حساب الاحتمال بأن a < X ≤ b باستخدام الصيغة:

    P(a < X ≤ b) = FX(b) – FX(a)

  • المقارنة بين التوزيعات: يمكن استخدام دالة التوزيع التراكمي لمقارنة توزيعات احتمالية مختلفة.
  • التحقق من صحة النماذج الإحصائية: يمكن استخدام دالة التوزيع التراكمي للتحقق من مدى توافق نموذج إحصائي مع البيانات التجريبية.
  • إنشاء أرقام عشوائية: يمكن استخدام دالة التوزيع التراكمي لإنشاء أرقام عشوائية تتبع توزيعًا احتماليًا محددًا (Inverse Transform Sampling).

دالة التوزيع التراكمي التجريبية (Empirical CDF)

بالإضافة إلى دالة التوزيع التراكمي النظرية، يوجد أيضًا مفهوم دالة التوزيع التراكمي التجريبية. تُستخدم دالة التوزيع التراكمي التجريبية لتقدير دالة التوزيع التراكمي لمتغير عشوائي بناءً على عينة من البيانات.

إذا كان لدينا عينة من البيانات x1, x2, …, xn، فإن دالة التوزيع التراكمي التجريبية تُعرَّف على النحو التالي:

Fn(x) = (عدد القيم في العينة ≤ x) / n

حيث:

  • Fn(x) هي دالة التوزيع التراكمي التجريبية.
  • n هو حجم العينة.

تستخدم دالة التوزيع التراكمية التجريبية على نطاق واسع في الإحصاء الوصفي والاستدلالي لتقييم توزيع البيانات المرصودة.

أمثلة على دوال التوزيع التراكمي الشائعة

  • التوزيع المنتظم (Uniform Distribution): له دالة توزيع تراكمي خطية بين الحد الأدنى والأقصى لقيم المتغير.
  • التوزيع الأسي (Exponential Distribution): شائع الاستخدام لنمذجة الوقت بين الأحداث في عملية بواسون.
  • توزيع بواسون (Poisson Distribution): يستخدم لنمذجة عدد الأحداث التي تحدث في فترة زمنية أو مكان محدد.
  • توزيع بيرنولي (Bernoulli Distribution): يمثل احتمال النجاح أو الفشل في تجربة واحدة.

العلاقة بين دالة التوزيع التراكمي ودالة الكثافة الاحتمالية

كما ذكرنا سابقًا، دالة التوزيع التراكمي (CDF) ودالة الكثافة الاحتمالية (PDF) ترتبطان ارتباطًا وثيقًا، خاصةً للمتغيرات العشوائية المستمرة. دالة الكثافة الاحتمالية هي مشتقة دالة التوزيع التراكمي.

رياضياً:

fX(x) = d/dx FX(x)

وبالمثل، دالة التوزيع التراكمي هي تكامل دالة الكثافة الاحتمالية:

FX(x) = ∫x-∞ fX(t) dt

هذه العلاقة مهمة لأنها تسمح لنا بالانتقال بين دالة الكثافة الاحتمالية ودالة التوزيع التراكمي، مما يوفر أدوات تحليلية مرنة.

دالة التوزيع التراكمي متعددة المتغيرات

يمكن أيضًا تعريف دالة التوزيع التراكمي للمتغيرات العشوائية متعددة المتغيرات. على سبيل المثال، لمتغير عشوائي ثنائي الأبعاد (X, Y)، تُعرَّف دالة التوزيع التراكمي على النحو التالي:

FX,Y(x, y) = P(X ≤ x, Y ≤ y)

وهي تمثل احتمال أن يكون X أقل من أو يساوي x و Y أقل من أو يساوي y في الوقت نفسه.

خاتمة

دالة التوزيع التراكمي (CDF) هي أداة قوية ومرنة في الإحصاء والاحتمالات. توفر وصفًا كاملاً لتوزيع المتغيرات العشوائية، مما يسمح لنا بحساب الاحتمالات، ومقارنة التوزيعات، والتحقق من صحة النماذج، وإنشاء أرقام عشوائية. فهم دالة التوزيع التراكمي أمر ضروري لأي شخص يعمل مع البيانات والتحليل الإحصائي.

المراجع

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *