أجهزة الكمبيوتر شبابيك إنترنت

توزيع بيتا. تقريب قانون التوزيع لمجموع المتغيرات العشوائية موزعة حسب قانون بيتا. توليد الأعداد العشوائية وتقدير المعلمات

ضع في اعتبارك توزيع بيتا ، واحسب توقعاته الرياضية ، والتباين ، والصيغة. باستخدام وظيفة MS EXCEL BETA.DIST () ، سنقوم برسم الرسوم البيانية لوظيفة التوزيع وكثافة الاحتمال. دعونا ننشئ مصفوفة أرقام عشوائيةوتقدير معلمات التوزيع.

توزيع بيتابيتا- توزيع) يعتمد على معلمتين: α ( alpha)> 0(يحدد شكل التوزيع) و ب (بيتا)> 0(يحدد المقياس).

على عكس العديد من التوزيعات المستمرة الأخرى ، فإن نطاق التباين لمتغير عشوائي له توزيع بيتا، يحده المقطع. خارج هذا الجزء كثافة التوزيعيساوي 0. يتم تعيين حدود هذا الجزء من قبل الباحث حسب المشكلة. إذا كان A = 0 و B = 1 ، فعندئذٍ هكذا توزيع بيتايسمى المعيار.

توزيع بيتالديه التعيين بيتا(الحروف الأبجدية).

ملحوظة: إذا كانت المعلمات ألفاو بيتا= 1 إذن توزيع بيتايتحول إلى ، أي بيتا (1 ، 1 ، أ ، ب) = يو (أ ، ب).

بشكل عام دالة التوزيعلا يمكن التعبير عنها في وظائف أولية ، لذلك يتم حسابها بالطرق العددية ، على سبيل المثال ، باستخدام وظيفة MS EXCEL BETA.DIST ().

ملحوظة: لتسهيل كتابة المعادلات في ملف المثال لمعلمات التوزيع ألفا وبيتاملائم.

يحتوي ملف المثال أيضًا على رسوم بيانية كثافة الاحتمالو وظائف التوزيعبقيم ملحوظة وسط، و .

توليد الأرقام العشوائية وتقدير المعلمة

استخدام دالة التوزيع العكسي(أو القيم الكمية ( ص- كمية), راجع) يمكنك إنشاء قيم لمتغير عشوائي له توزيع بيتا... للقيام بذلك ، تحتاج إلى استخدام الصيغة:

BETA.OBR (RAND () ؛ ألفا ؛ بيتا ؛ أ ؛ ب)

النصيحة: لأن يتم إنشاء الأرقام العشوائية باستخدام وظيفة RAND () ، ثم الضغط على المفتاح F9، من الممكن الحصول على عينة جديدة في كل مرة ، وبالتالي ، تقدير جديد للمعلمات.

تُنشئ الدالة RAND () من 0 إلى 1 ، وهو ما يتوافق تمامًا مع نطاق تباين الاحتمال (انظر. مثال على إنشاء ملف ورقة).

يوجد الآن مجموعة من الأرقام العشوائية التي تم إنشاؤها باستخدام معلمات التوزيع المحددة ألفاو بيتا(فليكن هناك 200) ، دعونا نقدر معلمات التوزيع.

تقدير المعلمة ألفاو بيتايمكن القيام به مع طريقة اللحظات(من المفترض أن المعلمات A و B معروفة):

ما هي فكرة التفكير الاحتمالي؟

الخطوة الأولى والأكثر طبيعية في التفكير الاحتمالي هي كما يلي: إذا كان لديك متغير يأخذ قيمًا بشكل عشوائي ، فأنت تريد معرفة الاحتمالات التي يتخذها هذا المتغير لقيم معينة. مزيج هذه الاحتمالات هو بالضبط ما يحدد توزيع الاحتمالات. على سبيل المثال ، باستخدام النرد ، يمكنك ذلك افترض مسبقًا أنه مع وجود احتمالات متساوية 1/6 ستقع على أي حافة. وهذا يحدث بشرط أن يكون العظم متماثلًا. إذا كان العظم غير متماثل ، فمن الممكن تحديد احتمالات عالية لتلك الوجوه التي تتساقط كثيرًا ، واحتمالات أقل لتلك الوجوه التي تتساقط كثيرًا ، بناءً على البيانات التجريبية. إذا لم تسقط بعض الحافة على الإطلاق ، فيمكن عندئذٍ تعيين احتمالية قدرها 0. هذا هو أبسط قانون احتمالية يمكن استخدامه لوصف نتائج رمي النرد. بالطبع ، هذا مثال بسيط للغاية ، ولكن تظهر مشكلات مماثلة ، على سبيل المثال ، في الحسابات الاكتوارية ، عندما يتم حساب المخاطر الحقيقية بناءً على بيانات حقيقية عند إصدار بوليصة التأمين.

في هذا الفصل ، سوف نلقي نظرة على القوانين الاحتمالية الأكثر شيوعًا في الممارسة.

يمكن رسم هذه التوزيعات بسهولة في STATISTICA.

التوزيع الطبيعي

التوزيع الاحتمالي العادي يستخدم بشكل شائع في الإحصاء. يعطي التوزيع الطبيعي نموذجًا جيدًا لظواهر العالم الحقيقي حيث:

1) هناك ميل قوي لتجمع البيانات حول المركز ؛

2) الانحرافات الإيجابية والسلبية عن المركز محتملة بشكل متساوٍ ؛

3) يتناقص تواتر الانحرافات بسرعة عندما تصبح الانحرافات عن المركز كبيرة.

يمكن وصف الآلية التي يقوم عليها التوزيع الطبيعي ، والتي يتم شرحها باستخدام ما يسمى بنظرية الحد المركزي ، بشكل مجازي على النحو التالي. تخيل أن لديك جزيئات حبوب اللقاح التي ألقيتها عشوائيًا في كوب من الماء. بالنظر إلى جسيم فردي تحت المجهر ، سترى ظاهرة مذهلة - الجسيم يتحرك. بالطبع ، يحدث هذا لأن جزيئات الماء تتحرك وتنقل حركتها إلى جزيئات حبوب اللقاح المعلقة.

ولكن كيف تجري الحركة بالضبط؟ هذا سؤال أكثر إثارة للاهتمام. وهذه الحركة غريبة جدا!

هناك عدد لا حصر له من التأثيرات المستقلة على جسيم فردي من حبوب اللقاح في شكل تأثيرات جزيئات الماء ، والتي تجعل الجسيم يتحرك على طول مسار غريب للغاية. تحت المجهر ، تشبه هذه الحركة خطًا مكسورًا بشكل متكرر. لا يمكن التنبؤ بهذه الخلل ، ولا يوجد انتظام فيها ، وهو ما يتوافق تمامًا مع التصادمات الفوضوية للجزيئات على الجسيم. الجسيم المعلق ، بعد أن اختبر تأثير جزيء الماء في لحظة عشوائية من الزمن ، يغير اتجاه حركته ، ثم يتحرك لبعض الوقت بالقصور الذاتي ، ثم يقع مرة أخرى تحت تأثير الجزيء التالي ، وهكذا. يوجد بلياردو مذهل في كوب من الماء!

نظرًا لأن حركة الجزيئات لها اتجاه وسرعة عشوائيان ، فإن حجم واتجاه مكامن الخلل في المسار يكونان عشوائيًا تمامًا ولا يمكن التنبؤ بهما. هذه الظاهرة المدهشة ، المسماة بالحركة البراونية ، المكتشفة في القرن التاسع عشر ، تجعلنا نفكر في أشياء كثيرة.

إذا أدخلنا نظامًا مناسبًا وحددنا إحداثيات الجسيم في بعض اللحظات ، فسنحصل على القانون العادي. بتعبير أدق ، فإن عمليات إزاحة جسيمات حبوب اللقاح الناتجة عن تأثير الجزيئات ستمتثل للقانون الطبيعي.

لأول مرة ، تم وصف قانون حركة مثل هذا الجسيم ، المسمى براوني ، على المستوى الفيزيائي للصرامة من قبل أ. أينشتاين. ثم طور لينجيفان نهجًا أبسط وأكثر حدسية.

كرس علماء الرياضيات في القرن العشرين لهذه النظرية أفضل الصفحات، وقد اتخذت الخطوة الأولى قبل 300 عام ، عندما تم اكتشاف أبسط نسخة من نظرية الحد المركزي.

في نظرية الاحتمالات ، نظرية الحد المركزي ، المعروفة أصلاً في صياغة Moivre و Laplace في القرن السابع عشر كتطور لقانون الأعداد الكبيرة الشهير بواسطة J. Bernoulli (1654-1705) (انظر J. Bernoulli (1713) ، Ars Conjectandi) ، أصبح الآن شديد التطور ووصل إلى ذروته. في مبدأ الثبات الحديث ، الذي لعبت فيه المدرسة الرياضية الروسية دورًا أساسيًا. في هذا المبدأ ، تجد حركة الجسيم البراوني تفسيرها الرياضي الدقيق.

الفكرة هي أنه عندما يتم تلخيص عدد كبير من الكميات المستقلة (تأثيرات الجزيئات على جزيئات حبوب اللقاح) في ظل ظروف معقولة معينة ، فإن الكميات الموزعة بشكل طبيعي هي بالضبط التي يتم الحصول عليها. وهذا يحدث بشكل مستقل ، أي بشكل ثابت من توزيع القيم الأولية. بمعنى آخر ، إذا تأثر المتغير بالعديد من العوامل ، فإن هذه التأثيرات تكون مستقلة وصغيرة نسبيًا وتجمع بعضها مع بعض ، فإن القيمة الناتجة لها توزيع طبيعي.

على سبيل المثال ، يحدد عدد لا حصر له من العوامل وزن الشخص (آلاف الجينات ، والاستعداد ، والأمراض ، وما إلى ذلك). وبالتالي ، يمكن توقع التوزيع الطبيعي للوزن بين جميع السكان.

إذا كنت ممولًا ولعبت في البورصة ، فأنت بالطبع على دراية بالحالات التي تتصرف فيها أسعار الأسهم مثل الجسيمات البراونية ، وتعاني من تأثيرات فوضوية للعديد من العوامل.

رسميًا ، تتم كتابة كثافة التوزيع الطبيعي على النحو التالي:

حيث a و x 2 هي معلمات القانون ، يتم تفسيرها ، على التوالي ، على أنها متوسط ​​القيمة والتباين لمتغير عشوائي معين (في ضوء الدور الخاص للتوزيع الطبيعي ، سنستخدم تدوينًا خاصًا للإشارة إلى دالة الكثافة و دالة التوزيع). بصريا ، الرسم البياني للكثافة العادية هو منحنى شهير على شكل جرس.

يُشار إلى دالة التوزيع المقابلة للمتغير العشوائي العادي (أ ، × 2) بالرمز Ф (س ؛ أ ، × 2) وتعطى بالعلاقة:


يسمى القانون العادي مع المعلمات a = 0 و x 2 = 1 بالمعيار.

تم تطبيق دالة التوزيع العادية المعيارية المعكوسة على z ، 0

استخدم الآلة الحاسبة الاحتمالية STATISTICA لحساب z من x والعكس صحيح.

الخصائص الرئيسية للقانون العادي هي:

المتوسط ​​، الوضع ، الوسيط: E = x mod = x med = a ؛

التشتت: D = х 2 ؛

عدم التماثل:

إفراط:

يمكن أن نرى من الصيغ أن التوزيع الطبيعي موصوف بمعلمتين:

أ - متوسط ​​- متوسط ​​؛

õ - الانحراف المعياري - الانحراف المعياري ، يقرأ: "سيجما".

في بعض الأحيان مع يسمى الانحراف المعياري الانحراف المعياري، ولكن هذا بالفعل مصطلح قديم.

فيما يلي بعض الحقائق المفيدة حول التوزيع الطبيعي.

تحدد القيمة المتوسطة مقياس توزيع الكثافة. كثافة التوزيع الطبيعي متماثلة حول المتوسط. يتطابق متوسط ​​التوزيع الطبيعي مع الوسيط والوضع (انظر الرسوم البيانية).

كثافة التوزيع الطبيعي مع التباين 1 والمتوسط ​​1

كثافة التوزيع الطبيعي بمتوسط ​​0 والتباين 0.01

كثافة التوزيع الطبيعي بمتوسط ​​0 وتباين 4

مع زيادة التباين ، تنتشر كثافة التوزيع الطبيعي أو تنتشر على طول محور OX ؛ مع انخفاض التباين ، على العكس من ذلك ، تتقلص ، مع التركيز حول نقطة واحدة - نقطة القيمة القصوى تتزامن مع المتوسط القيمة. في حالة الحد من التباين الصفري قيمة عشوائيةيتدهور ويأخذ قيمة واحدة تساوي المتوسط.

من المفيد معرفة القواعد 2 و 3 سيجما ، أو 2- و 3 الانحرافات المعيارية ، التي ترتبط بالتوزيع الطبيعي وتستخدم في مجموعة متنوعة من التطبيقات. معنى هذه القواعد بسيط للغاية.

إذا تم ضبط اثنين وثلاثة انحرافات معيارية (2- و 3 سيغما) على اليمين واليسار ، على التوالي ، من نقطة الوسط أو ، وهو نفس الشيء ، من نقطة الكثافة القصوى للتوزيع الطبيعي ، فإن ستكون المساحة الموجودة أسفل الرسم البياني للكثافة العادية المحسوبة خلال هذه الفترة ، مساوية على التوالي لـ 95.45٪ و 99.73٪ من المساحة بأكملها تحت الرسم البياني (تحقق من أداة حاسبة احتمالية STATISTICA!).

بمعنى آخر ، يمكن التعبير عن هذا على النحو التالي: 95.45٪ و 99.73٪ من جميع الملاحظات المستقلة من السكان العاديين ، على سبيل المثال ، حجم جزء أو سعر السهم ، تقع في منطقة 2 و 3 الانحرافات المعيارية من الوسط.

حتى التوزيع

يكون التوزيع المنتظم مفيدًا عند وصف المتغيرات التي تكون فيها كل قيمة محتملة بشكل متساوٍ ، وبعبارة أخرى ، يتم توزيع قيم المتغير بالتساوي في بعض المناطق.

فيما يلي الصيغ الخاصة بالكثافة ودالة التوزيع لمتغير عشوائي منتظم يأخذ قيمًا في الفترة [أ ، ب].

من السهل أن نفهم من هذه الصيغ أن احتمالية أن يأخذ متغير عشوائي منتظم قيمًا من المجموعة [c، d] [a، b] تساوي (d - c) / (b - a).

نضع أ = 0 ، ب = 1. يوجد أدناه رسم بياني لكثافة احتمالية موحدة متمركزة على قطعة.

الخصائص العددية للقانون الموحد:

التوزيع الأسي

هناك أحداث يمكن تسميتها نادرة في اللغة العادية. إذا كان T هو الوقت بين بداية الأحداث النادرة التي تحدث في المتوسط ​​بكثافة X ، فإن القيمة
يحتوي T على توزيع أسي بمعامل (لامدا). غالبًا ما يُستخدم التوزيع الأسي لوصف الفترات الفاصلة بين الأحداث العشوائية المتتالية ، على سبيل المثال ، الفترات الفاصلة بين الزيارات إلى موقع غير مرغوب فيه ، نظرًا لأن هذه الزيارات هي أحداث نادرة.

هذا التوزيع له خاصية مثيرة للغاية ليس لها أي تأثير لاحق ، أو كما يقولون ، ملكية ماركوف ، تكريما لعالم الرياضيات الروسي الشهير أ.أ.ماركوف ، والتي يمكن تفسيرها على النحو التالي. إذا كان التوزيع بين لحظات وقوع بعض الأحداث دلالة ، فسيتم احتساب التوزيع من أي لحظة ر حتى الحدث التالي له أيضًا توزيع أسي (بنفس المعلمة).

بمعنى آخر ، بالنسبة إلى سلسلة من الأحداث النادرة ، يتم دائمًا توزيع وقت انتظار الزائر التالي بشكل كبير ، بغض النظر عن المدة التي انتظرتها بالفعل.

يرتبط التوزيع الأسي بتوزيع بواسون: في الفاصل الزمني للوحدة ، فإن عدد الأحداث ، والفترات الفاصلة بينها المستقلة والموزعة بشكل أسي ، لها توزيع بواسون. إذا كانت الفترات الفاصلة بين زيارات الموقع لها توزيع أسي ، فسيتم توزيع عدد الزيارات ، على سبيل المثال ، في غضون ساعة ، وفقًا لقانون بواسون.

التوزيع الأسي هو حالة خاصة لتوزيع Weibull.

إذا لم يكن الوقت مستمرًا ، ولكنه منفصل ، فإن التناظرية للتوزيع الأسي هو التوزيع الهندسي.

يتم وصف كثافة التوزيع الأسي بالصيغة:

هذا التوزيع له معلمة واحدة فقط تحدد خصائصه.

يبدو الرسم البياني لكثافة التوزيع الأسي كما يلي:

الخصائص العددية الرئيسية للتوزيع الأسي:

توزيع إرلانج

يتركز هذا التوزيع المستمر على (0،1) وله كثافة:

التوقع الرياضي والتباين متساويان على التوالي

تمت تسمية توزيع Erlang على اسم A. Erlang ، الذي طبقه لأول مرة على مشاكل في نظرية الاصطفاف والاتصال الهاتفي.

توزيع Erlang مع المعلمات µ و n هو توزيع مجموع n المتغيرات العشوائية المستقلة والموزعة بشكل متماثل ، ولكل منها توزيع أسي مع المعلمة nµ

في إن التوزيع n = 1 Erlang هو نفس التوزيع الأسي أو الأسي.

توزيع لابلاس

تُستخدم دالة الكثافة لتوزيع لابلاس ، أو كما يُطلق عليها أيضًا ، الأسي المزدوج ، على سبيل المثال ، لوصف توزيع الأخطاء في نماذج الانحدار. بالنظر إلى الرسم البياني لهذا التوزيع ، سترى أنه يتكون من توزيعين أسيين ، متماثل حول محور OY.

إذا كانت معلمة الموضع هي 0 ، فإن دالة كثافة توزيع لابلاس لها الشكل:

الخصائص الرقمية الرئيسية لقانون التوزيع هذا ، بافتراض أن معلمة الموضع هي صفر ، هي كما يلي:

في الحالة العامة ، فإن كثافة توزيع لابلاس لها الشكل:

أ هو وسيلة التوزيع ؛ ب هي معلمة المقياس ؛ البريد هو رقم أويلر (2.71 ...).

توزيع جاما

كثافة التوزيع الأسي لها وضع عند النقطة 0 ، وهذا أحيانًا غير مريح للتطبيقات العملية. في العديد من الأمثلة ، من المعروف مسبقًا أن وضع المتغير العشوائي المدروس لا يساوي 0 ، على سبيل المثال ، الفترات الفاصلة بين وصول المتسوقين إلى متجر التجارة الإلكترونية أو زيارة أحد المواقع لها وضع واضح. يتم استخدام توزيع جاما لمحاكاة مثل هذه الأحداث.

كثافة توزيع جاما كالتالي:

حيث Γ هي دالة Γ لأويلر ، و> 0 هي معلمة "الشكل" و b> 0 هي معلمة المقياس.

في حالة معينة ، لدينا توزيع Erlang وتوزيع أسي.

الخصائص الرئيسية لتوزيع جاما:

يوجد أدناه مخططان لكثافة جاما بمعامل مقياس 1 ومعلمات الشكل 3 و 5.

خاصية مفيدة لتوزيع جاما: مجموع أي عدد من المتغيرات المستقلة الموزعة جاما العشوائية (بنفس معامل المقياس ب)

(أ ل ، ب) + (أ 2 ، ب) + --- + (أ ن ، ب) تخضع أيضًا لتوزيع جاما ، ولكن مع المعلمات a 1 + a 2 + + a n and b.

التوزيع اللوغاريتمي

المتغير العشوائي h يسمى اللوغاريتم العادي ، أو اللوغاريتم الطبيعي ، إذا كان لوغاريتمه الطبيعي (lnh) يطيع قانون التوزيع العادي.

يتم استخدام التوزيع اللوغاريتمي الطبيعي ، على سبيل المثال ، عند نمذجة المتغيرات مثل الدخل أو عمر المتزوجين حديثًا أو التسامح من معيار المواد الضارة في الطعام.

لذا ، إذا كانت الكمية x لها توزيع طبيعي ، ثم الكمية y = e x لها توزيع لوغاريتمي طبيعي.

إذا استبدلت القيمة العادية بالقوة الأسية ، فستفهم بسهولة أن القيمة اللوغاريتمية الطبيعية يتم الحصول عليها نتيجة لمضاعفات متعددة للمتغيرات المستقلة ، تمامًا كما أن المتغير العشوائي العادي هو نتيجة الجمع المتعدد.

كثافة التوزيع اللوغاريتمي الطبيعي هي:

الخصائص الرئيسية للتوزيع اللوغاريتمي الطبيعي هي:


توزيع مربع كاي

مجموع المربعات من القيم العادية المستقلة m بمتوسط ​​0 والتباين 1 له توزيع مربع كاي مع درجات الحرية. يستخدم هذا التوزيع بشكل شائع في تحليل البيانات.

بشكل رسمي ، تكون كثافة توزيع مربع البئر مع m درجة من الحرية على الشكل:

مع السلبية تتحول كثافة x إلى 0.

الخصائص العددية الأساسية لتوزيع كاي تربيع:

يظهر مخطط الكثافة في الشكل أدناه:

توزيع ثنائي

التوزيع ذو الحدين هو التوزيع المنفصل الأكثر أهمية والذي يتركز في نقاط قليلة فقط. التوزيع ذو الحدين يعين الاحتمالات الموجبة لهذه النقاط. وبالتالي ، يختلف التوزيع ذي الحدين عن التوزيعات المستمرة (عادي ، مربع كاي ، إلخ) ، والتي تعين احتمالات صفرية لنقاط محددة بشكل منفصل وتسمى مستمرة.

يمكنك فهم التوزيع ذي الحدين بشكل أفضل من خلال النظر إلى اللعبة التالية.

تخيل أنك ترمي قطعة نقود. دع احتمال الحصول على شعار النبالة يكون p ، واحتمال الحصول على ذيول هو q = 1 - p (نعتبر الحالة الأكثر عمومية عندما تكون العملة غير متكافئة ، على سبيل المثال ، بها مركز ثقل مزاح - يتم عمل ثقب في العملة).

يعتبر سقوط شعار النبالة نجاحًا ، بينما يعتبر سقوط الذيل فاشلاً. ثم عدد معاطف الذراعين (أو ذيول) التي تم إسقاطها له توزيع ذي الحدين.

لاحظ أن النظر في العملات غير المتكافئة أو الزهر غير المنتظم له أهمية عملية. كما لاحظ ج. نيومان في كتابه الأنيق الدورة التمهيدية في نظرية الاحتمالات والإحصاء الرياضي ، فقد خمن الناس منذ فترة طويلة أن تكرار النقاط التي تسقط على قالب يعتمد على خصائص القالب نفسه ويمكن تغييره بشكل مصطنع. وجد علماء الآثار زوجين من العظام في قبر الفرعون: "صادق" - مع احتمالية متساوية لتساقط جميع الجوانب ، ومزيفة - مع تحول متعمد لمركز الثقل ، مما زاد من احتمال سقوط الستات.

معلمات التوزيع ذي الحدين هي احتمالية النجاح p (q = 1 - p) وعدد الاختبارات n.

التوزيع ذو الحدين مفيد لوصف توزيع الأحداث ذات الحدين ، مثل عدد الرجال والنساء في الشركات المختارة عشوائياً. إن تطبيق التوزيع ذي الحدين في مشاكل اللعبة له أهمية خاصة.

الصيغة الدقيقة لاحتمال t للنجاح في تتم كتابة الاختبارات n على النحو التالي:

احتمالية النجاح

q يساوي 1-p ، q> = 0 ، p + q == 1

ن- عدد الاختبارات ، م = 0.1 ... م

الخصائص الرئيسية للتوزيع ذي الحدين:

الرسم البياني لهذا التوزيع لعدد مختلف من المحاولات n واحتمالات النجاح p له الشكل:

يرتبط التوزيع ذو الحدين بالتوزيع الطبيعي وتوزيع بواسون (انظر أدناه) ؛ عند قيم معينة للمعلمات مع عدد كبير من الاختبارات ، يتحول إلى هذه التوزيعات. يتم إثبات ذلك بسهولة باستخدام STATISTICA.

على سبيل المثال ، النظر في الرسم البياني للتوزيع ذي الحدين مع المعلمات p = 0.7 ، n = 100 (انظر الشكل) ، استخدمنا STATISTICA BASIC - يمكنك أن ترى أن الرسم البياني مشابه جدًا لكثافة التوزيع الطبيعي (إنه حقًا!).

مؤامرة التوزيع ذات الحدين مع المعلمات p = 0.05 ، n = 100 تشبه إلى حد بعيد الرسم البياني لتوزيع بواسون.

كما ذكرنا سابقًا ، نشأ التوزيع ذو الحدين من ملاحظات أبسط لعبة قمار - رمي العملة الصحيحة. في كثير من الحالات ، يعمل هذا النموذج كأول تقدير تقريبي جيد للألعاب الأكثر تعقيدًا والعمليات العشوائية التي تنشأ عند اللعب في البورصة. من اللافت للنظر أنه يمكن فهم السمات الأساسية للعديد من العمليات المعقدة من نموذج بسيط ذي الحدين.

على سبيل المثال ، ضع في اعتبارك الموقف التالي.

دعونا نحدد سقوط شعار النبالة على أنه 1 ، وسقوط الذيل - ناقص 1 ، وسنلخص المكاسب والخسائر في لحظات متتالية من الوقت. تُظهر الرسوم البيانية المسارات النموذجية لمثل هذه اللعبة مع 1000 رمية ، و 5000 رمية ، و 10000 رمية. انتبه إلى المدة التي يكون فيها المسار أعلى أو أقل من الصفر ، بمعنى آخر ، الوقت الذي يفوز فيه أحد اللاعبين في لعبة عادلة تمامًا طويل جدًا ، والانتقالات من الفوز إلى الخسارة نادرة نسبيًا ، وهذا هو يصعب ملاءمته. في عقل غير مهيأ ، حيث تبدو عبارة "لعبة عادلة تمامًا" بمثابة تعويذة سحرية. لذلك ، على الرغم من أن اللعبة عادلة في ظل الظروف ، فإن سلوك المسار النموذجي ليس عادلاً على الإطلاق ولا يظهر التوازن!

بالطبع ، هذه الحقيقة معروفة من الناحية التجريبية لجميع اللاعبين ، ترتبط الإستراتيجية بها ، عندما لا يُسمح للاعب بالمغادرة بفوز ، ولكن يُجبر على اللعب أكثر.


ضع في اعتبارك عدد الرميات التي يفوز خلالها أحد اللاعبين (المسار أعلى من 0) ويخسر الآخر (المسار أقل من 0). للوهلة الأولى ، يبدو أن عدد هذه الرميات هو نفسه تقريبًا. ومع ذلك (انظر الكتاب المثير: Feller V. "مقدمة لنظرية الاحتمالية وتطبيقاتها". موسكو: مير ، 1984 ، ص 106) مع 10000 رمية لعملة مثالية ع = ف = 0.5 ، n = 10،000) احتمال أن يقود أحد الطرفين أكثر من 9،930 تجربة ، والآخر - أقل من 70 ، يتجاوز 0.1.

والمثير للدهشة أنه في لعبة تتكون من 10000 رمية للعملة الصحيحة ، فإن احتمال تغير القيادة لا يزيد عن 8 مرات أكبر من 0.14 ، واحتمال حدوث أكثر من 78 تغييرًا في القيادة هو 0.12 تقريبًا.

لذلك ، لدينا موقف متناقض: في مسيرة برنولي المتماثلة ، يمكن أن تكون "الموجات" على الرسم البياني بين عوائد صفرية متتالية (انظر الرسوم البيانية) طويلة بشكل مدهش. هذا مرتبط بظرف آخر ، وهو أن T n / n (نسبة الوقت عندما يكون الرسم البياني أعلى من محور الإحداثي) تكون أقل القيم المحتملة قريبة من 1/2.

اكتشف علماء الرياضيات ما يسمى بقانون أركسين ، والذي بموجبه لكل 0< а <1 вероятность неравенства , где Т n - число шагов, в течение которых первый игрок находится в выигрыше, стремится к

توزيع القوسين

يتركز هذا التوزيع المستمر على الفترة (0 ، 1) وله كثافة:

يرتبط توزيع الجيب العكسي بمسيرة عشوائية. هذا هو توزيع نسبة الوقت التي يفوز خلالها اللاعب الأول عند رمي عملة متماثلة ، أي عملة ذات احتمالات متساوية يقع S على شعار النبالة وذيول. بطريقة أخرى ، يمكن النظر إلى مثل هذه اللعبة على أنها مسيرة عشوائية لجسيم ، والتي ، بدءًا من الصفر ، تقفز مرة واحدة إلى اليمين أو إلى اليسار باحتمالات متساوية. نظرًا لأن قفزات الجسيم - ظهور شعار النبالة أو الذيل - محتملة بنفس القدر ، غالبًا ما يُطلق على مثل هذا المشي اسم متماثل. إذا كانت الاحتمالات مختلفة ، فسنحظى بمسيرة غير متكافئة.

يظهر الرسم البياني لكثافة توزيع القوس في الشكل التالي:

الشيء الأكثر إثارة للاهتمام هو التفسير عالي الجودة للرسم البياني ، والذي يمكنك من خلاله استخلاص استنتاجات مذهلة حول سلسلة الانتصارات والخسارة المتتالية في لعبة عادلة. بالنظر إلى الرسم البياني ، يمكنك أن ترى أن الحد الأدنى للكثافة عند هذه النقطة 1/2. "وماذا في ذلك ؟!" - أنت تسأل. لكن إذا فكرت في هذه الملاحظة ، فلن يكون لدهشتك حدود! اتضح أنه عند تعريف اللعبة على أنها عادلة ، فإنها في الواقع ليست عادلة كما قد تبدو للوهلة الأولى.

تعد مسارات العشوائية المتماثلة ، التي يقضي فيها الجسيم وقتًا متساويًا على كل من النصفين الموجب والسالب ، أي إلى اليمين أو إلى اليسار من الصفر ، هي الأقل احتمالًا. بالانتقال إلى لغة اللاعبين ، يمكننا القول أنه عند رمي عملة متناظرة ، فإن الألعاب التي يتساوى فيها اللاعبون في الفوز والخسارة هي الأقل احتمالًا.

على العكس من ذلك ، فإن الألعاب التي من المرجح أن يفوز فيها أحد اللاعبين ، والآخر ، على التوالي ، هو الأكثر احتمالًا. مفارقة مذهلة!

لحساب احتمال أن يقع جزء الوقت الذي يفوز فيه اللاعب الأول في النطاق من من t1 إلى t2 ، من الضروري من قيمة دالة التوزيع F (t2) اطرح قيمة دالة التوزيع F (t1).

نحصل رسميًا على:

ف (t1

بناءً على هذه الحقيقة ، من الممكن حساب باستخدام STATISTICA أنه عند 10000 خطوة يبقى الجسيم على الجانب الإيجابي لأكثر من 9930 لحظات زمنية مع احتمال 0.1 ، أي تقريبًا ، سيتم ملاحظة مثل هذا الموقف على الأقل في حالة واحدة من أصل عشرة (على الرغم من أنها تبدو سخيفة للوهلة الأولى ؛ انظر الملاحظة الواضحة بشكل ملحوظ لـ Yu. V. Prokhorov "مسيرة برنولي" في موسوعة "الاحتمالات والإحصاءات الرياضية" ، ص 42-43 ، موسكو: الموسوعة الروسية الكبيرة ، 1999) ...

التوزيع السالب ذو الحدين

هذا توزيع منفصل يتم تخصيصه لكامل النقاط ك = 0،1،2 ، ... الاحتمالات:

p k = P (X = k) = C k r + k-1 p r (l-p) k "، حيث 0<р<1,r>0.

تم العثور على التوزيع السالب ذي الحدين في العديد من التطبيقات.

بشكل عام r> 0 يتم تفسير التوزيع ذي الحدين السالب على أنه توزيع وقت الانتظار لـ "النجاح" في مخطط اختبار برنولي مع احتمال "النجاح" p ، على سبيل المثال ، عدد اللفات التي يجب صنعها قبل دحرجة شعار النبالة الثاني ، وفي هذه الحالة يطلق عليه أحيانًا توزيع باسكال وهو تناظرية منفصلة لتوزيع جاما.

في r = 1 يتزامن التوزيع السالب ذي الحدين مع التوزيع الهندسي.

إذا كان Y متغيرًا عشوائيًا مع توزيع بواسون مع معلمة عشوائية ، والتي بدورها لها توزيع غاما بكثافة

ثم Ub سيكون لها توزيع سالب ذي الحدين مع المعلمات ؛

توزيع السم

يُشار أحيانًا إلى توزيع Poisson بتوزيع الأحداث النادرة. من أمثلة المتغيرات الموزعة وفقًا لقانون بواسون: عدد الحوادث ، وعدد العيوب في عملية التصنيع ، وما إلى ذلك. يتم تحديد توزيع بواسون من خلال الصيغة:

الخصائص الرئيسية لمتغير Poisson العشوائي:

يرتبط توزيع بواسون بالتوزيع الأسي وتوزيع برنولي.

إذا كان لعدد الأحداث توزيع بواسون ، فإن الفواصل الزمنية بين الأحداث لها توزيع أسي أو أسي.

مؤامرة توزيع بواسون:

قارن مخطط توزيع بواسون مع المعلمة 5 مع مخطط توزيع برنولي عند p = q = 0.5 ، n = 100.

سترى أن الرسوم البيانية متشابهة جدًا. في الحالة العامة ، هناك النمط التالي (انظر ، على سبيل المثال ، الكتاب الممتاز: Shiryaev AN “Probability.” موسكو: Nauka ، ص 76): إذا كان n في اختبارات برنولي يأخذ قيمًا كبيرة ، واحتمال النجاح / ؟ صغير نسبيًا ، بحيث لا يكون متوسط ​​عدد النجاحات (المنتج و bp) صغيرًا أو كبيرًا ، ثم يمكن استبدال توزيع برنولي مع المعلمات n ، p بتوزيع بواسون بالمعامل = np.

يستخدم توزيع Poisson على نطاق واسع في الممارسة العملية ، على سبيل المثال ، في مخططات مراقبة الجودة كتوزيع للأحداث النادرة.

كمثال آخر ، ضع في اعتبارك المشكلة التالية المتعلقة بخطوط الهاتف والمأخوذة من الممارسة (انظر: Feller V. في الهندسة ، الهندسة الكهربائية ، 54 ، ص 423-427 ؛ دراسة المنشورات الفنية لنظام هاتف بيل ، B-854). يمكن ترجمة هذه المهمة بسهولة إلى لغة حديثة ، على سبيل المثال ، إلى لغة الاتصالات المتنقلة ، وهو ما ندعو القراء المهتمين للقيام به.

تمت صياغة المشكلة على النحو التالي. يجب ألا يكون هناك مقسمان هاتفيان - A و B.

يجب أن توفر محطة الهاتف "أ" اتصالاً من 2000 مشترك مع المحطة "ب". يجب أن تكون جودة الاتصال بحيث تنتظر مكالمة واحدة فقط من أصل 100 حتى يصبح الخط مجانيًا.

السؤال هو: كم عدد خطوط الهاتف التي تحتاج إلى وضعها لضمان الجودة المعطاة للاتصالات؟ من الواضح أنه من الحماقة إنشاء 2000 سطر ، لأن العديد منها سيكون مجانيًا لفترة طويلة. من الاعتبارات البديهية ، من الواضح أن هناك عددًا مثاليًا من السطور N. كيف تحسب هذا الرقم؟

لنبدأ بنموذج واقعي يصف كثافة وصول المشترك إلى الشبكة ، مع ملاحظة أنه يمكن بالطبع التحقق من دقة النموذج باستخدام معايير إحصائية قياسية.

لذلك ، افترض أن كل مشترك يستخدم الخط في المتوسط ​​دقيقتان في الساعة وأن اتصالات المشترك مستقلة (ومع ذلك ، كما يلاحظ فيلر بحق ، فإن هذا الأخير يحدث إذا لم تكن هناك أحداث تؤثر على جميع المشتركين ، على سبيل المثال ، حرب أو اعصار).

لدينا بعد ذلك 2000 تجربة برنولي (رمي العملة) أو اتصالات الشبكة بمعدل نجاح p = 2/60 = 1/30.

من الضروري العثور على N عندما لا يتجاوز احتمال اتصال أكثر من N من المستخدمين بالشبكة في وقت واحد 0.01. يمكن حل هذه الحسابات بسهولة في نظام STATISTICA.

حل المشكلة على STATISTICA.

الخطوة 1.افتح الوحدة إحصائيات أساسية... قم بإنشاء ملف binoml.sta يحتوي على 110 ملاحظة. اسم المتغير الأول ذو الحدين، المتغير الثاني هو بويسون.

الخطوة 2. ذو الحدين، افتح النافذة المتغير 1(انظر الشكل). أدخل الصيغة في النافذة كما هو موضح في الشكل. انقر فوق الزر نعم.


الخطوه 3.عن طريق النقر المزدوج على العنوان بويسون، افتح النافذة المتغير 2(انظر الشكل)

أدخل الصيغة في النافذة كما هو موضح في الشكل. لاحظ أننا نحسب معامل توزيع بواسون باستخدام الصيغة = ن × ص. لذلك = 2000 × 1/30. انقر فوق الزر نعم.


ستحسب STATISTICA الاحتمالات وتكتبها في الملف الذي تم إنشاؤه.

الخطوة 4.قم بالتمرير خلال الجدول المُنشأ إلى الحالات المرقمة 86. ستلاحظ أن احتمال عمل 86 مستخدمًا أو أكثر من بين 2000 مستخدم للشبكة في وقت واحد لمدة ساعة هو 0.01347 إذا تم استخدام التوزيع ذي الحدين.

احتمال عمل 86 شخصًا أو أكثر من بين 2000 مستخدم للشبكة بشكل متزامن لمدة ساعة هو 0.01293 عند استخدام تقريب بواسون للتوزيع ذي الحدين.

نظرًا لأننا نحتاج إلى احتمال لا يزيد عن 0.01 ، فسيكون 87 سطرًا كافيًا لتوفير جودة الاتصال المطلوبة.

يمكن الحصول على نتائج مماثلة باستخدام التقريب العادي للتوزيع ذي الحدين (تحقق من ذلك!).

لاحظ أن V. Feller لم يكن لديه نظام STATISTICA تحت تصرفه واستخدم الجداول للتوزيع ذي الحدين والتوزيع العادي.

باستخدام نفس المنطق ، يمكن للمرء حل المشكلة التالية التي ناقشها دبليو فيلير. مطلوب التحقق مما إذا كانت هناك حاجة إلى عدد أكبر أو أقل من الخطوط لخدمة المستخدمين بشكل موثوق عند تقسيمهم إلى مجموعتين من 1000 شخص لكل منهما.

اتضح أن تقسيم المستخدمين إلى مجموعات يتطلب 10 خطوط إضافية لتحقيق نفس مستوى الجودة.

يمكنك أيضًا مراعاة التغيير في كثافة اتصال الشبكة خلال اليوم.

التوزيع الهندسي

إذا تم إجراء اختبارات برنولي المستقلة وتم حساب عدد الاختبارات حتى حدوث "النجاح" التالي ، فسيكون لهذا الرقم توزيع هندسي. وبالتالي ، إذا قمت بقلب عملة معدنية ، فإن عدد الرميات التي يتعين عليك القيام بها قبل سقوط شعار النبالة التالي يخضع للقانون الهندسي.

يتم تحديد التوزيع الهندسي بواسطة الصيغة:

F (x) = p (1-p) x-1

p هو احتمال النجاح ، x = 1 ، 2،3 ...

يرتبط اسم التوزيع بالتقدم الهندسي.

لذلك ، يحدد التوزيع الهندسي احتمالية أن النجاح جاء في خطوة معينة.

التوزيع الهندسي هو تناظرية منفصلة للتوزيع الأسي. إذا تغير الوقت في الكوانتا ، فإن احتمالية النجاح في كل لحظة زمنية موصوفة بقانون هندسي. إذا كان الوقت مستمرًا ، فسيتم وصف الاحتمال بقانون أسي أو أسي.

التوزيع الهندسي المفرط

هذا توزيع احتمالي منفصل لمتغير عشوائي X يأخذ قيمًا صحيحة m = 0 ، 1،2 ، ... ، n مع الاحتمالات:

حيث N و M و n أعداد صحيحة غير سالبة و M< N, n < N.

عادةً ما يرتبط التوزيع الهندسي الفائق باختيار بدون تكرار ويحدد ، على سبيل المثال ، احتمالية العثور بالضبط على m من الكرات السوداء في عينة عشوائية بحجم n من مجموعة عامة تحتوي على N كرات ، بما في ذلك M أسود و N - M أبيض (انظر ، على سبيل المثال ، موسوعة "الاحتمالات والإحصاءات الرياضية" ، موسكو: الموسوعة الروسية العظمى ، ص 144).

لا يعتمد التوقع الرياضي للتوزيع الهندسي الفائق على N ويتزامن مع التوقع الرياضي µ = np للتوزيع ذي الحدين المقابل.

تشتت التوزيع الهندسي الفائق لا يتجاوز تباين التوزيع ذي الحدين npq. للحظات من أي ترتيب ، يميل التوزيع الهندسي الفائق إلى القيم المقابلة للحظات التوزيع ذي الحدين.

هذا التوزيع شائع للغاية في مهام مراقبة الجودة.

توزيع متعدد الحدود

التوزيع متعدد الحدود أو متعدد الحدود يعمم التوزيع بشكل طبيعي. إذا حدث التوزيع ذي الحدين عندما رُميَت عملة مع نتيجتين (شعرية أو شعار النبالة) ، فإن التوزيع متعدد الحدود يحدث عندما يتم دحرجة قالب النرد ويكون هناك أكثر من نتيجتين محتملتين. رسميًا ، هذا هو التوزيع الاحتمالي المشترك للمتغيرات العشوائية X 1 ، ... ، X k ، مع أخذ القيم الصحيحة غير السالبة n 1 ، ... ، nk ، تلبية الشرط n 1 + ... + nk = ن ، مع الاحتمالات:

يفسر اسم "التوزيع متعدد الحدود" بحقيقة أن الاحتمالات متعددة الحدود تنشأ أثناء توسيع كثير الحدود (р 1 + ... + p k) n

توزيع بيتا

توزيع بيتا له كثافة من الشكل:


يتركز توزيع بيتا القياسي في النطاق من 0 إلى 1. بتطبيق التحويلات الخطية ، يمكن تحويل قيمة بيتا بحيث تأخذ قيمًا في أي نطاق.

الخصائص العددية الرئيسية لكمية بتوزيع بيتا:


توزيع القيم المتطرفة

توزيع القيم القصوى (النوع الأول) له كثافة بالشكل:

يسمى هذا التوزيع أحيانًا أيضًا بالتوزيع المتطرف.

يتم استخدام توزيع القيمة القصوى لمحاكاة الأحداث المتطرفة ، مثل مستويات الفيضانات ، وسرعات إيدي ، والحد الأقصى لمؤشرات سوق الأوراق المالية لسنة معينة ، وما إلى ذلك.

يستخدم هذا التوزيع في نظرية الموثوقية ، على سبيل المثال ، لوصف وقت فشل الدوائر الكهربائية ، وكذلك في الحسابات الاكتوارية.

توزيع رايلي

توزيع رايلي له كثافة من الشكل:

حيث ب هي معلمة المقياس.

يتركز توزيع رايلي في المدى من 0 إلى اللانهاية. بدلاً من 0 ، يسمح لك STATISTICA بإدخال قيمة أخرى لمعلمة العتبة ، والتي سيتم طرحها من البيانات الأصلية قبل ملاءمة توزيع Rayleigh. لذلك ، يجب أن تكون قيمة معلمة العتبة أقل من جميع القيم المرصودة.

إذا كان المتغيران y 1 و y 2 مستقلين عن بعضهما البعض ويتم توزيعهما عادةً بنفس التباين ، فعندئذٍ يكون المتغير سيكون لها توزيع رايلي.

يتم استخدام توزيع رايلي ، على سبيل المثال ، في نظرية الرماية.


توزيع ويبل

تمت تسمية توزيع Weibull على اسم الباحث السويدي Waloddi Weibull ، الذي استخدم هذا التوزيع لوصف أنواع مختلفة من أوقات الفشل في نظرية الموثوقية.

رسميًا ، تتم كتابة كثافة توزيع Weibull بالشكل:

أحيانًا يتم كتابة كثافة توزيع Weibull بالشكل:

B هي معلمة المقياس ؛

С - معلمة الشكل ؛

E هو ثابت أويلر (2.718 ...).

معلمة الموقف. عادةً ما يتركز توزيع Weibull على نصف المحور من 0 إلى اللانهاية. إذا ، بدلاً من الحد 0 ، أدخلنا المعامل a ، والذي غالبًا ما يكون ضروريًا في الممارسة العملية ، عندئذٍ ينشأ ما يسمى بتوزيع Weibull ذي المعلمات الثلاثة.

يتم استخدام توزيع Weibull على نطاق واسع في نظرية الموثوقية والتأمين.

كما هو موضح أعلاه ، غالبًا ما يستخدم التوزيع الأسي كنموذج لتقدير MTBF على افتراض أن احتمال فشل الكائن ثابت. إذا تغير احتمال الفشل بمرور الوقت ، فسيتم تطبيق توزيع Weibull.

في c = 1 أو ، في معلمات أخرى ، عند توزيع Weibull ، كما يسهل رؤيته من الصيغ ، يتحول إلى توزيع أسي ، وفي - إلى توزيع Rayleigh.

تم تطوير طرق خاصة لتقدير معلمات توزيع Weibull (انظر ، على سبيل المثال ، الكتاب: Lawless (1982) النماذج الإحصائية وطرق بيانات العمر ، Belmont ، CA: Lifetime Learning ، الذي يصف طرق التقدير ، وكذلك المشكلات التي تنشأ عند تقدير معلمة الموضع لتوزيع Weibull بثلاث معلمات).

في كثير من الأحيان ، عند إجراء تحليل الموثوقية ، من الضروري مراعاة احتمال الفشل خلال فترة زمنية قصيرة بعد نقطة زمنية. ر قدمت ذلك حتى اللحظة ر لم يحدث فشل.

تسمى هذه الوظيفة وظيفة المخاطرة ، أو وظيفة معدل الفشل ، ويتم تعريفها رسميًا على النحو التالي:

H (t) - دالة معدل الفشل أو دالة المخاطرة في الوقت t ؛

f (t) - كثافة توزيع أوقات الفشل ؛

F (t) هي دالة توزيع أوقات الفشل (جزء لا يتجزأ من الكثافة خلال الفترة الزمنية).

بشكل عام ، تتم كتابة دالة معدل الفشل على النحو التالي:

عندما تكون وظيفة المخاطرة مساوية لثابت ، وهو ما يتوافق مع التشغيل العادي للجهاز (انظر الصيغ).

في ، تنخفض وظيفة المخاطرة ، وهو ما يتوافق مع تشغيل الجهاز.

في ، تنخفض وظيفة المخاطرة ، وهو ما يتوافق مع شيخوخة الجهاز. يتم عرض وظائف المخاطر النموذجية في الرسم البياني.


يتم عرض مخططات كثافة Weibull بمعلمات مختلفة أدناه. من الضروري الانتباه إلى ثلاثة نطاقات من قيم المعلمة أ:

في المنطقة الأولى ، تنخفض وظيفة المخاطرة (فترة الضبط) ، في المنطقة الثانية ، وظيفة المخاطرة تساوي ثابتًا ، في المنطقة الثالثة ، تزداد وظيفة المخاطرة.

يمكنك بسهولة فهم ما قيل في مثال شراء سيارة جديدة: أولاً ، هناك فترة لتكييف السيارة ، ثم فترة طويلة من التشغيل العادي ، ثم تتآكل أجزاء السيارة ويزداد خطر فشلها بشكل حاد .

من المهم أن يتم وصف جميع فترات التشغيل من قبل عائلة التوزيع نفسها. هذه هي فكرة توزيع Weibull.


فيما يلي الخصائص العددية الرئيسية لتوزيع وايبول.


توزيع باريتو

في العديد من المشكلات المتعلقة بالإحصاءات التطبيقية ، غالبًا ما يتم مواجهة ما يسمى بالتوزيعات المقطوعة.

على سبيل المثال ، يتم استخدام هذا التوزيع في التأمين أو الضرائب عندما تكون الدخل ذات فائدة تتجاوز قيمة معينة c 0

الخصائص العددية الرئيسية لتوزيع باريتو:


التوزيع اللوجستي

التوزيع اللوجستي له دالة كثافة:

أ - معلمة الموقف ؛

B هي معلمة المقياس ؛

E هو رقم أويلر (2.71 ...).


هوتلينغ تي 2 - التوزيع

هذا التوزيع المستمر ، المركّز على الفترة (0 ، T) ، له كثافة:

حيث المعلمات تسمى n و k ، n> _k> _1 ، درجات الحرية.

في هوتلينج ك = 1 ، يتم تقليل توزيع P إلى توزيع الطالب ، ولأي منها يمكن اعتبار k> 1 بمثابة تعميم لتوزيع الطلاب على الحالة متعددة الأبعاد.

التوزيع الفندقي قائم على التوزيع الطبيعي.

دع متجهًا عشوائيًا ك الأبعاد Y له توزيع طبيعي بمتجه صفر متوسط ​​ومصفوفة التغاير.

ضع في اعتبارك الكمية

حيث تكون المتجهات العشوائية Z i مستقلة عن بعضها البعض و Y ويتم توزيعها بنفس الطريقة مثل Y.

ثم المتغير العشوائي T 2 = Y T S -1 Y له توزيع T 2-Hotelling مع درجات n من الحرية (Y هو متجه عمود ، T هو عامل التحويل).

حيث المتغير العشوائي يحتوي t n على توزيع Student مع درجات n من الحرية (انظر "الاحتمالية والإحصاء الرياضي" ، الموسوعة ، ص 792).

إذا كان Y له توزيع عادي بمتوسط ​​غير صفري ، فسيتم استدعاء التوزيع المقابل خارج المركز Hotelling T 2 - التوزيع مع درجات n من معامل الحرية واللامركزية v.

يتم استخدام توزيع T 2 الخاص بـ Hotelling في الإحصاء الرياضي في نفس الموقف مثل توزيع t للطالب ، ولكن فقط في الحالة متعددة الأبعاد. إذا كانت نتائج الملاحظات X 1 ، ... ، X n مستقلة ، متجهات عشوائية موزعة بشكل طبيعي مع متجه متوسط ​​µ ومصفوفة تغاير غير متجانسة ، فإن الإحصائيات


لديه توزيع Hotelling T 2 مع ن - 1 درجات الحرية. تشكل هذه الحقيقة أساس معيار هوتلينغ.

في STATISTICA ، يتوفر معيار Hotelling ، على سبيل المثال ، في الوحدة النمطية للإحصائيات والجداول الأساسية (انظر مربع الحوار أدناه).


توزيع ماكسويل

نشأ توزيع ماكسويل في الفيزياء عند وصف توزيع سرعات جزيئات الغاز المثالية.

يتركز هذا التوزيع المستمر على (0 ،) وله كثافة:

دالة التوزيع لها الشكل:

حيث Ф (x) هي دالة التوزيع العادية القياسية. توزيع ماكسويل له معامل انحراف إيجابي ووضع فردي عند نقطة ما (أي أن التوزيع أحادي النسق).

توزيع ماكسويل له لحظات محدودة من أي ترتيب ؛ التوقع الرياضي والتباين متساويان ، على التوالي ، و

يرتبط توزيع ماكسويل بشكل طبيعي بالتوزيع الطبيعي.

إذا كانت X 1 ، X 2 ، X 3 متغيرات عشوائية مستقلة مع توزيع طبيعي مع المعلمات 0 و х 2 ، ثم المتغير العشوائي لديه توزيع ماكسويل. وبالتالي ، يمكن اعتبار توزيع ماكسويل توزيعًا لطول ناقل عشوائي ، تكون إحداثياته ​​في نظام الإحداثيات الديكارتية في الفضاء ثلاثي الأبعاد مستقلة وموزعة بشكل طبيعي بمتوسط ​​0 وتباين × 2.

توزيع كوشي

هذا التوزيع المذهل في بعض الأحيان ليس له قيمة متوسطة ، لأن كثافته تميل ببطء شديد إلى الصفر مع زيادة x في القيمة المطلقة. تسمى هذه التوزيعات التوزيعات ذات الذيل الثقيل. إذا كنت بحاجة إلى التوصل إلى توزيع ليس له معنى ، فاتصل على الفور بتوزيع Cauchy.

يعتبر توزيع كوشي أحادي النسق ومتماثل فيما يتعلق بالوضع ، وهو في نفس الوقت الوسيط وله دالة كثافة للشكل:

أين c> 0 هي معلمة المقياس و أ هي المعلمة المركزية ، التي تحدد في نفس الوقت قيم الوضع والوسيط.

تكامل الكثافة ، أي دالة التوزيع تعطى من خلال النسبة:

توزيع t للطالب

الإحصائي الإنجليزي دبليو جوسيه ، المعروف باسم مستعار "الطالب" والذي بدأ حياته المهنية بدراسة إحصائية لجودة البيرة الإنجليزية ، حصل في عام 1908 على النتيجة التالية. اسمحوا ان x 0، x 1، ..، x m - مستقل، (0، s 2) - المتغيرات العشوائية الموزعة بشكل طبيعي:


هذا التوزيع ، المعروف الآن باسم توزيع t للطالب (والمختصر باسم t (m) - التوزيع ، حيث m هو عدد درجات الحرية) ، يكمن وراء اختبار t الشهير المصمم لمقارنة وسائل مجموعتين من السكان.

دالة الكثافة لا تعتمد f t (x) على التباين х 2 في المتغيرات العشوائية ، وعلاوة على ذلك ، فهي أحادية النسق ومتماثلة فيما يتعلق بالنقطة х = 0.

الخصائص العددية الأساسية لتوزيع الطالب:

يعتبر توزيع t مهمًا عندما يتم النظر في تقديرات المتوسط ​​ويكون تباين العينة غير معروف. في هذه الحالة ، يتم استخدام تباين العينة وتوزيع t.

عند درجات الحرية الكبيرة (أكبر من 30) ، يتزامن توزيع t عمليًا مع التوزيع الطبيعي القياسي.

يتشوه الرسم البياني لدالة الكثافة لتوزيع t مع زيادة عدد درجات الحرية على النحو التالي: تزداد الذروة ، وتنتقل الأطراف بشكل أكثر حدة إلى 0 ، ويبدو أن الرسوم البيانية لوظيفة الكثافة لتوزيع t يتم ضغطها بشكل جانبي.


توزيع F.

انصح م 1 + م 2 مستقلة و (0 ، ث 2) كميات موزعة بشكل طبيعي

و ضع

من الواضح ، يمكن أيضًا تعريف نفس المتغير العشوائي على أنه نسبة اثنين من الكميات المستقلة والمطابقة بشكل مناسب لتوزيع مربع كاي ، وهذا هو

أظهر الإحصائي الإنجليزي الشهير R. Fisher في عام 1924 أن الكثافة الاحتمالية للمتغير العشوائي F (م 1 ، م 2) تعطى من خلال الوظيفة:


حيث Γ (y) هي قيمة دالة جاما لأويلر في. نقطة y ، والقانون نفسه يسمى توزيع F مع عدد درجات الحرية للبسط والمقام يساوي m ، 1 و m7 ، على التوالي

الخصائص العددية الأساسية لتوزيع F:


يحدث التوزيع F في التمييز ، وتحليل الانحدار ، وتحليل التباين ، وأنواع أخرى من تحليل البيانات متعدد المتغيرات.

إسم، عدد المرادفات: توزيع واحد (62) معجم مرادف أيسيس. في. تريشين. 2013 ... قاموس مرادف

توزيع بيتا- 1.45. توزيع بيتا التوزيع الاحتمالي لمتغير عشوائي مستمر X ، والذي يمكن أن يأخذ أي قيم من 0 إلى 1 ، بما في ذلك الحدود ، وكثافة توزيعه عند 0 £ x 1 £ والمعلمات m1> 0 ، m2> 0 ، حيث Г .. .... قاموس - كتاب مرجعي للمصطلحات المعيارية والتقنية

توزيع بيتا- التوزيع الاحتمالي لمتغير عشوائي مستمر يأخذ قيمًا على فترة زمنية ، تُعطى كثافتها بواسطة الصيغة ، حيث ، a ، b> 0 وهي دالة جاما. ملحوظة. العديد من الحالات الخاصة تستخدم على نطاق واسع ... ... قاموس الإحصاء الاجتماعي

انظر الخطة ... قاموس مرادف

في نظرية الاحتمالات والإحصاءات الرياضية ، غالبًا ما يشير توزيع Dirichlet (الذي سمي على اسم Johann Peter Gustave Lejeune Dirichlet) إلى Dir (α) وهي عائلة من التوزيعات الاحتمالية المستمرة متعددة المتغيرات التي تم تحديد معلماتها بواسطة المتجه α ... ... ويكيبيديا

بيتا: Wiktionary لديها إدخال "بيتا" بيتا (حرف) (β) هو الحرف الثاني من الأبجدية اليونانية. اختبار بيتا معامل بيتا دالة بيتا (رياضيات) توزيع بيتا (نظرية الاحتمالات ... ويكيبيديا

كثافة الاحتمال ... ويكيبيديا

التوزيع الاحتمالي هو قانون يصف نطاق قيم المتغير العشوائي واحتمال قبولها. المحتويات 1 التعريف 2 طرق لتعريف التوزيعات ... ويكيبيديا

توزيع. توزيع بيرسون الكثافة الاحتمالية ... ويكيبيديا

كتب

  • مقارنة بين القبول في البرامج التعليمية في إحدى الجامعات بناءً على نتائج الأولمبياد ودرجات USE ، O. V. Poldin. في المقالة ، لمقارنة جودة القبول في الجامعات للبرامج التعليمية المختلفة ، يُقترح استخدام منحنيات الطلب المعدلة التي تم الحصول عليها من نتائج استخدام المسجلين في ...
الرابط الصحيح لهذه المقالة:

Oleinikova S.A. - تقريب قانون التوزيع لمجموع المتغيرات العشوائية موزعة حسب قانون بيتا // علم التحكم الآلي والبرمجة. 2015. - رقم 6. - ص 35 - 54. DOI: 10.7256 / 2306-4196.2015.6.17225 URL: https://nbpublish.com/library_read_article.php؟id=17225

تقريب قانون التوزيع لمجموع المتغيرات العشوائية موزعة حسب قانون بيتا

Oleinikova Svetlana Alexandrovna

دكتوراه في العلوم التقنية

أستاذ مشارك ، جامعة ولاية فورونيج التقنية

394026 ، روسيا ، فورونيج ، احتمال موسكوفسكي ، 14

Oleinikova Svetlana Aleksandrovna

دكتوراه في العلوم التقنية

أستاذ مشارك ، قسم النظم الآلية والحوسبة ، جامعة فورونيج التقنية الحكومية

394026، روسيا، g. فورونيج ، موسكوفسكي بروسبكت 14

تاريخ إرسال المقال للمحرر:

14-12-2015

تاريخ مراجعة المقال:

15-12-2015

حاشية. ملاحظة.

موضوع البحث في هذا العمل هو كثافة توزيع المتغير العشوائي ، وهو مجموع عدد محدود من قيم بيتا ، يتم توزيع كل منها في فترة زمنية مع معلماتها الخاصة. هذا القانون واسع الانتشار في نظرية الاحتمالات والإحصاءات الرياضية ، حيث يمكن استخدامه لوصف عدد كبير بما فيه الكفاية من الظواهر العشوائية إذا كانت قيم المتغير العشوائي المستمر المقابل مركزة في فترة زمنية معينة. نظرًا لأن المجموع المطلوب لقيم بيتا لا يمكن التعبير عنه بأي من القوانين المعروفة ، تنشأ مشكلة تقدير كثافة التوزيع. الهدف من هذا العمل هو إيجاد مثل هذا التقريب لكثافة توزيع مجموع قيم بيتا ، والتي قد تختلف في أصغر خطأ. لتحقيق هذا الهدف ، تم إجراء تجربة حسابية ، ونتيجة لذلك ، لعدد معين من قيم بيتا ، تمت مقارنة القيمة العددية لكثافة التوزيع مع تقريب الكثافة المرغوبة. تم استخدام التوزيعات العادية وبيتا كتقديرات. نتيجة للتحليل التجريبي ، تم الحصول على النتائج التي تشير إلى استصواب تقريب قانون التوزيع المطلوب بقانون بيتا. كأحد مجالات تطبيق النتائج التي تم الحصول عليها ، يتم النظر في مشكلة إدارة المشروع لمدة عشوائية ، حيث يتم لعب الدور الرئيسي من خلال تقدير وقت تنفيذ المشروع ، والذي ، بسبب خصوصيات مجال الموضوع ، يمكن وصفها باستخدام مجموع قيم بيتا.


الكلمات الدالة: متغير عشوائي ، توزيع بيتا ، كثافة التوزيع ، قانون التوزيع الطبيعي ، مجموع المتغيرات العشوائية ، التجربة الحسابية ، الخوارزمية العودية ، التقريب ، الخطأ ، بيرت

10.7256/2306-4196.2015.6.17225


تاريخ النشر:

19-01-2016

الملخص.

موضوع البحث في هذه الورقة هو دالة الكثافة الاحتمالية (PDF) للمتغير العشوائي ، وهي مجموع عدد محدد من قيم بيتا. هذا القانون واسع الانتشار في نظرية الاحتمالات والإحصاءات الرياضية ، لأنه يمكن وصف استخدامه بعدد كبير بما فيه الكفاية من الأحداث العشوائية ، إذا كانت قيمة المتغير العشوائي المستمر المقابل مركزة في نطاق معين. نظرًا لأن المجموع المطلوب لقيم بيتا لا يمكن التعبير عنه بأي من القوانين المعروفة ، فهناك مشكلة تقدير توزيع كثافته. والهدف من ذلك هو إيجاد مثل هذا التقريب لمجموع قيم بيتا لمجموع قيم بيتا التي سيكون بها أقل خطأ لملف PDF. لتحقيق هذا الهدف تم إجراء تجربة حسابية ، حيث تمت مقارنة القيمة العددية لملف PDF مع التقريب للكثافة المرغوبة لعدد معين من قيم بيتا. كتقريب تم استخدام التوزيعات العادية وبيتا. في ختام التحليل التجريبي ، تم الحصول على النتائج التي تشير إلى مدى ملاءمة تقريب القانون المطلوب بمساعدة توزيع بيتا. كأحد مجالات تطبيق النتائج ، يتم النظر في مشكلة إدارة المشروع مع فترات العمل العشوائية. هنا ، تكمن القضية الأساسية في تقييم وقت تنفيذ المشروع ، والذي ، بسبب مجال الموضوع المحدد ، يمكن وصفه بمجموع قيم بيتا.

الكلمات الدالة:

القيمة العشوائية ، توزيع بيتا ، دالة الكثافة ، التوزيع الطبيعي ، مجموع المتغيرات العشوائية ، التجربة الحسابية ، الخوارزمية العودية ، التقريب ، الخطأ ، بيرت

مقدمة

تؤخذ في الاعتبار مشكلة تقدير قانون التوزيع لمجموع قيم بيتا. هذا قانون عالمي يمكن استخدامه لوصف معظم الظواهر العشوائية بقانون توزيع مستمر. على وجه الخصوص ، في العدد الهائل من حالات دراسة الظواهر العشوائية التي يمكن وصفها بواسطة متغيرات عشوائية مستمرة أحادية النمط تقع في نطاق معين من القيم ، يمكن تقريب هذه القيمة بواسطة قانون بيتا. في هذا الصدد ، فإن مشكلة إيجاد قانون التوزيع لمجموع قيم بيتا ليست علمية بطبيعتها فحسب ، بل هي أيضًا ذات فائدة عملية معينة. علاوة على ذلك ، على عكس معظم قوانين التوزيع ، لا يحتوي قانون بيتا على خصائص فريدة تسمح بوصف تحليلي للمبلغ المطلوب. علاوة على ذلك ، فإن خصوصية هذا القانون تجعل من الصعب للغاية استخراج تكامل محدد متعدد ضروري لتحديد كثافة مجموع المتغيرات العشوائية ، والنتيجة هي تعبير مرهق إلى حد ما حتى لـ n = 2 ، وبزيادة في عدد المصطلحات ، يزيد تعقيد التعبير النهائي عدة مرات. في هذا الصدد ، تنشأ مشكلة تقريب كثافة توزيع مجموع قيم بيتا بحد أدنى من الخطأ.

تقدم هذه الورقة طريقة لإيجاد تقريب للقانون المطلوب عن طريق تجربة حسابية تسمح لكل حالة محددة بمقارنة الخطأ الناتج عن طريق تقدير كثافة الفائدة باستخدام أنسب القوانين: العادي وبيتا. نتيجة لذلك ، استنتج أنه من المستحسن تقدير مجموع قيم بيتا باستخدام توزيع بيتا.

1. بيان المشكلة وخصائصها

بشكل عام ، يتم تحديد قانون بيتا من خلال الكثافة المحددة في الفترة الزمنية على النحو التالي:

`f_ (xi_ (i)) (x) = ((0،؛ t<0), ((t^(p_(i)-1)(1-t)^(q_(i)-1))/(B(p_(i),q_(i))(b_(i)-a_(i))^(p_(i)+q_(i)-1)), ; 0<=t<=1;),(0, ; t>1):} (1)`

ومع ذلك ، من الفائدة العملية ، كقاعدة عامة ، تكون قيم بيتا المحددة في فاصل زمني تعسفي ذات أهمية. هذا يرجع في المقام الأول إلى حقيقة أن نطاق المشكلات العملية في هذه الحالة أوسع بكثير ، وثانيًا ، عند إيجاد حل لحالة أكثر عمومية ، لن يكون من الممكن الحصول على نتيجة لحالة معينة ، والتي سوف يتم تحديدها بواسطة متغير عشوائي (1). لا توجد صعوبة. لذلك ، في ما يلي سننظر في المتغيرات العشوائية المحددة على فاصل زمني عشوائي. في هذه الحالة ، يمكن صياغة المشكلة على النحو التالي.

نحن نأخذ في الاعتبار مشكلة تقدير قانون التوزيع لمتغير عشوائي ، وهو مجموع المتغيرات العشوائية `xi_ (i) ،` أنا = 1 ، ... ، ن ، يتم توزيع كل منها وفقًا لقانون بيتا في الفاصل الزمني مع المعلمات p i و q i. سيتم تحديد كثافة توزيع المصطلحات الفردية من خلال الصيغة:

تم حل مشكلة إيجاد قانون مجموع قيم بيتا جزئيًا في وقت سابق. على وجه الخصوص ، تم الحصول على الصيغ لتقدير مجموع قيمتين بيتا ، يتم تحديد كل منهما باستخدام (1). في النهج المقترح للبحث عن مجموع متغيرين عشوائيين مع قانون التوزيع (2).

ومع ذلك ، في الحالة العامة ، لم يتم حل المشكلة الأصلية. هذا يرجع في المقام الأول إلى خصوصية الصيغة (2) ، والتي لا تسمح بالحصول على صيغ مضغوطة ومريحة لإيجاد الكثافة من مجموع المتغيرات العشوائية. في الواقع ، لكميتين"xi_1" و "xi_2" سيتم تحديد الكثافة المطلوبة على النحو التالي:

`f_ (eta) (z) = int_ prop ^ propf_ (xi_1) (x) f_ (xi_2) (z-x) dx (3)`

في حالة إضافة n متغيرات عشوائية ، يتم الحصول على تكامل متعدد. في الوقت نفسه ، توجد صعوبات مرتبطة بتفاصيل توزيع بيتا لهذه المشكلة. على وجه الخصوص ، حتى بالنسبة لـ n = 2 ، يؤدي استخدام الصيغة (3) إلى نتيجة مرهقة إلى حد ما ، والتي يتم تحديدها من حيث الوظائف الهندسية الفائقة. من الصعب للغاية إعادة أخذ تكامل الكثافة التي تم الحصول عليها ، والذي يجب القيام به بالفعل عند n = 3 وما فوق. في الوقت نفسه ، لا يتم استبعاد الأخطاء التي ستظهر حتماً عند تقريب وحساب مثل هذا التعبير المعقد. في هذا الصدد ، يصبح من الضروري البحث عن تقريب للصيغة (3) ، مما يجعل من الممكن تطبيق الصيغ المعروفة بأقل قدر من الخطأ.

2. تجربة حسابية لتقريب كثافة مجموع قيم بيتا

لتحليل تفاصيل كثافة التوزيع المرغوبة ، تم إجراء تجربة تسمح بجمع معلومات إحصائية حول متغير عشوائي ، وهو مجموع عدد محدد مسبقًا من المتغيرات العشوائية مع توزيع بيتا مع معلمات معينة. تم وصف الإعداد التجريبي بمزيد من التفصيل في. بتفاوت معلمات قيم بيتا الفردية ، وكذلك عددها ، نتيجة لعدد كبير من التجارب التي تم إجراؤها ، توصلنا إلى الاستنتاجات التالية.

1. إذا كانت المتغيرات العشوائية الفردية المدرجة في المجموع لها كثافات متماثلة ، فإن الرسم البياني للتوزيع النهائي له شكل قريب من الطبيعي. كما أنها قريبة من القانون العادي لتقييم الخصائص العددية للقيمة النهائية (التوقع الرياضي ، والتباين ، وعدم التناسق ، والتفرطح).

2. إذا كانت المتغيرات العشوائية الفردية غير متماثلة (مع كل من عدم التماثل الموجب والسالب) ، ولكن التباين الكلي هو 0 ، فمن وجهة نظر التمثيل البياني والخصائص العددية ، يكون قانون التوزيع الذي تم الحصول عليه قريبًا أيضًا من الطبيعي.

3. في حالات أخرى ، يكون القانون المطلوب قريبًا بصريًا من قانون بيتا. على وجه الخصوص ، يظهر مجموع خمسة متغيرات عشوائية غير متماثلة في الشكل 1.

الشكل 1 - مجموع خمسة متغيرات عشوائية غير متماثلة

وبالتالي ، بناءً على التجربة التي تم إجراؤها ، من الممكن طرح فرضية حول التقريب المحتمل لكثافة مجموع قيم بيتا بالتوزيع العادي أو التوزيع التجريبي.

لتأكيد هذه الفرضية واختيار القانون الوحيد للتقريب ، سنجري التجربة التالية. بعد إعطاء عدد المتغيرات العشوائية مع توزيع بيتا ، بالإضافة إلى معلماتها ، نجد القيمة العددية للكثافة المطلوبة ومقارنتها بكثافة التوزيع العادي أو التوزيع التجريبي المقابل. سيتطلب ذلك:

1) تطوير خوارزمية تسمح لك بتقدير كثافة مجموع قيم بيتا عدديًا ؛

2) باستخدام المعلمات المحددة وعدد القيم الأولية ، حدد معلمات التوزيع النهائي بافتراض التوزيع العادي أو التوزيع التجريبي ؛

3) تحديد خطأ التقريب بالتوزيع الطبيعي أو توزيع بيتا.

دعنا نفكر في هذه المهام بمزيد من التفصيل. تعتمد الخوارزمية الرقمية لإيجاد كثافة مجموع قيم بيتا على العودية. يمكن تحديد مجموع n المتغيرات العشوائية العشوائية على النحو التالي:

`eta_ (n) = xi_ (1) + ... + xi_ (n) = eta_ (n-1) + xi_ (n)` , (4)

"eta_ (n-1) = xi_ (1) + ... + xi_ (n-1)" . (5)

وبالمثل ، يمكنك وصف كثافة توزيع المتغير العشوائي `eta_ (n-1)`:

`eta_ (n-1) = xi_ (1) + ... + xi_ (n-1) = eta_ (n-2) + xi_ (n-1)` , (6)

استمرار التفكير المماثل واستخدام الصيغة (3) ، نحصل على:

`f_ (eta_ (n)) (x) = int_-prop ^ prop (f_ (xi_ (n-1)) (x-x_ (n-1)) * int_-prop ^ prop (f_ (xi_ (n- 2)) (x_ (n-1) -x_ (n-2)) ... int_-prop ^ propf_ (xi_ (2)) (x_ (2) -x_ (1)) dx_ (1) ... ) dx_ (n-2)) dx_ (n-1). (7) ``

هذه الاعتبارات ، بالإضافة إلى تفاصيل تحديد كثافة الكميات مع توزيع بيتا ، معطاة بمزيد من التفصيل في.

يتم تحديد معلمات قانون التوزيع النهائي بناءً على افتراض استقلالية المتغيرات العشوائية. في هذه الحالة ، سيتم تحديد التوقع الرياضي والتباين لمجموعها من خلال الصيغ:

"Meta_ (n) = Mxi_ (1) + ... + Mxi_ (n) ، (8)`

بالنسبة للقانون العادي ، سيتم تحديد المعلمات a و "sigma" بشكل مباشر بواسطة الصيغتين (8) و (9). لتوزيع بيتا ، يجب عليك أولاً حساب الحدود الدنيا والعليا. يمكن تعريفها على النحو التالي:` `

`أ = sum_ (i = 1) ^ na_ (i)` ؛ (عشرة)

،، ب = sum_ (i = 1) ^ nb_ (i) `. (أحد عشر)

هنا i و b i هما حدود الفواصل الزمنية للمصطلحات الفردية. بعد ذلك ، سنقوم بتكوين نظام معادلات يتضمن صيغًا للتوقع الرياضي والتباين في قيمة بيتا:

`((Mxi = a + (ba) p / (p + q)) ، (Dxi = (ba) ^ (2) (pq) / ((p + q) ^ 2 (p + q + 1))) :) (12) `

هنا "xi" متغير عشوائي يصف المجموع المطلوب. يتم تحديد توقعها الرياضي وتباينها من خلال الصيغتين (8) و (9) ؛ يتم إعطاء المعلمات a و b بواسطة الصيغتين (10) و (11). بعد حل النظام (12) فيما يتعلق بالمعلمات p و q ، سيكون لدينا:

`p = ((b-Mxi) (Mxi-a) ^ 2-Dxi (Mxi-a)) / (Dxi (b-a))` . (13)

`q = ((b-Mxi) ^ 2 (Mxi-a) -Dxi (b-Mxi)) / (Dxi (b-a))` . (14)

`E = int_a ^ b | hatf (x) -f_ (eta) (x) | dx. (15) ``

هنا `` hatf (x) '' هو تقريب لمجموع قيم بيتا ؛ "f_ (eta) (x)" - قانون توزيع مجموع قيم بيتا.

سنقوم بتغيير معلمات قيم بيتا الفردية بالتتابع لتقدير الأخطاء. على وجه الخصوص ، ستكون الأسئلة التالية ذات أهمية:

1) مدى سرعة تقارب مجموع قيم بيتا مع التوزيع الطبيعي ، وهل من الممكن تقدير المجموع بواسطة قانون آخر سيكون له حد أدنى من الخطأ بالنسبة لقانون التوزيع الحقيقي لمجموع قيم بيتا ؛

2) مقدار الخطأ الذي يزداد مع زيادة عدم تناسق قيم بيتا ؛

3) كيف سيتغير الخطأ إذا كانت فترات توزيع قيم بيتا مختلفة.

يمكن تمثيل المخطط العام لخوارزمية التجربة لكل قيم فردية لقيم بيتا على النحو التالي (الشكل 2).

الشكل 2 - المخطط العام لخوارزمية التجربة

PogBeta - الخطأ الناتج عن تقريب القانون النهائي بتوزيع بيتا في الفترة الزمنية ؛

PogNorm - الخطأ الناتج عن تقريب القانون النهائي بالتوزيع الطبيعي في الفترة الزمنية ؛

ItogBeta - القيمة النهائية للخطأ الناشئ عن تقريب التوزيع النهائي بموجب قانون بيتا ؛

ItogNorm - القيمة الإجمالية للخطأ الناشئ عن تقريب التوزيع النهائي بموجب القانون العادي.

3. النتائج التجريبية

دعنا نحلل نتائج التجربة الموصوفة سابقًا.

ديناميات تناقص الأخطاء مع زيادة عدد المصطلحات موضحة في الشكل 3. يُظهر الإحداثي عدد المصطلحات ، بينما يُظهر الإحداثي حجم الخطأ. فيما يلي سلسلة "نورم" توضح التغير في الخطأ بالتوزيع الطبيعي ، سلسلة "بيتا" - توزيع بيتا.

الشكل 3 - تقليل الأخطاء مع تقليل عدد المصطلحات

كما يتضح من هذا الشكل ، بالنسبة لمصطلحين ، يكون خطأ التقريب بواسطة قانون بيتا أقل بأربع مرات تقريبًا من خطأ التقريب وفقًا لقانون التوزيع العادي. من الواضح ، مع زيادة الشروط ، يتناقص خطأ التقريب وفقًا للقانون العادي بشكل أسرع بكثير من قانون بيتا. يمكن الافتراض أيضًا أنه بالنسبة لعدد كبير جدًا من المصطلحات ، فإن التقريب بالقانون العادي سيكون له خطأ أصغر من التقريب بواسطة توزيع بيتا. ومع ذلك ، مع الأخذ في الاعتبار حجم الخطأ في هذه الحالة ، يمكن استنتاج أنه من وجهة نظر عدد المصطلحات ، فإن توزيع بيتا هو الأفضل.

يوضح الشكل 4 ديناميات التغييرات في الأخطاء مع زيادة عدم تناسق المتغيرات العشوائية. بدون فقدان التعميم ، تم إصلاح المعلمة p لجميع قيم بيتا الأولية بقيمة 2 ، ويمثل الإحداثي السيني ديناميكيات التغيير في المعلمة q + 1. يُظهر المحور الإحداثي في ​​الرسوم البيانية خطأ التقريب. نتائج التجربة مع القيم الأخرى للمعلمات متشابهة بشكل عام.

في هذه الحالة ، من الواضح أيضًا أنه من الأفضل تقريب مجموع قيم بيتا بتوزيع بيتا.

الشكل 4 - التغيير في أخطاء التقريب مع زيادة عدم تناسق الكميات

بعد ذلك ، قمنا بتحليل التغيير في الأخطاء مع تغيير نطاق قيم بيتا الأولية. يوضح الشكل 5 نتائج قياس الخطأ لمجموع أربع قيم بيتا ، ثلاثة منها موزعة في الفاصل الزمني ، ويزداد نطاق الرابع بالتتابع (يتم رسمه على الإحداثي).

الشكل 5 - التغيير في الأخطاء عند تغيير فترات توزيع المتغيرات العشوائية

استنادًا إلى الرسوم التوضيحية الموضحة في الأشكال 3-5 ، بالإضافة إلى مراعاة البيانات التي تم الحصول عليها نتيجة للتجربة ، يمكن استنتاج أنه من المستحسن استخدام توزيع بيتا لتقريب مجموع قيم بيتا.

كما يتضح من النتائج التي تم الحصول عليها ، في 98٪ من الحالات ، سيكون الخطأ في تقريب القيمة التي تم فحصها بواسطة قانون بيتا أقل مما هو عليه في تقريب التوزيع الطبيعي. سيعتمد متوسط ​​قيمة خطأ تقريب بيتا بشكل أساسي على عرض الفواصل الزمنية التي يتم فيها توزيع كل مصطلح. في هذه الحالة ، يعتمد هذا التقدير (على عكس القانون العادي) قليلاً جدًا على تناظر المتغيرات العشوائية ، وكذلك على عدد المصطلحات.

4. التطبيقات

واحدة من مجالات تطبيق النتائج التي تم الحصول عليها هي مهمة إدارة المشروع. المشروع عبارة عن مجموعة من الوظائف المتسلسلة المتوازية التي تعتمد على بعضها البعض مع مدة خدمة عشوائية. في هذه الحالة ، ستكون مدة المشروع قيمة عشوائية. من الواضح أن تقييم قانون التوزيع لهذه الكمية مهم ليس فقط في مراحل التخطيط ، ولكن أيضًا في تحليل المواقف المحتملة المرتبطة بالانتهاء المبكر لجميع الأعمال. مع الأخذ في الاعتبار حقيقة أن تأخير المشروع يمكن أن يؤدي إلى مجموعة متنوعة من المواقف غير المواتية ، بما في ذلك الغرامات ، فإن تقدير قانون التوزيع لمتغير عشوائي يصف مدة المشروع يبدو مهمة عملية بالغة الأهمية.

حاليًا ، يتم استخدام طريقة PERT لهذا التقييم. وفقًا لافتراضاته ، فإن مدة المشروع عبارة عن متغير عشوائي يتم توزيعه بشكل طبيعي "eta" مع معلمات:

`أ = sum_ (i = 1) ^ k Meta_ (i)` ، (16)

`سيجما = الجذر التربيعي (sum_ (i = 1) ^ k D eta_ (i))` . (17)

هنا k هو عدد الأعمال على المسار الحرج للمشروع ؛ `eta_ (1)` ، ... ، `eta_ (k)` - مدة هذه الأعمال.

لنفكر في تصحيح طريقة PERT مع مراعاة النتائج التي تم الحصول عليها. في هذه الحالة ، سنفترض أن مدة المشروع موزعة وفقًا لقانون بيتا مع المعلمات (13) و (14).

دعنا نجرب النتائج التي تم الحصول عليها في الممارسة. ضع في اعتبارك مشروعًا محددًا بواسطة مخطط الشبكة الموضح في الشكل 6.

الشكل 6 - مثال على مخطط الشبكة

هنا ، تشير حواف الرسم البياني إلى الوظائف ، وتشير أوزان الحواف إلى عدد الوظائف ؛ الرؤوس في المربعات - الأحداث التي تشير إلى بداية العمل أو نهايته. دع الأعمال تُعطى بالمدد الواردة في الجدول 1.

الجدول 1 - الخصائص الزمنية لأعمال المشروع

وظيفة رقم. دقيقة الأعلى حصيرة. تعليق
1 5 10 9
2 3 6 4
3 6 8 7
4 4 7 6
5 4 7 7
6 2 5 3
7 4 8 6
8 4 6 5
9 6 8 7
10 2 6 4
11 9 13 12
12 2 6 3
13 5 7 6

في الجدول أعلاه ، الحد الأدنى هو أقصر وقت يمكن فيه تنفيذ هذا العمل ؛ ماكس هو أطول وقت ؛ حصيرة. تعليق هو التوقع الرياضي لتوزيع بيتا ، ويوضح الوقت المتوقع لإكمال وظيفة معينة.

سنقوم بمحاكاة عملية تنفيذ المشروع باستخدام نظام محاكاة مطور خصيصًا. تم وصفه بمزيد من التفصيل في. كإخراج ، تحتاج إلى الحصول على:

الرسوم البيانية للمشروع

تقدير احتمالات تنفيذ المشروع في فترة زمنية معينة بناءً على البيانات الإحصائية لنظام المحاكاة ؛

تقدير الاحتمالات باستخدام التوزيعات العادية وبيتا.

أثناء محاكاة تنفيذ المشروع 10000 مرة ، تم الحصول على عينة من مدة الخدمة ، يظهر الرسم البياني لها في الشكل 7.

الشكل 7 - الرسم البياني لمدة المشروع

من الواضح أن مظهر الرسم البياني الموضح في الشكل 7 يختلف عن الرسم البياني للكثافة لقانون التوزيع الطبيعي.

سوف نستخدم الصيغتين (8) و (9) لإيجاد التباين والتوقع الرياضي النهائيين. نحن نحصل:

`م إيتا = 27 ؛ D eta = 1.3889.`

سيتم حساب احتمال الوصول إلى فترة زمنية معينة باستخدام الصيغة المعروفة:

ص (ل (18)

حيث أن `f_ (eta) (x)` هو قانون توزيع المتغير العشوائي `eta` ، لو ص- حدود فترة الاهتمام.

دعنا نحسب معلمات توزيع بيتا النهائي. لهذا نستخدم الصيغتين (13) و (14). نحن نحصل:

ص = 13.83 ؛ ف = 4.61.

يتم تحديد حدود توزيع بيتا بالصيغتين (10) و (11). سوف نحصل على:

نتائج الدراسة معطاة في الجدول 2. بدون فقدان التعميم ، دعونا نختار عدد عمليات تشغيل النموذج التي تساوي 10000. في العمود "الإحصائيات" ، يتم حساب الاحتمالية التي تم الحصول عليها على أساس البيانات الإحصائية. يُظهر العمود "عادي" الاحتمال المحسوب وفقًا لقانون التوزيع العادي ، والذي يتم استخدامه الآن لحل المشكلة. يُظهر عمود بيتا قيمة الاحتمال المحسوبة من توزيع بيتا.

الجدول 2 - نتائج التقديرات الاحتمالية

بناءً على النتائج المعروضة في الجدول 2 ، وكذلك النتائج المماثلة التي تم الحصول عليها أثناء نمذجة عملية تنفيذ المشاريع الأخرى ، يمكن استنتاج أن التقديرات التي تم الحصول عليها لتقريب مجموع المتغيرات العشوائية (2) بواسطة بيتا يتيح التوزيع إمكانية الحصول على حل لهذه المشكلة بدقة أكبر مقارنة بالنظراء الحاليين.

كان الهدف من هذا العمل هو إيجاد مثل هذا التقريب لقانون التوزيع لمجموع قيم بيتا ، والذي قد يختلف في أصغر خطأ مقارنةً بالنظائر الأخرى. تم الحصول على النتائج التالية.

1. من الناحية التجريبية ، تم طرح فرضية حول إمكانية تقريب مجموع قيم بيتا باستخدام توزيع بيتا.

2. تم تطوير أداة برمجية تسمح للشخص بالحصول على القيمة العددية للخطأ الذي ينشأ عندما يتم تقريب الكثافة المطلوبة بواسطة قانون التوزيع العادي وقانون بيتا. يعتمد هذا البرنامج على خوارزمية متكررة تسمح لك بتحديد كثافة مجموع قيم بيتا بكثافة معينة عدديًا ، والتي تم وصفها بمزيد من التفصيل في.

3. تم عمل تجربة حسابية كان الغرض منها تحديد أفضل تقدير تقريبي من خلال التحليل المقارن للأخطاء في الظروف المختلفة. أظهرت النتائج التجريبية جدوى استخدام توزيع بيتا كأفضل تقدير تقريبي لكثافة التوزيع لمجموع قيم بيتا.

4. يتم تقديم مثال تكون فيه النتائج التي تم الحصول عليها ذات أهمية عملية. هذه مهام إدارة المشروع بأوقات تنفيذ عشوائية للوظائف الفردية. من المشاكل المهمة لمثل هذه المهام تقييم المخاطر المرتبطة بالتأخر في استكمال المشروع. تتيح النتائج التي تم الحصول عليها الحصول على تقديرات أكثر دقة للاحتمالات المرغوبة ، ونتيجة لذلك ، تقليل احتمالية الأخطاء في التخطيط.

فهرس

.