คอมพิวเตอร์ Windows อินเทอร์เน็ต

การกระจายเบต้า การประมาณของกฎการกระจายของผลรวมของตัวแปรสุ่มที่กระจายตามกฎหมายเบต้า การสร้างตัวเลขสุ่มและการประมาณค่าพารามิเตอร์

พิจารณาการแจกแจงเบต้า คำนวณความคาดหวังทางคณิตศาสตร์ ความแปรปรวน และโหมดของมัน การใช้ฟังก์ชัน MS EXCEL BETA.DIST () เราจะพล็อตกราฟของฟังก์ชันการกระจายและความหนาแน่นของความน่าจะเป็น มาสร้างอาร์เรย์กันเถอะ ตัวเลขสุ่มและประมาณค่าพารามิเตอร์การกระจาย

การกระจายเบต้าเบต้า- การกระจาย) ขึ้นอยู่กับ 2 พารามิเตอร์: α ( อัลฟ่า)> 0(กำหนดรูปร่างของการกระจาย) และ (เบต้า)> 0(กำหนดมาตราส่วน).

ต่างจากการแจกแจงแบบต่อเนื่องอื่น ๆ ช่วงของการแปรผันของตัวแปรสุ่มที่มี การกระจายเบต้าถูกจำกัดโดยกลุ่ม นอกส่วนนี้ ความหนาแน่นของการกระจายเท่ากับ 0 ขอบเขตของส่วนนี้กำหนดโดยผู้วิจัยขึ้นอยู่กับปัญหา ถ้า A = 0 และ B = 1 เช่นนั้น การกระจายเบต้าเรียกว่ามาตรฐาน

การกระจายเบต้ามีนามว่า เบต้า(อัลฟา; เบต้า).

บันทึก: ถ้าพารามิเตอร์ อัลฟ่าและ เบต้า= 1 แล้ว การกระจายเบต้ากลายเป็นเช่น เบต้า (1; 1; A; B) = U (A; B)

โดยทั่วไป ฟังก์ชันการกระจายไม่สามารถแสดงในฟังก์ชันพื้นฐานได้ ดังนั้นจึงคำนวณด้วยวิธีตัวเลข เช่น การใช้ฟังก์ชัน MS EXCEL BETA.DIST ()

บันทึก: เพื่อความสะดวกในการเขียนสูตรในไฟล์ตัวอย่างสำหรับพารามิเตอร์การกระจาย อัลฟ่าและเบต้าเหมาะสม.

ไฟล์ตัวอย่างยังมีกราฟ ความหนาแน่นของความน่าจะเป็นและ ฟังก์ชันการกระจายด้วยค่าที่ทำเครื่องหมายไว้ กลาง, และ .

การสร้างตัวเลขสุ่มและการประมาณค่าพารามิเตอร์

โดยใช้ ฟังก์ชันการกระจายผกผัน(หรือค่าควอนไทล์ ( พี- ปริมาณ), ดู) คุณสามารถสร้างค่าของตัวแปรสุ่มที่มี การกระจายเบต้า... ในการทำเช่นนี้คุณต้องใช้สูตร:

BETA.OBR (RAND (); อัลฟา; เบต้า; A; B)

คำแนะนำ: เพราะ ตัวเลขสุ่มถูกสร้างขึ้นโดยใช้ฟังก์ชัน RAND () จากนั้นกดปุ่ม F9เป็นไปได้ที่จะได้รับตัวอย่างใหม่ในแต่ละครั้ง และตามค่าประมาณใหม่ของพารามิเตอร์

ฟังก์ชัน RAND () สร้างจาก 0 ถึง 1 ซึ่งตรงกับช่วงของการเปลี่ยนแปลงของความน่าจะเป็น (ดู ตัวอย่างไฟล์แผ่นงาน Generation).

ขณะนี้มีอาร์เรย์ของตัวเลขสุ่มที่สร้างขึ้นด้วยพารามิเตอร์การกระจายที่กำหนด อัลฟ่าและ เบต้า(ให้มี 200) ให้เราประมาณค่าพารามิเตอร์การกระจาย

การประมาณค่าพารามิเตอร์ อัลฟ่าและ เบต้าสามารถทำได้ด้วย วิธีการของช่วงเวลา(สันนิษฐานว่ารู้จักพารามิเตอร์ A และ B):

แนวคิดของการให้เหตุผลเชิงความน่าจะเป็นคืออะไร?

ขั้นตอนแรกและเป็นธรรมชาติที่สุดในการให้เหตุผลเชิงความน่าจะเป็นมีดังนี้: หากคุณมีตัวแปรบางตัวที่ใช้ค่าแบบสุ่ม คุณต้องการทราบว่าตัวแปรนี้มีความน่าจะเป็นเท่าใดกับค่าบางค่า การรวมกันของความน่าจะเป็นเหล่านี้คือสิ่งที่กำหนดการกระจายความน่าจะเป็นอย่างแม่นยำ ตัวอย่างเช่น กับลูกเต๋า คุณสามารถ ลำดับความสำคัญที่จะสมมติว่ามีความน่าจะเป็นเท่ากัน 1/6 จะตกอยู่ที่ขอบใด ๆ และสิ่งนี้เกิดขึ้นภายใต้เงื่อนไขที่ว่ากระดูกมีความสมมาตร หากกระดูกไม่สมมาตร ก็เป็นไปได้ที่จะระบุความน่าจะเป็นสูงสำหรับใบหน้าที่หลุดออกมาบ่อยขึ้น และความน่าจะเป็นที่ต่ำกว่าสำหรับใบหน้าเหล่านั้นที่หลุดออกมาไม่บ่อยนัก ตามข้อมูลการทดลอง หากขอบบางส่วนไม่หลุดออกมาเลย ก็สามารถกำหนดความน่าจะเป็นเป็น 0 ได้ นี่คือกฎความน่าจะเป็นที่ง่ายที่สุดที่สามารถใช้เพื่ออธิบายผลลัพธ์ของการโยนลูกเต๋า แน่นอนว่านี่เป็นตัวอย่างที่ง่ายมาก แต่เกิดปัญหาที่คล้ายกัน เช่น ในการคำนวณทางคณิตศาสตร์ประกันภัย เมื่อความเสี่ยงที่แท้จริงคำนวณจากข้อมูลจริงเมื่อออกกรมธรรม์ประกันภัย

ในบทนี้ เราจะพิจารณากฎความน่าจะเป็นที่พบบ่อยที่สุดในทางปฏิบัติ

การแจกแจงเหล่านี้สามารถลงจุดได้อย่างง่ายดายใน STATISTICA

การกระจายแบบปกติ

การแจกแจงความน่าจะเป็นปกติมักใช้ในสถิติโดยเฉพาะ การแจกแจงแบบปกติให้แบบจำลองที่ดีสำหรับปรากฏการณ์ในโลกแห่งความเป็นจริง ซึ่ง:

1) มีแนวโน้มสูงที่ข้อมูลจะจัดกลุ่มรอบศูนย์

2) ความเบี่ยงเบนเชิงบวกและเชิงลบจากจุดศูนย์กลางมีความน่าจะเป็นเท่ากัน

3) ความถี่ของการเบี่ยงเบนลดลงอย่างรวดเร็วเมื่อความเบี่ยงเบนจากจุดศูนย์กลางมีขนาดใหญ่

กลไกที่เป็นรากฐานของการแจกแจงแบบปกติ ซึ่งอธิบายโดยใช้ทฤษฎีบทขีดจำกัดกลางที่เรียกว่า สามารถอธิบายเป็นรูปเป็นร่างได้ดังนี้ ลองนึกภาพคุณมีละอองเรณูที่คุณสุ่มโยนลงไปในแก้วน้ำ เมื่อมองดูอนุภาคแต่ละชิ้นภายใต้กล้องจุลทรรศน์ คุณจะเห็นปรากฏการณ์ที่น่าอัศจรรย์ - อนุภาคกำลังเคลื่อนที่ แน่นอนว่าสิ่งนี้เกิดขึ้นเพราะโมเลกุลของน้ำเคลื่อนที่และถ่ายโอนการเคลื่อนที่ของพวกมันไปยังอนุภาคของละอองเกสรที่แขวนอยู่

แต่การเคลื่อนไหวเกิดขึ้นได้อย่างไร? นี่เป็นคำถามที่น่าสนใจกว่า และการเคลื่อนไหวนี้แปลกประหลาดมาก!

อนุภาคละอองเรณูแต่ละตัวมีอิทธิพลอย่างอิสระนับไม่ถ้วนในรูปแบบของผลกระทบของโมเลกุลของน้ำ ซึ่งทำให้อนุภาคเคลื่อนที่ไปตามวิถีที่แปลกมาก ภายใต้กล้องจุลทรรศน์ การเคลื่อนไหวนี้คล้ายกับเส้นซ้ำๆ และแตกอย่างโกลาหล ไม่สามารถคาดเดาข้อบกพร่องเหล่านี้ได้ไม่มีความสม่ำเสมอซึ่งสอดคล้องกับการชนกันของโมเลกุลที่วุ่นวายบนอนุภาค อนุภาคแขวนลอยซึ่งได้รับผลกระทบจากโมเลกุลของน้ำในช่วงเวลาสุ่มๆ เปลี่ยนทิศทางการเคลื่อนที่ จากนั้นเคลื่อนที่ไปตามแรงเฉื่อยในบางครั้ง จากนั้นจะตกอยู่ภายใต้ผลกระทบของโมเลกุลถัดไปอีกครั้ง เป็นต้น มีโต๊ะบิลเลียดที่น่าทึ่งในแก้วน้ำ!

เนื่องจากการเคลื่อนที่ของโมเลกุลมีทิศทางและความเร็วแบบสุ่ม ขนาดและทิศทางของรอยหยักในวิถีจึงเป็นแบบสุ่มอย่างสมบูรณ์และคาดเดาไม่ได้ ปรากฏการณ์ที่น่าทึ่งนี้เรียกว่า การเคลื่อนที่แบบบราวเนียน ซึ่งค้นพบในศตวรรษที่ 19 ทำให้เรานึกถึงหลายสิ่งหลายอย่าง

ถ้าเราแนะนำระบบที่เหมาะสมและทำเครื่องหมายพิกัดของอนุภาคในช่วงเวลาหนึ่ง เราก็จะได้กฎปกติ ที่แม่นยำยิ่งขึ้น การกระจัดของอนุภาคเรณูที่เกิดจากผลกระทบของโมเลกุลจะเป็นไปตามกฎปกติ

เป็นครั้งแรกที่ A. Einstein อธิบายกฎการเคลื่อนที่ของอนุภาคดังกล่าวที่เรียกว่า Brownian ที่ระดับความรุนแรงทางกายภาพ จากนั้น Lenjevan ได้พัฒนาวิธีการที่ง่ายและใช้งานง่ายขึ้น

นักคณิตศาสตร์ในศตวรรษที่ 20 ที่อุทิศให้กับทฤษฎีนี้ เพจที่ดีที่สุดและขั้นตอนแรกเกิดขึ้นเมื่อ 300 ปีก่อน เมื่อมีการค้นพบเวอร์ชันที่ง่ายที่สุดของทฤษฎีบทขีดจำกัดกลาง

ในทฤษฎีความน่าจะเป็น ทฤษฎีบทจำกัดศูนย์กลาง ซึ่งเดิมรู้จักในสูตรของ Moivre และ Laplace ในช่วงต้นศตวรรษที่ 17 โดยเป็นการพัฒนากฎที่มีชื่อเสียงเรื่องตัวเลขจำนวนมากโดย J. Bernoulli (1654-1705) (ดู J. Bernoulli (1713) ) Ars Conjectandi) ตอนนี้ได้รับการพัฒนาอย่างมากและถึงขีดสูงสุดแล้ว ในหลักการสมัยใหม่ของความไม่แปรเปลี่ยนซึ่งโรงเรียนคณิตศาสตร์ของรัสเซียมีบทบาทสำคัญ ด้วยหลักการนี้เองที่การเคลื่อนที่ของอนุภาคบราวเนียนพบคำอธิบายทางคณิตศาสตร์ที่เข้มงวด

แนวคิดก็คือโดยสรุปปริมาณอิสระจำนวนมาก (ผลกระทบของโมเลกุลต่ออนุภาคละอองเกสร) ภายใต้สภาวะที่สมเหตุสมผลบางประการ จะเป็นปริมาณที่กระจายตามปกติที่ได้รับอย่างแม่นยำ และสิ่งนี้เกิดขึ้นอย่างอิสระ นั่นคือ สม่ำเสมอ จากการกระจายค่าเริ่มต้น กล่าวอีกนัยหนึ่ง หากตัวแปรได้รับอิทธิพลจากหลายปัจจัย อิทธิพลเหล่านี้เป็นอิสระ ค่อนข้างน้อย และรวมกันแล้วค่าผลลัพธ์จะมีการแจกแจงแบบปกติ

ตัวอย่างเช่น ปัจจัยจำนวนนับไม่ถ้วนที่เกือบจะกำหนดน้ำหนักของบุคคล (พันยีน ความโน้มเอียง โรค ฯลฯ) ดังนั้นจึงสามารถคาดหวังการกระจายน้ำหนักตามปกติในประชากรของทุกคนได้

หากคุณเป็นนักการเงินและเล่นหุ้น แน่นอนว่าคุณตระหนักดีถึงกรณีที่ราคาหุ้นมีพฤติกรรมเหมือนอนุภาคของ Brownian ซึ่งประสบกับผลกระทบที่วุ่นวายจากหลายปัจจัย

อย่างเป็นทางการ ความหนาแน่นของการแจกแจงแบบปกติเขียนดังนี้:

โดยที่ a และ x 2 เป็นพารามิเตอร์ของกฎหมาย ตีความตามลำดับเป็นค่าเฉลี่ยและความแปรปรวนของตัวแปรสุ่มที่กำหนด (เนื่องจากบทบาทพิเศษของการแจกแจงแบบปกติ เราจะใช้สัญกรณ์พิเศษเพื่อแสดงฟังก์ชันความหนาแน่นและการแจกแจง การทำงาน). สายตา กราฟความหนาแน่นปกติคือเส้นโค้งรูประฆังที่มีชื่อเสียง

ฟังก์ชันการกระจายที่สอดคล้องกันของตัวแปรสุ่มปกติ (a, x 2) แสดงโดย Ф (x; a, x 2) และกำหนดโดยความสัมพันธ์:


กฎปกติที่มีพารามิเตอร์ a = 0 และ x 2 = 1 เรียกว่ามาตรฐาน

ฟังก์ชันการกระจายปกติแบบมาตรฐานผกผันที่ใช้กับ z, 0

ใช้เครื่องคำนวณความน่าจะเป็นของ STATISTICA เพื่อคำนวณ z จาก x และในทางกลับกัน

ลักษณะพื้นฐานของกฎปกติ:

ค่าเฉลี่ย โหมด ค่ามัธยฐาน: E = x mod = x med = a;

การกระจาย: D = х 2;

ไม่สมมาตร:

ส่วนเกิน:

สามารถเห็นได้จากสูตรที่อธิบายการแจกแจงแบบปกติด้วยสองพารามิเตอร์:

เอ - ค่าเฉลี่ย - ค่าเฉลี่ย;

õ - ส่วนเบี่ยงเบนมาตรฐาน - ส่วนเบี่ยงเบนมาตรฐาน อ่านว่า "ซิกมา"

บางครั้งกับ ค่าเบี่ยงเบนมาตรฐานเรียกว่าค่าเบี่ยงเบนมาตรฐานแต่นี่เป็นคำศัพท์ที่ล้าสมัยไปแล้ว

ต่อไปนี้คือข้อเท็จจริงที่เป็นประโยชน์บางประการเกี่ยวกับการแจกแจงแบบปกติ

ค่าเฉลี่ยกำหนดการวัดการกระจายความหนาแน่น ความหนาแน่นของการแจกแจงแบบปกตินั้นสมมาตรเกี่ยวกับค่าเฉลี่ย ค่าเฉลี่ยของการแจกแจงแบบปกติตรงกับค่ามัธยฐานและโหมด (ดูกราฟ)

ความหนาแน่นของการแจกแจงแบบปกติที่มีความแปรปรวน 1 และค่าเฉลี่ย 1

ความหนาแน่นของการแจกแจงแบบปกติที่มีค่าเฉลี่ย 0 และความแปรปรวน 0.01

ความหนาแน่นของการแจกแจงแบบปกติที่มีค่าเฉลี่ย 0 และค่าความแปรปรวน4

ด้วยความแปรปรวนที่เพิ่มขึ้นความหนาแน่นของการแจกแจงแบบปกติจะกระจายหรือกระจายไปตามแกน OX ด้วยความแปรปรวนที่ลดลงตรงกันข้ามจะหดตัวซึ่งมีสมาธิอยู่ที่จุดหนึ่ง - จุดที่มีค่าสูงสุดประจวบกับค่าเฉลี่ย ค่า. ในกรณีจำกัดความแปรปรวนเป็นศูนย์ ค่าสุ่มเสื่อมสภาพและรับค่าเดียวเท่ากับค่าเฉลี่ย

เป็นประโยชน์ที่จะทราบค่าเบี่ยงเบนมาตรฐาน 2- และ 3-sigma หรือ 2- และ 3- ส่วนเบี่ยงเบนมาตรฐาน กฎที่เกี่ยวข้องกับการแจกแจงแบบปกติและใช้ในแอปพลิเคชันต่างๆ ความหมายของกฎเหล่านี้ง่ายมาก

หากค่าเบี่ยงเบนมาตรฐานสองและสาม (2- และ 3-ซิกมา) ถูกตั้งค่าไปทางขวาและทางซ้ายตามลำดับ จากจุดเฉลี่ยหรือจากจุดความหนาแน่นสูงสุดของการกระจายตัวแบบปกติที่เท่ากัน พื้นที่ใต้ พล็อตความหนาแน่นปกติที่คำนวณในช่วงเวลานี้จะเท่ากับ 95.45% และ 99.73% ของพื้นที่ทั้งหมดภายใต้กราฟตามลำดับ (ตรวจสอบที่เครื่องคำนวณความน่าจะเป็นของ STATICA!)

กล่าวอีกนัยหนึ่ง มันสามารถแสดงได้ดังนี้: 95.45% และ 99.73% ของการสังเกตอิสระทั้งหมดจากประชากรปกติ เช่น ขนาดของชิ้นส่วนหรือราคาหุ้น อยู่ในโซนของส่วนเบี่ยงเบนมาตรฐาน 2 และ 3 จากค่าเฉลี่ย

กระจายสม่ำเสมอ

การแจกแจงแบบสม่ำเสมอมีประโยชน์ในการอธิบายตัวแปรที่แต่ละค่ามีความน่าจะเป็นเท่ากัน กล่าวคือ ค่าของตัวแปรจะกระจายอย่างสม่ำเสมอในบางพื้นที่

ด้านล่างนี้คือสูตรความหนาแน่นและฟังก์ชันการแจกแจงของตัวแปรสุ่มแบบสม่ำเสมอโดยใช้ค่าในช่วง [a, b]

จากสูตรเหล่านี้ทำให้เข้าใจได้ง่ายว่าความน่าจะเป็นที่ตัวแปรสุ่มแบบสม่ำเสมอจะรับค่าจากเซต [c, d] [a, b] เท่ากับ (d - c) / (b - a)

เราใส่ ก = 0, ข = 1 ด้านล่างนี้คือกราฟของความหนาแน่นของความน่าจะเป็นแบบสม่ำเสมอที่มีศูนย์กลางอยู่ที่กลุ่ม

ลักษณะเชิงตัวเลขของกฎหมายสม่ำเสมอ:

การกระจายแบบเอกซ์โพเนนเชียล

มีเหตุการณ์ที่เรียกว่าหายากในภาษาธรรมดา หาก T คือเวลาระหว่างการเริ่มต้นของเหตุการณ์หายากที่เกิดขึ้นโดยเฉลี่ยด้วยความเข้ม X แล้วค่า
T มีการแจกแจงแบบเอ็กซ์โพเนนเชียลพร้อมพารามิเตอร์ (แลมบ์ดา) การแจกแจงแบบเอ็กซ์โพเนนเชียลมักใช้เพื่ออธิบายช่วงเวลาระหว่างเหตุการณ์สุ่มที่ต่อเนื่องกัน เช่น ช่วงเวลาระหว่างการเข้าชมไซต์ที่ไม่เป็นที่นิยม เนื่องจากการเข้าชมเหล่านี้เป็นเหตุการณ์ที่เกิดขึ้นได้ยาก

การแจกแจงนี้มีคุณสมบัติที่น่าสนใจมากในเรื่องการไม่มีผลที่ตามมา หรืออย่างที่พวกเขาพูดกันว่า คุณสมบัติของมาร์คอฟ เพื่อเป็นเกียรติแก่นักคณิตศาสตร์ชาวรัสเซียชื่อดัง เอ.เอ. มาร์คอฟ ซึ่งสามารถอธิบายได้ดังนี้ หากการแจกแจงระหว่างช่วงเวลาที่เกิดเหตุการณ์บางอย่างเป็นตัวบ่งชี้ การแจกแจงจะนับจากช่วงเวลาใดๆ t จนกว่าเหตุการณ์ถัดไปจะมีการแจกแจงแบบเอ็กซ์โพเนนเชียลด้วย (ด้วยพารามิเตอร์เดียวกัน)

กล่าวอีกนัยหนึ่ง สำหรับกระแสของเหตุการณ์ที่หายาก เวลารอคอยสำหรับผู้มาเยี่ยมคนต่อไปจะถูกกระจายแบบทวีคูณเสมอ ไม่ว่าคุณจะรอเขามานานแค่ไหนแล้วก็ตาม

การแจกแจงแบบเอ็กซ์โพเนนเชียลสัมพันธ์กับการแจกแจงแบบปัวซอง: ในช่วงเวลาหน่วย จำนวนของเหตุการณ์ ช่วงเวลาระหว่างที่เป็นอิสระและกระจายแบบทวีคูณ มีการแจกแจงแบบปัวซอง หากช่วงเวลาระหว่างการเข้าชมไซต์มีการแจกแจงแบบทวีคูณ จำนวนการเข้าชม เช่น ภายในหนึ่งชั่วโมง จะถูกกระจายตามกฎของปัวซอง

การแจกแจงแบบเอ็กซ์โพเนนเชียลเป็นกรณีพิเศษของการแจกแจงแบบไวบูล

หากเวลาไม่ต่อเนื่องแต่ไม่ต่อเนื่อง ดังนั้นอะนาล็อกของการแจกแจงแบบเอ็กซ์โปเนนเชียลก็คือการแจกแจงทางเรขาคณิต

ความหนาแน่นของการแจกแจงแบบเอ็กซ์โพเนนเชียลอธิบายโดยสูตร:

การแจกแจงนี้มีพารามิเตอร์เพียงตัวเดียวซึ่งกำหนดคุณสมบัติของมัน

กราฟความหนาแน่นการแจกแจงแบบเอ็กซ์โพเนนเชียลมีรูปแบบดังนี้

ลักษณะเชิงตัวเลขพื้นฐานของการแจกแจงแบบเอ็กซ์โปเนนเชียล:

การกระจาย Erlang

การกระจายแบบต่อเนื่องนี้มีศูนย์กลางที่ (0,1) และมีความหนาแน่น:

ค่าความคาดหมายและความแปรปรวนทางคณิตศาสตร์มีค่าเท่ากัน

การแจกแจง Erlang ได้รับการตั้งชื่อตาม A. Erlang ซึ่งเป็นคนแรกที่นำไปใช้กับปัญหาในทฤษฎีการเข้าคิวและการโทรศัพท์

การแจกแจง Erlang ด้วยพารามิเตอร์ µ และ n คือการกระจายของผลรวมของ n ตัวแปรสุ่มที่กระจายอย่างอิสระและเหมือนกัน ซึ่งแต่ละตัวมีการแจกแจงแบบเอ็กซ์โพเนนเชียลด้วยพารามิเตอร์ nµ

ที่ การแจกแจง n = 1 Erlang เหมือนกับการแจกแจงแบบเอ็กซ์โปเนนเชียลหรือเอ็กซ์โปเนนเชียล

การกระจายลาปลาซ

ฟังก์ชันความหนาแน่นของการแจกแจง Laplace หรือที่เรียกอีกอย่างว่าเลขชี้กำลังสองเท่าใช้เพื่ออธิบายการแจกแจงข้อผิดพลาดในแบบจำลองการถดถอย เมื่อดูกราฟของการแจกแจงนี้ คุณจะเห็นว่ามันประกอบด้วยการแจกแจงแบบเอ็กซ์โพเนนเชียลสองชุด ซึ่งสมมาตรเกี่ยวกับแกน OY

หากพารามิเตอร์ตำแหน่งเป็น 0 แสดงว่าฟังก์ชันความหนาแน่นของการกระจาย Laplace มีรูปแบบดังนี้

ลักษณะเชิงตัวเลขหลักของกฎการกระจายนี้ โดยสมมติว่าพารามิเตอร์ตำแหน่งเป็นศูนย์ มีดังนี้:

ในกรณีทั่วไป ความหนาแน่นของการกระจาย Laplace มีรูปแบบดังนี้

a คือค่าเฉลี่ยของการแจกแจง; b คือพารามิเตอร์มาตราส่วน e คือเลขของออยเลอร์ (2.71 ...)

การกระจายแกมมา

ความหนาแน่นของการแจกแจงแบบเอ็กซ์โพเนนเชียลมีโหมดอยู่ที่จุด 0 และบางครั้งก็ไม่สะดวกสำหรับการใช้งานจริง ในหลายตัวอย่าง เป็นที่ทราบล่วงหน้าว่าโหมดของตัวแปรสุ่มที่พิจารณาแล้วไม่เท่ากับ 0 ตัวอย่างเช่น ช่วงเวลาระหว่างผู้ซื้อที่มาถึงร้านอีคอมเมิร์ซหรือการเยี่ยมชมไซต์มีโหมดที่เด่นชัด การแจกแจงแกมมาใช้เพื่อจำลองเหตุการณ์ดังกล่าว

ความหนาแน่นของการแจกแจงแกมมามีดังนี้:

โดยที่ Γ คือฟังก์ชัน Γ ของออยเลอร์ a> 0 คือพารามิเตอร์ "รูปร่าง" และ b> 0 คือพารามิเตอร์มาตราส่วน

ในบางกรณี เรามีการแจกแจง Erlang และการแจกแจงแบบเอ็กซ์โปเนนเชียล

ลักษณะสำคัญของการกระจายแกมมา:

ด้านล่างนี้คือแผนภาพความหนาแน่นแกมมาสองแปลงที่มีพารามิเตอร์มาตราส่วน 1 และพารามิเตอร์รูปร่าง 3 และ 5

คุณสมบัติที่มีประโยชน์ของการแจกแจงแกมมา: ผลรวมของตัวแปรสุ่มแบบกระจายแกมมาอิสระจำนวนเท่าใดก็ได้ (ด้วยพารามิเตอร์มาตราส่วน b เดียวกัน)

(a l, b) + (a 2, b) + --- + (a n, b) ก็เชื่อฟังการแจกแจงแกมมาเช่นกัน แต่ด้วยพารามิเตอร์ a 1 + a 2 + + a n และ b

การกระจาย Lognormal

ตัวแปรสุ่ม h เรียกว่า log-normal หรือ log-normal ถ้าลอการิทึมธรรมชาติ (lnh) เป็นไปตามกฎการแจกแจงแบบปกติ

ใช้การแจกแจงแบบล็อกนอร์มัล ตัวอย่างเช่น เมื่อสร้างแบบจำลองตัวแปรต่างๆ เช่น รายได้ อายุของคู่บ่าวสาว หรือค่าความทนทานจากมาตรฐานสำหรับสารอันตรายในอาหาร

ดังนั้น ถ้าปริมาณ x มีการแจกแจงแบบปกติ แล้วจึงเท่ากับปริมาณ y = e x มีการแจกแจงแบบ Lognormal

หากคุณแทนที่ค่าปกติลงในกำลังเลขชี้กำลัง คุณจะเข้าใจได้ง่ายว่าค่า lognormal ได้มาจากการคูณค่าอิสระหลายค่า เช่นเดียวกับตัวแปรสุ่มปกติเป็นผลมาจากการรวมหลายค่า

ความหนาแน่นของการแจกแจงแบบล็อกนอร์มัลคือ:

ลักษณะสำคัญของการแจกแจงแบบล็อกนอร์มัลคือ:


การกระจายไคสแควร์

ผลรวมของกำลังสองของ m ค่าปกติอิสระที่มีค่าเฉลี่ย 0 และความแปรปรวน 1 มีการแจกแจงแบบไคสแควร์โดยมีองศาอิสระ m การกระจายนี้มักใช้ในการวิเคราะห์ข้อมูล

ตามแบบแผน ความหนาแน่นของการกระจายกำลังสองกำลังสองที่มีองศาอิสระ m มีรูปแบบดังนี้

ด้วยค่าลบ ความหนาแน่น x เปลี่ยนเป็น 0

ลักษณะเชิงตัวเลขพื้นฐานของการแจกแจงแบบไคสแควร์:

พล็อตความหนาแน่นแสดงในรูปด้านล่าง:

การกระจายทวินาม

การแจกแจงทวินามเป็นการแจกแจงแบบแยกส่วนที่สำคัญที่สุดซึ่งมีความเข้มข้นเพียงไม่กี่จุด การแจกแจงทวินามกำหนดความน่าจะเป็นเชิงบวกให้กับจุดเหล่านี้ ดังนั้น การแจกแจงทวินามจึงแตกต่างจากการแจกแจงแบบต่อเนื่อง (ปกติ ไคสแควร์ ฯลฯ) ซึ่งกำหนดความน่าจะเป็นศูนย์ให้กับจุดที่เลือกแยกกันและเรียกว่าต่อเนื่อง

คุณสามารถเข้าใจการแจกแจงทวินามได้ดีขึ้นโดยดูที่เกมต่อไปนี้

ลองนึกภาพคุณกำลังโยนเหรียญ ให้โอกาสหลุดจากแขนเสื้อเป็น p และความน่าจะเป็นที่จะได้ก้อยคือ q = 1 - p (เราพิจารณากรณีทั่วไปที่สุดเมื่อเหรียญไม่สมมาตร ตัวอย่างเช่น มีจุดศูนย์ถ่วงที่ขยับ - มีรูในเหรียญ)

การล้มแขนเสื้อถือเป็นความสำเร็จ และการตกก้อยถือเป็นความล้มเหลว จากนั้นจำนวนแขนเสื้อ (หรือหาง) ที่หล่นลงมาจะมีการกระจายแบบทวินาม

โปรดทราบว่าการพิจารณาเหรียญอสมมาตรหรือลูกเต๋าที่ไม่ปกตินั้นเป็นประโยชน์ในทางปฏิบัติ ดังที่ J. Neumann ระบุไว้ในหนังสือ "An Introductory Course in Probability Theory and Mathematical Statistics" ที่สง่างามของเขา ผู้คนคาดเดากันมานานแล้วว่าความถี่ของแต้มที่ตกบนลูกเต๋าขึ้นอยู่กับคุณสมบัติของลูกเต๋านี้เอง และสามารถเปลี่ยนแปลงได้ นักโบราณคดีพบกระดูกสองคู่ในหลุมฝังศพของฟาโรห์: "ซื่อสัตย์" - มีความน่าจะเป็นเท่ากันของทุกด้านที่ตกลงมาและของปลอม - ด้วยการเปลี่ยนจุดศูนย์ถ่วงโดยเจตนาซึ่งเพิ่มความน่าจะเป็นที่จะหกออกมา

พารามิเตอร์ของการแจกแจงทวินามคือความน่าจะเป็นของความสำเร็จ p (q = 1 - p) และจำนวนการทดสอบ n

การแจกแจงแบบทวินามมีประโยชน์ในการอธิบายการแจกแจงเหตุการณ์ทวินาม เช่น จำนวนชายและหญิงในบริษัทที่สุ่มเลือก การใช้การแจกแจงทวินามในปัญหาของเกมมีความสำคัญเป็นพิเศษ

สูตรที่แน่นอนสำหรับความน่าจะเป็น t ของความสำเร็จใน n การทดสอบเขียนดังนี้:

p-ความน่าจะเป็นของความสำเร็จ

q เท่ากับ 1-p, q> = 0, p + q == 1

n- จำนวนการทดสอบ m = 0.1 ... m

ลักษณะสำคัญของการแจกแจงทวินาม:

กราฟของการแจกแจงนี้สำหรับจำนวนการทดลองที่แตกต่างกัน n และความน่าจะเป็นของความสำเร็จ p มีรูปแบบดังนี้

การแจกแจงทวินามเกี่ยวข้องกับการแจกแจงแบบปกติและการแจกแจงแบบปัวซอง (ดูด้านล่าง) ที่ค่าพารามิเตอร์บางค่าที่มีการทดสอบจำนวนมากจะกลายเป็นการแจกแจงเหล่านี้ สิ่งนี้แสดงให้เห็นอย่างง่ายดายด้วย STATISTICA

ตัวอย่างเช่น พิจารณากราฟของการแจกแจงทวินามด้วยพารามิเตอร์ p = 0.7, n = 100 (ดูรูป) เราใช้ STATISTICA BASIC - คุณจะสังเกตได้ว่ากราฟนั้นใกล้เคียงกับความหนาแน่นของการแจกแจงแบบปกติมาก (จริงๆ แล้ว!)

พล็อตการแจกแจงทวินามพร้อมพารามิเตอร์ p = 0.05, n = 100 คล้ายกับกราฟของการแจกแจงแบบปัวซองมาก

ดังที่ได้กล่าวไปแล้ว การแจกแจงทวินามเกิดขึ้นจากการสังเกตเกมการพนันที่ง่ายที่สุด - การโยนเหรียญที่ถูกต้อง ในหลาย ๆ สถานการณ์ โมเดลนี้ทำหน้าที่เป็นตัวประมาณแรกที่ดีสำหรับเกมที่ซับซ้อนมากขึ้นและกระบวนการสุ่มที่เกิดขึ้นเมื่อเล่นในตลาดหลักทรัพย์ เป็นที่น่าสังเกตว่าคุณลักษณะที่สำคัญของกระบวนการที่ซับซ้อนหลายอย่างสามารถเข้าใจได้จากแบบจำลองทวินามอย่างง่าย

ตัวอย่างเช่น พิจารณาสถานการณ์ต่อไปนี้

มาทำเครื่องหมายการล่มสลายของเสื้อคลุมแขนเป็น 1 และการตกของก้อย - ลบ 1 แล้วเราจะสรุปการได้รับและการสูญเสียในช่วงเวลาต่อเนื่องกัน กราฟแสดงวิถีทั่วไปของเกมดังกล่าวด้วยการโยน 1,000 ครั้ง โยน 5,000 ครั้ง และโยน 10,000 ครั้ง ให้ความสนใจกับวิถีที่สูงกว่าหรือต่ำกว่าศูนย์ กล่าวคือ ช่วงเวลาที่ผู้เล่นคนใดคนหนึ่งชนะในเกมที่ยุติธรรมอย่างยิ่งนั้นยาวนานมาก และการเปลี่ยนจากการชนะเป็นการสูญเสียนั้นค่อนข้างหายาก และนี่คือ ยากที่จะพอดี ในจิตใจที่ไม่ได้เตรียมตัวไว้ซึ่งสำนวน "เกมที่ยุติธรรมอย่างยิ่ง" ฟังดูเหมือนคาถาวิเศษ ดังนั้นแม้ว่าเกมจะยุติธรรมภายใต้เงื่อนไข แต่พฤติกรรมของวิถีทั่วไปนั้นไม่ยุติธรรมเลยและไม่แสดงสมดุล!

แน่นอน ความจริงข้อนี้เป็นที่รู้จักของผู้เล่นทุกคน กลยุทธ์ที่เกี่ยวข้องกับมัน เมื่อผู้เล่นไม่ได้รับอนุญาตให้ออกไปพร้อมกับชัยชนะ แต่ถูกบังคับให้เล่นต่อไป


พิจารณาจำนวนการโยนระหว่างที่ผู้เล่นคนหนึ่งชนะ (วิถีที่สูงกว่า 0) และอีกคนหนึ่งแพ้ (วิถีที่ต่ำกว่า 0) เมื่อมองแวบแรก ดูเหมือนว่าจำนวนการขว้างจะใกล้เคียงกัน อย่างไรก็ตาม (ดูหนังสือที่น่าสนใจ: Feller V. "ความรู้เบื้องต้นเกี่ยวกับทฤษฎีความน่าจะเป็นและการประยุกต์" มอสโก: Mir, 1984, p. 106) พร้อม 10,000 เหรียญในอุดมคติ p = q = 0.5, n = 10,000) ความน่าจะเป็นที่ฝ่ายใดฝ่ายหนึ่งจะเป็นผู้นำในการทดลองมากกว่า 9,930 ครั้ง และอีกฝ่ายหนึ่ง - น้อยกว่า 70 เกิน 0.1

น่าแปลกที่ในเกมที่โยนเหรียญที่ถูกต้อง 10,000 ครั้ง ความน่าจะเป็นของการเปลี่ยนแปลงผู้นำไม่เกิน 8 ครั้งจะมากกว่า 0.14 และความน่าจะเป็นของการเปลี่ยนแปลงผู้นำมากกว่า 78 ครั้งจะอยู่ที่ 0.12 โดยประมาณ

ดังนั้นเราจึงมีสถานการณ์ที่ขัดแย้ง: ในการเดินแบบสมมาตรของ Bernoulli “คลื่น” บนแผนภูมิระหว่างผลตอบแทนเป็นศูนย์ที่ต่อเนื่องกัน (ดูแผนภูมิ) อาจยาวอย่างน่าประหลาดใจ เรื่องนี้เกี่ยวโยงกับอีกกรณีหนึ่งคือสำหรับ T n / n (เศษส่วนของเวลาที่กราฟอยู่เหนือแกน abscissa) ค่าที่น่าจะเป็นน้อยที่สุดจะใกล้เคียงกับ 1/2

นักคณิตศาสตร์ค้นพบกฎของอาร์คไซน์ ซึ่งแต่ละ 0< а <1 вероятность неравенства , где Т n - число шагов, в течение которых первый игрок находится в выигрыше, стремится к

การกระจายอาร์คไซน์

การแจกแจงแบบต่อเนื่องนี้จะเน้นที่ช่วง (0, 1) และมีความหนาแน่น:

การกระจายไซน์ผกผันสัมพันธ์กับการสุ่มเดิน นี่คือการแจกแจงสัดส่วนของเวลาที่ผู้เล่นคนแรกชนะเมื่อโยนเหรียญสมมาตร นั่นคือ เหรียญที่มีความน่าจะเป็นเท่ากัน S ตกลงบนแขนเสื้อและหาง ในอีกทางหนึ่ง เกมดังกล่าวสามารถถูกมองว่าเป็นการสุ่มเดินของอนุภาคที่เริ่มต้นจากศูนย์ ทำให้หน่วยกระโดดไปทางขวาหรือไปทางซ้ายโดยมีโอกาสเท่ากัน เนื่องจากการกระโดดของอนุภาค - การปรากฏตัวของเสื้อคลุมแขนหรือหาง - มีความเป็นไปได้เท่ากัน การเดินเช่นนี้มักเรียกว่าสมมาตร หากความน่าจะเป็นต่างกัน เราก็จะมีการเดินแบบอสมมาตร

กราฟความหนาแน่นการกระจายของอาร์กไซน์แสดงในรูปต่อไปนี้:

สิ่งที่น่าสนใจที่สุดคือการตีความแผนภูมิคุณภาพสูง ซึ่งคุณสามารถสรุปผลที่น่าทึ่งเกี่ยวกับสตรีคที่ชนะและสตรีคที่แพ้ในเกมที่ยุติธรรม เมื่อดูกราฟ จะเห็นว่าความหนาแน่นต่ำสุดอยู่ที่จุด 1/2. "แล้วไง!" - คุณถาม. แต่ถ้าคุณคิดเกี่ยวกับการสังเกตนี้ คุณจะไม่แปลกใจเลย! ปรากฎว่าเมื่อกำหนดว่ายุติธรรม แท้จริงแล้วเกมไม่ยุติธรรมอย่างที่เห็นในแวบแรก

เส้นทางของการสุ่มแบบสมมาตร ซึ่งอนุภาคใช้เวลาเท่ากันทั้งบนครึ่งบวกและลบ นั่นคือ ทางขวาหรือทางซ้ายของศูนย์ มีความเป็นไปได้น้อยที่สุด พูดถึงภาษาของผู้เล่นเราสามารถพูดได้ว่าเมื่อโยนเหรียญสมมาตร เกมที่ผู้เล่นมีเวลาเท่ากันในการชนะและแพ้มีโอกาสน้อยที่สุด

ในทางตรงกันข้าม เกมที่ผู้เล่นคนหนึ่งมีโอกาสชนะมากกว่า และอีกเกมตามลำดับจะแพ้มีโอกาสมากที่สุด พาราด็อกซ์สุดอัศจรรย์!

ในการคำนวณความน่าจะเป็นที่เศษของเวลา t ในระหว่างที่ผู้เล่นคนแรกชนะอยู่ในช่วงตั้งแต่ t1 ถึง t2 มันเป็นสิ่งจำเป็นจากค่าของฟังก์ชันการกระจาย F (t2) ลบค่าของฟังก์ชันการกระจาย F (t1)

อย่างเป็นทางการเราได้รับ:

พี (t1

จากข้อเท็จจริงนี้ เป็นไปได้ที่จะคำนวณโดยใช้ STATISTICA ที่ 10,000 ขั้นตอนอนุภาคยังคงอยู่ในด้านบวกของช่วงเวลามากกว่า 9930 ครั้งโดยมีความน่าจะเป็น 0.1 กล่าวโดยคร่าว ๆ สถานการณ์ดังกล่าวจะถูกสังเกตอย่างน้อยใน หนึ่งกรณีในสิบ (แม้ว่าในแวบแรกมันดูไร้สาระดูบันทึกที่ชัดเจนอย่างน่าทึ่งโดย Yu. V. Prokhorov "Bernoulli's Walk" ในสารานุกรม "ความน่าจะเป็นและสถิติทางคณิตศาสตร์", หน้า 42-43, มอสโก: สารานุกรมรัสเซียขนาดใหญ่, 1999) ...

การกระจายทวินามเชิงลบ

นี่คือการแจกแจงแบบไม่ต่อเนื่องที่กำหนดให้กับจุดทั้งหมด k = 0,1,2, ... ความน่าจะเป็น:

p k = P (X = k) = C k r + k-1 p r (l-p) k " โดยที่ 0<р<1,r>0.

การกระจายทวินามลบพบได้ในหลาย ๆ แอพพลิเคชั่น

โดยทั่วไป r> 0 การแจกแจงทวินามเชิงลบถูกตีความว่าเป็นการกระจายเวลารอสำหรับ "ความสำเร็จ" rth ในรูปแบบการทดสอบ Bernoulli ที่มีความน่าจะเป็นของ "ความสำเร็จ" ตัวอย่างเช่น จำนวนม้วนที่จะทำก่อนที่จะรีดเสื้อคลุมแขนที่สอง ซึ่งในกรณีนี้บางครั้งเรียกว่าการกระจายแบบปาสกาล และเป็นอะนาล็อกที่ไม่ต่อเนื่องของการแจกแจงแกมมา

ที่ r = 1 การแจกแจงทวินามลบพร้อมการแจกแจงทางเรขาคณิต

ถ้า Y เป็นตัวแปรสุ่มที่มีการแจกแจงแบบปัวซองด้วยพารามิเตอร์สุ่ม ซึ่งในทางกลับกัน จะมีการแจกแจงแกมมาที่มีความหนาแน่น

จากนั้น Ub จะมีการกระจายทวินามลบพร้อมพารามิเตอร์

การกระจายปัวซอง

การแจกแจงแบบปัวซองบางครั้งเรียกว่าการแจกแจงเหตุการณ์หายาก ตัวอย่างของตัวแปรที่กระจายตามกฎของปัวซอง ได้แก่ จำนวนอุบัติเหตุ จำนวนข้อบกพร่องในกระบวนการผลิต ฯลฯ การกระจายปัวซองถูกกำหนดโดยสูตร:

ลักษณะสำคัญของตัวแปรสุ่มปัวซอง:

การแจกแจงแบบปัวซองเกี่ยวข้องกับการแจกแจงแบบเอ็กซ์โพเนนเชียลและการแจกแจงแบบเบอร์นูลลี

หากจำนวนของเหตุการณ์มีการแจกแจงแบบปัวซอง ช่วงเวลาระหว่างเหตุการณ์จะมีการแจกแจงแบบเอ็กซ์โปเนนเชียลหรือแบบเอ็กซ์โพเนนเชียล

แผนการจำหน่ายปัวซอง:

เปรียบเทียบพล็อตของการแจกแจงแบบปัวซองกับพารามิเตอร์ 5 กับพล็อตของการแจกแจงแบบเบอร์นูลลีที่ p = q = 0.5, n = 100

คุณจะเห็นว่ากราฟมีความคล้ายคลึงกันมาก ในกรณีทั่วไป มีรูปแบบดังต่อไปนี้ (ดูตัวอย่างหนังสือยอดเยี่ยม: Shiryaev AN “ความน่าจะเป็น” มอสโก: Nauka, p. 76): ถ้าในการทดสอบของ Bernoulli n ใช้ค่าจำนวนมากและความน่าจะเป็นของความสำเร็จ / ? ค่อนข้างน้อย ดังนั้นจำนวนเฉลี่ยของความสำเร็จ (ผลิตภัณฑ์และ bp) จึงไม่น้อยหรือมาก จากนั้นการแจกแจงแบบเบอร์นูลลีด้วยพารามิเตอร์ n, p สามารถแทนที่ได้ด้วยการแจกแจงแบบปัวซองด้วยค่าพารามิเตอร์ = np

การกระจายของปัวซองนั้นใช้กันอย่างแพร่หลายในทางปฏิบัติ ตัวอย่างเช่น ในแผนภูมิควบคุมคุณภาพ เป็นการแจกแจงเหตุการณ์หายาก

อีกตัวอย่างหนึ่ง ให้พิจารณาปัญหาต่อไปนี้ที่เกี่ยวข้องกับสายโทรศัพท์และนำมาจากการปฏิบัติ (ดู: Feller V. บทนำสู่ทฤษฎีความน่าจะเป็นและการประยุกต์ใช้ มอสโก: Mir, 1984, p. 205 และ Molina E. S. (1935 ) ความน่าจะเป็น วิศวกรรมศาสตร์, วิศวกรรมไฟฟ้า, 54, p. 423-427; Bell Telephone System Technical Publications Monograph B-854). งานนี้แปลเป็นภาษาสมัยใหม่ได้ง่าย เช่น เป็นภาษาของการสื่อสารเคลื่อนที่ ซึ่งเชิญชวนผู้อ่านที่สนใจให้ทำ

โจทย์กำหนดไว้ดังนี้ ให้มีการแลกเปลี่ยนทางโทรศัพท์สองครั้ง - A และ B.

สถานีโทรศัพท์ A ต้องแน่ใจว่ามีการสื่อสารของสมาชิก 2,000 รายกับสถานี B คุณภาพของการสื่อสารจะต้องเป็นแบบที่มีเพียง 1 สายจาก 100 สายเท่านั้นที่รอสายจึงจะว่าง

คำถามคือ คุณต้องวางสายโทรศัพท์กี่สายเพื่อให้แน่ใจว่าการสื่อสารมีคุณภาพ แน่นอนว่าการสร้าง 2,000 บรรทัดนั้นเป็นเรื่องโง่ เพราะหลายๆ เส้นจะว่างเป็นเวลานาน จากการพิจารณาโดยสัญชาตญาณ เห็นได้ชัดว่ามีจำนวนบรรทัดที่เหมาะสมที่สุด N จะคำนวณจำนวนนี้ได้อย่างไร

เริ่มต้นด้วยแบบจำลองจริงที่อธิบายความรุนแรงของการเข้าถึงเครือข่ายของผู้สมัครสมาชิก ในขณะที่โปรดทราบว่าแน่นอนว่าสามารถตรวจสอบความถูกต้องของแบบจำลองได้โดยใช้เกณฑ์ทางสถิติมาตรฐาน

ดังนั้น สมมติว่าสมาชิกแต่ละคนใช้สายโดยเฉลี่ย 2 นาทีต่อชั่วโมง และการเชื่อมต่อของสมาชิกมีความเป็นอิสระ (อย่างไรก็ตาม ตามที่ Feller ตั้งข้อสังเกตไว้อย่างถูกต้อง เหตุการณ์หลังจะเกิดขึ้นหากไม่มีเหตุการณ์ที่ส่งผลกระทบต่อสมาชิกทั้งหมด เช่น สงครามหรือ พายุเฮอริเคน)

จากนั้นเรามีการทดลอง Bernoulli 2,000 ครั้ง (การโยนเหรียญ) หรือการเชื่อมต่อเครือข่ายด้วยอัตราความสำเร็จ p = 2/60 = 1/30

คุณต้องค้นหา N ดังกล่าวเมื่อความน่าจะเป็นที่ผู้ใช้มากกว่า N รายเชื่อมต่อกับเครือข่ายพร้อมกันไม่เกิน 0.01 การคำนวณเหล่านี้สามารถแก้ไขได้ง่ายในระบบ STATISTICA

การแก้ปัญหาใน STATISTICA

ขั้นตอนที่ 1.เปิดโมดูล สถิติพื้นฐาน... สร้างไฟล์ binoml.sta ที่มีการสังเกต 110 รายการ ตั้งชื่อตัวแปรตัวแรก ทวินามตัวแปรที่สองคือ ปัวซอง.

ขั้นตอนที่ 2. ทวินาม, เปิดหน้าต่าง ตัวแปร 1(ดูรูป) ป้อนสูตรในหน้าต่างดังแสดงในรูป คลิกที่ปุ่ม ตกลง.


ขั้นตอนที่ 3โดยดับเบิลคลิกที่ชื่อเรื่อง ปัวซอง, เปิดหน้าต่าง ตัวแปร2(ดูรูป)

ป้อนสูตรในหน้าต่างดังแสดงในรูป โปรดทราบว่าเรากำลังคำนวณพารามิเตอร์ของการแจกแจงปัวซองโดยใช้สูตร = n × หน้า ดังนั้น = 2000 × 1/30 คลิกที่ปุ่ม ตกลง.


สถิติจะคำนวณความน่าจะเป็นและเขียนลงในไฟล์ที่สร้างขึ้น

ขั้นตอนที่ 4เลื่อนดูตารางที่สร้างขึ้นไปยังกรณีที่หมายเลข 86 คุณจะเห็นว่าความน่าจะเป็นที่ผู้ใช้เครือข่าย 86 คนขึ้นไปจาก 2,000 คนทำงานพร้อมกันเป็นเวลาหนึ่งชั่วโมงคือ 0.01347 หากใช้การแจกแจงแบบทวินาม

ความน่าจะเป็นที่ผู้ใช้เครือข่าย 86 คนขึ้นไปจาก 2,000 คนทำงานพร้อมกันเป็นเวลาหนึ่งชั่วโมงคือ 0.01293 เมื่อใช้ค่าประมาณปัวซองสำหรับการแจกแจงแบบทวินาม

เนื่องจากเราต้องการความน่าจะเป็นไม่เกิน 0.01 ดังนั้น 87 บรรทัดจึงเพียงพอที่จะให้คุณภาพการสื่อสารที่ต้องการ

ผลลัพธ์ที่คล้ายกันสามารถรับได้โดยใช้การประมาณปกติสำหรับการแจกแจงทวินาม (ลองดูสิ!)

โปรดทราบว่า V. Feller ไม่มีระบบ STATISTICA และใช้ตารางสำหรับการแจกแจงทวินามและแบบปกติ

ด้วยการใช้เหตุผลเดียวกันนี้ เราสามารถแก้ปัญหาต่อไปนี้ที่ W. Feller อภิปรายอภิปรายไว้ได้ จำเป็นต้องตรวจสอบว่าผู้ใช้บริการต้องเข้าแถวมากหรือน้อยหรือไม่ เมื่อแบ่งเป็น 2 กลุ่ม กลุ่มละ 1,000 คน

ปรากฎว่าการแบ่งผู้ใช้ออกเป็นกลุ่มจะต้องเพิ่มอีก 10 บรรทัดเพื่อให้ได้ระดับคุณภาพเดียวกัน

คุณยังสามารถคำนึงถึงการเปลี่ยนแปลงของความเข้มของการเชื่อมต่อเครือข่ายในระหว่างวันได้อีกด้วย

การกระจายทางเรขาคณิต

หากทำการทดสอบเบอร์นูลลีอย่างอิสระและนับจำนวนการทดสอบจนกว่าจะมี "ความสำเร็จ" ครั้งต่อไป ตัวเลขนี้จะมีการแจกแจงทางเรขาคณิต ดังนั้น หากคุณพลิกเหรียญ จำนวนครั้งของการโยนที่คุณต้องทำก่อนที่เสื้อคลุมแขนชุดถัดไปจะตกไปตามกฎทางเรขาคณิต

การกระจายทางเรขาคณิตถูกกำหนดโดยสูตร:

F (x) = p (1-p) x-1

p คือความน่าจะเป็นของความสำเร็จ x = 1, 2,3 ...

ชื่อการแจกจ่ายมีความเกี่ยวข้องกับความก้าวหน้าทางเรขาคณิต

ดังนั้น การแจกแจงทางเรขาคณิตกำหนดความน่าจะเป็นที่ความสำเร็จมาถึงขั้นหนึ่ง

การกระจายทางเรขาคณิตเป็นแบบอะนาล็อกที่ไม่ต่อเนื่องของการแจกแจงแบบเลขชี้กำลัง หากเวลาเปลี่ยนแปลงในควอนตา ความน่าจะเป็นของความสำเร็จในแต่ละช่วงเวลาจะถูกอธิบายโดยกฎเรขาคณิต หากเวลาต่อเนื่อง ความน่าจะเป็นจะอธิบายโดยกฎเลขชี้กำลังหรือเลขชี้กำลัง

การกระจายแบบไฮเปอร์เรขาคณิต

นี่คือการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องของตัวแปรสุ่ม X โดยใช้ค่าจำนวนเต็ม m = 0, 1,2, ..., n ด้วยความน่าจะเป็น:

โดยที่ N, M และ n เป็นจำนวนเต็มที่ไม่ติดลบและ M< N, n < N.

การแจกแจงแบบไฮเปอร์จีโอเมตริกมักจะสัมพันธ์กับตัวเลือกโดยไม่เกิดซ้ำ และเป็นตัวกำหนด ตัวอย่างเช่น ความน่าจะเป็นที่จะพบลูกบอลสีดำ m ลูกในตัวอย่างสุ่มขนาด n จากประชากรทั่วไปที่มี N ลูก รวมทั้ง M สีดำ และ N - M สีขาว (ดู ตัวอย่างเช่น สารานุกรม "ความน่าจะเป็นและสถิติทางคณิตศาสตร์", มอสโก: สารานุกรมรัสเซียอันยิ่งใหญ่, หน้า 144)

ความคาดหวังทางคณิตศาสตร์ของการแจกแจงแบบไฮเปอร์จีโอเมตริกไม่ได้ขึ้นอยู่กับ N และตรงกับการคาดหมายทางคณิตศาสตร์ µ = np ของการแจกแจงแบบทวินามที่สอดคล้องกัน

การกระจายตัวของการกระจายแบบไฮเปอร์จีโอเมตริก ไม่เกินความแปรปรวนของการแจกแจงทวินาม เอ็นพีคิว สำหรับช่วงเวลาของลำดับใดๆ การแจกแจงแบบไฮเปอร์จีโอเมตริกมีแนวโน้มที่ค่าที่สอดคล้องกันของโมเมนต์ของการแจกแจงทวินาม

การกระจายนี้เป็นเรื่องปกติธรรมดาในงานควบคุมคุณภาพ

การแจกแจงพหุนาม

การแจกแจงพหุนามหรือพหุนามเป็นการแจกแจงทั่วไปโดยธรรมชาติ หากการแจกแจงแบบทวินามเกิดขึ้นเมื่อเหรียญถูกโยนด้วยผลลัพธ์สองอย่าง (ตาข่ายหรือเสื้อคลุมแขน) การแจกแจงพหุนามจะเกิดขึ้นเมื่อมีการรีดแม่พิมพ์และมีผลลัพธ์ที่เป็นไปได้มากกว่าสองรายการ อย่างเป็นทางการ นี่คือการแจกแจงความน่าจะเป็นร่วมของตัวแปรสุ่ม X 1, ..., X k, รับค่าจำนวนเต็มที่ไม่ใช่ค่าลบ n 1, ..., nk, ตรงตามเงื่อนไข n 1 + ... + nk = n ด้วยความน่าจะเป็น:

ชื่อ "การแจกแจงพหุนาม" อธิบายโดยข้อเท็จจริงที่ว่าความน่าจะเป็นพหุนามเกิดขึ้นระหว่างการขยายตัวของพหุนาม (p 1 + ... + p k) n

การกระจายเบต้า

การกระจายเบต้ามีความหนาแน่นของรูปแบบ:


การแจกแจงแบบเบต้ามาตรฐานจะกระจุกตัวอยู่ในช่วงตั้งแต่ 0 ถึง 1 เมื่อใช้การแปลงเชิงเส้น ค่าเบต้าจะถูกแปลงเพื่อให้รับค่าที่ช่วงใดก็ได้

ลักษณะเชิงตัวเลขหลักของปริมาณที่มีการแจกแจงแบบเบต้า:


การกระจายค่าสุดขั้ว

การกระจายค่าสุดขีด (ประเภท I) มีความหนาแน่นของรูปแบบ:

การแจกแจงนี้บางครั้งเรียกว่าการแจกแจงแบบสุดโต่ง

การกระจายค่าสุดขั้วใช้เพื่อจำลองเหตุการณ์ที่รุนแรง เช่น ระดับน้ำท่วม ความเร็วของกระแสน้ำวน ดัชนีตลาดหุ้นสูงสุดในปีที่กำหนด เป็นต้น

การกระจายนี้ใช้ในทฤษฎีความน่าเชื่อถือ ตัวอย่างเช่น เพื่ออธิบายเวลาความล้มเหลวของวงจรไฟฟ้า เช่นเดียวกับในการคำนวณทางคณิตศาสตร์ประกันภัย

การกระจาย Rayleigh

การกระจาย Rayleigh มีความหนาแน่นของรูปแบบ:

โดยที่ b คือพารามิเตอร์มาตราส่วน

การแจกแจงแบบ Rayleigh กระจุกตัวอยู่ในช่วงตั้งแต่ 0 ถึงอนันต์ แทนที่จะเป็น 0 สถิติจะให้คุณป้อนค่าอื่นสำหรับพารามิเตอร์ธรณีประตู ซึ่งจะถูกลบออกจากข้อมูลเดิมก่อนที่จะปรับการกระจาย Rayleigh ให้เหมาะสม ดังนั้น ค่าของพารามิเตอร์ขีดจำกัดควรน้อยกว่าค่าที่สังเกตได้ทั้งหมด

หากตัวแปร y 1 และ y 2 เป็นอิสระจากกัน และปกติจะกระจายด้วยความแปรปรวนเท่ากัน ตัวแปรนั้น จะมีการกระจายเรย์ลี

การแจกแจงแบบ Rayleigh ใช้ในทฤษฎีการยิงปืน


การกระจาย Weibull

การแจกจ่าย Weibull ได้รับการตั้งชื่อตามนักวิจัยชาวสวีเดน Waloddi Weibull ซึ่งใช้การแจกแจงนี้เพื่ออธิบายประเภทของความล้มเหลวในทฤษฎีความน่าเชื่อถือ

อย่างเป็นทางการ ความหนาแน่นของการกระจาย Weibull ถูกเขียนในรูปแบบ:

บางครั้งความหนาแน่นของการแจกแจงแบบไวบูลก็เขียนในรูปแบบ:

B คือพารามิเตอร์มาตราส่วน

С - พารามิเตอร์รูปร่าง;

E คือค่าคงที่ของออยเลอร์ (2.718 ...)

พารามิเตอร์ตำแหน่ง โดยทั่วไป การแจกแจงแบบไวบูลจะอยู่ที่กึ่งกลางของเซมิแกนจาก 0 ถึงอนันต์ หากแทนที่จะเป็นขอบเขต 0 เราแนะนำพารามิเตอร์ a ซึ่งมักจะจำเป็นในทางปฏิบัติ ดังนั้นการกระจาย Weibull แบบสามพารามิเตอร์ที่เรียกว่าจะเกิดขึ้น

การกระจาย Weibull ถูกใช้อย่างกว้างขวางในทฤษฎีความน่าเชื่อถือและการประกันภัย

ตามที่อธิบายไว้ข้างต้น การแจกแจงแบบเอ็กซ์โพเนนเชียลมักใช้เป็นแบบจำลองสำหรับการประมาณค่า MTBF ภายใต้สมมติฐานที่ว่าความน่าจะเป็นของความล้มเหลวของโรงงานนั้นคงที่ หากความน่าจะเป็นของความล้มเหลวเปลี่ยนแปลงไปตามกาลเวลา การแจกแจงแบบไวบูลจะถูกนำไปใช้

ที่ c = 1 หรือในการกำหนดพารามิเตอร์อื่น ที่ การแจกแจงแบบไวบูล ที่มองเห็นได้ง่ายจากสูตร แปลงเป็นการแจกแจงแบบเอ็กซ์โพเนนเชียล และ at เป็นการแจกแจงแบบเรย์ลี

มีการพัฒนาวิธีการพิเศษในการประมาณค่าพารามิเตอร์ของการแจกแจงแบบไวบูลล์ (ดูตัวอย่างในหนังสือ: Lawless (1982) แบบจำลองทางสถิติและวิธีการสำหรับข้อมูลตลอดอายุขัย Belmont, CA: Lifetime Learning ซึ่งอธิบายวิธีการประมาณค่าด้วย ปัญหาที่เกิดขึ้นเมื่อประมาณค่าพารามิเตอร์ตำแหน่งสำหรับการแจกแจงแบบสามพารามิเตอร์ Weibull)

บ่อยครั้ง เมื่อทำการวิเคราะห์ความน่าเชื่อถือ จำเป็นต้องพิจารณาความน่าจะเป็นของความล้มเหลวภายในช่วงเวลาสั้นๆ หลังจากช่วงเวลาหนึ่ง t กำหนดว่าจนถึงขณะนี้ ไม่มีความล้มเหลวเกิดขึ้น

ฟังก์ชันดังกล่าวเรียกว่าฟังก์ชันความเสี่ยง หรือฟังก์ชันอัตราความล้มเหลว และมีการกำหนดอย่างเป็นทางการดังนี้

H (t) - ฟังก์ชันของอัตราความล้มเหลวหรือฟังก์ชันความเสี่ยง ณ เวลา t;

ฉ (t) - ความหนาแน่นของการกระจายครั้งของความล้มเหลว;

F (t) - ฟังก์ชั่นการกระจายของเวลาล้มเหลว (อินทิกรัลของความหนาแน่นในช่วงเวลา)

โดยทั่วไป ฟังก์ชันอัตราความล้มเหลวเขียนดังนี้:

เมื่อฟังก์ชันความเสี่ยงเท่ากับค่าคงที่ซึ่งสอดคล้องกับการทำงานปกติของอุปกรณ์ (ดูสูตร)

ที่ ฟังก์ชันความเสี่ยงลดลง ซึ่งสอดคล้องกับการทำงานในอุปกรณ์

ที่ ฟังก์ชันความเสี่ยงลดลงซึ่งสอดคล้องกับอายุของอุปกรณ์ ฟังก์ชันความเสี่ยงโดยทั่วไปจะแสดงในกราฟ


แผนภาพความหนาแน่น Weibull พร้อมพารามิเตอร์ต่างๆ แสดงไว้ด้านล่าง จำเป็นต้องใส่ใจกับค่าสามช่วงของพารามิเตอร์ a:

ในพื้นที่แรก ฟังก์ชันความเสี่ยงลดลง (ช่วงการปรับค่า) ในพื้นที่ที่สอง ฟังก์ชันความเสี่ยงเท่ากับค่าคงที่ ในพื้นที่ที่สาม ฟังก์ชันความเสี่ยงจะเพิ่มขึ้น

คุณสามารถเข้าใจสิ่งที่พูดได้ง่ายเช่นตัวอย่างการซื้อรถใหม่: อันดับแรกมีระยะเวลาในการปรับตัวของรถจากนั้นใช้งานได้ตามปกติเป็นเวลานานชิ้นส่วนรถยนต์จะเสื่อมสภาพและความเสี่ยงของความล้มเหลวเพิ่มขึ้นอย่างรวดเร็ว .

เป็นสิ่งสำคัญที่ทุกช่วงเวลาของการทำงานสามารถอธิบายได้ด้วยตระกูลการแจกจ่ายเดียวกัน นี่คือแนวคิดของการแจกแจงแบบไวบูล


ต่อไปนี้คือลักษณะพิเศษเชิงตัวเลขของการแจกแจงแบบไวบูล


การกระจายพาเรโต

ในปัญหาต่าง ๆ ของสถิติประยุกต์มักพบการแจกแจงแบบตัดทอนที่เรียกว่า

ตัวอย่างเช่น การกระจายนี้ใช้ในการประกันหรือในการจัดเก็บภาษีเมื่อรายได้เป็นดอกเบี้ยที่เกินค่าที่กำหนด c 0

ลักษณะเชิงตัวเลขหลักของการกระจาย Pareto:


การกระจายโลจิสติกส์

การกระจายโลจิสติกมีฟังก์ชันความหนาแน่น:

เอ - พารามิเตอร์ตำแหน่ง;

B คือพารามิเตอร์มาตราส่วน

E คือเลขของออยเลอร์ (2.71 ...)


โรงแรม T 2 - การกระจาย

การแจกแจงแบบต่อเนื่องซึ่งมีความเข้มข้นในช่วง (0, T) มีความหนาแน่น:

โดยที่พารามิเตอร์ n และ k, n> _k> _1 เรียกว่าองศาอิสระ

ที่ Hotelling's k = 1 การแจกแจงแบบ P จะลดลงตามการแจกแจงของ Student และสำหรับทุกๆ k> 1 ถือได้ว่าเป็นลักษณะทั่วไปของการแจกแจงแบบนักเรียนกับกรณีแบบหลายมิติ

การกระจายโรงแรมขึ้นอยู่กับการแจกแจงแบบปกติ

ให้เวกเตอร์สุ่ม k มิติ Y มีการแจกแจงแบบปกติโดยมีเวกเตอร์ค่าเฉลี่ยเป็นศูนย์และเมทริกซ์ความแปรปรวนร่วม

พิจารณาความคุ้มค่า

โดยที่เวกเตอร์สุ่ม Z i เป็นอิสระจากกันและ Y และกระจายในลักษณะเดียวกับ Y

จากนั้นตัวแปรสุ่ม T 2 = Y T S -1 Y มีการกระจาย T 2-Hotelling ด้วยองศาอิสระ n (Y คือเวกเตอร์คอลัมน์ T คือตัวดำเนินการขนย้าย)

โดยที่ตัวแปรสุ่ม t n มีการแจกแจงแบบนักเรียนด้วยระดับความเป็นอิสระ n (ดู "ความน่าจะเป็นและสถิติทางคณิตศาสตร์", สารานุกรม, หน้า 792)

หาก Y มีการแจกแจงแบบปกติที่มีค่าเฉลี่ยไม่เป็นศูนย์ การแจกแจงที่สอดคล้องกันจะเรียกว่า นอกศูนย์ Hotelling T 2 -การกระจายด้วย n องศาอิสระและพารามิเตอร์ noncentrality v.

การแจกแจงแบบ T 2 ของ Hotelling ใช้ในสถิติทางคณิตศาสตร์ในสถานการณ์เดียวกันกับการแจกแจงแบบ t ของนักเรียน แต่เฉพาะในกรณีหลายมิติเท่านั้น หากผลการสังเกต X 1, ..., X n เป็นอิสระจากกัน ปกติจะกระจายเวกเตอร์สุ่มที่มีค่าเฉลี่ยเวกเตอร์ µ และเมทริกซ์ความแปรปรวนร่วมที่ไม่เสื่อมลง สถิติ


มี Hotelling T 2 - จัดจำหน่ายด้วย n - 1 องศาอิสระ ข้อเท็จจริงนี้เป็นพื้นฐานของเกณฑ์ของ Hotelling

ใน STATISTICA เกณฑ์ Hotelling จะพร้อมใช้งาน ตัวอย่างเช่น ในโมดูลสถิติพื้นฐานและตาราง (ดูกล่องโต้ตอบด้านล่าง)


การกระจายแมกซ์เวลล์

การกระจายแมกซ์เวลล์เกิดขึ้นในฟิสิกส์เมื่ออธิบายการกระจายของความเร็วของโมเลกุลก๊าซในอุดมคติ

การกระจายแบบต่อเนื่องนี้มีศูนย์กลางที่ (0,) และมีความหนาแน่น:

ฟังก์ชันการกระจายมีรูปแบบ:

โดยที่ Ф (x) คือฟังก์ชันการแจกแจงแบบปกติมาตรฐาน การแจกแจงแบบแมกซ์เวลล์มีค่าสัมประสิทธิ์ความเบ้ที่เป็นบวกและโหมดเดียวที่จุดหนึ่ง (กล่าวคือ การกระจายเป็นแบบยูนิโมดัล)

การกระจายของ Maxwell มีช่วงเวลาจำกัดของคำสั่งใดๆ ความคาดหวังทางคณิตศาสตร์และความแปรปรวนมีค่าเท่ากันตามลำดับและ

การกระจายตัวของแมกซ์เวลล์นั้นสัมพันธ์กับการแจกแจงแบบปกติตามธรรมชาติ

ถ้า X 1, X 2, X 3 เป็นตัวแปรสุ่มอิสระที่มีการแจกแจงแบบปกติด้วยพารามิเตอร์ 0 และ х 2 แสดงว่าตัวแปรสุ่ม มีการแจกแจงแบบแมกซ์เวลล์ ดังนั้น การแจกแจงแมกซ์เวลล์ถือได้ว่าเป็นการแจกแจงความยาวของเวกเตอร์สุ่ม ซึ่งพิกัดในระบบพิกัดคาร์ทีเซียนในพื้นที่สามมิติมีความเป็นอิสระและปกติจะแจกแจงด้วยค่าเฉลี่ย 0 และความแปรปรวน x 2

การกระจาย Cauchy

การแจกแจงที่น่าทึ่งนี้บางครั้งไม่มีค่าเฉลี่ย เนื่องจากความหนาแน่นของมันมีแนวโน้มที่จะเป็นศูนย์ช้ามากโดยการเพิ่ม x ในค่าสัมบูรณ์ การแจกแจงดังกล่าวเรียกว่าการแจกแจงแบบหนัก หากคุณต้องการสร้างการแจกแจงที่ไม่มีค่าเฉลี่ย ให้เรียกการแจกแจงของ Cauchy ทันที

การกระจาย Cauchy เป็นแบบเดียวและสมมาตรเมื่อเทียบกับโหมด ซึ่งเป็นค่ามัธยฐานพร้อมกันและมีฟังก์ชันความหนาแน่นของรูปแบบ:

ที่ไหน c> 0 คือพารามิเตอร์มาตราส่วนและ a คือพารามิเตอร์ศูนย์กลางซึ่งกำหนดค่าของโหมดและค่ามัธยฐานพร้อมกัน

อินทิกรัลของความหนาแน่น กล่าวคือ ฟังก์ชันการกระจายถูกกำหนดโดยอัตราส่วน:

แจกเสื้อนักเรียน

นักสถิติชาวอังกฤษ V. Gosset ซึ่งรู้จักกันในนามนามแฝง "นักศึกษา" และผู้ที่เริ่มต้นอาชีพด้วยการศึกษาสถิติเกี่ยวกับคุณภาพของเบียร์อังกฤษ ได้รับผลในปี 1908 ดังต่อไปนี้ อนุญาต x 0, x 1, .., x m - อิสระ, (0, s 2) - ตัวแปรสุ่มแบบกระจายตามปกติ:


การแจกแจงนี้ ซึ่งปัจจุบันรู้จักกันในชื่อ การแจกแจง t ของนักเรียน (ย่อว่า t (m) -การแจกแจง โดยที่ m คือจำนวนองศาอิสระ) รองรับการทดสอบ t ที่มีชื่อเสียงซึ่งออกแบบมาเพื่อเปรียบเทียบค่าเฉลี่ยของประชากรสองกลุ่ม

ฟังก์ชันความหนาแน่น ฉ t (x) ไม่ได้ขึ้นอยู่กับความแปรปรวน х 2 ของตัวแปรสุ่ม และยิ่งไปกว่านั้น เป็นแบบเดียวและสมมาตรเมื่อเทียบกับจุด х = 0

ลักษณะตัวเลขพื้นฐานของการแจกแจงของนักเรียน:

การกระจายแบบ t มีความสำคัญเมื่อพิจารณาการประมาณค่าเฉลี่ยและไม่ทราบความแปรปรวนตัวอย่าง ในกรณีนี้ จะใช้ความแปรปรวนตัวอย่างและการแจกแจงแบบ t

ที่ระดับความอิสระสูง (มากกว่า 30) การแจกแจงแบบ t จะใกล้เคียงกับการแจกแจงแบบปกติมาตรฐาน

กราฟของฟังก์ชันความหนาแน่นของการแจกแจงแบบ t จะเสียรูปด้วยจำนวนองศาอิสระที่เพิ่มขึ้นดังนี้ จุดสูงสุดเพิ่มขึ้น ส่วนหางจะสูงชันเป็น 0 มากขึ้น และดูเหมือนว่ากราฟของฟังก์ชันความหนาแน่นของการแจกแจงแบบ t ถูกบีบอัดจากด้านข้าง


F-การกระจาย

พิจารณา m 1 + m 2 อิสระและ (0, s 2) ปริมาณการกระจายตามปกติ

และใส่

เห็นได้ชัดว่า ตัวแปรสุ่มเดียวกันสามารถกำหนดเป็นอัตราส่วนของปริมาณที่กระจายไคสแควร์อิสระสองค่าที่เป็นอิสระและเหมาะสมอย่างเหมาะสม และนั่นคือ

R. Fisher นักสถิติชาวอังกฤษที่มีชื่อเสียงในปี 1924 แสดงให้เห็นว่าความหนาแน่นของความน่าจะเป็นของตัวแปรสุ่ม F (m 1, m 2) ถูกกำหนดโดยฟังก์ชัน:


โดยที่ Γ (y) คือค่าของฟังก์ชันแกมมาของออยเลอร์ จุด y และกฎนั้นเรียกว่าการแจกแจงแบบ F โดยมีจำนวนองศาอิสระของตัวเศษและตัวส่วนเท่ากับ m, 1 และ m7 ตามลำดับ

ลักษณะตัวเลขพื้นฐานของการแจกแจงแบบ F:


การกระจาย F เกิดขึ้นในการเลือกปฏิบัติ การถดถอยและการวิเคราะห์ความแปรปรวน และการวิเคราะห์ข้อมูลหลายตัวแปรประเภทอื่นๆ

คำนาม จำนวนคำพ้องความหมาย : 1 การแจกแจง (62) พจนานุกรมคำพ้องความหมาย ASIS ว.น. ทริชิน. 2556 ... พจนานุกรมคำพ้องความหมาย

การกระจายเบต้า- 1.45. การกระจายแบบเบต้า การแจกแจงความน่าจะเป็นของตัวแปรสุ่มต่อเนื่อง X ซึ่งสามารถรับค่าใดก็ได้ตั้งแต่ 0 ถึง 1 รวมถึงขอบเขตและความหนาแน่นของการแจกแจงที่ 0 £ x 1 ปอนด์และพารามิเตอร์ m1> 0, m2> 0 โดยที่ Г .. . ... หนังสืออ้างอิงพจนานุกรมของเงื่อนไขของเอกสารเชิงบรรทัดฐานและทางเทคนิค

การกระจายเบต้า- การกระจายความน่าจะเป็นของตัวแปรสุ่มแบบต่อเนื่องโดยรับค่าบนเซ็กเมนต์ ความหนาแน่นที่กำหนดโดยสูตร โดยที่ a, b> 0 และเป็นฟังก์ชันแกมมา บันทึก. เคสพิเศษนิยมใช้กันแพร่หลายมาก ... ... พจนานุกรมสถิติทางสังคมวิทยา

ดูแผน ... พจนานุกรมคำพ้องความหมาย

ในทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ การแจกแจงแบบ Dirichlet (ตั้งชื่อตาม Johann Peter Gustave Lejeune Dirichlet) มักแสดงว่า Dir (α) เป็นตระกูลของการแจกแจงความน่าจะเป็นแบบพหุตัวแปรต่อเนื่องที่กำหนดพารามิเตอร์โดยเวกเตอร์ α ... ... Wikipedia

เบต้า: วิกิพจนานุกรมมีรายการ "เบต้า" เบต้า (ตัวอักษร) (β) เป็นอักษรตัวที่สองของอักษรกรีก การทดสอบเบต้า ค่าสัมประสิทธิ์เบต้า ฟังก์ชันเบต้า (คณิตศาสตร์) การกระจายเบต้า (ทฤษฎีความน่าจะเป็น ... Wikipedia

ความหนาแน่นของความน่าจะเป็น ... Wikipedia

การแจกแจงความน่าจะเป็นเป็นกฎหมายที่อธิบายช่วงของค่าของตัวแปรสุ่มและความน่าจะเป็นของการยอมรับ สารบัญ 1 คำจำกัดความ 2 วิธีในการกำหนดการกระจาย ... Wikipedia

การกระจาย. การกระจายแบบเพียร์สัน ความหนาแน่นของความน่าจะเป็น ... Wikipedia

หนังสือ

  • การเปรียบเทียบการรับเข้าศึกษาในมหาวิทยาลัยโดยพิจารณาจากผลการแข่งขันกีฬาโอลิมปิกและคะแนน USE, O.V. Poldin ในบทความเพื่อเปรียบเทียบคุณภาพการรับเข้าเรียนในมหาวิทยาลัยสำหรับโปรแกรมการศึกษาต่างๆ ขอเสนอให้ใช้เส้นอุปสงค์ที่ปรับแล้วซึ่งได้รับจากผลการใช้ของผู้ที่ลงทะเบียนเรียนใน ...
ลิงค์ที่ถูกต้องไปยังบทความนี้:

Oleinikova S.A. - การประมาณของกฎหมายการกระจายของผลรวมของตัวแปรสุ่มที่กระจายตามกฎหมายเบต้า // ไซเบอร์เนติกส์และการเขียนโปรแกรม - 2558. - ลำดับที่ 6 - หน้า 35 - 54. ดอย: 10.7256 / 2306-4196.2015.6.17225 URL: https://nbpublish.com/library_read_article.php?id=17225

การประมาณค่ากฎการกระจายของผลรวมของตัวแปรสุ่มที่แจกแจงตามกฎเบตา

Oleinikova Svetlana Alexandrovna

วิทยาศาสตรดุษฎีบัณฑิต

รองศาสตราจารย์ Voronezh State Technical University

394026, รัสเซีย, Voronezh, Moskovsky Prospect, 14

Oleinikova Svetlana Aleksandrovna

วิทยาศาสตรดุษฎีบัณฑิต

รองศาสตราจารย์ ภาควิชาระบบอัตโนมัติและคอมพิวเตอร์ Voronezh State Technical University

394026 รัสเซีย ก. Voronezh, Moskovskii prospekt, 14

วันที่ส่งบทความถึงบรรณาธิการ:

14-12-2015

วันที่ทบทวนบทความ:

15-12-2015

คำอธิบายประกอบ

หัวข้อของการวิจัยในงานนี้คือความหนาแน่นของการแจกแจงของตัวแปรสุ่ม ซึ่งเป็นผลรวมของค่าเบตาจำนวนจำกัด ซึ่งแต่ละค่าจะกระจายตามช่วงเวลาด้วยพารามิเตอร์ของตัวเอง กฎข้อนี้แพร่หลายในทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ เนื่องจากสามารถใช้อธิบายปรากฏการณ์สุ่มจำนวนมากเพียงพอได้ หากค่าของตัวแปรสุ่มต่อเนื่องที่สอดคล้องกันนั้นกระจุกตัวกันในช่วงเวลาหนึ่ง เนื่องจากผลรวมของค่าเบต้าที่ต้องการไม่สามารถแสดงได้โดยกฎที่ทราบปัญหาใดๆ จึงเกิดจากการประมาณความหนาแน่นของการกระจาย จุดมุ่งหมายของงานคือการหาค่าประมาณดังกล่าวสำหรับความหนาแน่นของการกระจายของผลรวมของค่าเบต้า ซึ่งจะแตกต่างกันในข้อผิดพลาดที่น้อยที่สุด เพื่อให้บรรลุเป้าหมายนี้ ได้ทำการทดลองทางคอมพิวเตอร์ซึ่งเป็นผลมาจากค่าเบต้าที่กำหนด ค่าตัวเลขของความหนาแน่นของการแจกแจงจะถูกนำมาเปรียบเทียบกับค่าประมาณของความหนาแน่นที่ต้องการ การแจกแจงแบบปกติและแบบเบต้าถูกใช้เป็นการประมาณ จากผลการวิเคราะห์เชิงทดลอง ได้ผลลัพธ์ที่บ่งชี้ถึงความเหมาะสมของการประมาณกฎการแจกจ่ายที่ต้องการโดยกฎหมายเบต้า ในฐานะที่เป็นหนึ่งในขอบเขตของการประยุกต์ใช้ผลลัพธ์ที่ได้รับ การพิจารณาปัญหาของการจัดการโครงการด้วยระยะเวลาสุ่มซึ่งมีบทบาทสำคัญในการประมาณเวลาดำเนินการโครงการซึ่งเนื่องจากเฉพาะของสาขาวิชา สามารถอธิบายได้โดยใช้ผลรวมของค่าเบต้า


คำสำคัญ: ตัวแปรสุ่ม, การกระจายแบบเบต้า, ความหนาแน่นของการแจกแจง, กฎการแจกแจงแบบปกติ, ผลรวมของตัวแปรสุ่ม, การทดลองทางคอมพิวเตอร์, อัลกอริธึมแบบเรียกซ้ำ, การประมาณค่า, ข้อผิดพลาด, PERT

10.7256/2306-4196.2015.6.17225


วันที่ตีพิมพ์:

19-01-2016

เชิงนามธรรม.

หัวข้อของการวิจัยในบทความนี้คือฟังก์ชันความหนาแน่นของความน่าจะเป็น (PDF) ของตัวแปรสุ่ม ซึ่งเป็นผลรวมของค่าเบต้าจำนวนจำกัด กฎข้อนี้แพร่หลายในทฤษฎีความน่าจะเป็นและสถิติทางคณิตศาสตร์ เนื่องจากการใช้กฎนี้สามารถอธิบายได้โดยเหตุการณ์สุ่มจำนวนมากเพียงพอ หากค่าของตัวแปรสุ่มต่อเนื่องที่สอดคล้องกันกระจุกตัวอยู่ในช่วงใดช่วงหนึ่ง เนื่องจากผลรวมของค่าเบต้าที่ต้องการไม่สามารถแสดงโดยกฎหมายที่รู้จักใดๆ ได้ ปัญหาในการประเมินการกระจายความหนาแน่นจึงมีปัญหา จุดมุ่งหมายคือการหาค่าประมาณดังกล่าวสำหรับ PDF ของผลรวมของค่าเบต้าซึ่งจะมีข้อผิดพลาดน้อยที่สุด เพื่อให้บรรลุเป้าหมายนี้ ได้ทำการทดลองทางคอมพิวเตอร์ ซึ่งสำหรับค่าเบต้าที่กำหนด จะมีการเปรียบเทียบค่าตัวเลขของ PDF ที่มีการประมาณความหนาแน่นที่ต้องการ เป็นการประมาณโดยใช้การแจกแจงแบบปกติและแบบเบต้า จากข้อสรุปของการวิเคราะห์เชิงทดลอง ได้ผลลัพธ์ ซึ่งระบุถึงความเหมาะสมของการประมาณของกฎหมายที่ต้องการด้วยความช่วยเหลือของการแจกแจงแบบเบต้า เป็นหนึ่งในสาขาของการประยุกต์ใช้ผลลัพธ์ ปัญหาการจัดการโครงการที่มีระยะเวลาสุ่มของงานได้รับการพิจารณา ในที่นี้ ประเด็นสำคัญคือการประเมินเวลาในการดำเนินโครงการ ซึ่งสามารถอธิบายได้ด้วยผลรวมของค่าเบต้าเนื่องจากหัวข้อเฉพาะ

คำสำคัญ:

ค่าสุ่ม การกระจายเบต้า ฟังก์ชันความหนาแน่น การแจกแจงแบบปกติ ผลรวมของตัวแปรสุ่ม การทดลองทางคอมพิวเตอร์ อัลกอริธึมแบบเรียกซ้ำ การประมาณค่า ข้อผิดพลาด PERT

บทนำ

พิจารณาปัญหาของการประมาณกฎหมายการกระจายของผลรวมของค่าเบต้า นี่เป็นกฎสากลที่สามารถใช้เพื่ออธิบายปรากฏการณ์สุ่มส่วนใหญ่ด้วยกฎการแจกแจงแบบต่อเนื่อง โดยเฉพาะอย่างยิ่ง ในกรณีจำนวนมหาศาลของการตรวจสอบปรากฏการณ์สุ่มที่สามารถอธิบายได้ด้วยตัวแปรสุ่มต่อเนื่องแบบยูนิโมดัลซึ่งอยู่ในช่วงของค่าที่แน่นอน ค่าดังกล่าวสามารถประมาณได้โดยกฎหมายเบต้า ในเรื่องนี้ ปัญหาในการหากฎการจัดจำหน่ายสำหรับผลรวมของค่าเบต้าไม่ได้เป็นเพียงลักษณะทางวิทยาศาสตร์เท่านั้น แต่ยังเป็นเรื่องที่น่าสนใจในทางปฏิบัติอีกด้วย ยิ่งกว่านั้น กฎหมายเบต้าไม่มีคุณสมบัติเฉพาะที่แตกต่างจากกฎหมายการจำหน่ายส่วนใหญ่ ซึ่งทำให้สามารถอธิบายรายละเอียดเชิงวิเคราะห์ของจำนวนที่ต้องการได้ ยิ่งไปกว่านั้น ความเฉพาะเจาะจงของกฎข้อนี้ทำให้ยากมากที่จะแยกอินทิกรัลจำกัดจำนวนหลายตัวที่จำเป็นสำหรับการกำหนดความหนาแน่นของผลรวมของตัวแปรสุ่ม และผลลัพธ์ที่ได้คือนิพจน์ที่ค่อนข้างยุ่งยากสำหรับ n = 2 และเพิ่มขึ้น ในจำนวนเงื่อนไข ความซับซ้อนของนิพจน์สุดท้ายเพิ่มขึ้นหลายครั้ง ในเรื่องนี้ ปัญหาเกิดขึ้นจากการประมาณความหนาแน่นของการกระจายของผลรวมของค่าเบต้าโดยมีข้อผิดพลาดน้อยที่สุด

บทความนี้นำเสนอแนวทางในการหาค่าประมาณของกฎหมายที่ต้องการโดยใช้การทดลองทางคอมพิวเตอร์ที่ช่วยให้แต่ละกรณีเปรียบเทียบข้อผิดพลาดที่ได้รับจากการประมาณความหนาแน่นของดอกเบี้ยโดยใช้กฎหมายที่เหมาะสมที่สุด ได้แก่ ปกติและเบต้า ดังนั้นจึงสรุปได้ว่าแนะนำให้ประมาณการผลรวมของค่าเบต้าโดยใช้การแจกแจงแบบเบต้า

1. คำชี้แจงปัญหาและคุณสมบัติของปัญหา

โดยทั่วไป กฎหมายเบต้ากำหนดโดยความหนาแน่นที่ระบุในช่วงเวลาดังต่อไปนี้:

`f_ (xi_ (i)) (x) = ((0,; t<0), ((t^(p_(i)-1)(1-t)^(q_(i)-1))/(B(p_(i),q_(i))(b_(i)-a_(i))^(p_(i)+q_(i)-1)), ; 0<=t<=1;),(0, ; t>1):} (1)`

อย่างไรก็ตามสิ่งที่น่าสนใจในทางปฏิบัตินั้นตามกฎแล้วค่าเบต้าจะถูกกำหนดในช่วงเวลาโดยพลการ สาเหตุหลักมาจากความจริงที่ว่าช่วงของปัญหาในทางปฏิบัติในกรณีนี้กว้างกว่ามากและประการที่สองเมื่อค้นหาวิธีแก้ปัญหาสำหรับกรณีทั่วไปที่มากขึ้นจะไม่สามารถได้รับผลลัพธ์สำหรับกรณีใดกรณีหนึ่งซึ่งจะ ถูกกำหนดโดยตัวแปรสุ่ม (1) ไม่มีปัญหา ดังนั้น ในสิ่งต่อไปนี้ เราจะพิจารณาตัวแปรสุ่มที่กำหนดไว้ในช่วงเวลาที่กำหนด ในกรณีนี้ สามารถกำหนดปัญหาได้ดังนี้

เราพิจารณาปัญหาของการประมาณกฎการกระจายของตัวแปรสุ่ม ซึ่งก็คือผลรวมของตัวแปรสุ่ม `xi_ (i)` i = 1, ..., n ซึ่งแต่ละอันมีการกระจายตามกฎหมายเบต้าในช่วงเวลาที่มีพารามิเตอร์ p i และ q i ความหนาแน่นของการแจกแจงของแต่ละเงื่อนไขจะถูกกำหนดโดยสูตร:

ปัญหาในการหากฎของผลรวมของค่าเบต้าได้รับการแก้ไขบางส่วนก่อนหน้านี้ โดยเฉพาะอย่างยิ่ง ได้รับสูตรเพื่อประมาณผลรวมของค่าเบต้าสองค่า ซึ่งแต่ละค่ากำหนดโดยใช้ (1) ในแนวทางที่เสนอในการค้นหาผลรวมของตัวแปรสุ่มสองตัวด้วยกฎการกระจาย (2)

อย่างไรก็ตาม ในกรณีทั่วไป ปัญหาเดิมยังไม่ได้รับการแก้ไข สาเหตุหลักมาจากความจำเพาะของสูตร (2) ซึ่งไม่อนุญาตให้ได้รับสูตรที่กะทัดรัดและสะดวกสำหรับการค้นหาความหนาแน่นจากผลรวมของตัวแปรสุ่ม แน่นอนสำหรับสองปริมาณ`xi_1` และ` xi_2` ความหนาแน่นที่ต้องการจะถูกกำหนดดังนี้:

`f_ (กท.) (z) = int_-prop ^ propf_ (xi_1) (x) f_ (xi_2) (z-x) dx (3)`

ในกรณีของการเพิ่มตัวแปรสุ่ม n ตัว จะได้อินทิกรัลหลายตัว ในเวลาเดียวกัน สำหรับปัญหานี้ มีปัญหาที่เกี่ยวข้องกับลักษณะเฉพาะของการแจกแจงเบต้า โดยเฉพาะอย่างยิ่ง แม้แต่สำหรับ n = 2 การใช้สูตร (3) จะทำให้เกิดผลลัพธ์ที่ค่อนข้างยุ่งยาก ซึ่งกำหนดไว้ในแง่ของฟังก์ชันไฮเปอร์จีโอเมตริก การดึงอินทิกรัลของความหนาแน่นที่ได้รับกลับมาใหม่ ซึ่งต้องทำอยู่แล้วที่ n = 3 และสูงกว่านั้นเป็นเรื่องยากมาก ในเวลาเดียวกัน ข้อผิดพลาดจะไม่เกิดขึ้นอย่างหลีกเลี่ยงไม่ได้เมื่อทำการปัดเศษและคำนวณนิพจน์ที่ซับซ้อนดังกล่าว ในเรื่องนี้ จำเป็นต้องค้นหาค่าประมาณของสูตร (3) ซึ่งทำให้สามารถใช้สูตรที่รู้จักกันดีโดยมีข้อผิดพลาดน้อยที่สุด

2. การทดลองทางคอมพิวเตอร์เพื่อประมาณความหนาแน่นของผลรวมของค่าเบต้า

ในการวิเคราะห์ข้อมูลเฉพาะของความหนาแน่นของการแจกแจงที่ต้องการ ได้ทำการทดลองที่อนุญาตให้รวบรวมข้อมูลทางสถิติเกี่ยวกับตัวแปรสุ่ม ซึ่งเป็นผลรวมของตัวแปรสุ่มจำนวนหนึ่งที่กำหนดไว้ล่วงหน้าพร้อมการแจกแจงแบบเบต้าพร้อมพารามิเตอร์ที่กำหนด มีการอธิบายการตั้งค่าการทดลองโดยละเอียดใน ความแตกต่างของค่าพารามิเตอร์ของค่าเบต้าแต่ละค่า เช่นเดียวกับจำนวนของพวกเขา อันเป็นผลมาจากการทดลองจำนวนมาก เราได้ข้อสรุปดังต่อไปนี้

1. หากตัวแปรสุ่มแต่ละตัวที่รวมอยู่ในผลรวมมีความหนาแน่นสมมาตร ฮิสโตแกรมของการแจกแจงขั้นสุดท้ายจะมีรูปแบบที่ใกล้เคียงปกติ นอกจากนี้ยังใกล้เคียงกับกฎปกติในการประเมินลักษณะเชิงตัวเลขของค่าสุดท้าย (การคาดหมายทางคณิตศาสตร์ ความแปรปรวน ความไม่สมมาตร และความโด่ง)

2. หากตัวแปรสุ่มแต่ละตัวไม่สมมาตร (มีทั้งอสมมาตรบวกและลบ) แต่ความไม่สมมาตรรวมเป็น 0 จากมุมมองของการแสดงกราฟิกและลักษณะเชิงตัวเลข กฎการแจกแจงที่ได้รับก็ใกล้เคียงปกติเช่นกัน

3. ในกรณีอื่นๆ กฎหมายที่ร้องขอจะมองเห็นได้ใกล้เคียงกับกฎหมายเบต้า โดยเฉพาะอย่างยิ่ง ผลรวมของตัวแปรสุ่มแบบอสมมาตรห้าตัวแสดงในรูปที่ 1

รูปที่ 1 - ผลรวมของตัวแปรสุ่มแบบอสมมาตร 5 ตัวที่เท่ากัน

ดังนั้นบนพื้นฐานของการทดลองที่ดำเนินการจึงเป็นไปได้ที่จะเสนอสมมติฐานเกี่ยวกับการประมาณความหนาแน่นที่เป็นไปได้ของผลรวมของค่าเบต้าโดยการแจกแจงแบบปกติหรือแบบเบต้า

เพื่อยืนยันสมมติฐานนี้และเลือกกฎข้อเดียวสำหรับการประมาณ เราจะทำการทดลองต่อไปนี้ เมื่อให้จำนวนตัวแปรสุ่มที่มีการแจกแจงแบบเบต้าตลอดจนพารามิเตอร์ของตัวแปรแล้ว เราจะหาค่าตัวเลขของความหนาแน่นที่ต้องการและเปรียบเทียบกับความหนาแน่นของการแจกแจงแบบปกติหรือแบบเบต้าที่สอดคล้องกัน สิ่งนี้จะต้อง:

1) พัฒนาอัลกอริธึมที่ให้คุณประเมินความหนาแน่นของผลรวมของค่าเบต้าเป็นตัวเลข

2) ด้วยพารามิเตอร์ที่กำหนดและจำนวนค่าเริ่มต้น กำหนดพารามิเตอร์ของการแจกแจงขั้นสุดท้ายภายใต้สมมติฐานของการแจกแจงแบบปกติหรือแบบเบต้า

3) กำหนดข้อผิดพลาดของการประมาณโดยการแจกแจงแบบปกติหรือการแจกแจงแบบเบต้า

พิจารณางานเหล่านี้ในรายละเอียดเพิ่มเติม อัลกอริธึมเชิงตัวเลขสำหรับการค้นหาความหนาแน่นของผลรวมของค่าเบต้านั้นอิงจากการเรียกซ้ำ ผลรวมของตัวแปรสุ่มจำนวน n ตัวสามารถกำหนดได้ดังนี้:

`eta_ (n) = xi_ (1) + ... + xi_ (n) = eta_ (n-1) + xi_ (n)` , (4)

`eta_ (n-1) = xi_ (1) + ... + xi_ (n-1)` . (5)

ในทำนองเดียวกัน คุณสามารถอธิบายความหนาแน่นของการแจกแจงของตัวแปรสุ่ม `eta_ (n-1)`:

`eta_ (n-1) = xi_ (1) + ... + xi_ (n-1) = eta_ (n-2) + xi_ (n-1)` , (6)

ใช้เหตุผลที่คล้ายกันและใช้สูตร (3) ต่อไป เราได้รับ:

`f_ (eta_ (n)) (x) = int_-prop ^ prop (f_ (xi_ (n-1)) (x-x_ (n-1)) * int_-prop ^ prop (f_ (xi_ (n-) 2)) (x_ (n-1) -x_ (n-2)) ... int_-prop ^ propf_ (xi_ (2)) (x_ (2) -x_ (1)) dx_ (1) ... ) dx_ (n-2)) dx_ (n-1). (7) `

การพิจารณาเหล่านี้ ตลอดจนรายละเอียดเฉพาะของการกำหนดความหนาแน่นสำหรับปริมาณที่มีการแจกแจงแบบเบต้านั้นมีรายละเอียดเพิ่มเติมใน

พารามิเตอร์ของกฎหมายการแจกแจงขั้นสุดท้ายพิจารณาจากสมมติฐานความเป็นอิสระของตัวแปรสุ่ม ในกรณีนี้ การคาดหมายทางคณิตศาสตร์และความแปรปรวนของผลรวมจะถูกกำหนดโดยสูตร:

`Meta_ (n) = Mxi_ (1) + ... + Mxi_ (n), (8)`

สำหรับกฎปกติ พารามิเตอร์ a และ "ซิกมา" จะถูกกำหนดโดยตรงโดยสูตร (8) และ (9) สำหรับการกระจายเบต้า คุณต้องคำนวณขอบเขตล่างและบนก่อน สามารถกำหนดได้ดังนี้:` `

`a = sum_ (i = 1) ^ na_ (i)`; (10)

,,, b = sum_ (i = 1) ^ nb_ (i) ` (สิบเอ็ด)

โดยที่ a i และ b i เป็นขอบเขตของช่วงของพจน์แต่ละตัว ต่อไป เราจะสร้างระบบสมการที่รวมสูตรสำหรับความคาดหวังทางคณิตศาสตร์และความแปรปรวนของค่าเบต้า:

`((Mxi = a + (ba) p / (p + q)), (Dxi = (ba) ^ (2) (pq) / ((p + q) ^ 2 (p + q + 1))) : ) (12) `

`xi` เป็นตัวแปรสุ่มที่อธิบายผลรวมที่ต้องการ ความคาดหวังและความแปรปรวนทางคณิตศาสตร์ของมันถูกกำหนดโดยสูตร (8) และ (9); พารามิเตอร์ a และ b ถูกกำหนดโดยสูตร (10) และ (11) เมื่อแก้ไขระบบ (12) เกี่ยวกับพารามิเตอร์ p และ q แล้วเราจะมี:

`p = ((b-Mxi) (Mxi-a) ^ 2-Dxi (Mxi-a)) / (Dxi (b-a))` . (13)

`q = ((b-Mxi) ^ 2 (Mxi-a) -Dxi (b-Mxi)) / (Dxi (b-a))` . (14)

`E = int_a ^ b | hatf (x) -f_ (eta) (x) | dx. (15) `

ที่นี่ `hatf (x)` เป็นค่าประมาณของผลรวมของค่าเบต้า `f_ (eta) (x)` - กฎหมายการกระจายของผลรวมของค่าเบต้า

เราจะเปลี่ยนพารามิเตอร์ของค่าเบต้าแต่ละรายการตามลำดับเพื่อประเมินข้อผิดพลาด โดยเฉพาะอย่างยิ่งคำถามต่อไปนี้จะเป็นที่สนใจ:

1) ผลรวมของค่าเบต้ามาบรรจบกันที่การแจกแจงแบบปกติได้เร็วแค่ไหน และเป็นไปได้ไหมที่จะประมาณผลรวมโดยกฎหมายอื่นที่จะมีข้อผิดพลาดน้อยที่สุดเมื่อเทียบกับกฎหมายการแจกแจงที่แท้จริงของผลรวมของค่าเบต้า

2) ข้อผิดพลาดเพิ่มขึ้นเท่าใดเมื่อความไม่สมดุลของค่าเบต้าเพิ่มขึ้น

3) ข้อผิดพลาดจะเปลี่ยนไปอย่างไรหากช่วงเวลาการกระจายของค่าเบต้าแตกต่างกัน

รูปแบบทั่วไปของอัลกอริธึมการทดสอบสำหรับแต่ละค่าของค่าเบต้าสามารถแสดงได้ดังนี้ (รูปที่ 2)

รูปที่ 2 - โครงร่างทั่วไปของอัลกอริธึมการทดลอง

PogBeta - ข้อผิดพลาดที่เกิดจากการประมาณของกฎหมายขั้นสุดท้ายโดยการกระจายเบต้าในช่วงเวลา

PogNorm - ข้อผิดพลาดที่เกิดจากการประมาณของกฎขั้นสุดท้ายโดยการแจกแจงแบบปกติในช่วงเวลา

ItogBeta - ค่าสุดท้ายของข้อผิดพลาดที่เกิดขึ้นจากการประมาณการการกระจายขั้นสุดท้ายโดยกฎหมายเบต้า

ItogNorm - มูลค่ารวมของข้อผิดพลาดที่เกิดจากการประมาณการการกระจายขั้นสุดท้ายตามกฎปกติ

3. ผลการทดลอง

มาวิเคราะห์ผลการทดลองที่ได้อธิบายไว้ก่อนหน้านี้

พลวัตของข้อผิดพลาดที่ลดลงพร้อมกับจำนวนคำศัพท์ที่เพิ่มขึ้นแสดงในรูปที่ 3 abscissa แสดงจำนวนคำศัพท์และลำดับแสดงขนาดของข้อผิดพลาด ต่อไปนี้ ชุด "ปกติ" จะแสดงการเปลี่ยนแปลงในข้อผิดพลาดโดยการแจกแจงแบบปกติ ซีรีส์ "เบต้า" - เบต้า - การกระจาย

รูปที่ 3 - ลดข้อผิดพลาดด้วยการลดจำนวนเงื่อนไข

ดังที่เห็นได้จากรูปนี้ สำหรับคำสองคำ ข้อผิดพลาดของการประมาณโดยกฎหมายเบต้านั้นต่ำกว่าข้อผิดพลาดของการประมาณโดยกฎหมายการกระจายปกติประมาณ 4 เท่า เห็นได้ชัดว่า เมื่อข้อกำหนดเพิ่มขึ้น ข้อผิดพลาดในการประมาณตามกฎปกติจะลดลงเร็วกว่ากฎหมายเบต้าอย่างมาก นอกจากนี้ยังสามารถสันนิษฐานได้ว่าสำหรับคำศัพท์จำนวนมาก การประมาณโดยกฎปกติจะมีข้อผิดพลาดน้อยกว่าการประมาณโดยการกระจายเบต้า อย่างไรก็ตาม เมื่อพิจารณาถึงขนาดของข้อผิดพลาดในกรณีนี้แล้ว สรุปได้ว่าจากมุมมองของจำนวนเงื่อนไข การกระจายเบต้าจะดีกว่า

รูปที่ 4 แสดงพลวัตของการเปลี่ยนแปลงของข้อผิดพลาดพร้อมกับความไม่สมดุลของตัวแปรสุ่มที่เพิ่มขึ้น โดยไม่สูญเสียความทั่วไป พารามิเตอร์ p ของค่าเบต้าเริ่มต้นทั้งหมดได้รับการแก้ไขด้วยค่า 2 และไดนามิกของการเปลี่ยนแปลงในพารามิเตอร์ q + 1 จะแสดงบนแกน abscissa แกนพิกัดในกราฟแสดงข้อผิดพลาดในการประมาณ ผลลัพธ์ของการทดลองกับค่าอื่นๆ ของพารามิเตอร์นั้นโดยทั่วไปจะคล้ายคลึงกัน

ในกรณีนี้ เป็นที่แน่ชัดว่าควรประมาณผลรวมของค่าเบต้าโดยการแจกแจงแบบเบต้า

รูปที่ 4 - เปลี่ยนข้อผิดพลาดในการประมาณด้วยความไม่สมดุลของปริมาณที่เพิ่มขึ้น

ต่อไป เราวิเคราะห์การเปลี่ยนแปลงข้อผิดพลาดเมื่อเปลี่ยนช่วงของค่าเบต้าเริ่มต้น รูปที่ 5 แสดงผลการวัดค่าความผิดพลาดสำหรับผลรวมของค่าเบต้าสี่ค่า ซึ่งสามค่าจะถูกกระจายในช่วงเวลา และช่วงของค่าที่สี่เพิ่มขึ้นตามลำดับ (ซึ่งแสดงอยู่บน abscissa)

รูปที่ 5 - เปลี่ยนข้อผิดพลาดเมื่อเปลี่ยนช่วงเวลาของการแจกแจงตัวแปรสุ่ม

จากภาพประกอบกราฟิกที่แสดงในรูปที่ 3-5 เช่นเดียวกับการพิจารณาข้อมูลที่ได้รับจากการทดลอง สามารถสรุปได้ว่าควรใช้การแจกแจงแบบเบต้าเพื่อประมาณผลรวมของค่าเบต้า

ดังที่แสดงโดยผลลัพธ์ที่ได้รับ ใน 98% ของกรณี ข้อผิดพลาดในการประมาณค่าที่ตรวจสอบโดยกฎหมายเบต้าจะต่ำกว่าในการประมาณการแจกแจงแบบปกติ ค่าเฉลี่ยของข้อผิดพลาดในการประมาณค่าเบต้าจะขึ้นอยู่กับความกว้างของช่วงที่มีการกระจายคำศัพท์แต่ละคำเป็นหลัก ในกรณีนี้ การประมาณนี้ (ตรงกันข้ามกับกฎปกติ) ขึ้นอยู่กับความสมมาตรของตัวแปรสุ่มเพียงเล็กน้อยเท่านั้น เช่นเดียวกับจำนวนเงื่อนไข

4. แอปพลิเคชัน

หนึ่งในขอบเขตของการประยุกต์ใช้ผลลัพธ์ที่ได้คืองานของการจัดการโครงการ โปรเจ็กต์คือชุดของงานอนุกรม-ขนานที่พึ่งพาซึ่งกันและกันโดยมีระยะเวลาบริการแบบสุ่ม ในกรณีนี้ ระยะเวลาของโปรเจ็กต์จะเป็นค่าสุ่ม เห็นได้ชัดว่าการประเมินกฎหมายการกระจายของปริมาณนี้เป็นที่สนใจไม่เพียงแต่ในขั้นตอนการวางแผนเท่านั้น แต่ยังรวมถึงการวิเคราะห์สถานการณ์ที่เป็นไปได้ที่เกี่ยวข้องกับการทำงานทั้งหมดให้เสร็จก่อนเวลาอันควรด้วย โดยคำนึงถึงข้อเท็จจริงที่ว่าความล่าช้าของโครงการสามารถนำไปสู่สถานการณ์ที่ไม่เอื้ออำนวยได้หลากหลาย รวมทั้งค่าปรับ การประมาณกฎการกระจายของตัวแปรสุ่มที่อธิบายระยะเวลาของโครงการดูเหมือนจะเป็นงานภาคปฏิบัติที่สำคัญอย่างยิ่ง

ปัจจุบันใช้วิธี PERT สำหรับการประเมินนี้ ตามสมมติฐานของเขา ระยะเวลาของโครงการคือตัวแปรสุ่มแบบกระจายตามปกติ "eta" พร้อมพารามิเตอร์:

`a = sum_ (i = 1) ^ k Meta_ (i)`, (16)

`sigma = sqrt (sum_ (i = 1) ^ k D eta_ (i))` . (17)

โดยที่ k คือจำนวนงานบนเส้นทางวิกฤตของโครงการ `eta_ (1)`, ..., `eta_ (k)` - ระยะเวลาของงานเหล่านี้

ลองพิจารณาการแก้ไขวิธี PERT โดยคำนึงถึงผลลัพธ์ที่ได้รับ ในกรณีนี้ เราจะถือว่าระยะเวลาของโครงการมีการกระจายตามกฎหมายเบต้าด้วยพารามิเตอร์ (13) และ (14)

ลองใช้ผลลัพธ์ที่ได้ในทางปฏิบัติ พิจารณาโครงการที่กำหนดโดยแผนภาพเครือข่ายที่แสดงในรูปที่ 6

รูปที่ 6 - ตัวอย่างแผนภาพเครือข่าย

ในที่นี้ ขอบของกราฟแสดงถึงงาน น้ำหนักของขอบระบุจำนวนงาน จุดยอดในสี่เหลี่ยม - เหตุการณ์ที่บ่งบอกถึงจุดเริ่มต้นหรือจุดสิ้นสุดของงาน ให้ผลงานเป็นไปตามระยะเวลาที่กำหนดในตารางที่ 1

ตารางที่ 1 - ลักษณะเวลาของงานโครงการ

เลขที่งาน นาที max เสื่อ. รอ
1 5 10 9
2 3 6 4
3 6 8 7
4 4 7 6
5 4 7 7
6 2 5 3
7 4 8 6
8 4 6 5
9 6 8 7
10 2 6 4
11 9 13 12
12 2 6 3
13 5 7 6

ในตารางด้านบน min คือเวลาที่สั้นที่สุดในการทำงานให้เสร็จ สูงสุด - นานที่สุด; เสื่อ. รอ คือความคาดหวังทางคณิตศาสตร์ของการแจกแจงแบบเบต้า ซึ่งแสดงเวลาที่คาดว่าจะทำงานให้เสร็จลุล่วง

เราจะจำลองกระบวนการดำเนินโครงการโดยใช้ระบบแบบจำลองการจำลองที่พัฒนาขึ้นเป็นพิเศษ ได้อธิบายไว้อย่างละเอียดใน ในฐานะที่เป็นผลลัพธ์ คุณต้องได้รับ:

ฮิสโตแกรมโครงการ

การประเมินความน่าจะเป็นของการดำเนินโครงการในช่วงเวลาที่กำหนดตามข้อมูลทางสถิติของระบบจำลอง

การประมาณความน่าจะเป็นโดยใช้การแจกแจงแบบปกติและแบบเบต้า

ในระหว่างการจำลองการดำเนินการโครงการ 10,000 ครั้ง จะได้รับตัวอย่างระยะเวลาการให้บริการ ซึ่งฮิสโตแกรมแสดงในรูปที่ 7

รูปที่ 7 - ฮิสโตแกรมระยะเวลาโครงการ

เห็นได้ชัดว่าลักษณะที่ปรากฏของฮิสโตแกรมที่แสดงในรูปที่ 7 แตกต่างจากกราฟความหนาแน่นของกฎการแจกแจงแบบปกติ

เราจะใช้สูตร (8) และ (9) เพื่อค้นหาความคาดหวังและความแปรปรวนทางคณิตศาสตร์ขั้นสุดท้าย เราได้รับ:

`M กท. = 27; D กท. = 1.3889.`

ความน่าจะเป็นที่จะตีในช่วงเวลาที่กำหนดจะถูกคำนวณโดยใช้สูตรที่รู้จักกันดี:

`พี (ล (18)

โดยที่ `f_ (eta) (x)` คือกฎการกระจายของตัวแปรสุ่ม `eta' lและ r- ขอบเขตของช่วงเวลาที่น่าสนใจ

มาคำนวณพารามิเตอร์สำหรับการแจกแจงเบต้าขั้นสุดท้ายกัน สำหรับสิ่งนี้เราใช้สูตร (13) และ (14) เราได้รับ:

p = 13.83; q = 4.61

ขอบเขตของการแจกแจงแบบเบต้าถูกกำหนดโดยสูตร (10) และ (11) จะมี:

ผลการศึกษาแสดงไว้ในตารางที่ 2 โดยไม่สูญเสียความทั่วถึง ให้เราเลือกจำนวนการรันแบบจำลองเท่ากับ 10,000 ในคอลัมน์ "สถิติ" ความน่าจะเป็นที่ได้รับจากข้อมูลทางสถิติจะถูกคำนวณ คอลัมน์ "ปกติ" แสดงความน่าจะเป็นที่คำนวณตามกฎการแจกแจงแบบปกติ ซึ่งตอนนี้ใช้เพื่อแก้ปัญหา คอลัมน์เบต้าประกอบด้วยค่าความน่าจะเป็นที่คำนวณจากการแจกแจงแบบเบต้า

ตารางที่ 2 - ผลการประมาณการความน่าจะเป็น

จากผลลัพธ์ที่นำเสนอในตารางที่ 2 เช่นเดียวกับผลลัพธ์ที่คล้ายกันที่ได้รับในระหว่างการสร้างแบบจำลองกระบวนการของการดำเนินการโครงการอื่น ๆ สามารถสรุปได้ว่าค่าประมาณที่ได้รับของการประมาณผลรวมของตัวแปรสุ่ม (2) โดยเบต้า การกระจายทำให้สามารถแก้ไขปัญหานี้ได้อย่างแม่นยำมากขึ้นเมื่อเทียบกับคู่ที่มีอยู่

จุดมุ่งหมายของงานนี้คือการหาค่าประมาณของกฎการกระจายของผลรวมของค่าเบต้า ซึ่งจะแตกต่างกันในข้อผิดพลาดที่น้อยที่สุดเมื่อเปรียบเทียบกับแอนะล็อกอื่นๆ ได้ผลลัพธ์ดังต่อไปนี้

1. ในการทดลอง มีการเสนอสมมติฐานเกี่ยวกับความเป็นไปได้ในการประมาณผลรวมของค่าเบต้าโดยใช้การแจกแจงแบบเบต้า

2. เครื่องมือซอฟต์แวร์ได้รับการพัฒนาขึ้นเพื่อให้ได้รับค่าตัวเลขของข้อผิดพลาดที่เกิดจากการประมาณความหนาแน่นที่ต้องการโดยกฎการกระจายปกติและกฎหมายเบต้า โปรแกรมนี้ใช้อัลกอริธึมแบบเรียกซ้ำซึ่งช่วยให้คุณกำหนดความหนาแน่นของผลรวมของค่าเบต้าด้วยความหนาแน่นที่กำหนดเป็นตัวเลข ซึ่งจะอธิบายในรายละเอียดเพิ่มเติมใน

3. มีการตั้งค่าการทดลองทางคอมพิวเตอร์ขึ้น โดยมีจุดประสงค์เพื่อหาค่าประมาณที่ดีที่สุดโดยการวิเคราะห์เปรียบเทียบข้อผิดพลาดในสภาวะต่างๆ ผลการทดลองแสดงให้เห็นความเป็นไปได้ของการใช้การแจกแจงแบบเบตาเป็นค่าประมาณที่ดีที่สุดของความหนาแน่นของการกระจายของผลรวมของค่าเบต้า

4. ตัวอย่างถูกนำเสนอซึ่งผลลัพธ์ที่ได้มีความสำคัญในทางปฏิบัติ เหล่านี้เป็นงานการจัดการโครงการที่มีเวลาดำเนินการแบบสุ่มสำหรับแต่ละงาน ปัญหาสำคัญสำหรับงานดังกล่าวคือการประเมินความเสี่ยงที่เกี่ยวข้องกับการสิ้นสุดโครงการล่าช้า ผลลัพธ์ที่ได้ทำให้สามารถรับค่าประมาณความน่าจะเป็นที่ต้องการได้แม่นยำยิ่งขึ้น และด้วยเหตุนี้ จึงช่วยลดความน่าจะเป็นของข้อผิดพลาดในการวางแผน

บรรณานุกรม

.