คอมพิวเตอร์ Windows อินเทอร์เน็ต

การคำนวณสหสัมพันธ์ของเคนดัลล์ ความสัมพันธ์ของอันดับและค่าสัมประสิทธิ์สหสัมพันธ์อันดับของ Kendall สิ่งที่ควรเป็นจุดเริ่มต้นในการกำหนดหัวข้อ วัตถุ หัวข้อ เป้าหมาย วัตถุประสงค์ และสมมติฐานของการวิจัย

เพื่อคำนวณสัมประสิทธิ์ ความสัมพันธ์ของอันดับเคนดัลล์ r kจำเป็นต้องจัดลำดับข้อมูลสำหรับแอตทริบิวต์ใดคุณลักษณะหนึ่งตามลำดับจากน้อยไปมาก และกำหนดอันดับที่สอดคล้องกันสำหรับแอตทริบิวต์ที่สอง จากนั้น สำหรับแต่ละอันดับของจุดสนใจที่สอง จะกำหนดจำนวนอันดับที่ตามมาในขนาดที่มากกว่าอันดับที่ใช้ และหาผลรวมของตัวเลขเหล่านี้

ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของ Kendall ถูกกำหนดโดยสูตร


ที่ไหน อาร์ ไอ- จำนวนอันดับของตัวแปรที่สอง เริ่มจาก ผม+1 ขนาดที่มากกว่าขนาด ผมอันดับของตัวแปรนี้

มีตารางจุดเปอร์เซ็นต์ของการแจกแจงสัมประสิทธิ์ r kช่วยให้คุณทดสอบสมมติฐานเกี่ยวกับความสำคัญของสัมประสิทธิ์สหสัมพันธ์

สำหรับตัวอย่างขนาดใหญ่ ค่าวิกฤต r kไม่ได้จัดทำเป็นตาราง และจะต้องคำนวณโดยใช้สูตรโดยประมาณ ซึ่งอิงตามข้อเท็จจริงที่ว่าภายใต้สมมติฐานว่าง H 0: r k= 0 และใหญ่ NSค่าสุ่ม

กระจายประมาณตามกฎปกติมาตรฐาน

40. ความสัมพันธ์ระหว่างลักษณะที่วัดในมาตราส่วนเล็กน้อยหรือลำดับ

ปัญหามักเกิดขึ้นจากการตรวจสอบความเป็นอิสระของคุณลักษณะสองประการที่วัดในระดับเล็กน้อยหรือลำดับขั้น

ให้วัตถุบางอย่างวัดคุณสมบัติสองอย่าง NSและ Yด้วยจำนวนระดับ NSและ NSตามลำดับ ผลลัพธ์ของการสังเกตดังกล่าวถูกนำเสนออย่างสะดวกในรูปแบบของตารางที่เรียกว่าตารางฉุกเฉิน

ในตาราง คุณ ฉัน(ผม = 1, ..., NS) และ วี เจ (NS= 1, ..., NS) - ค่าที่ใช้โดยคุณสมบัติ, ค่า น อิจ- จำนวนวัตถุจากจำนวนวัตถุทั้งหมดที่แอตทริบิวต์ NSรับความหมาย คุณ ฉันและเครื่องหมาย Y- ความหมาย วี เจ

เราแนะนำตัวแปรสุ่มต่อไปนี้:

คุณ ฉัน


- จำนวนวัตถุที่มีค่า วี เจ


นอกจากนี้ยังมีความเท่าเทียมกันที่ชัดเจน



ตัวแปรสุ่มแบบไม่ต่อเนื่อง NSและ Yเป็นอิสระก็ต่อเมื่อ

สำหรับคู่รักทุกคู่ ผม, NS

ดังนั้น การคาดเดาเกี่ยวกับความเป็นอิสระของตัวแปรสุ่มแบบไม่ต่อเนื่อง NSและ Yสามารถเขียนได้ดังนี้

ตามกฎแล้วพวกเขาใช้สมมติฐาน

ความถูกต้องของสมมติฐาน H 0 ควรตัดสินโดยพิจารณาจากความถี่ตัวอย่าง น อิจตารางฉุกเฉิน ตามกฎหมายจำนวนมากที่ NS→∞ ความถี่สัมพัทธ์ใกล้เคียงกับความน่าจะเป็นที่สอดคล้องกัน:



เพื่อทดสอบสมมติฐาน H 0 ใช้สถิติ

ซึ่งถ้าสมมุติฐานเป็นจริงก็มีการกระจายตัว χ 2 วินาที rs − (NS + NS- 1) องศาของเสรีภาพ

เกณฑ์ความเป็นอิสระ χ 2 ปฏิเสธสมมติฐาน H 0 ที่มีระดับนัยสำคัญ α ถ้า:


41. การวิเคราะห์การถดถอย แนวคิดพื้นฐานของการวิเคราะห์การถดถอย

สำหรับคำอธิบายทางคณิตศาสตร์ของความสัมพันธ์ทางสถิติระหว่างตัวแปรที่ศึกษา ปัญหาต่อไปนี้ควรได้รับการแก้ไข:

ü เลือกคลาสของฟังก์ชันที่แนะนำให้หาสิ่งที่ดีที่สุด (ในแง่หนึ่ง) โดยประมาณของการพึ่งพาความสนใจ

ü ค้นหาค่าประมาณของค่าที่ไม่รู้จักของพารามิเตอร์ที่รวมอยู่ในสมการของการพึ่งพาที่ต้องการ

ü เพื่อสร้างความเพียงพอของสมการที่ได้รับของการพึ่งพาที่จำเป็น

ü เพื่อระบุตัวแปรอินพุตที่ให้ข้อมูลมากที่สุด

จำนวนทั้งหมดของงานที่ระบุไว้เป็นเรื่องของการวิจัยในการวิเคราะห์การถดถอย

ฟังก์ชันการถดถอย (หรือการถดถอย) คือการพึ่งพาการคาดหมายทางคณิตศาสตร์ของตัวแปรสุ่มตัวหนึ่งกับค่าที่ตัวแปรสุ่มตัวอื่นใช้ ซึ่งสร้างระบบสองมิติของตัวแปรสุ่มกับตัวแปรแรก

ให้มีระบบตัวแปรสุ่ม ( NS,Y) จากนั้นฟังก์ชันการถดถอย Yบน NS

และฟังก์ชันถดถอย NSบน Y

ฟังก์ชันการถดถอย NS(NS) และ φ (y) ไม่สามารถย้อนกลับกันได้หากมีเพียงความสัมพันธ์ระหว่าง NSและ Yไม่ทำงาน

เมื่อไหร่ NS-เวกเตอร์มิติพร้อมพิกัด NS 1 , NS 2 ,…, X นู๋คุณสามารถพิจารณาการคาดหมายทางคณิตศาสตร์แบบมีเงื่อนไขสำหรับส่วนประกอบใดก็ได้ ตัวอย่างเช่น สำหรับ NS 1


เรียกว่า ถดถอย NS 1 วัน NS 2 ,…, X นู๋.

สำหรับคำจำกัดความที่สมบูรณ์ของฟังก์ชันการถดถอย จำเป็นต้องทราบการแจกแจงแบบมีเงื่อนไขของตัวแปรเอาต์พุตสำหรับค่าคงที่ของตัวแปรอินพุต

เนื่องจากในสถานการณ์จริงไม่มีข้อมูลดังกล่าว จึงมักถูกจำกัดให้ค้นหาฟังก์ชันการประมาณที่เหมาะสมเท่านั้น (NS) สำหรับ NS(NS) ตามข้อมูลสถิติของแบบฟอร์ม ( x ฉัน, ฉัน), ผม = 1,…, NS... ข้อมูลนี้เป็นผลลัพธ์ NSการสังเกตอย่างอิสระ y 1 ,…, y nตัวแปรสุ่ม Yสำหรับค่าของตัวแปรอินพุต NS 1 ,…, x นในขณะที่การวิเคราะห์การถดถอยถือว่าค่าของตัวแปรอินพุตถูกระบุอย่างถูกต้อง

ปัญหาของการเลือกฟังก์ชันการประมาณที่ดีที่สุด (NS) เป็นหลักในการวิเคราะห์การถดถอย และไม่มีขั้นตอนที่เป็นทางการสำหรับการแก้ปัญหา บางครั้ง ทางเลือกจะถูกกำหนดโดยการวิเคราะห์ข้อมูลการทดลอง บ่อยครั้งขึ้นจากการพิจารณาทางทฤษฎี

หากถือว่าฟังก์ชันการถดถอยมีความราบรื่นเพียงพอ แสดงว่าฟังก์ชันการประมาณ (NS) สามารถแสดงเป็นชุดค่าผสมเชิงเส้นของชุดฟังก์ชันพื้นฐานอิสระเชิงเส้นได้ ψ k(NS), k = 0, 1,…, NS-1 กล่าวคือ ในรูปแบบ


ที่ไหน NS- จำนวนพารามิเตอร์ที่ไม่รู้จัก θ k(ในกรณีทั่วไป ไม่ทราบค่า ปรับปรุงระหว่างการสร้างแบบจำลอง)

ฟังก์ชันดังกล่าวเป็นพารามิเตอร์เชิงเส้น ดังนั้น ในกรณีที่อยู่ระหว่างการพิจารณา เราพูดถึงโมเดลฟังก์ชันการถดถอยที่เป็นพารามิเตอร์เชิงเส้น

แล้วปัญหาการหาค่าประมาณที่ดีที่สุดสำหรับเส้นถดถอย NS(NS) ลดลงเพื่อค้นหาค่าพารามิเตอร์ดังกล่าวซึ่ง (NS; θ) เพียงพอที่สุดสำหรับข้อมูลที่มีอยู่ วิธีหนึ่งในการแก้ปัญหานี้คือวิธีกำลังสองน้อยที่สุด

42. วิธีกำลังสองน้อยที่สุด

ให้เซตของคะแนน ( x ฉัน, ฉัน), ผม= 1,…, NSอยู่บนเครื่องบินตามแนวเส้นตรงบางเส้น

จากนั้นเป็นหน้าที่ (NS) การประมาณฟังก์ชันการถดถอย NS(NS) = NS [Y|NS] เป็นเรื่องปกติที่จะรับ ฟังก์ชันเชิงเส้นการโต้แย้ง NS:


นั่นคือเลือกฟังก์ชั่นพื้นฐานที่นี่ ψ 0 (NS) ≡1 และ ψ 1 (NS)≡NS... การถดถอยนี้เรียกว่าการถดถอยเชิงเส้นอย่างง่าย

ถ้าชุดของคะแนน ( x ฉัน, ฉัน), ผม= 1,…, NSตั้งอยู่ตามแนวโค้งบางจุดแล้วเป็น (NS) เป็นเรื่องธรรมดาที่จะลองเลือกตระกูลพาราโบลา

ฟังก์ชันนี้ไม่เป็นเชิงเส้นในพารามิเตอร์ θ 0 และ θ 1 อย่างไรก็ตาม โดยการแปลงเชิงฟังก์ชัน (ในกรณีนี้ ลอการิทึม) สามารถลดลงเป็น ฟังก์ชั่นใหม่ ฉ'a(NS) พารามิเตอร์เชิงเส้น:


43. การถดถอยเชิงเส้นอย่างง่าย

แบบจำลองการถดถอยที่ง่ายที่สุดคือแบบง่าย (หนึ่งมิติ ทางเดียว จับคู่) แบบจำลองเชิงเส้นซึ่งมีรูปแบบดังนี้


ที่ไหน ε ฉัน- ตัวแปรสุ่ม (ข้อผิดพลาด) ไม่สัมพันธ์กัน ไม่มีความคาดหวังทางคณิตศาสตร์และความแปรปรวนเดียวกัน σ 2 , NSและ NS- ค่าสัมประสิทธิ์คงที่ (พารามิเตอร์) ที่ต้องประมาณจากค่าการตอบสนองที่วัดได้ ฉัน.

เพื่อหาค่าประมาณพารามิเตอร์ NSและ NSการถดถอยเชิงเส้น กำหนดเส้นตรงที่ตรงกับข้อมูลการทดลองมากที่สุด:


ใช้วิธีการกำลังสองน้อยที่สุด

ตาม สี่เหลี่ยมน้อยที่สุด การประมาณค่าพารามิเตอร์ NSและ NSหาได้จากเงื่อนไขการลดผลรวมของกำลังสองของส่วนเบี่ยงเบนของค่า ฉันในแนวตั้งจากเส้นถดถอย "จริง":

ให้มีการสังเกตตัวแปรสุ่มสิบครั้ง Yด้วยค่าคงที่ของตัวแปร NS

เพื่อลดขนาด NSเราเท่ากับศูนย์อนุพันธ์ย่อยในส่วนที่เกี่ยวกับ NSและ NS:



ดังนั้นเราจึงได้ระบบสมการในการหาค่าประมาณดังต่อไปนี้ NSและ NS:


การแก้สมการทั้งสองนี้จะให้:



นิพจน์สำหรับการประมาณค่าพารามิเตอร์ NSและ NSยังสามารถแสดงเป็น:

แล้วสมการเชิงประจักษ์ของเส้นถดถอย Yบน NSสามารถเขียนเป็น:


ค่าประมาณความแปรปรวนที่ไม่เอนเอียง σ ค่าเบี่ยงเบน 2 ค่า ฉันจากเส้นตรงประกอบของการถดถอยถูกกำหนดโดยนิพจน์

มาคำนวณค่าพารามิเตอร์ของสมการถดถอยกัน


ดังนั้น เส้นถดถอยคือ:


และการประมาณค่าความแปรปรวนส่วนเบี่ยงเบนของค่า ฉันจากเส้นตรงติดของการถดถอย


44. การตรวจสอบความสำคัญของเส้นถดถอย

พบค่าประมาณ NS≠ 0 สามารถทำให้เป็นจริงของตัวแปรสุ่มได้ ซึ่งการคาดหมายทางคณิตศาสตร์มีค่าเท่ากับศูนย์ นั่นคือ ปรากฎว่าไม่มีการพึ่งพาการถดถอยจริงๆ

เพื่อจัดการกับสถานการณ์นี้ คุณควรทดสอบสมมติฐาน H 0: NS= 0 ด้วยสมมติฐานที่แข่งขันกัน H 1: NS ≠ 0.

ความสำคัญของเส้นการถดถอยสามารถทดสอบได้โดยใช้การวิเคราะห์ความแปรปรวน

พิจารณาเอกลักษณ์ต่อไปนี้:

ปริมาณ ฉันŷ ฉัน = ε ฉันเรียกว่า ส่วนที่เหลือ และเป็นความแตกต่างระหว่างปริมาณสองปริมาณ:

ü การเบี่ยงเบนของค่าที่สังเกตได้ (การตอบสนอง) จากการตอบสนองเฉลี่ยทั้งหมด

ü การเบี่ยงเบนของค่าการตอบสนองที่คาดการณ์ไว้ ŷ ฉันจากค่าเฉลี่ยเดียวกัน

อัตลักษณ์ที่เป็นลายลักษณ์อักษรสามารถเขียนได้เป็น


โดยการยกกำลังทั้งสองส่วนแล้วรวมเข้าด้วยกัน ผม, เราได้รับ:


ที่ชื่อปริมาณ:

รวม (ทั้งหมด) ผลรวมของกำลังสองของ SC n ซึ่งเท่ากับผลรวมของความเบี่ยงเบนของการสังเกตที่สัมพันธ์กับค่าเฉลี่ยของการสังเกต

ผลรวมของกำลังสองเนื่องจากการถดถอยของ SK p ซึ่งเท่ากับผลรวมของกำลังสองของการเบี่ยงเบนของค่าเส้นการถดถอยที่สัมพันธ์กับค่าเฉลี่ยของการสังเกต

ผลรวมคงเหลือของสี่เหลี่ยมจัตุรัส SK 0 ซึ่งเท่ากับผลรวมของกำลังสองของส่วนเบี่ยงเบนของการสังเกตที่สัมพันธ์กับค่าของเส้นถดถอย

ดังนั้นการแพร่กระจาย Y-kov ที่สัมพันธ์กับค่าเฉลี่ยสามารถนำมาประกอบกับข้อเท็จจริงที่ว่าการสังเกตทั้งหมดไม่ได้อยู่บนเส้นการถดถอย หากเป็นกรณีนี้ ผลรวมของกำลังสองที่สัมพันธ์กับการถดถอยจะเป็นศูนย์ ดังนั้นการถดถอยจะมีนัยสำคัญหากผลรวมของกำลังสองของ SC p มากกว่าผลรวมของกำลังสองของ SC 0

การคำนวณเพื่อทดสอบความสำคัญของการถดถอยได้ดำเนินการในตาราง ANOVA . ต่อไปนี้

หากผิดพลาด ε ฉันกระจายตามกฎปกติแล้วถ้าสมมติฐาน H 0 ถูกต้อง: NS= 0 สถิติ:


เผยแพร่ตามกฎหมายของฟิชเชอร์ด้วยจำนวนองศาอิสระ 1 และ NS−2.

สมมติฐานว่างจะถูกปฏิเสธที่ระดับนัยสำคัญ α ถ้าค่าที่คำนวณได้ของสถิติ NSจะมากกว่าจุดเปอร์เซ็นต์ α NS 1;NS−2; α ของการกระจายฟิชเชอร์

45. การตรวจสอบความเพียงพอของแบบจำลองการถดถอย วิธีตกค้าง

ความเพียงพอของแบบจำลองการถดถอยที่สร้างขึ้นนั้นเป็นที่เข้าใจกันว่าไม่มีแบบจำลองอื่นใดให้การปรับปรุงอย่างมีนัยสำคัญในการทำนายการตอบสนอง

หากได้ค่าของการตอบสนองทั้งหมดที่มีค่าต่างกัน NSนั่นคือไม่มีค่าการตอบสนองหลายอย่างที่ได้รับเหมือนกัน x ฉันจากนั้นจะทำการทดสอบความเพียงพอของตัวแบบเชิงเส้นอย่างจำกัดเท่านั้น พื้นฐานสำหรับเช็คดังกล่าวคือของเหลือ:

ความเบี่ยงเบนจากรูปแบบที่กำหนดไว้:

ตราบเท่าที่ NS- ตัวแปรหนึ่งมิติ จุด ( x ฉัน, ฉัน) สามารถพล็อตบนระนาบในรูปแบบของพล็อตที่เหลือที่เรียกว่า การเป็นตัวแทนดังกล่าวบางครั้งทำให้สามารถค้นหาความสม่ำเสมอในพฤติกรรมของสิ่งตกค้างได้ นอกจากนี้ การวิเคราะห์ส่วนที่เหลือยังช่วยให้คุณวิเคราะห์สมมติฐานเกี่ยวกับการกระจายข้อผิดพลาดได้

ในกรณีที่มีการกระจายข้อผิดพลาดตามกฎปกติและมีค่าประมาณการล่วงหน้าของความแปรปรวน σ 2 (ค่าประมาณที่ได้จากการวัดที่ดำเนินการก่อนหน้านี้) จากนั้นจึงทำการประเมินความเพียงพอของแบบจำลองได้แม่นยำยิ่งขึ้น

โดยใช้ NS-เกณฑ์ของฟิชเชอร์ใช้ตรวจสอบว่าความแปรปรวนที่เหลือมีนัยสำคัญหรือไม่ NS 0 2 แตกต่างจากการประมาณการเบื้องต้น หากมากกว่านั้นมาก แสดงว่ามีความไม่เพียงพอและควรแก้ไขแบบจำลอง

ถ้าประมาณการล่วงหน้า σ 2 ไม่ใช่ แต่การวัดการตอบสนอง Yทำซ้ำสองครั้งขึ้นไปด้วยค่าเดียวกัน NSจากนั้นการสังเกตซ้ำเหล่านี้สามารถใช้เพื่อรับค่าประมาณอื่นได้ σ 2 (อันแรกคือความแปรปรวนที่เหลือ) การประมาณการดังกล่าวถือเป็นข้อผิดพลาดที่ “บริสุทธิ์” เนื่องจาก if NSเหมือนกันสำหรับการสังเกตสองครั้งขึ้นไป จากนั้นการเปลี่ยนแปลงแบบสุ่มเท่านั้นที่สามารถส่งผลต่อผลลัพธ์และสร้างการกระจายระหว่างกัน

ค่าประมาณที่ได้จะกลายเป็นค่าประมาณความแปรปรวนที่เชื่อถือได้มากกว่าค่าประมาณที่ได้จากวิธีอื่น ด้วยเหตุนี้ เมื่อวางแผนการทดลอง คุณควรตั้งค่าการทดลองซ้ำๆ

สมมุติว่ามี NSความหมายต่างกัน NS : NS 1 , NS 2 , ..., x ม... ให้สำหรับแต่ละค่าเหล่านี้ x ฉันมี ฉันการสังเกตการตอบสนอง Y... ได้รับการสังเกตทั้งหมด:

จากนั้นตัวแบบการถดถอยเชิงเส้นอย่างง่ายสามารถเขียนได้ดังนี้:


มาหาความแปรปรวนของข้อผิดพลาด "บริสุทธิ์" ความแปรปรวนนี้เป็นค่าประมาณรวมของความแปรปรวน σ 2 ถ้าเราแทนค่าของการตอบสนอง y ijที่ NS = x ฉันเป็นปริมาตรตัวอย่าง ฉัน... ด้วยเหตุนี้ ความแปรปรวนของข้อผิดพลาด "บริสุทธิ์" คือ:

ความแปรปรวนนี้ทำหน้าที่เป็นค่าประมาณ σ 2 ไม่ว่ารุ่นที่ติดตั้งจะถูกต้องหรือไม่

ให้เราแสดงให้เห็นว่าผลรวมของกำลังสองของ "ข้อผิดพลาดล้วนๆ" เป็นส่วนหนึ่งของผลรวมของกำลังสองที่เหลือ (ผลรวมของกำลังสองที่รวมอยู่ในนิพจน์สำหรับความแปรปรวนที่เหลือ) ส่วนที่เหลือสำหรับ NSการสังเกตที่ x ฉันสามารถเขียนเป็น:

ถ้าเรายกกำลังสองข้างของความเท่ากันนี้แล้วรวมมันเข้าด้วยกัน NSและโดย ผม, เราได้รับ:

ทางด้านซ้ายของความเท่าเทียมกันนี้คือผลรวมของกำลังสองที่เหลือ เทอมแรกทางด้านขวาคือผลรวมของกำลังสองของข้อผิดพลาด "บริสุทธิ์" เทอมที่สองสามารถเรียกได้ว่าเป็นผลรวมของกำลังสองของความไม่เพียงพอ จำนวนเงินสุดท้ายมี NS−2 องศาอิสระ ดังนั้น ความแปรปรวนของความไม่เพียงพอ

สถิติของเกณฑ์การทดสอบสมมติฐาน H 0: แบบจำลองเชิงเส้นอย่างง่ายเพียงพอ เทียบกับสมมติฐาน H 1: แบบจำลองเชิงเส้นอย่างง่ายไม่เพียงพอ ตัวแปรสุ่มคือ

หากสมมติฐานว่างเป็นจริง ค่า NSมีการแจกแจงแบบฟิชเชอร์ด้วยองศาอิสระ NS−2 และ NSNS... สมมติฐานความเป็นเส้นตรงของเส้นการถดถอยควรถูกปฏิเสธด้วยระดับนัยสำคัญ α หากค่าที่ได้รับของสถิติมากกว่าจุดเปอร์เซ็นต์ α ของการแจกแจงแบบฟิชเชอร์ด้วยจำนวนองศาอิสระ NS−2 และ NSNS.

46. การตรวจสอบความเพียงพอของแบบจำลองการถดถอย (ดู 45) ANOVA

47. การตรวจสอบความเพียงพอของแบบจำลองการถดถอย (ดู 45) สัมประสิทธิ์ความมุ่งมั่น

บางครั้ง เพื่ออธิบายลักษณะคุณภาพของเส้นการถดถอย จะใช้ค่าสัมประสิทธิ์ตัวอย่างของการกำหนด NS 2 แสดงส่วนใด (เศษส่วน) ของผลรวมของกำลังสอง เนื่องจากการถดถอย SK p อยู่ในผลรวมของกำลังสองทั้งหมด SK n:

ใกล้ชิด NS 2 ต่อ 1 ยิ่งการถดถอยใกล้เคียงกับข้อมูลการทดลองมากเท่าใด การสังเกตยิ่งใกล้เส้นการถดถอยมากขึ้นเท่านั้น ถ้า NS 2 = 0 ดังนั้นการเปลี่ยนแปลงในการตอบสนองจะสมบูรณ์เนื่องจากอิทธิพลของปัจจัยที่ไม่ได้นับและเส้นการถดถอยจะขนานกับแกน NS-อ. ในกรณีของการถดถอยเชิงเส้นอย่างง่าย สัมประสิทธิ์การกำหนด NS 2 เท่ากับกำลังสองของสัมประสิทธิ์สหสัมพันธ์ NS 2 .

ค่าสูงสุด R 2 = 1 สามารถทำได้เฉพาะในกรณีที่มีการสังเกตด้วยค่า x-ov ที่แตกต่างกัน หากมีการทดลองซ้ำในข้อมูล ค่าของ R 2 ก็ไม่สามารถเข้าถึงความสามัคคีได้ ไม่ว่าแบบจำลองจะดีเพียงใด

48. ช่วงความเชื่อมั่นสำหรับพารามิเตอร์การถดถอยเชิงเส้นอย่างง่าย

เฉกเช่นค่าเฉลี่ยตัวอย่างคือค่าประมาณของค่าเฉลี่ยจริง (ค่าเฉลี่ยประชากร) พารามิเตอร์ตัวอย่างของสมการถดถอยก็เช่นกัน NSและ NS- ไม่มีอะไรมากไปกว่าค่าประมาณของสัมประสิทธิ์การถดถอยที่แท้จริง ตัวอย่างที่ต่างกันให้ค่าประมาณของค่าเฉลี่ยต่างกัน - เช่นเดียวกับตัวอย่างที่ต่างกันจะให้ค่าประมาณสัมประสิทธิ์การถดถอยที่ต่างกัน

สมมติว่ากฎหมายการกระจายข้อผิดพลาด ε ฉันอธิบายโดยกฎปกติ การประมาณค่าพารามิเตอร์ NSจะมีการแจกแจงแบบปกติพร้อมพารามิเตอร์:


เนื่องจากค่าประมาณพารามิเตอร์ NSเป็นผลรวมเชิงเส้นของอิสระตามปกติ ปริมาณกระจายมันจะมีการแจกแจงแบบปกติพร้อมค่าเฉลี่ยและความแปรปรวนด้วย:


ในกรณีนี้ ช่วงความเชื่อมั่น (1 - α) สำหรับการประมาณค่าความแปรปรวน σ 2 โดยคำนึงถึงอัตราส่วน ( NS−2)NS 0 2 /σ 2 จัดจำหน่ายโดยกฎหมาย χ 2 กับจำนวนองศาอิสระ NS−2 จะถูกกำหนดโดยนิพจน์


49. ช่วงความเชื่อมั่นสำหรับเส้นการถดถอย ช่วงความเชื่อมั่นสำหรับค่าตัวแปรตาม

เรามักจะไม่ทราบค่าที่แท้จริงของสัมประสิทธิ์การถดถอย NSและ NS... เรารู้แค่การประมาณการของพวกเขาเท่านั้น กล่าวอีกนัยหนึ่ง เส้นการถดถอยที่แท้จริงอาจสูงหรือต่ำกว่า ชันหรือตื้นกว่าเส้นที่สร้างขึ้นจากข้อมูลตัวอย่าง เราคำนวณช่วงความเชื่อมั่นสำหรับสัมประสิทธิ์การถดถอย คุณยังสามารถคำนวณขอบเขตความเชื่อมั่นสำหรับเส้นการถดถอยได้อีกด้วย

ปล่อยให้การถดถอยเชิงเส้นอย่างง่ายจำเป็นต้องสร้าง (1− α ) ช่วงความเชื่อมั่นสำหรับความคาดหวังทางคณิตศาสตร์ของการตอบสนอง Yที่มูลค่า NS = NS 0. ความคาดหวังทางคณิตศาสตร์นี้คือ NS+bx 0 และค่าประมาณ

ตั้งแต่นั้นเป็นต้นมา

การประมาณการที่คาดหวังทางคณิตศาสตร์ที่ได้รับคือผลรวมเชิงเส้นของปริมาณการกระจายแบบปกติที่ไม่สัมพันธ์กัน และดังนั้นจึงมีการแจกแจงแบบปกติที่จุดศูนย์กลางของค่าที่แท้จริงของการคาดหมายทางคณิตศาสตร์แบบมีเงื่อนไขและความแปรปรวน

ดังนั้น ช่วงความเชื่อมั่นของเส้นถดถอยที่แต่ละค่า NS 0 สามารถแสดงเป็น


อย่างที่คุณเห็น ช่วงความเชื่อมั่นขั้นต่ำจะได้มาที่ NS 0 เท่ากับค่าเฉลี่ยและเพิ่มขึ้นเป็น NS 0 “เคลื่อนออก” จากตรงกลางไปในทิศทางใดก็ได้

เพื่อให้ได้ชุดของช่วงความเชื่อมั่นร่วมที่เหมาะสมกับฟังก์ชันการถดถอยทั้งหมดตลอดความยาวในนิพจน์ข้างต้นแทน t n −2,α / 2 จะต้องถูกแทนที่

ปัจจัยหนึ่งที่จำกัดการใช้เกณฑ์ตามสมมติฐานของภาวะปกติคือขนาดกลุ่มตัวอย่าง ตราบใดที่กลุ่มตัวอย่างมีขนาดใหญ่เพียงพอ (เช่น การสังเกต 100 ครั้งขึ้นไป) คุณสามารถสันนิษฐานได้ว่าการกระจายตัวอย่างเป็นเรื่องปกติ แม้ว่าคุณจะไม่แน่ใจว่าการกระจายของตัวแปรในประชากรเป็นเรื่องปกติ อย่างไรก็ตาม หากกลุ่มตัวอย่างมีขนาดเล็ก เกณฑ์เหล่านี้ควรใช้ก็ต่อเมื่อมีความมั่นใจว่าตัวแปรนั้นมีการแจกแจงแบบปกติอย่างแท้จริง อย่างไรก็ตาม ไม่มีทางที่จะทดสอบสมมติฐานนี้กับกลุ่มตัวอย่างขนาดเล็กได้

การใช้เกณฑ์ตามสมมติฐานของภาวะปกติยังจำกัดอยู่ที่มาตราส่วนของการวัด (ดูบท แนวคิดพื้นฐานของการวิเคราะห์ข้อมูล) วิธีการทางสถิติ เช่น t-test การถดถอย ฯลฯ ถือว่าข้อมูลเดิมมีความต่อเนื่อง อย่างไรก็ตาม มีบางสถานการณ์ที่ข้อมูลถูกจัดอันดับอย่างง่าย ๆ (วัดจากมาตราส่วนลำดับ) มากกว่าที่จะวัดได้อย่างแม่นยำ

ตัวอย่างทั่วไปได้รับจากการให้คะแนนของไซต์บนอินเทอร์เน็ต: ตำแหน่งแรกคือไซต์ที่มีจำนวนผู้เข้าชมสูงสุด ตำแหน่งที่สองคือไซต์ที่มีจำนวนผู้เข้าชมสูงสุดในไซต์ที่เหลือ (ระหว่างไซต์ จากที่ไซต์แรกถูกลบออก) ฯลฯ เมื่อรู้การจัดอันดับเราสามารถพูดได้ว่าจำนวนผู้เยี่ยมชมไซต์หนึ่งมากกว่าจำนวนผู้เยี่ยมชมไซต์อื่น แต่จะพูดมากกว่านี้ไม่ได้ ลองนึกภาพคุณมี 5 ไซต์: A, B, C, D, E ซึ่งอยู่ใน 5 อันดับแรก สมมติว่าในเดือนปัจจุบัน เรามีการจัดเรียงดังต่อไปนี้: A, B, C, D, E และในเดือนก่อนหน้า: D, E, A, B, C คำถามคือ มีการเปลี่ยนแปลงที่สำคัญในการจัดอันดับเว็บไซต์ หรือไม่? ในสถานการณ์นี้ เห็นได้ชัดว่าเราไม่สามารถใช้ t-test เพื่อเปรียบเทียบข้อมูลสองกลุ่มนี้ และไปยังพื้นที่ของการคำนวณความน่าจะเป็นเฉพาะ (และเกณฑ์ทางสถิติใด ๆ มีการคำนวณความน่าจะเป็น!) เราให้เหตุผลดังนี้: เป็นไปได้มากน้อยเพียงใดที่ความแตกต่างในเค้าโครงไซต์ทั้งสองนั้นเกิดจากเหตุผลแบบสุ่มล้วนๆ หรือความแตกต่างนั้นใหญ่เกินไปและไม่สามารถอธิบายได้ด้วยโอกาสล้วนๆ ด้วยเหตุผลนี้ เราใช้อันดับหรือการเปลี่ยนแปลงของไซต์เท่านั้น และไม่ใช้รูปแบบเฉพาะของการกระจายจำนวนผู้เข้าชมไซต์

สำหรับการวิเคราะห์ตัวอย่างขนาดเล็กและข้อมูลที่วัดได้ในระดับที่ไม่ดี จะใช้วิธีการแบบไม่อิงพารามิเตอร์

ทัวร์ชมขั้นตอนที่ไม่ใช่พารามิเตอร์อย่างรวดเร็ว

โดยพื้นฐานแล้ว สำหรับทุกเกณฑ์พารามิเตอร์ มีทางเลือกที่ไม่ใช่พารามิเตอร์อย่างน้อยหนึ่งรายการ

โดยทั่วไป ขั้นตอนเหล่านี้จัดอยู่ในประเภทใดประเภทหนึ่งต่อไปนี้:

  • เกณฑ์การแยกตัวอย่างอิสระ
  • เกณฑ์ความแตกต่างสำหรับตัวอย่างที่ขึ้นต่อกัน
  • การประเมินระดับการพึ่งพาอาศัยกันระหว่างตัวแปร

โดยทั่วไป แนวทางสู่เกณฑ์ทางสถิติในการวิเคราะห์ข้อมูลควรเป็นแนวทางปฏิบัติและไม่ต้องแบกรับภาระในการให้เหตุผลเชิงทฤษฎีที่ไม่จำเป็น ด้วยคอมพิวเตอร์ของ STATISTICA คุณสามารถใช้เกณฑ์ต่างๆ กับข้อมูลของคุณได้อย่างง่ายดาย เมื่อทราบถึงข้อผิดพลาดบางประการของวิธีการ คุณจะเลือกวิธีแก้ปัญหาที่ถูกต้องผ่านการทดลอง การพัฒนาโครงเรื่องค่อนข้างเป็นธรรมชาติ หากคุณต้องการเปรียบเทียบค่าของตัวแปรสองตัว ให้ใช้ t-test อย่างไรก็ตาม พึงระลึกไว้เสมอว่าตั้งอยู่บนสมมติฐานของความปกติและความเท่าเทียมกันของความแปรปรวนในแต่ละกลุ่ม การทำลายสมมติฐานเหล่านี้นำไปสู่การทดสอบแบบไม่อิงพารามิเตอร์ซึ่งมีประโยชน์อย่างยิ่งสำหรับตัวอย่างขนาดเล็ก

การพัฒนา t-test นำไปสู่การวิเคราะห์ความแปรปรวน ซึ่งใช้เมื่อจำนวนกลุ่มเปรียบเทียบมากกว่าสองกลุ่ม การพัฒนากระบวนการที่ไม่ใช่พารามิเตอร์ที่สอดคล้องกันนำไปสู่การวิเคราะห์ความแปรปรวนแบบไม่อิงพารามิเตอร์ แม้ว่าจะด้อยกว่าการวิเคราะห์ความแปรปรวนแบบดั้งเดิมอย่างมีนัยสำคัญ

ในการประเมินการพึ่งพาอาศัยกันหรือเพื่อให้ค่อนข้างโอ้อวดระดับความหนาแน่นของการเชื่อมต่อคำนวณค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน กล่าวโดยเคร่งครัด แอปพลิเคชันมีข้อจำกัดที่เกี่ยวข้อง ตัวอย่างเช่น กับประเภทของมาตราส่วนที่มีการวัดข้อมูลและความไม่เชิงเส้นของการพึ่งพาอาศัยกัน ดังนั้น ค่าสัมประสิทธิ์สหสัมพันธ์จึงใช้อีกทางหนึ่งคือ แบบไม่อิงพารามิเตอร์ หรือที่เรียกกันว่า ใช้ตัวอย่างเช่นสำหรับข้อมูลที่จัดอันดับ หากข้อมูลถูกวัดในระดับเล็กน้อย เป็นเรื่องปกติที่จะนำเสนอในตารางฉุกเฉินที่ใช้การทดสอบไคสแควร์ของ Pearson พร้อมรูปแบบและการแก้ไขที่หลากหลายเพื่อความแม่นยำ

โดยพื้นฐานแล้ว มีเกณฑ์และขั้นตอนเพียงไม่กี่ประเภทที่คุณต้องรู้และใช้งานได้ ทั้งนี้ขึ้นอยู่กับเฉพาะของข้อมูล คุณต้องพิจารณาว่าควรใช้เกณฑ์ใดในสถานการณ์เฉพาะ

วิธีการที่ไม่ใช่พารามิเตอร์จะเหมาะสมที่สุดเมื่อขนาดตัวอย่างมีขนาดเล็ก หากมีข้อมูลจำนวนมาก (เช่น n> 100) มักจะไม่สมเหตุสมผลเลยที่จะใช้สถิติที่ไม่ใช่พารามิเตอร์

หากขนาดตัวอย่างมีขนาดเล็กมาก (เช่น n = 10 หรือน้อยกว่า) ระดับนัยสำคัญของการทดสอบแบบไม่อิงพารามิเตอร์ที่ใช้การประมาณปกติจะถือเป็นการประมาณคร่าวๆ เท่านั้น

ความแตกต่างระหว่างกลุ่มอิสระ... หากมีตัวอย่างสองตัวอย่าง (เช่น ชายและหญิง) ที่ต้องเปรียบเทียบโดยเทียบกับค่าเฉลี่ยบางอย่าง เช่น ความดันเฉลี่ยหรือจำนวนเม็ดเลือดขาวในเลือด การทดสอบ t ก็สามารถใช้แยกกัน ตัวอย่าง

ทางเลือกที่ไม่ใช่พารามิเตอร์สำหรับการทดสอบนี้คือการทดสอบ Val'da-Wolfowitz, Mann-Whitney series) / n โดยที่ x i - ค่าที่ i, n คือจำนวนการสังเกต หากตัวแปรมีค่าลบหรือศูนย์ (0) จะไม่สามารถคำนวณค่าเฉลี่ยทางเรขาคณิตได้

ค่าเฉลี่ยฮาร์มอนิก

ค่าเฉลี่ยฮาร์มอนิกบางครั้งใช้กับความถี่เฉลี่ย ค่าเฉลี่ยฮาร์มอนิกคำนวณโดยสูตร: ГС = n / S (1 / х i) โดยที่ ГС คือค่าเฉลี่ยฮาร์มอนิก n คือจำนวนการสังเกต х i คือค่าของการสังเกตด้วยจำนวน i หากตัวแปรมีค่าเป็นศูนย์ (0) จะไม่สามารถคำนวณค่าเฉลี่ยฮาร์มอนิกได้

การกระจายตัวและส่วนเบี่ยงเบนมาตรฐาน

ความแปรปรวนตัวอย่างและค่าเบี่ยงเบนมาตรฐานเป็นการวัดความแปรปรวนของข้อมูล (ความแปรปรวน) ที่ใช้บ่อยที่สุด ความแปรปรวนคำนวณเป็นผลรวมของกำลังสองของการเบี่ยงเบนของค่าของตัวแปรจากค่าเฉลี่ยตัวอย่าง หารด้วย n-1 (แต่ไม่ใช่ n) ค่าเบี่ยงเบนมาตรฐานคำนวณเป็นรากที่สองของการประมาณค่าความแปรปรวน

แกว่ง

ช่วงของตัวแปรเป็นตัวบ่งชี้ความผันผวน โดยคำนวณเป็นค่าสูงสุดลบค่าต่ำสุด

ขอบเขตควอร์ไทล์

ตามคำนิยาม ช่วงรายไตรมาสคือ: ควอไทล์บนลบควอไทล์ต่ำกว่า (เปอร์เซ็นต์ไทล์ 75% ลบเปอร์เซ็นต์ไทล์ 25%) เนื่องจากเปอร์เซ็นไทล์ 75% (ควอร์ไทล์บน) เป็นค่าทางด้านซ้ายซึ่งมีเคสอยู่ 75% และเปอร์เซ็นไทล์ 25% (ควอร์ไทล์ล่าง) เป็นค่าทางด้านซ้ายซึ่งมีเคสอยู่ 25% ควอร์ไทล์ range คือช่วงรอบค่ามัธยฐาน ซึ่งประกอบด้วย 50% ของกรณี (ค่าตัวแปร)

ไม่สมมาตร

ความไม่สมมาตรเป็นลักษณะของรูปร่างของการแจกแจง การกระจายจะเบ้ไปทางซ้ายหากค่าความเบ้เป็นลบ การกระจายจะเบ้ไปทางขวาหากความไม่สมมาตรเป็นค่าบวก ความเบ้ของการแจกแจงแบบปกติมาตรฐานคือ 0 ความเบ้เกี่ยวข้องกับช่วงเวลาที่สามและถูกกำหนดเป็น: ความเบ้ = n × M 3 / [(n-1) × (n-2) × s 3] โดยที่ M 3 คือ: (xi -x ค่าเฉลี่ย x) 3, s 3 คือค่าเบี่ยงเบนมาตรฐานยกกำลังสาม n คือจำนวนการสังเกต

ส่วนเกิน

Kurtosis เป็นลักษณะของรูปร่างของการแจกแจง กล่าวคือ การวัดความรุนแรงของจุดสูงสุด (เทียบกับการแจกแจงแบบปกติ ความโด่งเท่ากับ 0) ตามกฎแล้ว การแจกแจงที่มีจุดสูงสุดที่คมชัดกว่าปกติจะมีความโด่งเป็นบวก การแจกแจงที่มีพีคน้อยกว่ายอดของการแจกแจงแบบปกติจะมีเคอร์โทซิสเป็นลบ ส่วนเกินนั้นสัมพันธ์กับช่วงเวลาที่สี่และถูกกำหนดโดยสูตร:

ความโด่ง = / [(n-1) × (n-2) × (n-3) × s 4] โดยที่ M j คือ: (xx ค่าเฉลี่ย x, s 4 คือค่าเบี่ยงเบนมาตรฐานในยกกำลังที่สี่ n คือ จำนวนการสังเกต ...

ความต้องการของการปฏิบัติทางเศรษฐกิจและสังคมจำเป็นต้องมีการพัฒนาวิธีการสำหรับคำอธิบายเชิงปริมาณของกระบวนการที่อนุญาตให้มีการลงทะเบียนที่แม่นยำไม่เพียง แต่เชิงปริมาณเท่านั้น แต่ยังรวมถึงปัจจัยเชิงคุณภาพด้วย โดยมีเงื่อนไขว่าสามารถสั่งซื้อค่าของลักษณะเชิงคุณภาพหรือจัดลำดับตามระดับการลดลง (เพิ่มขึ้น) ของลักษณะได้ ก็สามารถประเมินความใกล้ชิดของความสัมพันธ์ระหว่างลักษณะเชิงคุณภาพได้ เชิงคุณภาพหมายถึงคุณลักษณะที่ไม่สามารถวัดได้อย่างแม่นยำ แต่ช่วยให้คุณสามารถเปรียบเทียบวัตถุกับแต่ละอื่น ๆ ได้ดังนั้นจึงจัดเรียงตามลำดับคุณภาพที่ลดลงหรือเพิ่มขึ้น และเนื้อหาจริงของการวัดในมาตราส่วนอันดับคือลำดับที่วัตถุถูกจัดเรียงตามความรุนแรงของคุณสมบัติที่วัดได้

ในทางปฏิบัติ การใช้ความสัมพันธ์ของอันดับเป็นประโยชน์อย่างมาก ตัวอย่างเช่น หากมีการสร้างความสัมพันธ์ระดับสูงระหว่างคุณลักษณะเชิงคุณภาพของผลิตภัณฑ์สองรายการ ก็เพียงพอแล้วที่จะควบคุมผลิตภัณฑ์โดยคุณลักษณะอย่างใดอย่างหนึ่งเท่านั้น ซึ่งจะทำให้การควบคุมมีราคาถูกลงและเร็วขึ้น

ตัวอย่างเช่น เราสามารถพิจารณาความเชื่อมโยงระหว่างความพร้อมใช้งานของผลิตภัณฑ์เชิงพาณิชย์ของวิสาหกิจจำนวนหนึ่งกับต้นทุนค่าโสหุ้ยสำหรับการขาย ในการสังเกต 10 ครั้ง ได้ตารางต่อไปนี้:

ให้เราจัดเรียงค่าของ X ตามลำดับจากน้อยไปมาก และกำหนดค่าแต่ละค่าให้กับเลขลำดับ (อันดับ):

ดังนั้น,

มาสร้างตารางต่อไปนี้กันซึ่งมีการเขียนคู่ X และ Y ซึ่งได้จากการสังเกตด้วยอันดับของพวกเขา:

แสดงถึงความแตกต่างของอันดับ โดยเราเขียนสูตรสำหรับคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างของสเปียร์แมน:

โดยที่ n คือจำนวนการสังเกต มันก็เป็นจำนวนคู่ของอันดับด้วย

ค่าสัมประสิทธิ์ของสเปียร์แมนมีคุณสมบัติดังต่อไปนี้:

หากมีความสัมพันธ์โดยตรงอย่างสมบูรณ์ระหว่างคุณสมบัติเชิงคุณภาพ X และ Y ในแง่ที่ว่าอันดับของวัตถุตรงกับค่าทั้งหมดของ i ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างของสเปียร์แมนคือ 1 อันที่จริงแล้วแทนที่ลงในสูตรเราจะได้ 1.

หากมีความสัมพันธ์ผกผันอย่างสมบูรณ์ระหว่างคุณลักษณะเชิงคุณภาพ X และ Y ในแง่ที่อันดับสอดคล้องกับอันดับ สัมประสิทธิ์สหสัมพันธ์ตัวอย่างของสเปียร์แมนจะเท่ากับ -1

แท้จริงแล้วถ้า

แทนค่าลงในสูตรสัมประสิทธิ์สหสัมพันธ์สเปียร์แมน เราจะได้ -1

หากไม่มีเส้นตรงสมบูรณ์หรือเส้นตรงสมบูรณ์ ข้อเสนอแนะดังนั้นสัมประสิทธิ์สหสัมพันธ์ตัวอย่างของสเปียร์แมนจะอยู่ระหว่าง -1 ถึง 1 และยิ่งมีค่าเข้าใกล้ 0 มากเท่าใด ความสัมพันธ์ระหว่างคุณลักษณะก็จะยิ่งน้อยลงเท่านั้น

จากตัวอย่างข้างต้น เราจะพบค่าของ P สำหรับสิ่งนี้ เราจะทำตารางให้สมบูรณ์ด้วยค่าและ:

ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างของเคนดัลล์ คุณสามารถประเมินความสัมพันธ์ระหว่างสองคุณลักษณะเชิงคุณภาพโดยใช้ค่าสัมประสิทธิ์สหสัมพันธ์อันดับของ Kendall

ให้อันดับของวัตถุของกลุ่มตัวอย่างขนาด n เท่ากัน:

บนพื้นฐานของ X:

บนพื้นฐานของ Y:. สมมุติว่าทางขวามียศ ใหญ่ ขวามียศ ใหญ่ ขวามียศ ใหญ่. เรามาแนะนำสัญกรณ์สำหรับผลรวมของอันดับ

ในทำนองเดียวกัน เราแนะนำสัญกรณ์เป็นผลรวมของจำนวนอันดับที่อยู่ทางด้านขวา แต่น้อยกว่า

ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างของ Kendall เขียนโดยสูตร:

โดยที่ n คือขนาดตัวอย่าง

ค่าสัมประสิทธิ์ของ Kendall มีคุณสมบัติเหมือนกับค่าสัมประสิทธิ์ของ Spearman:

หากมีความสัมพันธ์โดยตรงอย่างสมบูรณ์ระหว่างคุณสมบัติเชิงคุณภาพ X และ Y ในแง่ที่ว่าลำดับของวัตถุตรงกับค่าทั้งหมดของ i ค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่างของ Kendall คือ 1 แน่นอน ทางด้านขวาจะมี n-1 ตำแหน่งที่มีขนาดใหญ่ดังนั้นในทำนองเดียวกันเราสร้างอะไร แล้ว. และค่าสัมประสิทธิ์ของเคนดัลล์คือ:

หากมีความสัมพันธ์ผกผันอย่างสมบูรณ์ระหว่างลักษณะเชิงคุณภาพ X และ Y ในแง่ที่ว่าอันดับนั้นสอดคล้องกับอันดับ สัมประสิทธิ์สหสัมพันธ์ตัวอย่างของเคนดัลล์คือ -1 ทางด้านขวาไม่มียศใหญ่ดังนั้น เช่นเดียวกัน. แทนค่า R + = 0 ในสูตรสัมประสิทธิ์เคนดัลล์ เราได้ -1

ด้วยขนาดตัวอย่างที่ใหญ่เพียงพอและด้วยค่าสัมประสิทธิ์สหสัมพันธ์อันดับไม่ใกล้กับ 1 ความเท่าเทียมกันโดยประมาณจึงเกิดขึ้น:

สัมประสิทธิ์ของเคนดัลล์ให้ค่าประมาณความสัมพันธ์ที่อนุรักษ์นิยมมากกว่าสัมประสิทธิ์ของสเปียร์แมนหรือไม่ (ค่าตัวเลข? น้อยกว่าเสมอ) ขณะคำนวณสัมประสิทธิ์? ลำบากน้อยกว่าการคำนวณค่าสัมประสิทธิ์ ค่าหลังจะคำนวณใหม่ได้ง่ายกว่าถ้ามีการเพิ่มเทอมใหม่ในอนุกรม

ข้อได้เปรียบที่สำคัญของสัมประสิทธิ์คือสามารถใช้เพื่อกำหนดสัมประสิทธิ์สหสัมพันธ์อันดับบางส่วน ซึ่งทำให้สามารถประเมินระดับของการเชื่อมต่อระหว่างกัน "บริสุทธิ์" ของคุณสมบัติอันดับสองอันดับ ขจัดอิทธิพลของอันดับที่สาม:

ความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์อันดับ เมื่อพิจารณาความแรงของความสัมพันธ์ของอันดับตามข้อมูลตัวอย่าง จำเป็นต้องพิจารณาคำถามต่อไปนี้: ด้วยระดับของความน่าเชื่อถือใด ๆ ที่สามารถพึ่งพาข้อสรุปว่ามีความสัมพันธ์ในกลุ่มประชากรทั่วไปถ้าค่าสัมประสิทธิ์ตัวอย่างบางค่าของสหสัมพันธ์ของอันดับคือ ได้รับ กล่าวอีกนัยหนึ่ง ความสำคัญของความสัมพันธ์ของอันดับที่สังเกตได้ควรได้รับการตรวจสอบตามสมมติฐานที่ว่าการจัดอันดับทั้งสองที่อยู่ระหว่างการพิจารณามีความเป็นอิสระทางสถิติ

ด้วยขนาดตัวอย่างที่ค่อนข้างใหญ่ n ความสำคัญของสัมประสิทธิ์สหสัมพันธ์อันดับสามารถตรวจสอบได้โดยใช้ตารางการแจกแจงแบบปกติ (ตารางภาคผนวก 1) เพื่อทดสอบความสำคัญของค่าสัมประสิทธิ์สเปียร์แมน? (สำหรับ n> 20) คำนวณค่า

และเพื่อทดสอบความสำคัญของสัมประสิทธิ์เคนดัลล์? (สำหรับ n> 10) คำนวณค่า

โดยที่ S = R + - R-, n คือขนาดตัวอย่าง

ถัดไป ระดับนัยสำคัญ ถูกกำหนดแล้ว ค่าวิกฤตของ tcr (?, K) ถูกกำหนดจากตารางจุดวิกฤตของการแจกแจงของนักเรียนและค่าที่คำนวณได้หรือนำมาเปรียบเทียบกับค่านั้น จำนวนองศาอิสระจะถือว่า k = n-2 ถ้า หรือ> tcr แสดงว่าค่าหรือถือว่ามีนัยสำคัญ

ค่าสัมประสิทธิ์สหสัมพันธ์ของเฟชเนอร์

สุดท้าย เราควรพูดถึงค่าสัมประสิทธิ์ Fechner ซึ่งกำหนดระดับเบื้องต้นของความหนาแน่นของการเชื่อมต่อ ซึ่งแนะนำให้ใช้เพื่อสร้างความจริงของการเชื่อมต่อเมื่อมีข้อมูลเบื้องต้นจำนวนเล็กน้อย พื้นฐานสำหรับการคำนวณนั้นคำนึงถึงทิศทางของการเบี่ยงเบนจากค่าเฉลี่ยเลขคณิตของตัวแปรของชุดตัวแปรแต่ละชุด และการกำหนดความสอดคล้องของสัญญาณของการเบี่ยงเบนเหล่านี้สำหรับชุดข้อมูลสองชุด ซึ่งเป็นความสัมพันธ์ระหว่างชุดข้อมูลที่วัด

สัมประสิทธิ์นี้ถูกกำหนดโดยสูตร:

โดยที่ na คือจำนวนความบังเอิญของสัญญาณของการเบี่ยงเบนของค่าแต่ละค่าจากค่าเฉลี่ยเลขคณิต nb - จำนวนที่ไม่ตรงกันตามลำดับ

ค่าสัมประสิทธิ์ของ Fechner สามารถเปลี่ยนแปลงได้ระหว่าง -1.0<= Кф<= +1,0.

แง่มุมที่เกี่ยวข้องของอันดับสหสัมพันธ์ ดังที่ระบุไว้แล้ว ค่าสัมประสิทธิ์สหสัมพันธ์อันดับสามารถใช้ได้ไม่เพียงแต่สำหรับการวิเคราะห์เชิงคุณภาพของความสัมพันธ์ระหว่างคุณสมบัติอันดับสองรายการ แต่ยังใช้สำหรับกำหนดความแข็งแกร่งของความสัมพันธ์ระหว่างอันดับและคุณสมบัติเชิงปริมาณ ในกรณีนี้ ค่าของลักษณะเชิงปริมาณจะถูกจัดเรียงและอันดับที่สอดคล้องกันจะถูกกำหนดให้กับพวกมัน

มีหลายสถานการณ์ในการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์อันดับเมื่อพิจารณาความแข็งแกร่งของความสัมพันธ์ระหว่างคุณสมบัติเชิงปริมาณทั้งสอง ดังนั้น ด้วยความเบี่ยงเบนที่มีนัยสำคัญของการกระจายตัวของหนึ่งในนั้น (หรือทั้งสองอย่าง) จากการแจกแจงแบบปกติ การกำหนดระดับนัยสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ตัวอย่าง r จะไม่ถูกต้อง ในขณะที่ อันดับสัมประสิทธิ์? และ? ไม่อยู่ภายใต้ข้อจำกัดดังกล่าวเมื่อกำหนดระดับความสำคัญ

สถานการณ์ประเภทนี้อีกประการหนึ่งเกิดขึ้นเมื่อความสัมพันธ์ระหว่างคุณลักษณะเชิงปริมาณทั้งสองแบบไม่เป็นเชิงเส้น (แต่ซ้ำซากจำเจ) ถ้าจำนวนของวัตถุในกลุ่มตัวอย่างมีน้อยหรือถ้าสัญญาณของการเชื่อมต่อมีความสำคัญสำหรับผู้วิจัย แล้วการใช้อัตราส่วนสหสัมพันธ์? อาจไม่เพียงพอที่นี่ การคำนวณค่าสัมประสิทธิ์สหสัมพันธ์อันดับช่วยให้เราข้ามความยากที่ระบุได้

ภาคปฏิบัติ

ภารกิจที่ 1 การวิเคราะห์สหสัมพันธ์ - การถดถอย

คำชี้แจงและการจัดรูปแบบปัญหา:

ให้ตัวอย่างเชิงประจักษ์ซึ่งรวบรวมจากชุดการสังเกตสภาพของอุปกรณ์ (สำหรับความล้มเหลว) และจำนวนผลิตภัณฑ์ที่ผลิต ตัวอย่างแสดงลักษณะความสัมพันธ์ระหว่างจำนวนอุปกรณ์ที่ล้มเหลวและจำนวนรายการที่ผลิตขึ้นโดยปริยาย ตามความหมายของกลุ่มตัวอย่าง เป็นที่ชัดเจนว่าผลิตภัณฑ์ที่ผลิตขึ้นนั้นถูกผลิตขึ้นบนอุปกรณ์ที่ยังคงใช้งานอยู่ เนื่องจากอุปกรณ์ที่ล้มเหลวมากกว่า% ผลิตภัณฑ์ที่ผลิตก็จะน้อยลง จำเป็นต้องทำการศึกษาตัวอย่างสำหรับการพึ่งพาสหสัมพันธ์ - การถดถอย กล่าวคือ เพื่อสร้างรูปแบบของการพึ่งพา การประเมินฟังก์ชันการถดถอย (การวิเคราะห์การถดถอย) ตลอดจนระบุความสัมพันธ์ระหว่างตัวแปรสุ่มและประเมินความหนาแน่นของมัน (การวิเคราะห์สหสัมพันธ์). งานเพิ่มเติมของการวิเคราะห์สหสัมพันธ์คือการประมาณสมการถดถอยของตัวแปรหนึ่งสำหรับตัวแปรอื่น นอกจากนี้ จำเป็นต้องคาดการณ์จำนวนผลิตภัณฑ์ที่ผลิตขึ้นโดยที่อุปกรณ์ขัดข้อง 30%

ให้เรากำหนดตัวอย่างที่กำหนดในตารางโดยกำหนดข้อมูล "อุปกรณ์ล้มเหลว%" เป็น X ข้อมูล "จำนวนผลิตภัณฑ์" เป็น Y:

ข้อมูลเบื้องต้น ตารางที่ 1

ตามความหมายทางกายภาพของปัญหา จะเห็นได้ว่าจำนวนผลิตภัณฑ์ที่ผลิต Y ขึ้นอยู่กับ% ของความล้มเหลวของอุปกรณ์โดยตรง กล่าวคือ มีการพึ่งพา Y บน X เมื่อทำการวิเคราะห์การถดถอย จำเป็นต้อง หาความสัมพันธ์ทางคณิตศาสตร์ (การถดถอย) เชื่อมค่าของ X และ Y ในกรณีนี้ การวิเคราะห์การถดถอยใน ต่างจากสหสัมพันธ์ จะถือว่าค่า X ทำหน้าที่เป็นตัวแปรอิสระหรือตัวประกอบค่า Y - เป็น ขึ้นอยู่กับมันหรือสัญญาณที่มีประสิทธิภาพ ดังนั้นจึงจำเป็นต้องสังเคราะห์แบบจำลองทางเศรษฐศาสตร์และคณิตศาสตร์ที่เพียงพอ กล่าวคือ กำหนด (ค้นหา เลือก) ฟังก์ชัน Y = f (X) ซึ่งกำหนดลักษณะความสัมพันธ์ระหว่างค่าของ X และ Y โดยใช้ซึ่งจะสามารถทำนายค่าของ Y ที่ X = 30 ได้ ปัญหานี้สามารถ แก้ไขโดยใช้การวิเคราะห์สหสัมพันธ์-ถดถอย

ทบทวนสั้น ๆ เกี่ยวกับวิธีการแก้ปัญหาการถดถอยสหสัมพันธ์และเหตุผลสำหรับวิธีการแก้ปัญหาที่เลือก

วิธีวิเคราะห์การถดถอยแบ่งออกเป็นปัจจัยเดียวและหลายปัจจัยตามจำนวนปัจจัยที่ส่งผลต่อลักษณะที่มีประสิทธิภาพ ตัวแปรเดียว - จำนวนของปัจจัยอิสระ = 1 เช่น Y = F (X)

multifactorial - จำนวนปัจจัย> 1 เช่น

ตามจำนวนของตัวแปรตามที่ได้รับการตรวจสอบ (ตัวชี้วัดที่มีประสิทธิภาพ) ปัญหาการถดถอยสามารถแบ่งออกเป็นงานที่มีตัวบ่งชี้ที่มีประสิทธิภาพหนึ่งตัวหรือหลายตัว โดยทั่วไป งานที่มีคุณสมบัติที่มีประสิทธิภาพมากมายสามารถเขียนได้:

วิธีการวิเคราะห์สหสัมพันธ์ - การถดถอยประกอบด้วยการค้นหาพารามิเตอร์ของการพึ่งพาอาศัยกันโดยประมาณ (โดยประมาณ) ของแบบฟอร์ม

เนื่องจากตัวแปรอิสระเพียงตัวเดียวปรากฏในปัญหาที่กำหนด กล่าวคือ มีการตรวจสอบการพึ่งพาปัจจัยเดียวที่มีอิทธิพลต่อผลลัพธ์ จึงควรใช้การศึกษาสำหรับการพึ่งพาทางเดียว หรือการถดถอยคู่

หากมีเพียงปัจจัยเดียว การพึ่งพาอาศัยกันจะถูกกำหนดเป็น:

รูปแบบของการเขียนสมการถดถอยเฉพาะนั้นขึ้นอยู่กับการเลือกฟังก์ชันที่แสดงความสัมพันธ์ทางสถิติระหว่างปัจจัยและตัวบ่งชี้ผลลัพธ์ และรวมถึงสิ่งต่อไปนี้:

การถดถอยเชิงเส้น สมการของรูปแบบ

พาราโบลา สมการของรูปแบบ

ลูกบาศก์สมการของรูปแบบ

ไฮเพอร์โบลิก สมการของรูปแบบ

เซมิลอการิทึม สมการของรูปแบบ

เลขชี้กำลัง, สมการของรูปแบบ

กำลัง สมการของรูปแบบ

การหาฟังก์ชันจะลดลงเพื่อกำหนดพารามิเตอร์ของสมการถดถอยและประเมินความน่าเชื่อถือของสมการเอง ในการกำหนดพารามิเตอร์ คุณสามารถใช้ทั้งวิธีกำลังสองน้อยที่สุดและวิธีโมดูลัสน้อยที่สุด

ประการแรกคือผลรวมของกำลังสองของการเบี่ยงเบนของค่าเชิงประจักษ์ Yi จากค่าเฉลี่ยที่คำนวณได้ Yi มีค่าน้อยที่สุด

วิธีโมดูลัสน้อยที่สุดคือการลดผลรวมของโมดูลัสของความแตกต่างระหว่างค่าเชิงประจักษ์ Yi และค่าเฉลี่ยที่คำนวณได้ Yi

ในการแก้ปัญหา เราจะเลือกวิธีกำลังสองน้อยที่สุด เนื่องจากเป็นวิธีที่ง่ายที่สุดและให้ค่าประมาณที่ดีในแง่ของคุณสมบัติทางสถิติ

เทคโนโลยีในการแก้ปัญหาการวิเคราะห์การถดถอยโดยใช้วิธีกำลังสองน้อยที่สุด

เป็นไปได้ที่จะกำหนดประเภทของการพึ่งพา (เชิงเส้น, สมการกำลังสอง, ลูกบาศก์ ฯลฯ ) ระหว่างตัวแปรโดยการประเมินค่าเบี่ยงเบนของค่าจริงของ y จากค่าที่คำนวณได้:

โดยที่ - ค่าเชิงประจักษ์ - ค่าที่คำนวณโดยฟังก์ชันการประมาณ การประมาณค่าของ Si สำหรับฟังก์ชันต่างๆ และเลือกค่าที่น้อยที่สุด เราจะเลือกฟังก์ชันการประมาณ

ประเภทของฟังก์ชันถูกกำหนดโดยการหาสัมประสิทธิ์ที่พบในแต่ละฟังก์ชันเพื่อแก้ปัญหาของระบบสมการบางระบบ:

การถดถอยเชิงเส้น สมการของรูปแบบ ระบบ -

พาราโบลา, สมการของรูปแบบ, ระบบ -

ลูกบาศก์, สมการของรูปแบบ, ระบบ -

เมื่อแก้ไขระบบแล้ว เราพบว่าด้วยความช่วยเหลือของนิพจน์เฉพาะของฟังก์ชันการวิเคราะห์ ซึ่งเราพบค่าที่คำนวณได้ นอกจากนี้ยังมีข้อมูลทั้งหมดสำหรับการหาค่าประมาณของค่าเบี่ยงเบน S และวิเคราะห์ค่าต่ำสุด

สำหรับความสัมพันธ์เชิงเส้น เราประมาณความใกล้ชิดของความสัมพันธ์ระหว่างปัจจัย X และตัวบ่งชี้ที่มีประสิทธิผล Y ในรูปแบบของสัมประสิทธิ์สหสัมพันธ์ r:

ค่าเฉลี่ยของตัวบ่งชี้

ค่าตัวประกอบเฉลี่ย

y คือค่าทดลองของตัวบ่งชี้

x คือค่าทดลองของตัวประกอบ

ส่วนเบี่ยงเบนมาตรฐานใน x;

ส่วนเบี่ยงเบนมาตรฐานใน y

ถ้าค่าสัมประสิทธิ์สหสัมพันธ์ r = 0 แสดงว่าความสัมพันธ์ระหว่างคุณลักษณะไม่มีนัยสำคัญหรือขาดหายไป ถ้า r = 1 แสดงว่ามีความสัมพันธ์เชิงฟังก์ชันที่สูงมากระหว่างคุณลักษณะ

การใช้ตาราง Chaddock คุณสามารถประเมินความหนาแน่นของความสัมพันธ์ระหว่างสัญญาณในเชิงคุณภาพได้:

โต๊ะแชดด็อก ตารางที่ 2

สำหรับการพึ่งพาอาศัยกันแบบไม่เชิงเส้น จะกำหนดอัตราส่วนสหสัมพันธ์ (0 1) และดัชนีสหสัมพันธ์ R ซึ่งคำนวณจากการขึ้นต่อกันต่อไปนี้

โดยที่ value คือค่าของตัวบ่งชี้ที่คำนวณโดยการพึ่งพาการถดถอย

ในการประมาณความถูกต้องของการคำนวณ เราใช้ค่าของข้อผิดพลาดในการประมาณค่าสัมพัทธ์เฉลี่ย

ด้วยความแม่นยำสูงจึงอยู่ในช่วง 0-12%

ในการประเมินการเลือกการพึ่งพาฟังก์ชัน เราใช้สัมประสิทธิ์การกำหนด

ค่าสัมประสิทธิ์การกำหนดใช้เป็นตัววัด "ทั่วไป" ของคุณภาพของการเลือกแบบจำลองเชิงฟังก์ชัน เพราะมันแสดงอัตราส่วนระหว่างแฟกทอเรียลและความแปรปรวนรวม หรือจะแทนส่วนแบ่งของความแปรปรวนแฟกทอเรียลในผลรวม

ในการประเมินความสำคัญของดัชนีสหสัมพันธ์ R จะใช้การทดสอบ F ของฟิชเชอร์ มูลค่าที่แท้จริงของเกณฑ์ถูกกำหนดโดยสูตร:

โดยที่ m คือจำนวนพารามิเตอร์ของสมการถดถอย n คือจำนวนการสังเกต ค่าจะถูกเปรียบเทียบกับค่าวิกฤต ซึ่งกำหนดตามตารางเกณฑ์ F โดยคำนึงถึงระดับนัยสำคัญที่ยอมรับและจำนวนองศาอิสระและ ถ้าค่าของดัชนีความสัมพันธ์ R ถือว่ามีนัยสำคัญ

สำหรับรูปแบบการถดถอยที่เลือก ค่าสัมประสิทธิ์ของสมการถดถอยจะถูกคำนวณ เพื่อความสะดวก ผลการคำนวณจะรวมอยู่ในตารางของโครงสร้างต่อไปนี้ (โดยทั่วไป จำนวนคอลัมน์และลักษณะที่ปรากฏจะเปลี่ยนไปตามประเภทของการถดถอย):

ตารางที่ 3

การแก้ปัญหา

การสังเกตเกิดขึ้นจากปรากฏการณ์ทางเศรษฐกิจ - การพึ่งพาการปล่อยผลิตภัณฑ์ตามเปอร์เซ็นต์ของความล้มเหลวของอุปกรณ์ ได้รับชุดค่าแล้ว

ค่าที่เลือกได้อธิบายไว้ในตารางที่ 1

เราสร้างกราฟของการพึ่งพาเชิงประจักษ์สำหรับตัวอย่างที่กำหนด (รูปที่ 1)

ตามประเภทของกราฟ เราพิจารณาว่าการพึ่งพาเชิงวิเคราะห์สามารถแสดงเป็นฟังก์ชันเชิงเส้นได้:

มาคำนวณค่าสัมประสิทธิ์สหสัมพันธ์แบบคู่เพื่อประเมินความสัมพันธ์ระหว่าง X และ Y:

มาสร้างตารางเสริมกัน:

ตารางที่ 4

เราแก้ระบบสมการเพื่อหาสัมประสิทธิ์และ:

จากสมการแรกแทนค่า

ในสมการที่สอง เราได้:

เราพบว่า

เราได้รูปแบบของสมการถดถอย:

9. ในการประเมินความหนาแน่นของความสัมพันธ์ที่พบ เราใช้ค่าสัมประสิทธิ์สหสัมพันธ์ r:

จากตาราง Chaddock เราพบว่าสำหรับ r = 0.90 ความสัมพันธ์ระหว่าง X และ Y นั้นสูงมาก ดังนั้น ความน่าเชื่อถือของสมการถดถอยก็สูงเช่นกัน ในการประมาณความถูกต้องของการคำนวณ เราใช้ค่าของข้อผิดพลาดในการประมาณค่าสัมพัทธ์โดยเฉลี่ย:

เราเชื่อว่าค่านี้ให้ความน่าเชื่อถือในระดับสูงของสมการถดถอย

สำหรับความสัมพันธ์เชิงเส้นตรงระหว่าง X และ Y ดัชนีการกำหนดจะเท่ากับกำลังสองของสัมประสิทธิ์สหสัมพันธ์ r: ดังนั้น 81% ของรูปแบบทั้งหมดจะอธิบายโดยการเปลี่ยนแปลงแอตทริบิวต์ปัจจัย X

ในการประเมินความสำคัญของดัชนีสหสัมพันธ์ R ซึ่งในกรณีของการพึ่งพาอาศัยเชิงเส้นมีค่าเท่ากับค่าสัมบูรณ์กับสัมประสิทธิ์สหสัมพันธ์ r จะใช้การทดสอบ F ของฟิชเชอร์ เรากำหนดค่าจริงโดยใช้สูตร:

โดยที่ m คือจำนวนพารามิเตอร์ของสมการถดถอย n คือจำนวนการสังเกต นั่นคือ n = 5, m = 2

โดยคำนึงถึงระดับนัยสำคัญที่ยอมรับ = 0.05 และจำนวนองศาอิสระ เราได้รับค่าตารางวิกฤต เนื่องจากค่าของดัชนีสหสัมพันธ์ R ถือเป็นค่าที่มีนัยสำคัญ

มาคำนวณค่าที่คาดการณ์ Y ที่ X = 30:

มาสร้างกราฟของฟังก์ชันที่พบกันเถอะ:

11. กำหนดข้อผิดพลาดของสัมประสิทธิ์สหสัมพันธ์ด้วยค่าเบี่ยงเบนมาตรฐาน

แล้วเราก็กำหนดค่าของการเบี่ยงเบนมาตรฐาน

จากอัตราส่วน> 2 ที่มีความน่าจะเป็น 95% เราสามารถพูดถึงความสำคัญของค่าสัมประสิทธิ์สหสัมพันธ์ที่ได้รับ

ปัญหาที่ 2 การเพิ่มประสิทธิภาพเชิงเส้น

ตัวเลือกที่ 1.

แผนพัฒนาของภูมิภาคนี้คาดว่าจะนำเข้าแหล่งน้ำมัน 3 แห่ง โดยมีปริมาณการผลิตรวม 9 ล้านตัน ที่สนามแรก ปริมาณการผลิตอย่างน้อย 1 ล้านตัน ที่สอง - 3 ล้านตัน ที่สาม - 5 ล้านตัน เพื่อให้ได้ผลผลิตนี้ จำเป็นต้องเจาะอย่างน้อย 125 หลุม สำหรับการดำเนินการตามแผนนี้มีการจัดสรร 25 ล้านรูเบิล เงินลงทุน (ตัวบ่งชี้ K) และท่อ 80 กม. (ตัวบ่งชี้ L)

จำเป็นต้องกำหนดจำนวนหลุมที่เหมาะสมที่สุด (สูงสุด) เพื่อให้แน่ใจว่าได้ผลผลิตตามแผนของแต่ละฟิลด์ ข้อมูลเริ่มต้นเกี่ยวกับงานจะได้รับในตาราง

ข้อมูลเบื้องต้น

คำชี้แจงปัญหาได้รับข้างต้น

ให้เรากำหนดเงื่อนไขและข้อจำกัดที่กำหนดไว้ในปัญหาให้เป็นทางการ เป้าหมายของการแก้ปัญหาการปรับให้เหมาะสมนี้คือการหามูลค่าสูงสุดของการผลิตน้ำมันด้วยจำนวนหลุมที่เหมาะสมที่สุดสำหรับแต่ละแหล่ง โดยคำนึงถึงข้อจำกัดที่มีอยู่ของปัญหา

ฟังก์ชั่นวัตถุประสงค์ตามข้อกำหนดของงานจะอยู่ในรูปแบบ:

จำนวนบ่อของแต่ละสนามคือที่ไหน

ข้อจำกัดที่มีอยู่ในงานสำหรับ:

วางท่อความยาว:

จำนวนหลุมในแต่ละสนาม:

ค่าก่อสร้าง 1 หลุม:

ปัญหาการปรับให้เหมาะสมเชิงเส้นได้รับการแก้ไข ตัวอย่างเช่น โดยวิธีการต่อไปนี้:

กราฟิก

วิธีซิมเพล็กซ์

การใช้วิธีการแบบกราฟิกจะสะดวกก็ต่อเมื่อแก้ปัญหาการปรับให้เหมาะสมเชิงเส้นด้วยตัวแปรสองตัวเท่านั้น ด้วยตัวแปรจำนวนมาก จึงจำเป็นต้องใช้เครื่องมือเกี่ยวกับพีชคณิต พิจารณาวิธีทั่วไปในการแก้ปัญหาการหาค่าเหมาะสมเชิงเส้นที่เรียกว่าวิธีซิมเพล็กซ์

วิธีแบบซิมเพล็กซ์เป็นตัวอย่างทั่วไปของการคำนวณแบบวนซ้ำที่ใช้ในการแก้ปัญหาการปรับให้เหมาะสมส่วนใหญ่ มีการพิจารณาขั้นตอนการทำซ้ำในลักษณะนี้ ซึ่งช่วยให้แน่ใจในการแก้ปัญหาด้วยความช่วยเหลือของแบบจำลองการวิจัยการปฏิบัติงาน

ในการแก้ปัญหาการหาค่าที่เหมาะสมที่สุดโดยใช้วิธีซิมเพล็กซ์ จำเป็นต้องให้จำนวนไม่ทราบค่า Xi มากกว่าจำนวนสมการ กล่าวคือ ระบบสมการ

ตอบสนองความสัมพันธ์ m

A = เท่ากับ m

ให้เราแสดงคอลัมน์ของเมทริกซ์ A เป็น และคอลัมน์ของเทอมอิสระเป็น

โซลูชันพื้นฐานของระบบ (1) คือชุดของ m ที่ไม่รู้จักซึ่งเป็นวิธีแก้ปัญหาของระบบ (1)

อัลกอริทึมของวิธีซิมเพล็กซ์มีคำอธิบายสั้น ๆ ดังนี้:

ข้อจำกัดเดิมที่เขียนเป็นความไม่เท่าเทียมกันเช่น<= (=>) สามารถแสดงเป็นความเท่าเทียมกันได้โดยการเพิ่มตัวแปรที่เหลือทางด้านซ้ายของข้อจำกัด (ลบตัวแปรซ้ำซ้อนออกจากด้านซ้าย)

ตัวอย่างเช่น ทางด้านซ้ายของข้อจำกัดเดิม

มีการแนะนำตัวแปรที่เหลือซึ่งเป็นผลมาจากความไม่เท่าเทียมกันดั้งเดิมกลายเป็นความเท่าเทียมกัน

หากข้อจำกัดเดิมกำหนดอัตราการไหลของไปป์ ตัวแปรควรถูกตีความว่าเป็นส่วนที่เหลือ หรือส่วนที่ไม่ได้ใช้ของทรัพยากรนี้

การเพิ่มฟังก์ชันวัตถุประสงค์ให้สูงสุดจะเท่ากับการลดฟังก์ชันเดียวกันกับเครื่องหมายตรงข้าม นั่นคือในกรณีของเรา

เทียบเท่ากับ

ตารางซิมเพล็กซ์ถูกคอมไพล์สำหรับโซลูชันพื้นฐานของแบบฟอร์มต่อไปนี้:

ในตารางนี้ระบุว่าหลังจากแก้ปัญหาแล้ว วิธีแก้ปัญหาพื้นฐานจะอยู่ในเซลล์เหล่านี้ - ผลหารจากการแบ่งคอลัมน์ด้วยคอลัมน์ใดคอลัมน์หนึ่ง - ตัวคูณเพิ่มเติมสำหรับการทำให้ค่าเป็นศูนย์ในเซลล์ของตารางที่เกี่ยวข้องกับคอลัมน์การแก้ไข - ค่าต่ำสุดของฟังก์ชันวัตถุประสงค์ -Z, - ค่าของสัมประสิทธิ์ในฟังก์ชันวัตถุประสงค์ที่ไม่ทราบค่า

ค่าบวกใด ๆ ที่พบในความหมาย หากไม่เป็นเช่นนั้นแสดงว่าปัญหาได้รับการแก้ไขแล้ว คอลัมน์ใดๆ ของตารางที่อยู่ในตารางถูกเลือก คอลัมน์นี้เรียกว่าคอลัมน์ "อนุญาต" หากไม่มีจำนวนบวกในองค์ประกอบของคอลัมน์การแก้ปัญหา แสดงว่าปัญหานั้นแก้ไม่ได้เนื่องจากความไร้ขอบเขตของฟังก์ชันวัตถุประสงค์ในชุดคำตอบ หากมีตัวเลขบวกอยู่ในคอลัมน์การแก้ ให้ไปที่ขั้นตอนที่ 5

คอลัมน์เต็มไปด้วยเศษส่วนในตัวเศษซึ่งเป็นองค์ประกอบของคอลัมน์และในตัวส่วน - องค์ประกอบที่สอดคล้องกันของคอลัมน์แก้ไข เลือกค่าที่น้อยที่สุดของทั้งหมด บรรทัดที่มีผลลัพธ์น้อยที่สุดเรียกว่าบรรทัด "เปิดใช้งาน" ที่จุดตัดของเส้นที่แก้ไขและคอลัมน์ที่แก้ไข จะพบองค์ประกอบการแก้ไข ซึ่งถูกเน้นในลักษณะใดลักษณะหนึ่ง เช่น ด้วยสี

ตามตารางซิมเพล็กซ์แรก คอมไพล์ต่อไปนี้:

แทนที่เวกเตอร์แถวด้วยเวกเตอร์คอลัมน์

เส้นอนุญาตถูกแทนที่ด้วยเส้นเดียวกันหารด้วยองค์ประกอบอนุญาต

แถวอื่นๆ ของตารางแต่ละแถวจะถูกแทนที่ด้วยผลรวมของแถวนี้กับแถวที่แก้ไข คูณด้วยปัจจัยเพิ่มเติมที่เลือกมาเป็นพิเศษเพื่อให้ได้ 0 ในเซลล์ของคอลัมน์ที่แก้ไข

ด้วยตารางใหม่ เราหันไปที่จุดที่ 4

การแก้ปัญหา

จากการกำหนดปัญหา เรามีระบบความไม่เท่าเทียมกันดังต่อไปนี้:

และหน้าที่วัตถุประสงค์

เราแปลงระบบความไม่เท่าเทียมกันเป็นระบบสมการโดยการเพิ่มตัวแปรเพิ่มเติม:

ให้เราลดฟังก์ชันวัตถุประสงค์ให้เทียบเท่ากัน:

มาสร้างตารางซิมเพล็กซ์ดั้งเดิมกันเถอะ:

มาเลือกคอลัมน์อนุญาตกันเถอะ มาคำนวณคอลัมน์กัน:

เราป้อนค่าลงในตาราง สำหรับค่าที่เล็กที่สุด = 10 เราจะกำหนดเส้นแก้ไข: ที่จุดตัดของเส้นที่แก้ไขและคอลัมน์ที่แก้ไข เราพบองค์ประกอบการแก้ไข = 1 เราเติมส่วนต่าง ๆ ของตารางด้วยปัจจัยเพิ่มเติม เช่น แถวที่แก้ไขคูณด้วยพวกมัน บวกกับแถวที่เหลือของตาราง รูปแบบ 0 ในองค์ประกอบของคอลัมน์แก้ไข

เราเขียนตารางซิมเพล็กซ์ที่สอง:

เรานำคอลัมน์การแก้ไขมาคำนวณค่าแล้วป้อนลงในตาราง โดยขั้นต่ำ เราได้รับเส้นแก้ไข องค์ประกอบการแก้ไขจะเป็น 1 ค้นหาปัจจัยเพิ่มเติม กรอกข้อมูลในคอลัมน์

เราสร้างตารางซิมเพล็กซ์ต่อไปนี้:

ในทำนองเดียวกัน เราพบคอลัมน์การแก้ไข การแก้ไขแถว และการแก้ไของค์ประกอบ = 2 เราสร้างตารางด้านเดียวต่อไปนี้:

เนื่องจากไม่มีค่าบวกในบรรทัด -Z ตารางนี้จึงมีขอบเขตจำกัด คอลัมน์แรกให้ค่าที่ต้องการของสิ่งที่ไม่รู้จักเช่น โซลูชันพื้นฐานที่เหมาะสมที่สุด:

ในกรณีนี้ ค่าของฟังก์ชันวัตถุประสงค์คือ -Z = -8000 ซึ่งเทียบเท่ากับ Zmax = 8000 ปัญหาได้รับการแก้ไขแล้ว

ภารกิจที่ 3 การวิเคราะห์คลัสเตอร์

การกำหนดปัญหา:

แยกวัตถุตามข้อมูลที่ระบุในตาราง การเลือกวิธีการแก้ปัญหาจะต้องดำเนินการอย่างอิสระเพื่อสร้างกราฟของการพึ่งพาข้อมูล

ตัวเลือกที่ 1.

ข้อมูลเบื้องต้น

ทบทวนวิธีการแก้ไขปัญหาประเภทที่ระบุ เหตุผลของวิธีการแก้ปัญหา

งานวิเคราะห์คลัสเตอร์ได้รับการแก้ไขโดยใช้วิธีการต่อไปนี้:

วิธีการจัดกลุ่มแบบยูเนี่ยนหรือแบบต้นไม้ใช้เพื่อสร้างกลุ่มของ "ความแตกต่าง" หรือ "ระยะห่างระหว่างวัตถุ" ระยะทางเหล่านี้สามารถกำหนดได้ในพื้นที่หนึ่งมิติหรือหลายมิติ

ใช้การรวมแบบสองทาง (ค่อนข้างน้อย) ในสถานการณ์ที่ข้อมูลไม่ถูกตีความในแง่ของ "วัตถุ" และ "คุณสมบัติของวัตถุ" แต่ในแง่ของการสังเกตและตัวแปร คาดว่าทั้งการสังเกตและตัวแปรจะมีส่วนช่วยในการตรวจหากลุ่มที่มีความหมายพร้อมกัน

วิธี K หมายถึง ใช้เมื่อมีสมมติฐานเกี่ยวกับจำนวนคลัสเตอร์อยู่แล้ว คุณสามารถบอกให้ระบบสร้างกลุ่มได้อย่างแม่นยำ ตัวอย่างเช่น สามคลัสเตอร์ เพื่อให้แตกต่างกันมากที่สุด โดยทั่วไป วิธี K-mean จะสร้างกระจุกตัว K ที่แตกต่างกันอย่างชัดเจน โดยอยู่ห่างจากกันและกันมากที่สุดเท่าที่จะเป็นไปได้

มีวิธีต่อไปนี้ในการวัดระยะทาง:

ระยะทางแบบยุคลิด นี่เป็นประเภทระยะทางที่พบบ่อยที่สุด มันเป็นเพียงระยะทางเรขาคณิตในปริภูมิหลายมิติและคำนวณได้ดังนี้:

โปรดทราบว่าระยะทางแบบยุคลิด (และกำลังสอง) คำนวณจากข้อมูลเดิม ไม่ใช่ข้อมูลมาตรฐาน

ระยะทางบล็อกเมือง (ระยะทางแมนฮัตตัน) ระยะทางนี้เป็นเพียงค่าเฉลี่ยของความแตกต่างของพิกัด ในกรณีส่วนใหญ่ การวัดระยะทางนี้นำไปสู่ผลลัพธ์เดียวกันกับระยะทางแบบยุคลิดธรรมดา อย่างไรก็ตาม โปรดทราบว่าสำหรับการวัดนี้ ผลกระทบของความแตกต่างขนาดใหญ่แต่ละรายการ (ค่าผิดปกติ) จะลดลง (เนื่องจากไม่ได้ยกกำลังสอง) ระยะทางแมนฮัตตันคำนวณโดยใช้สูตร:

ระยะทางของ Chebyshev ระยะนี้จะมีประโยชน์เมื่อคุณต้องการกำหนดวัตถุสองชิ้นเป็น "ต่างกัน" หากวัตถุทั้งสองต่างกันในพิกัดเดียว (มิติใดมิติหนึ่ง) ระยะทาง Chebyshev คำนวณโดยสูตร:

ระยะทางพลังงาน บางครั้งเราต้องการที่จะเพิ่มหรือลดน้ำหนักอย่างค่อยเป็นค่อยไปที่เกี่ยวข้องกับมิติที่วัตถุที่เกี่ยวข้องกันนั้นแตกต่างกันมาก สามารถทำได้โดยใช้ระยะห่างของกฎกำลัง ระยะทางกำลังคำนวณโดยสูตร:

โดยที่ r และ p เป็นพารามิเตอร์ที่ผู้ใช้กำหนด ตัวอย่างการคำนวณบางส่วนสามารถแสดงให้เห็นว่าการวัดนี้ "ทำงาน" อย่างไร พารามิเตอร์ p รับผิดชอบการถ่วงน้ำหนักทีละน้อยของความแตกต่างในแต่ละพิกัด พารามิเตอร์ r รับผิดชอบสำหรับการถ่วงน้ำหนักแบบก้าวหน้าของระยะห่างขนาดใหญ่ระหว่างวัตถุ หากพารามิเตอร์ทั้งสอง - r และ p มีค่าเท่ากับสอง แสดงว่าระยะนี้ตรงกับระยะทางแบบยุคลิด

เปอร์เซ็นต์ที่ไม่เห็นด้วย การวัดนี้ใช้เมื่อข้อมูลถูกจัดหมวดหมู่ ระยะทางนี้คำนวณโดยสูตร:

ในการแก้ปัญหา เราจะเลือกวิธีการรวมกัน (การจัดกลุ่มแบบต้นไม้) เป็นวิธีที่ตรงตามเงื่อนไขและการกำหนดปัญหาได้ดีที่สุด (เพื่อแยกวัตถุ) ในทางกลับกัน วิธีสหภาพสามารถใช้กฎการสื่อสารได้หลายแบบ:

ลิงค์เดียว (วิธีเพื่อนบ้านที่ใกล้ที่สุด) ในวิธีนี้ ระยะห่างระหว่างสองกระจุกจะถูกกำหนดโดยระยะห่างระหว่างวัตถุที่อยู่ใกล้ที่สุดทั้งสอง (เพื่อนบ้านที่ใกล้ที่สุด) ในกลุ่มที่ต่างกัน นั่นคือ วัตถุสองชิ้นในสองคลัสเตอร์จะอยู่ใกล้กันมากกว่าระยะห่างของลิงก์ที่สอดคล้องกัน ในแง่หนึ่งกฎนี้ควรรวมวัตถุสตริงเข้าด้วยกันเพื่อสร้างคลัสเตอร์ และคลัสเตอร์ที่เป็นผลลัพธ์มักจะเป็น "โซ่" ที่ยาว

การสื่อสารเต็มรูปแบบ (วิธีการของเพื่อนบ้านที่อยู่ห่างไกลที่สุด) ในวิธีนี้ ระยะห่างระหว่างกระจุกจะถูกกำหนดโดยระยะห่างที่ใหญ่ที่สุดระหว่างสองคุณลักษณะในกระจุกที่ต่างกัน (กล่าวคือ "เพื่อนบ้านที่อยู่ไกลที่สุด")

นอกจากนี้ยังมีวิธีการจัดกลุ่มอื่นๆ อีกมากมาย เช่น การจับคู่แบบไม่ถ่วงน้ำหนัก การจับคู่แบบถ่วงน้ำหนัก เป็นต้น

เทคโนโลยีวิธีการแก้ปัญหา การคำนวณตัวชี้วัด

ในขั้นตอนแรก เมื่อแต่ละวัตถุเป็นกระจุกที่แยกจากกัน ระยะห่างระหว่างวัตถุเหล่านี้จะถูกกำหนดโดยการวัดที่เลือก

เนื่องจากงานไม่ได้ระบุหน่วยวัดสำหรับคุณสมบัติ จึงถือว่าเหมือนกัน ดังนั้นจึงไม่จำเป็นต้องทำให้ข้อมูลเริ่มต้นเป็นปกติ ดังนั้นเราจึงดำเนินการคำนวณเมทริกซ์ระยะทางทันที

การแก้ปัญหา

มาสร้างกราฟการพึ่งพากันตามข้อมูลเบื้องต้นกัน (รูปที่ 2)

เราจะใช้ระยะทางแบบยุคลิดปกติเป็นระยะห่างระหว่างวัตถุ จากนั้นตามสูตร:

ที่ไหน ล. - สัญญาณ; k คือจำนวนคุณสมบัติ ระยะห่างระหว่างวัตถุ 1 และ 2 เท่ากับ:

เราคำนวณระยะทางที่เหลือต่อไป:

มาสร้างตารางจากค่าที่ได้รับกันเถอะ:

ระยะทางที่เล็กที่สุด ซึ่งหมายความว่าเรารวมองค์ประกอบ 3,6 และ 5 เข้าเป็นคลัสเตอร์เดียว เราได้รับตารางต่อไปนี้:

ระยะทางที่เล็กที่สุด องค์ประกอบ 3, 6, 5 และ 4 รวมกันเป็นหนึ่งคลัสเตอร์ เราได้รับตารางของสองคลัสเตอร์:

ระยะห่างขั้นต่ำระหว่างข้อ 3 ถึง 6 คือ ซึ่งหมายความว่าองค์ประกอบ 3 และ 6 จะรวมกันเป็นหนึ่งคลัสเตอร์ เราเลือกระยะห่างสูงสุดระหว่างคลัสเตอร์ที่สร้างขึ้นใหม่กับองค์ประกอบที่เหลือ ตัวอย่างเช่น ระยะห่างระหว่างคลัสเตอร์ 1 และคลัสเตอร์ 3.6 คือสูงสุด (13.34166, 13.60147) = 13.34166 มาเขียนตารางต่อไปนี้กัน:

ในนั้น ระยะทางต่ำสุดคือระยะห่างระหว่างคลัสเตอร์ 1 และ 2 เมื่อรวม 1 และ 2 เข้าเป็นคลัสเตอร์เดียว เราจะได้:

ดังนั้นโดยใช้วิธี "เพื่อนบ้านไกล" จะได้รับสองกลุ่ม: 1,2 และ 3,4,5,6 ระยะห่างระหว่างซึ่งเท่ากับ 13.60147

ปัญหาได้รับการแก้ไขแล้ว

แอพพลิเคชั่น การแก้ปัญหาโดยใช้แพ็คเกจซอฟต์แวร์ (MS Excel 7.0)

ปัญหาการวิเคราะห์สหสัมพันธ์และการถดถอย

เราป้อนข้อมูลเริ่มต้นลงในตาราง (รูปที่ 1)

เลือกเมนู "บริการ / การวิเคราะห์ข้อมูล" ในหน้าต่างที่ปรากฏขึ้น เลือกบรรทัด "การถดถอย" (รูปที่ 2)

มาตั้งค่าช่วงอินพุตสำหรับ X และ Y ในหน้าต่างถัดไป ระดับความน่าเชื่อถือจะอยู่ที่ 95% และข้อมูลเอาต์พุตจะถูกวางบนแผ่นงานแยกต่างหาก "แผ่นรายงาน" (รูปที่ 3)

หลังจากการคำนวณ เราได้รับข้อมูลการวิเคราะห์การถดถอยขั้นสุดท้ายในแผ่นงาน "รายงาน":

นอกจากนี้ยังแสดงพล็อตจุดของฟังก์ชันการประมาณ หรือ "กราฟการเลือก":


ค่าที่คำนวณได้และการเบี่ยงเบนจะแสดงในตารางในคอลัมน์ "Predicted Y" และ "Balance" ตามลำดับ

ตามข้อมูลเริ่มต้นและการเบี่ยงเบน กราฟที่เหลือจะถูกพล็อต:

งานเพิ่มประสิทธิภาพ


เราป้อนข้อมูลเริ่มต้นดังนี้:

X1, X2, X3 ที่ไม่รู้จักถูกป้อนลงในเซลล์ C9, D9, E9 ตามลำดับ

ค่าสัมประสิทธิ์ฟังก์ชันวัตถุประสงค์สำหรับ X1, X2, X3 ถูกป้อนลงใน C7, D7, E7 ตามลำดับ

ป้อนฟังก์ชันวัตถุประสงค์ลงในเซลล์ B11 ตามสูตร: = C7 * C9 + D7 * D9 + E7 * E9

ข้อจำกัดของงานที่มีอยู่

สำหรับความยาวของการวางท่อ:

เราเพิ่มในเซลล์ C5, D5, E5, F5, G5

จำนวนหลุมในแต่ละสนาม:

X3 Ј 100; เราเพิ่มในเซลล์ C8, D8, E8

ต้นทุนการก่อสร้าง 1 หลุม:

เราเพิ่มในเซลล์ C6, D6, E6, F6, G6

สูตรคำนวณความยาวรวม C5 * C9 + D5 * D9 + E5 * E9 อยู่ในเซลล์ B5 สูตรสำหรับคำนวณต้นทุนรวม C6 * C9 + D6 * D9 + E6 * E9 อยู่ในเซลล์ B6


เราเลือกในเมนู "บริการ / ค้นหาวิธีแก้ปัญหา" ป้อนพารามิเตอร์เพื่อค้นหาวิธีแก้ปัญหาตามข้อมูลเริ่มต้นที่ป้อน (รูปที่ 4):

ใช้ปุ่ม "พารามิเตอร์" ตั้งค่าพารามิเตอร์ต่อไปนี้เพื่อค้นหาวิธีแก้ปัญหา (รูปที่ 5):


หลังจากค้นหาวิธีแก้ปัญหา เราได้รับรายงานเกี่ยวกับผลลัพธ์:

รายงานผล Microsoft Excel 8.0e

สร้างรายงาน: 11/17/2002 01:28:30 น.

เซลล์เป้าหมาย (สูงสุด)

ผลลัพธ์

ปล้นทั้งหมด

เซลล์ที่ปรับเปลี่ยนได้

ผลลัพธ์

จำนวนบ่อน้ำ

จำนวนบ่อน้ำ

จำนวนบ่อน้ำ

ข้อ จำกัด

ความหมาย

ความยาว

ที่เกี่ยวข้อง

ต้นทุนโครงการ

ไม่เกี่ยวข้อง.

จำนวนบ่อน้ำ

ไม่เกี่ยวข้อง.

จำนวนบ่อน้ำ

ที่เกี่ยวข้อง

จำนวนบ่อน้ำ

ที่เกี่ยวข้อง

ตารางแรกแสดงค่าเริ่มต้นและค่าสุดท้าย (เหมาะสมที่สุด) ของเซลล์เป้าหมาย โดยวางฟังก์ชันวัตถุประสงค์ของปัญหาที่กำลังแก้ไข ในตารางที่สอง เราจะเห็นค่าเริ่มต้นและค่าสุดท้ายของตัวแปรที่จะปรับให้เหมาะสม ซึ่งมีอยู่ในเซลล์ที่แก้ไข ตารางที่สามของรายงานผลลัพธ์ประกอบด้วยข้อมูลเกี่ยวกับข้อจำกัด คอลัมน์ "ค่า" มีค่าที่เหมาะสมที่สุดของทรัพยากรที่จำเป็นและตัวแปรที่จะปรับให้เหมาะสม คอลัมน์ "สูตร" มีการจำกัดการใช้ทรัพยากรและตัวแปรที่ใช้ไปเพื่อเพิ่มประสิทธิภาพ โดยเขียนในรูปแบบของการอ้างอิงไปยังเซลล์ที่มีข้อมูลนี้ คอลัมน์ "สถานะ" กำหนดว่าข้อจำกัดเหล่านี้หรือข้อจำกัดเหล่านั้นเกี่ยวข้องหรือไม่เกี่ยวข้องกัน ที่นี่ "ถูกผูกมัด" เป็นข้อจำกัดที่นำมาใช้ในโซลูชันที่เหมาะสมที่สุดในรูปแบบของความเท่าเทียมกันที่เข้มงวด คอลัมน์ "ความแตกต่าง" สำหรับข้อจำกัดของทรัพยากรกำหนดส่วนที่เหลือของทรัพยากรที่ใช้ เช่น ความแตกต่างระหว่างจำนวนทรัพยากรที่ต้องการและความพร้อมใช้งาน

ในทำนองเดียวกัน เมื่อเขียนผลลัพธ์ของการค้นหาโซลูชันในแบบฟอร์ม "รายงานความยั่งยืน" เราจะได้รับตารางต่อไปนี้:

รายงานความยืดหยุ่นของ Microsoft Excel 8.0e

แผ่นงาน: [การแก้ปัญหาการปรับให้เหมาะสมที่สุด.xls] วิธีแก้ไขปัญหาการปรับให้เหมาะสม

สร้างรายงานเมื่อ: 11/17/2002 1:35:16 AM

เซลล์ที่ปรับเปลี่ยนได้

อนุญาตให้ทำได้

อนุญาตให้ทำได้

ความหมาย

ราคา

ค่าสัมประสิทธิ์

เพิ่มขึ้น

ลด

จำนวนบ่อน้ำ

จำนวนบ่อน้ำ

จำนวนบ่อน้ำ

ข้อ จำกัด

ข้อจำกัด

อนุญาตให้ทำได้

อนุญาตให้ทำได้

ความหมาย

ส่วนขวา

เพิ่มขึ้น

ลด

ความยาว

ต้นทุนโครงการ

รายงานความยั่งยืนประกอบด้วยข้อมูลเกี่ยวกับตัวแปรที่ปรับเปลี่ยนได้ (ปรับให้เหมาะสม) และข้อจำกัดของแบบจำลอง ข้อมูลนี้เกี่ยวข้องกับวิธีการแบบซิมเพล็กซ์ที่ใช้ในการเพิ่มประสิทธิภาพของปัญหาเชิงเส้นที่อธิบายไว้ข้างต้นในแง่ของการแก้ปัญหา ช่วยให้คุณประเมินว่าโซลูชันที่เหมาะสมที่ได้รับนั้นมีความละเอียดอ่อนเพียงใดต่อการเปลี่ยนแปลงที่เป็นไปได้ในพารามิเตอร์ของแบบจำลอง

ส่วนแรกของรายงานมีข้อมูลเกี่ยวกับเซลล์ที่แก้ไขซึ่งมีค่าเกี่ยวกับจำนวนหลุมในฟิลด์ คอลัมน์ "ค่าผลลัพธ์" ระบุค่าที่เหมาะสมที่สุดของตัวแปรที่จะปรับให้เหมาะสม คอลัมน์ "ค่าสัมประสิทธิ์เป้าหมาย" มีข้อมูลเริ่มต้นของค่าสัมประสิทธิ์ของฟังก์ชันวัตถุประสงค์ สองคอลัมน์ถัดไปแสดงการเพิ่มขึ้นและลดลงของสัมประสิทธิ์ที่อนุญาตโดยไม่ต้องเปลี่ยนวิธีแก้ปัญหาที่เหมาะสมที่สุดที่พบ

ส่วนที่สองของรายงานความยั่งยืนประกอบด้วยข้อมูลเกี่ยวกับข้อจำกัดที่กำหนดเกี่ยวกับตัวแปรที่ได้รับการปรับให้เหมาะสม คอลัมน์แรกแสดงความต้องการทรัพยากรสำหรับโซลูชันที่เหมาะสมที่สุด ส่วนที่สองมีค่าของราคาเงาสำหรับประเภทของทรัพยากรที่ใช้ สองคอลัมน์สุดท้ายมีข้อมูลเกี่ยวกับการเพิ่มขึ้นหรือลดลงของทรัพยากรที่มีอยู่

ปัญหาการจัดกลุ่ม

วิธีการทีละขั้นตอนในการแก้ปัญหาได้รับข้างต้น ตาราง Excel ที่แสดงความคืบหน้าในการแก้ปัญหามีดังนี้

วิธีเพื่อนบ้านที่ใกล้ที่สุด

การแก้ปัญหาของการวิเคราะห์คลัสเตอร์ - "วิธีใกล้เคียง"

ข้อมูลเบื้องต้น

โดยที่ x1 คือปริมาณของผลิตภัณฑ์ที่ผลิต

x2 - ต้นทุนเฉลี่ยต่อปีของ main

สินทรัพย์การผลิตเชิงอุตสาหกรรม

วิธีเพื่อนบ้านไกล

การแก้ปัญหาการวิเคราะห์คลัสเตอร์ - "DISTANCE NEIGHBOR METHOD"

ข้อมูลเบื้องต้น

โดยที่ x1 คือปริมาณของผลิตภัณฑ์ที่ผลิต

x2 - ต้นทุนเฉลี่ยต่อปีของ main

สินทรัพย์การผลิตเชิงอุตสาหกรรม