คอมพิวเตอร์ หน้าต่าง อินเทอร์เน็ต

ผลกระทบของความจุหน่วยความจำแคชต่อประสิทธิภาพของ Core i5 รุ่นที่สาม แคชโปรเซสเซอร์ส่งผลต่อ L1 L2 L3 อย่างไร เป็นไปได้หรือไม่ที่จะเพิ่มหน่วยความจำแคชของโปรเซสเซอร์

แคช L3 สำหรับโปรเซสเซอร์ AMD มีความสำคัญเพียงใด

แน่นอนว่าเป็นเรื่องสมเหตุสมผลที่จะติดตั้งโปรเซสเซอร์แบบมัลติคอร์ด้วยหน่วยความจำเฉพาะที่จะแชร์โดยคอร์ที่มีอยู่ทั้งหมด ในบทบาทนี้ แคชระดับที่สามที่รวดเร็ว (L3) สามารถเพิ่มความเร็วในการเข้าถึงข้อมูลที่ได้รับการร้องขอบ่อยที่สุดได้อย่างมาก ถ้าเป็นไปได้ แกนประมวลผลจะไม่ต้องเข้าถึงหน่วยความจำหลัก (RAM) ที่ช้า

อย่างน้อยก็ในทางทฤษฎี AMD เพิ่งประกาศโปรเซสเซอร์ Athlon II X4 ซึ่งเป็นรุ่นของ Phenom II X4 ที่ไม่มีแคช L3 ซึ่งบอกเป็นนัยว่าไม่จำเป็นขนาดนั้น เราตัดสินใจเปรียบเทียบโปรเซสเซอร์สองตัวโดยตรง (มีและไม่มีแคช L3) เพื่อทดสอบว่าแคชส่งผลต่อประสิทธิภาพอย่างไร

แคชทำงานอย่างไร?

ก่อนที่เราจะเจาะลึกการทดสอบ สิ่งสำคัญคือต้องเข้าใจพื้นฐานบางประการ หลักการทำงานของแคชนั้นค่อนข้างง่าย แคชบัฟเฟอร์ข้อมูลใกล้กับแกนประมวลผลของโปรเซสเซอร์มากที่สุดเท่าที่จะเป็นไปได้ เพื่อลดคำขอของ CPU ไปยังหน่วยความจำที่อยู่ห่างไกลและช้าลง บนแพลตฟอร์มเดสก์ท็อปสมัยใหม่ ลำดับชั้นของแคชมีมากถึงสามระดับที่อยู่ก่อนการเข้าถึง RAM ยิ่งไปกว่านั้น แคชของระดับที่สองและโดยเฉพาะระดับที่สามไม่เพียงทำหน้าที่ในการบัฟเฟอร์ข้อมูลเท่านั้น จุดประสงค์คือเพื่อป้องกันไม่ให้บัสโปรเซสเซอร์โอเวอร์โหลดเมื่อคอร์จำเป็นต้องแลกเปลี่ยนข้อมูล

ฮิตและพลาด

ประสิทธิภาพของสถาปัตยกรรมแคชวัดจากอัตราการเข้าชม คำขอข้อมูลที่แคชสามารถตอบสนองได้จะถือเป็น Hit หากแคชนี้ไม่มีข้อมูลที่จำเป็น คำขอจะถูกส่งต่อไปตามไปป์ไลน์หน่วยความจำ และจะนับการพลาด แน่นอนว่าการพลาดจะทำให้ต้องใช้เวลามากขึ้นในการรับข้อมูล เป็นผลให้ “ฟองสบู่” (ไม่ได้ใช้งาน) และความล่าช้าปรากฏขึ้นในขั้นตอนการประมวลผล ในทางกลับกัน การเข้าชมช่วยให้คุณรักษาประสิทธิภาพสูงสุดได้

รายการแคช ความพิเศษ การเชื่อมโยงกัน

นโยบายการเปลี่ยนจะกำหนดวิธีการเพิ่มพื้นที่ว่างในแคชสำหรับรายการใหม่ เนื่องจากข้อมูลที่เขียนลงในแคชจะต้องปรากฏในหน่วยความจำหลักในที่สุด ระบบจึงอาจดำเนินการในเวลาเดียวกันกับการเขียนลงในแคช (การเขียนผ่าน) หรืออาจทำเครื่องหมายพื้นที่ข้อมูลเป็น "สกปรก" (เขียนกลับ) และเขียนลงใน หน่วยความจำ เมื่อมันถูกขับออกจากแคช

ข้อมูลในระดับแคชหลายระดับสามารถจัดเก็บไว้โดยเฉพาะ กล่าวคือ โดยไม่มีความซ้ำซ้อน จากนั้นคุณจะไม่พบบรรทัดข้อมูลเดียวกันในลำดับชั้นแคชที่ต่างกันสองลำดับ หรือแคชสามารถทำงานได้โดยรวม กล่าวคือ รับประกันว่าระดับแคชด้านล่างจะมีข้อมูลอยู่ในระดับแคชด้านบน (ใกล้กับแกนประมวลผลมากขึ้น) AMD Phenom ใช้แคช L3 พิเศษ ในขณะที่ Intel ปฏิบัติตามกลยุทธ์แคชแบบรวม โปรโตคอล Coherency ช่วยให้มั่นใจในความสมบูรณ์และความใหม่ของข้อมูลในคอร์ ระดับแคช และแม้แต่โปรเซสเซอร์ที่แตกต่างกัน

ขนาดแคช

แคชที่ใหญ่กว่าสามารถเก็บข้อมูลได้มากกว่า แต่มีแนวโน้มที่จะเพิ่มเวลาแฝง นอกจากนี้ แคชขนาดใหญ่ยังใช้ทรานซิสเตอร์ของโปรเซสเซอร์เป็นจำนวนมาก ดังนั้นจึงเป็นสิ่งสำคัญที่จะต้องค้นหาสมดุลระหว่างงบประมาณของทรานซิสเตอร์ ขนาดดาย การใช้พลังงาน และประสิทธิภาพ/เวลาแฝง

การเชื่อมโยง

รายการใน RAM สามารถแมปกับแคชได้โดยตรง กล่าวคือ มีตำแหน่งแคชเพียงตำแหน่งเดียวสำหรับสำเนาข้อมูลจาก RAM หรือสามารถเชื่อมโยงแบบ n-way ได้ กล่าวคือ มีตำแหน่งที่เป็นไปได้ n ตำแหน่งในแคชโดยที่ ข้อมูลอาจถูกเก็บไว้ ระดับการเชื่อมโยงที่สูงกว่า (ขึ้นอยู่กับแคชที่เชื่อมโยงโดยสมบูรณ์) ให้ความยืดหยุ่นในการแคชที่มากขึ้น เนื่องจากข้อมูลที่มีอยู่ในแคชไม่จำเป็นต้องถูกเขียนใหม่ กล่าวอีกนัยหนึ่ง การเชื่อมโยงระดับ n ที่สูงรับประกันอัตราการเข้าชมที่สูงขึ้น แต่ยังเพิ่มเวลาแฝงด้วย เนื่องจากต้องใช้เวลามากขึ้นในการตรวจสอบการเชื่อมโยงทั้งหมดเหล่านั้นเพื่อหาการเข้าชม โดยทั่วไป ระดับการเชื่อมโยงสูงสุดจะสมเหตุสมผลสำหรับแคชระดับสุดท้าย เนื่องจากมีความจุสูงสุดอยู่ที่นั่น และการค้นหาข้อมูลนอกแคชนี้จะส่งผลให้โปรเซสเซอร์เข้าถึง RAM ที่ช้า

ต่อไปนี้คือตัวอย่างบางส่วน: Core i5 และ i7 ใช้แคช L1 ขนาด 32 KB พร้อมการเชื่อมโยง 8 ทิศทางสำหรับข้อมูล และแคช L1 ขนาด 32 KB พร้อมการเชื่อมโยง 4 ทิศทางสำหรับคำแนะนำ เป็นที่เข้าใจได้ว่า Intel ต้องการให้คำสั่งใช้งานได้เร็วขึ้นและแคชข้อมูล L1 ให้มีอัตราการเข้าชมสูงสุด แคช L2 บนโปรเซสเซอร์ Intel มีการเชื่อมโยงแบบ 8 ทิศทาง และแคช L3 ของ Intel นั้นฉลาดกว่าอีก เนื่องจากใช้การเชื่อมโยงแบบ 16 ทิศทางเพื่อเพิ่มการเข้าชมสูงสุด

อย่างไรก็ตาม AMD กำลังดำเนินตามกลยุทธ์ที่แตกต่างกับโปรเซสเซอร์ Phenom II X4 ซึ่งใช้แคช L1 ที่เชื่อมโยง 2 ทางเพื่อลดเวลาแฝง เพื่อชดเชยการพลาดที่อาจเกิดขึ้น ความจุแคชจึงเพิ่มขึ้นเป็นสองเท่า: 64 KB สำหรับข้อมูลและ 64 KB สำหรับคำแนะนำ แคช L2 มีการเชื่อมโยง 8 ทิศทาง เช่นเดียวกับการออกแบบของ Intel แต่แคช L3 ของ AMD ทำงานด้วยการเชื่อมโยง 48 ทิศทาง แต่การตัดสินใจเลือกสถาปัตยกรรมแคชหนึ่งทับอีกสถาปัตยกรรมหนึ่งไม่สามารถประเมินได้หากไม่พิจารณาสถาปัตยกรรม CPU ทั้งหมด เป็นเรื่องปกติที่ผลการทดสอบมีความสำคัญในทางปฏิบัติ และเป้าหมายของเราก็คือการทดสอบเชิงปฏิบัติของโครงสร้างแคชหลายระดับที่ซับซ้อนทั้งหมดนี้อย่างแม่นยำ

โปรเซสเซอร์คอมพิวเตอร์มีการพัฒนาอย่างก้าวกระโดดอย่างมากในช่วงไม่กี่ปีที่ผ่านมา ขนาดของทรานซิสเตอร์ลดลงทุกปี และประสิทธิภาพการผลิตก็เพิ่มขึ้น ในขณะเดียวกัน กฎของมัวร์ก็ไม่เกี่ยวข้อง สำหรับประสิทธิภาพของโปรเซสเซอร์ คุณควรคำนึงถึงไม่เพียงแต่จำนวนทรานซิสเตอร์และความถี่เท่านั้น แต่ยังรวมถึงขนาดแคชด้วย

คุณอาจเคยได้ยินเกี่ยวกับหน่วยความจำแคชเมื่อค้นหาข้อมูลเกี่ยวกับโปรเซสเซอร์ แต่โดยปกติแล้วเราไม่ได้ใส่ใจกับตัวเลขเหล่านี้มากนักและไม่ได้โดดเด่นมากนักในโฆษณาโปรเซสเซอร์ มาดูกันว่าแคชของโปรเซสเซอร์มีผลกระทบอะไรบ้าง มีแคชประเภทใดบ้าง และทำงานอย่างไร

พูดง่ายๆ ก็คือแคชของโปรเซสเซอร์นั้นเป็นหน่วยความจำที่เร็วมาก ดังที่คุณทราบแล้วว่าคอมพิวเตอร์มีหน่วยความจำหลายประเภท นี่คือหน่วยความจำถาวรที่ใช้จัดเก็บข้อมูล ระบบปฏิบัติการ และโปรแกรม เช่น SSD หรือฮาร์ดไดรฟ์ คอมพิวเตอร์ยังใช้ RAM นี่คือหน่วยความจำเข้าถึงโดยสุ่มซึ่งทำงานได้เร็วกว่ามากเมื่อเทียบกับหน่วยความจำถาวร ในที่สุด โปรเซสเซอร์ก็มีบล็อกหน่วยความจำที่เร็วกว่า ซึ่งเรียกรวมกันว่าแคช

หากคุณคิดว่าหน่วยความจำของคอมพิวเตอร์เป็นลำดับชั้นโดยอิงตามความเร็ว แคชจะอยู่ที่ด้านบนของลำดับชั้นนั้น นอกจากนี้ยังอยู่ใกล้กับแกนประมวลผลมากที่สุดเนื่องจากเป็นส่วนหนึ่งของโปรเซสเซอร์

หน่วยความจำแคชของโปรเซสเซอร์เป็นหน่วยความจำแบบคงที่ (SRAM) และได้รับการออกแบบมาเพื่อเพิ่มความเร็วในการทำงานกับ RAM ต่างจากหน่วยความจำเข้าถึงโดยสุ่มแบบไดนามิก (DRAM) ตรงที่สามารถจัดเก็บข้อมูลได้โดยไม่ต้องอัปเดตอย่างต่อเนื่อง

แคชโปรเซสเซอร์ทำงานอย่างไร

ดังที่คุณอาจทราบแล้วว่าโปรแกรมคือชุดคำสั่งที่โปรเซสเซอร์ดำเนินการ เมื่อคุณรันโปรแกรม คอมพิวเตอร์จำเป็นต้องถ่ายโอนคำแนะนำเหล่านี้จากหน่วยความจำถาวรไปยังโปรเซสเซอร์ นี่คือจุดที่ลำดับชั้นของหน่วยความจำเข้ามามีบทบาท ขั้นแรก ข้อมูลจะถูกโหลดลงใน RAM จากนั้นจึงโอนไปยังโปรเซสเซอร์

ในปัจจุบัน โปรเซสเซอร์สามารถประมวลผลคำสั่งจำนวนมากต่อวินาที เพื่อให้ได้รับประโยชน์สูงสุดจากความสามารถ โปรเซสเซอร์จำเป็นต้องมีหน่วยความจำที่เร็วเป็นพิเศษ นั่นเป็นสาเหตุที่แคชได้รับการพัฒนา

ตัวควบคุมหน่วยความจำของโปรเซสเซอร์ทำหน้าที่ดึงข้อมูลจาก RAM และส่งไปยังแคช ขึ้นอยู่กับโปรเซสเซอร์ที่ใช้ในระบบของคุณ คอนโทรลเลอร์นี้อาจอยู่ที่นอร์ธบริดจ์ของเมนบอร์ดหรือในตัวโปรเซสเซอร์เอง แคชยังเก็บผลลัพธ์ของการดำเนินการคำสั่งไว้ในโปรเซสเซอร์ด้วย นอกจากนี้แคชตัวประมวลผลเองก็มีลำดับชั้นของตัวเองเช่นกัน

ระดับแคชของโปรเซสเซอร์ - L1, L2 และ L3

หน่วยความจำแคชของโปรเซสเซอร์แบ่งออกเป็นสามระดับ: L1, L2 และ L3 ลำดับชั้นนี้ยังขึ้นอยู่กับความเร็วของแคช รวมถึงขนาดของแคชด้วย

  • แคช L1 (แคชระดับแรก)- นี่เป็นแคชประเภทที่เร็วที่สุดในโปรเซสเซอร์ ในแง่ของลำดับความสำคัญในการเข้าถึง แคชนี้ประกอบด้วยข้อมูลที่โปรแกรมอาจต้องใช้เพื่อดำเนินการคำสั่งเฉพาะ
  • L2 Cache (แคชระดับที่สองของโปรเซสเซอร์)- ช้ากว่าเมื่อเทียบกับ L1 แต่มีขนาดใหญ่กว่า ปริมาตรของมันสามารถอยู่ที่ 256 กิโลไบต์ถึงแปดเมกะไบต์ แคช L2 มีข้อมูลที่โปรเซสเซอร์อาจต้องการในอนาคต โปรเซสเซอร์สมัยใหม่ส่วนใหญ่มีแคช L1 และ L2 บนคอร์ของโปรเซสเซอร์ โดยแต่ละคอร์จะได้รับแคชของตัวเอง
  • แคช L3 (แคชระดับที่สาม)- นี่คือแคชที่ใหญ่ที่สุดและช้าที่สุด ขนาดของมันสามารถอยู่ในช่วงตั้งแต่ 4 ถึง 50 เมกะไบต์ ใน CPU สมัยใหม่ มีการจัดสรรพื้นที่แยกต่างหากบนชิปสำหรับแคช L3

ในขณะนี้นี่คือระดับแคชของโปรเซสเซอร์ทั้งหมด Intel พยายามสร้างแคช L4 อย่างไรก็ตามเทคโนโลยีนี้ยังไม่ได้หยั่งราก

แคชในโปรเซสเซอร์มีไว้เพื่ออะไร?

ถึงเวลาตอบคำถามหลักของบทความนี้: แคชของโปรเซสเซอร์ส่งผลกระทบอย่างไร ข้อมูลไหลจาก RAM ไปยังแคช L3 จากนั้นไปที่ L2 และไปยัง L1 เมื่อโปรเซสเซอร์ต้องการข้อมูลเพื่อดำเนินการ โปรเซสเซอร์จะพยายามค้นหาในแคช L1 และหากพบ สถานการณ์นี้เรียกว่าการเข้าถึงแคช มิฉะนั้น การค้นหาจะดำเนินต่อไปในแคช L2 และ L3 หากยังไม่พบข้อมูล ระบบจะทำการร้องขอไปยัง RAM

ตอนนี้เรารู้แล้วว่าแคชได้รับการออกแบบมาเพื่อเพิ่มความเร็วในการถ่ายโอนข้อมูลระหว่าง RAM และโปรเซสเซอร์ เวลาที่ต้องใช้ในการดึงข้อมูลจากหน่วยความจำเรียกว่าเวลาแฝง แคช L1 มีความหน่วงต่ำที่สุด ดังนั้นจึงเร็วที่สุด ส่วนแคช L3 มีค่าสูงสุด เมื่อไม่มีข้อมูลในแคช เราจะพบกับเวลาแฝงที่สูงขึ้น เนื่องจากโปรเซสเซอร์จำเป็นต้องเข้าถึงหน่วยความจำ

ก่อนหน้านี้ในการออกแบบโปรเซสเซอร์ แคช L2 และ L3 ถูกย้ายออกไปนอกโปรเซสเซอร์ ซึ่งทำให้มีเวลาแฝงสูง อย่างไรก็ตาม การลดกระบวนการผลิตที่ใช้ในการผลิตโปรเซสเซอร์ทำให้สามารถวางทรานซิสเตอร์นับพันล้านตัวในพื้นที่ที่เล็กลงกว่าเดิมมาก เป็นผลให้มีพื้นที่ว่างมากขึ้นเพื่อวางแคชให้ใกล้กับแกนประมวลผลมากที่สุด ช่วยลดเวลาแฝงลงอีก

แคชส่งผลต่อประสิทธิภาพอย่างไร

ผลกระทบของแคชต่อประสิทธิภาพของคอมพิวเตอร์โดยตรงขึ้นอยู่กับประสิทธิภาพและจำนวนการเข้าชมแคช สถานการณ์เมื่อไม่มีข้อมูลในแคชจะลดประสิทธิภาพโดยรวมลงอย่างมาก

ลองนึกภาพโปรเซสเซอร์โหลดข้อมูลจากแคช L1 100 ครั้งติดต่อกัน หากอัตราการเข้าถึงแคชคือ 100% โปรเซสเซอร์จะใช้เวลา 100 นาโนวินาทีในการดึงข้อมูลนี้ อย่างไรก็ตาม ทันทีที่อัตราการเข้าชมลดลงถึง 99% โปรเซสเซอร์จะต้องดึงข้อมูลจากแคช L2 และมีความล่าช้า 10 นาโนวินาทีอยู่แล้ว ผลลัพธ์คือ 99 นาโนวินาทีสำหรับ 99 คำขอ และ 10 นาโนวินาทีสำหรับ 1 คำขอ ดังนั้นการลดเปอร์เซ็นต์การเข้าถึงแคชลง 1% จะลดประสิทธิภาพของโปรเซสเซอร์ลง 10%

แบบเรียลไทม์ อัตราการเข้าถึงแคชอยู่ระหว่าง 95 ถึง 97% แต่อย่างที่คุณเข้าใจ ความแตกต่างในประสิทธิภาพระหว่างตัวบ่งชี้เหล่านี้ไม่ใช่ 2% แต่เป็น 14% โปรดทราบว่าในตัวอย่างนี้ เราถือว่าข้อมูลที่ให้อภัยนั้นอยู่ในแคช L2 เสมอ ในชีวิตจริง ข้อมูลอาจถูกลบออกจากแคช ซึ่งหมายความว่าจะต้องดึงข้อมูลจาก RAM ซึ่งมีเวลาแฝง 80- 120 นาโนวินาที ความแตกต่างระหว่าง 95 และ 97 เปอร์เซ็นต์มีความสำคัญยิ่งขึ้นไปอีก

ประสิทธิภาพแคชที่ไม่ดีในโปรเซสเซอร์ AMD Bulldozer และ Piledriver เป็นหนึ่งในสาเหตุหลักที่ทำให้โปรเซสเซอร์ Intel สูญเสียไป ในโปรเซสเซอร์เหล่านี้ แคช L1 ถูกใช้ร่วมกันในหลายคอร์ ซึ่งทำให้ไม่มีประสิทธิภาพมาก โปรเซสเซอร์ Ryzen สมัยใหม่ไม่มีปัญหานี้

เราสามารถสรุปได้ว่ายิ่งขนาดแคชมีขนาดใหญ่เท่าใด ประสิทธิภาพก็ยิ่งสูงขึ้นเท่านั้น เนื่องจากโปรเซสเซอร์จะสามารถรับข้อมูลที่ต้องการได้เร็วขึ้นในกรณีต่างๆ มากขึ้น อย่างไรก็ตามควรให้ความสนใจไม่เฉพาะกับขนาดของแคชโปรเซสเซอร์เท่านั้น แต่ยังรวมถึงสถาปัตยกรรมด้วย

ข้อสรุป

ตอนนี้คุณรู้แล้วว่าแคชโปรเซสเซอร์มีหน้าที่รับผิดชอบอย่างไรและทำงานอย่างไร การออกแบบแคชมีการพัฒนาอย่างต่อเนื่อง และหน่วยความจำก็เร็วขึ้นและถูกลง AMD และ Intel ได้ทำการทดลองเกี่ยวกับแคชหลายครั้งแล้ว และ Intel ก็ลองใช้แคช L4 ด้วยซ้ำ ตลาดโปรเซสเซอร์เติบโตเร็วกว่าที่เคย สถาปัตยกรรมแคชจะก้าวทันพลังของโปรเซสเซอร์ที่เพิ่มมากขึ้น

นอกจากนี้ ยังมีการดำเนินการอีกมากเพื่อขจัดปัญหาคอขวดที่คอมพิวเตอร์สมัยใหม่มีอยู่ การลดเวลาแฝงของหน่วยความจำเป็นส่วนที่สำคัญที่สุดประการหนึ่งของงานนี้ อนาคตดูสดใสมาก

กระทู้ที่เกี่ยวข้อง.

แคช L3 สำหรับโปรเซสเซอร์ AMD มีความสำคัญเพียงใด

แน่นอนว่าเป็นเรื่องสมเหตุสมผลที่จะติดตั้งโปรเซสเซอร์แบบมัลติคอร์ด้วยหน่วยความจำเฉพาะที่จะแชร์โดยคอร์ที่มีอยู่ทั้งหมด ในบทบาทนี้ แคชระดับที่สามที่รวดเร็ว (L3) สามารถเพิ่มความเร็วในการเข้าถึงข้อมูลที่ได้รับการร้องขอบ่อยที่สุดได้อย่างมาก ถ้าเป็นไปได้ แกนประมวลผลจะไม่ต้องเข้าถึงหน่วยความจำหลัก (RAM) ที่ช้า

อย่างน้อยก็ในทางทฤษฎี ล่าสุดเอเอ็มดี เปิดตัวโปรเซสเซอร์ Athlon II X4ซึ่งเป็นรุ่น Phenom II X4 ที่ไม่มีแคช L3 บอกเป็นนัยว่าไม่จำเป็นขนาดนั้น เราตัดสินใจเปรียบเทียบโปรเซสเซอร์สองตัวโดยตรง (มีและไม่มีแคช L3) เพื่อทดสอบว่าแคชส่งผลต่อประสิทธิภาพอย่างไร

คลิกที่ภาพเพื่อขยาย

แคชทำงานอย่างไร?

ก่อนที่เราจะเจาะลึกการทดสอบ สิ่งสำคัญคือต้องเข้าใจพื้นฐานบางประการ หลักการทำงานของแคชนั้นค่อนข้างง่าย แคชบัฟเฟอร์ข้อมูลใกล้กับแกนประมวลผลของโปรเซสเซอร์มากที่สุดเท่าที่จะเป็นไปได้ เพื่อลดคำขอของ CPU ไปยังหน่วยความจำที่อยู่ห่างไกลและช้าลง บนแพลตฟอร์มเดสก์ท็อปสมัยใหม่ ลำดับชั้นของแคชมีมากถึงสามระดับที่อยู่ก่อนการเข้าถึง RAM ยิ่งไปกว่านั้น แคชของระดับที่สองและโดยเฉพาะระดับที่สามไม่เพียงทำหน้าที่ในการบัฟเฟอร์ข้อมูลเท่านั้น จุดประสงค์คือเพื่อป้องกันไม่ให้บัสโปรเซสเซอร์โอเวอร์โหลดเมื่อคอร์จำเป็นต้องแลกเปลี่ยนข้อมูล

ฮิตและพลาด

ประสิทธิภาพของสถาปัตยกรรมแคชวัดจากอัตราการเข้าชม คำขอข้อมูลที่แคชสามารถตอบสนองได้จะถือเป็น Hit หากแคชนี้ไม่มีข้อมูลที่จำเป็น คำขอจะถูกส่งต่อไปตามไปป์ไลน์หน่วยความจำ และจะนับการพลาด แน่นอนว่าการพลาดจะทำให้ต้องใช้เวลามากขึ้นในการรับข้อมูล เป็นผลให้ “ฟองสบู่” (ไม่ได้ใช้งาน) และความล่าช้าปรากฏขึ้นในขั้นตอนการประมวลผล ในทางกลับกัน การเข้าชมช่วยให้คุณรักษาประสิทธิภาพสูงสุดได้

รายการแคช ความพิเศษ การเชื่อมโยงกัน

นโยบายการเปลี่ยนจะกำหนดวิธีการเพิ่มพื้นที่ว่างในแคชสำหรับรายการใหม่ เนื่องจากข้อมูลที่เขียนลงในแคชจะต้องปรากฏในหน่วยความจำหลักในที่สุด ระบบจึงอาจดำเนินการในเวลาเดียวกันกับการเขียนลงในแคช (การเขียนผ่าน) หรืออาจทำเครื่องหมายพื้นที่ข้อมูลเป็น "สกปรก" (เขียนกลับ) และเขียนลงใน หน่วยความจำ เมื่อมันถูกขับออกจากแคช

ข้อมูลในระดับแคชหลายระดับสามารถจัดเก็บไว้โดยเฉพาะ กล่าวคือ โดยไม่มีความซ้ำซ้อน จากนั้นคุณจะไม่พบบรรทัดข้อมูลเดียวกันในลำดับชั้นแคชที่ต่างกันสองลำดับ หรือแคชสามารถทำงานได้โดยรวม กล่าวคือ รับประกันว่าระดับแคชด้านล่างจะมีข้อมูลอยู่ในระดับแคชด้านบน (ใกล้กับแกนประมวลผลมากขึ้น) AMD Phenom ใช้แคช L3 พิเศษ ในขณะที่ Intel ปฏิบัติตามกลยุทธ์แคชแบบรวม โปรโตคอล Coherency ช่วยให้มั่นใจในความสมบูรณ์และความใหม่ของข้อมูลในคอร์ ระดับแคช และแม้แต่โปรเซสเซอร์ที่แตกต่างกัน

ขนาดแคช

แคชที่ใหญ่กว่าสามารถเก็บข้อมูลได้มากกว่า แต่มีแนวโน้มที่จะเพิ่มเวลาแฝง นอกจากนี้ แคชขนาดใหญ่ยังใช้ทรานซิสเตอร์ของโปรเซสเซอร์เป็นจำนวนมาก ดังนั้นจึงเป็นสิ่งสำคัญที่จะต้องค้นหาความสมดุลระหว่างงบประมาณของทรานซิสเตอร์ ขนาดดาย การใช้พลังงาน และประสิทธิภาพ/เวลาแฝง

การเชื่อมโยง

รายการใน RAM สามารถแมปกับแคชได้โดยตรง กล่าวคือ มีตำแหน่งแคชเพียงตำแหน่งเดียวสำหรับสำเนาข้อมูลจาก RAM หรือสามารถเชื่อมโยงแบบ n-way ได้ กล่าวคือ มีตำแหน่งที่เป็นไปได้ n ตำแหน่งในแคชโดยที่ ข้อมูลอาจถูกเก็บไว้ ระดับการเชื่อมโยงที่สูงกว่า (ขึ้นอยู่กับแคชที่เชื่อมโยงโดยสมบูรณ์) ให้ความยืดหยุ่นในการแคชที่มากขึ้น เนื่องจากข้อมูลที่มีอยู่ในแคชไม่จำเป็นต้องถูกเขียนใหม่ กล่าวอีกนัยหนึ่ง การเชื่อมโยงระดับ n ที่สูงรับประกันอัตราการเข้าชมที่สูงขึ้น แต่ยังเพิ่มเวลาแฝงด้วย เนื่องจากต้องใช้เวลามากขึ้นในการตรวจสอบการเชื่อมโยงทั้งหมดเหล่านั้นเพื่อหาการเข้าชม โดยทั่วไป ระดับการเชื่อมโยงสูงสุดจะสมเหตุสมผลสำหรับแคชระดับสุดท้าย เนื่องจากมีความจุสูงสุดอยู่ที่นั่น และการค้นหาข้อมูลนอกแคชนี้จะส่งผลให้โปรเซสเซอร์เข้าถึง RAM ที่ช้า

ต่อไปนี้คือตัวอย่างบางส่วน: Core i5 และ i7 ใช้แคช L1 ขนาด 32 KB พร้อมการเชื่อมโยง 8 ทิศทางสำหรับข้อมูล และแคช L1 ขนาด 32 KB พร้อมการเชื่อมโยง 4 ทิศทางสำหรับคำแนะนำ เป็นที่เข้าใจได้ว่า Intel ต้องการให้คำสั่งใช้งานได้เร็วขึ้นและแคชข้อมูล L1 ให้มีอัตราการเข้าชมสูงสุด แคช L2 บนโปรเซสเซอร์ Intel มีการเชื่อมโยงแบบ 8 ทิศทาง และแคช L3 ของ Intel นั้นฉลาดกว่าอีก เนื่องจากใช้การเชื่อมโยงแบบ 16 ทิศทางเพื่อเพิ่มการเข้าชมสูงสุด

อย่างไรก็ตาม AMD กำลังดำเนินตามกลยุทธ์ที่แตกต่างกับโปรเซสเซอร์ Phenom II X4 ซึ่งใช้แคช L1 ที่เชื่อมโยง 2 ทางเพื่อลดเวลาแฝง เพื่อชดเชยการพลาดที่อาจเกิดขึ้น ความจุแคชจึงเพิ่มขึ้นเป็นสองเท่า: 64 KB สำหรับข้อมูลและ 64 KB สำหรับคำแนะนำ แคช L2 มีการเชื่อมโยง 8 ทิศทาง เช่นเดียวกับการออกแบบของ Intel แต่แคช L3 ของ AMD ทำงานด้วยการเชื่อมโยง 48 ทิศทาง แต่การตัดสินใจเลือกสถาปัตยกรรมแคชหนึ่งทับอีกสถาปัตยกรรมหนึ่งไม่สามารถประเมินได้หากไม่พิจารณาสถาปัตยกรรม CPU ทั้งหมด เป็นเรื่องปกติที่ผลการทดสอบมีความสำคัญในทางปฏิบัติ และเป้าหมายของเราก็คือการทดสอบเชิงปฏิบัติของโครงสร้างแคชหลายระดับที่ซับซ้อนทั้งหมดนี้อย่างแม่นยำ

โปรเซสเซอร์สมัยใหม่ทุกตัวมีแคชเฉพาะที่จัดเก็บคำสั่งและข้อมูลของโปรเซสเซอร์ ซึ่งพร้อมใช้งานเกือบจะในทันที โดยทั่วไประดับนี้เรียกว่าแคชระดับ 1 หรือ L1 และเปิดตัวครั้งแรกในโปรเซสเซอร์ 486DX เมื่อเร็ว ๆ นี้โปรเซสเซอร์ AMD ได้กลายเป็นมาตรฐานด้วยแคช L1 64 KB ต่อคอร์ (สำหรับข้อมูลและคำแนะนำ) และโปรเซสเซอร์ Intel ใช้แคช L1 32 KB ต่อคอร์ (รวมถึงข้อมูลและคำแนะนำด้วย)

แคช L1 ปรากฏตัวครั้งแรกบนโปรเซสเซอร์ 486DX หลังจากนั้นก็กลายเป็นคุณสมบัติสำคัญของซีพียูสมัยใหม่ทั้งหมด

แคชระดับที่สอง (L2) ปรากฏบนโปรเซสเซอร์ทั้งหมดหลังจากการเปิดตัว Pentium III แม้ว่าการใช้งานครั้งแรกบนบรรจุภัณฑ์จะอยู่ในโปรเซสเซอร์ Pentium Pro (แต่ไม่ใช่บนชิป) โปรเซสเซอร์สมัยใหม่มีแคช L2 บนชิปสูงสุด 6 MB ตามกฎแล้ว โวลุ่มนี้จะถูกแบ่งระหว่างสองคอร์บนโปรเซสเซอร์ Intel Core 2 Duo เป็นต้น การกำหนดค่า L2 โดยทั่วไปจะมีแคช 512 KB หรือ 1 MB ต่อคอร์ โปรเซสเซอร์ที่มีแคช L2 น้อยกว่ามีแนวโน้มที่จะมีราคาต่ำกว่า ด้านล่างนี้คือแผนภาพการใช้งานแคช L2 ในระยะแรกๆ

Pentium Pro มีแคช L2 อยู่ในบรรจุภัณฑ์โปรเซสเซอร์ ใน Pentium III และ Athlon รุ่นต่อๆ มา แคช L2 ถูกนำมาใช้ผ่านชิป SRAM แยกกัน ซึ่งเป็นเรื่องปกติมากในเวลานั้น (1998, 1999)

การประกาศเทคโนโลยีกระบวนการที่สูงถึง 180 นาโนเมตรในเวลาต่อมาทำให้ผู้ผลิตสามารถรวมแคช L2 เข้ากับชิปโปรเซสเซอร์ได้ในที่สุด


โปรเซสเซอร์แบบดูอัลคอร์รุ่นแรกเพียงแต่ใช้การออกแบบที่มีอยู่ซึ่งมีดายสองตัวต่อแพ็คเกจ AMD เปิดตัวโปรเซสเซอร์แบบดูอัลคอร์บนชิปเสาหิน เพิ่มตัวควบคุมหน่วยความจำและสวิตช์ และ Intel เพิ่งประกอบชิปแบบซิงเกิลคอร์สองตัวในแพ็คเกจเดียวสำหรับโปรเซสเซอร์ดูอัลคอร์ตัวแรก


นับเป็นครั้งแรกที่แคช L2 เริ่มถูกแชร์ระหว่างคอร์ประมวลผลสองคอร์บนโปรเซสเซอร์ Core 2 Duo AMD ก้าวไปอีกขั้นและสร้าง Phenom แบบ quad-core ตัวแรกตั้งแต่เริ่มต้น และ Intel ก็ใช้แม่พิมพ์คู่อีกครั้ง โดยคราวนี้เป็น dual-core Core 2 สองตัวสำหรับโปรเซสเซอร์ Quad-core ตัวแรกเพื่อลดต้นทุน

แคชระดับที่สามมีมาตั้งแต่ยุคแรกๆ ของโปรเซสเซอร์ Alpha 21165 (96 KB, โปรเซสเซอร์ที่เปิดตัวในปี 1995) หรือ IBM Power 4 (256 KB, 2001) อย่างไรก็ตาม ในสถาปัตยกรรมที่ใช้ x86 แคช L3 ปรากฏตัวครั้งแรกพร้อมกับรุ่น Intel Itanium 2, Pentium 4 Extreme (Gallatin โปรเซสเซอร์ทั้งคู่ในปี 2003) และรุ่น Xeon MP (2006)

การใช้งานในช่วงแรกช่วยให้ลำดับชั้นแคชมีอีกระดับหนึ่ง แม้ว่าสถาปัตยกรรมสมัยใหม่จะใช้แคช L3 เป็นบัฟเฟอร์ขนาดใหญ่ที่ใช้ร่วมกันสำหรับการถ่ายโอนข้อมูลระหว่างคอร์ในโปรเซสเซอร์แบบมัลติคอร์ สิ่งนี้ถูกเน้นย้ำโดยความสัมพันธ์ที่มีระดับ n สูง เป็นการดีกว่าที่จะค้นหาข้อมูลในแคชนานกว่าเล็กน้อยแทนที่จะจบลงด้วยสถานการณ์ที่หลายคอร์ใช้การเข้าถึง RAM หลักช้ามาก AMD เปิดตัวแคช L3 เป็นครั้งแรกบนโปรเซสเซอร์เดสก์ท็อปด้วยกลุ่มผลิตภัณฑ์ Phenom ที่กล่าวถึงแล้ว Phenom X4 ขนาด 65 นาโนเมตรมีแคช L3 ที่ใช้ร่วมกันขนาด 2 MB และ Phenom II X4 ขนาด 45 นาโนเมตรที่ทันสมัยมีแคช L3 ที่ใช้ร่วมกันขนาด 6 MB อยู่แล้ว โปรเซสเซอร์ Intel Core i7 และ i5 ใช้แคช L3 ขนาด 8 MB

โปรเซสเซอร์ Quad-core สมัยใหม่มีแคช L1 และ L2 เฉพาะสำหรับแต่ละคอร์ รวมถึงแคช L3 ขนาดใหญ่ที่ใช้ร่วมกันโดยคอร์ทั้งหมด แคช L3 ที่ใช้ร่วมกันยังช่วยให้สามารถแลกเปลี่ยนข้อมูลที่คอร์สามารถทำงานแบบขนานได้


ยินดีต้อนรับสู่ GECID.com! เป็นที่ทราบกันดีว่าความเร็วสัญญาณนาฬิกาและจำนวนแกนประมวลผลส่งผลโดยตรงต่อระดับประสิทธิภาพ โดยเฉพาะอย่างยิ่งในการออกแบบแบบมัลติเธรด เราตัดสินใจตรวจสอบว่าแคช L3 มีบทบาทอย่างไรในเรื่องนี้

เพื่อศึกษาปัญหานี้ เราได้รับความกรุณาจากร้านค้าออนไลน์ pcshop.ua ที่มีโปรเซสเซอร์ 2 คอร์ที่มีความถี่การทำงานปกติ 3.7 GHz และแคช L3 3 MB พร้อม 12 ช่องสัญญาณที่เชื่อมโยง ฝ่ายตรงข้ามเป็นแบบ 4 คอร์ โดยปิดใช้งานสองคอร์และความถี่สัญญาณนาฬิกาลดลงเหลือ 3.7 GHz ขนาดแคช L3 คือ 8 MB และมีช่องสัญญาณที่เชื่อมโยง 16 ช่อง นั่นคือความแตกต่างที่สำคัญระหว่างพวกเขานั้นอยู่ที่แคชระดับสุดท้ายอย่างแม่นยำ: Core i7 มีมากกว่า 5 MB

หากสิ่งนี้ส่งผลกระทบอย่างมีนัยสำคัญต่อประสิทธิภาพการทำงาน ก็จะสามารถทำการทดสอบอีกครั้งกับตัวแทนของซีรีส์ Core i5 ซึ่งมีแคช L3 ขนาด 6 MB บนบอร์ดได้

แต่สำหรับตอนนี้เรากลับมาที่การทดสอบปัจจุบันกันดีกว่า การ์ดแสดงผลและ RAM DDR4-2400 MHz ขนาด 16 GB จะช่วยผู้เข้าร่วม เราจะเปรียบเทียบระบบเหล่านี้ด้วยความละเอียด Full HD

ขั้นแรก เรามาเริ่มด้วยการเล่นเกมสดที่ไม่ซิงค์กัน ซึ่งไม่สามารถระบุผู้ชนะได้อย่างชัดเจน ใน แสงสว่างที่กำลังจะตายที่การตั้งค่าคุณภาพสูงสุด ทั้งสองระบบจะแสดงระดับ FPS ที่สะดวกสบาย แม้ว่าโหลดโปรเซสเซอร์และการ์ดวิดีโอโดยเฉลี่ยจะสูงกว่าในกรณีของ Intel Core i7

อาร์มา 3มีการพึ่งพาโปรเซสเซอร์ที่เด่นชัดซึ่งหมายความว่าหน่วยความจำแคชจำนวนมากขึ้นควรมีบทบาทเชิงบวกแม้ในการตั้งค่ากราฟิกที่สูงเป็นพิเศษ นอกจากนี้โหลดบนการ์ดแสดงผลในทั้งสองกรณียังสูงถึง 60%

เกม ดูมที่การตั้งค่ากราฟิกสูงเป็นพิเศษ อนุญาตให้ซิงโครไนซ์ได้เพียงสองสามเฟรมแรก โดยที่ข้อได้เปรียบของ Core i7 คือประมาณ 10 FPS การยกเลิกการซิงโครไนซ์การเล่นเกมเพิ่มเติมไม่อนุญาตให้เรากำหนดระดับอิทธิพลของแคชต่อความเร็วของลำดับวิดีโอ ไม่ว่าในกรณีใด ความถี่จะถูกเก็บไว้ให้สูงกว่า 120 เฟรม/วินาที ดังนั้นแม้แต่ 10 FPS ก็ไม่มีผลกระทบต่อความสะดวกสบายในการเล่นมากนัก

จบมินิซีรีย์ของการเล่นเกมสด วิวัฒนาการขั้นที่ 2. ที่นี่เราอาจเห็นความแตกต่างระหว่างระบบ เนื่องจากในทั้งสองกรณี การ์ดแสดงผลโหลดประมาณครึ่งหนึ่ง ดังนั้นโดยอัตนัยดูเหมือนว่าระดับ FPS ในกรณีของ Core i7 จะสูงกว่า แต่ก็เป็นไปไม่ได้ที่จะพูดได้อย่างแน่นอนเนื่องจากฉากไม่เหมือนกัน

เกณฑ์มาตรฐานจะให้ภาพที่ให้ข้อมูลมากขึ้น ตัวอย่างเช่นใน จีทีเอ วีคุณจะเห็นว่านอกเมืองข้อดีของแคช 8 MB อยู่ที่ 5-6 เฟรม/วินาที และในเมือง - สูงถึง 10 FPS เนื่องจากโหลดการ์ดแสดงผลที่สูงขึ้น ในเวลาเดียวกันตัวเร่งความเร็ววิดีโอในทั้งสองกรณีนั้นยังห่างไกลจากการโหลดสูงสุดและทุกอย่างขึ้นอยู่กับ CPU

แม่มดคนที่สามเราเปิดตัวด้วยการตั้งค่ากราฟิกที่รุนแรงและโปรไฟล์หลังการประมวลผลที่สูง ในฉากที่มีสคริปต์ฉากหนึ่ง ข้อดีของ Core i7 ในบางสถานที่สูงถึง 6-8 FPS โดยมีการเปลี่ยนแปลงมุมอย่างมากและจำเป็นต้องโหลดข้อมูลใหม่ เมื่อโหลดบนโปรเซสเซอร์และการ์ดแสดงผลถึง 100% อีกครั้ง ความแตกต่างจะลดลงเหลือ 2-3 เฟรม

การตั้งค่ากราฟิกสูงสุดที่กำหนดไว้ล่วงหน้า เอ็กซ์คอม 2ไม่ใช่การทดสอบอย่างจริงจังสำหรับทั้งสองระบบ และอัตราเฟรมอยู่ที่ประมาณ 100 FPS แต่ที่นี่เช่นกัน หน่วยความจำแคชจำนวนมากขึ้นก็ถูกแปลงเป็นความเร็วที่เพิ่มขึ้นจาก 2 เป็น 12 เฟรม/วินาที และแม้ว่าโปรเซสเซอร์ทั้งสองจะไม่สามารถโหลดการ์ดแสดงผลได้สูงสุด แต่เวอร์ชัน 8 MB ก็ยังดีกว่าในเรื่องนี้ในบางแห่ง

เกมดังกล่าวทำให้ฉันประหลาดใจมากที่สุด ดินแรลลี่ซึ่งเราเปิดตัวด้วยค่าที่ตั้งไว้สูงมาก ในช่วงเวลาหนึ่งความแตกต่างถึง 25 fps เพียงอย่างเดียวเนื่องจากแคช L3 ที่ใหญ่กว่า ทำให้สามารถโหลดการ์ดแสดงผลได้ดีขึ้น 10-15% อย่างไรก็ตามผลการวัดประสิทธิภาพโดยเฉลี่ยแสดงให้เห็นถึงชัยชนะเล็กน้อยสำหรับ Core i7 - เพียง 11 FPS

ก็มีสถานการณ์ที่น่าสนใจเกิดขึ้นด้วย Rainbow Six ล้อม: บนถนนในเฟรมแรกของเกณฑ์มาตรฐาน ข้อดีของ Core i7 คือ 10-15 FPS ในอาคาร โหลดโปรเซสเซอร์และการ์ดแสดงผลในทั้งสองกรณีถึง 100% ดังนั้นความแตกต่างจึงลดลงเหลือ 3-6 FPS แต่สุดท้ายเมื่อกล้องออกไปนอกบ้าน Core i3 lag ก็เกิน 10 fps อีกครั้ง ตัวเลขเฉลี่ยกลายเป็น 7 FPS เพื่อสนับสนุนแคช 8 MB

กองด้วยคุณภาพกราฟิกสูงสุด ยังตอบสนองต่อการเพิ่มหน่วยความจำแคชได้ดีอีกด้วย เฟรมแรกของการวัดประสิทธิภาพโหลดเธรด Core i3 ทั้งหมดจนเต็มแล้ว แต่โหลดรวมบน Core i7 คือ 70-80% อย่างไรก็ตาม ความแตกต่างของความเร็วในช่วงเวลาเหล่านี้อยู่ที่ 2-3 FPS เท่านั้น หลังจากนั้นไม่นานโหลดของโปรเซสเซอร์ทั้งสองถึง 100% และในช่วงเวลาหนึ่งความแตกต่างนั้นอยู่หลัง Core i3 อยู่แล้ว แต่จะอยู่ที่ 1-2 เฟรม/วินาทีเท่านั้น โดยเฉลี่ยแล้วจะอยู่ที่ประมาณ 1 FPS เมื่อเทียบกับ Core i7

ในทางกลับกันเกณฑ์มาตรฐานการเพิ่มขึ้นของ Tomb Riderด้วยการตั้งค่ากราฟิกที่สูงในฉากทดสอบทั้งสามฉาก แสดงให้เห็นอย่างชัดเจนถึงข้อดีของโปรเซสเซอร์ที่มีหน่วยความจำแคชจำนวนมากขึ้นอย่างเห็นได้ชัด ประสิทธิภาพโดยเฉลี่ยอยู่ที่ 5-6 FPS ดีกว่า แต่หากคุณดูแต่ละฉากอย่างละเอียด ในบางสถานที่ Core i3 ล่าช้าเกิน 10 เฟรม/วินาที

แต่เมื่อเลือกค่าที่ตั้งไว้ล่วงหน้าที่มีการตั้งค่าที่สูงมาก โหลดของการ์ดแสดงผลและโปรเซสเซอร์จะเพิ่มขึ้น ดังนั้นในกรณีส่วนใหญ่ ความแตกต่างระหว่างระบบจะลดลงเหลือเพียงไม่กี่เฟรม และในช่วงเวลาสั้น ๆ เท่านั้นที่ Core i7 สามารถแสดงผลลัพธ์ที่สำคัญยิ่งขึ้นได้ ตัวบ่งชี้เฉลี่ยของความได้เปรียบตามผลการวัดประสิทธิภาพลดลงเหลือ 3-4 FPS

ฮิตแมนยังได้รับผลกระทบจากแคช L3 น้อยกว่าอีกด้วย แม้ว่าที่นี่จะมีโปรไฟล์ที่มีรายละเอียดสูงเป็นพิเศษ แต่การเพิ่ม 5 MB ก็ช่วยให้โหลดการ์ดวิดีโอได้ดีกว่า โดยเพิ่มเป็น 3-4 เฟรม/วินาที พวกเขาไม่ได้ส่งผลกระทบที่สำคัญอย่างยิ่งต่อประสิทธิภาพการทำงาน แต่ด้วยเหตุผลด้านกีฬาล้วนๆ เป็นเรื่องดีที่มีผู้ชนะ

การตั้งค่ากราฟิกสูง Deus ex: มนุษยชาติแตกแยกต้องการพลังการประมวลผลสูงสุดจากทั้งสองระบบทันที ดังนั้นความแตกต่างที่ดีที่สุดคือ 1-2 เฟรมสำหรับ Core i7 ตามที่ระบุโดยค่าเฉลี่ย

เรียกใช้งานอีกครั้งด้วยค่าที่ตั้งไว้ล่วงหน้าสูงเป็นพิเศษทำให้การ์ดแสดงผลโหลดมากขึ้น ดังนั้นผลกระทบของโปรเซสเซอร์ที่มีต่อความเร็วโดยรวมจึงน้อยลงไปอีก ดังนั้นความแตกต่างในแคช L3 แทบไม่มีผลกระทบต่อสถานการณ์และ FPS เฉลี่ยแตกต่างกันน้อยกว่าครึ่งเฟรม

จากผลการทดสอบพบว่าหน่วยความจำแคช L3 มีผลกระทบต่อประสิทธิภาพการเล่นเกม แต่จะปรากฏเฉพาะเมื่อไม่ได้โหลดการ์ดแสดงผลเต็มประสิทธิภาพเท่านั้น ในกรณีเช่นนี้ อาจเป็นไปได้ที่จะได้รับเพิ่มขึ้น 5-10 FPS หากแคชเพิ่มขึ้น 2.5 เท่า นั่นคือโดยประมาณปรากฎว่าสิ่งอื่น ๆ ทั้งหมดเท่ากันหน่วยความจำแคช L3 เพิ่มเติมแต่ละ MB จะเพิ่มความเร็วในการแสดงวิดีโอเพียง 1-2 FPS

ดังนั้นหากเราเปรียบเทียบบรรทัดข้างเคียงเช่น Celeron และ Pentium หรือรุ่นที่มีหน่วยความจำแคช L3 จำนวนต่างกันภายในซีรีส์ Core i3 ประสิทธิภาพหลักจะเพิ่มขึ้นเนื่องจากความถี่ที่สูงขึ้น จากนั้นจึงมีเธรดตัวประมวลผลเพิ่มเติม และแกน ดังนั้นเมื่อเลือกโปรเซสเซอร์ก่อนอื่นคุณต้องให้ความสำคัญกับคุณสมบัติหลักจากนั้นจึงใส่ใจกับจำนวนหน่วยความจำแคชเท่านั้น

นั่นคือทั้งหมดที่ ขอขอบคุณสำหรับความสนใจของคุณ. เราหวังว่าเนื้อหานี้จะมีประโยชน์และน่าสนใจ

บทความอ่าน 27,046 ครั้ง

สมัครสมาชิกช่องของเรา

เมื่อทำงานต่าง ๆ โปรเซสเซอร์ของคอมพิวเตอร์ของคุณจะได้รับบล็อกข้อมูลที่จำเป็นจาก RAM เมื่อประมวลผลแล้ว CPU จะเขียนผลการคำนวณที่ได้รับลงในหน่วยความจำและรับบล็อกข้อมูลถัดไปสำหรับการประมวลผล สิ่งนี้จะดำเนินต่อไปจนกว่างานจะเสร็จสิ้น

กระบวนการข้างต้นดำเนินการด้วยความเร็วสูงมาก อย่างไรก็ตาม ความเร็วของ RAM ที่เร็วที่สุดก็ยังน้อยกว่าความเร็วของโปรเซสเซอร์ที่อ่อนแอใดๆ อย่างมาก ทุกการกระทำ ไม่ว่าจะเป็นการเขียนข้อมูลลงไปหรืออ่านจากข้อมูลนั้น ล้วนใช้เวลานาน ความเร็วของ RAM นั้นต่ำกว่าความเร็วของโปรเซสเซอร์หลายสิบเท่า

แม้ว่าความเร็วในการประมวลผลข้อมูลจะแตกต่างกัน แต่โปรเซสเซอร์พีซีไม่ได้ใช้งานและไม่รอให้ RAM ออกและรับข้อมูล โปรเซสเซอร์ทำงานอยู่เสมอและต้องขอบคุณหน่วยความจำแคชในนั้น

แคชคือ RAM ชนิดพิเศษ โปรเซสเซอร์ใช้หน่วยความจำแคชเพื่อจัดเก็บสำเนาข้อมูลจาก RAM หลักของคอมพิวเตอร์ที่มีแนวโน้มที่จะเข้าถึงได้ในอนาคตอันใกล้นี้

โดยพื้นฐานแล้ว หน่วยความจำแคชทำหน้าที่เป็นบัฟเฟอร์หน่วยความจำความเร็วสูงที่จัดเก็บข้อมูลที่โปรเซสเซอร์อาจต้องการ ดังนั้นโปรเซสเซอร์จึงได้รับข้อมูลที่จำเป็นเร็วกว่าการอ่านจาก RAM ถึงสิบเท่า

ความแตกต่างที่สำคัญระหว่างหน่วยความจำแคชและบัฟเฟอร์ปกติคือฟังก์ชันลอจิคัลในตัว บัฟเฟอร์จัดเก็บข้อมูลแบบสุ่ม ซึ่งโดยปกติแล้วจะได้รับการประมวลผลตามรูปแบบ "ได้รับก่อน ออกก่อน" หรือ "ได้รับก่อน ออกครั้งหลัง" แคชหน่วยความจำประกอบด้วยข้อมูลที่น่าจะเข้าถึงได้ในอนาคตอันใกล้นี้ ดังนั้นด้วย "แคชอัจฉริยะ" โปรเซสเซอร์จึงสามารถทำงานได้เต็มความเร็วและไม่รอให้ดึงข้อมูลจาก RAM ที่ช้ากว่า

ประเภทและระดับพื้นฐานของหน่วยความจำแคช L1 L2 L3

หน่วยความจำแคชถูกสร้างขึ้นในรูปแบบของชิปหน่วยความจำเข้าถึงโดยสุ่มแบบคงที่ (SRAM) ซึ่งติดตั้งบนเมนบอร์ดหรือมีอยู่ในโปรเซสเซอร์ เมื่อเปรียบเทียบกับหน่วยความจำประเภทอื่นๆ หน่วยความจำแบบคงที่สามารถทำงานได้ที่ความเร็วสูงมาก

ความเร็วแคชขึ้นอยู่กับขนาดของชิปเฉพาะ ยิ่งชิปมีขนาดใหญ่เท่าใด การทำงานก็จะยิ่งมีความเร็วสูงได้ยากขึ้นเท่านั้น เมื่อคำนึงถึงคุณลักษณะนี้ ในระหว่างการผลิต หน่วยความจำแคชของโปรเซสเซอร์จะถูกสร้างขึ้นในรูปแบบของบล็อกเล็กๆ หลายบล็อกที่เรียกว่าระดับ วันนี้ที่พบมากที่สุดคือระบบแคชสามระดับ L1, L2, L3:

หน่วยความจำแคช L1 - มีขนาดเล็กที่สุด (เพียงไม่กี่สิบกิโลไบต์) แต่เป็นความเร็วที่เร็วที่สุดและสำคัญที่สุด ประกอบด้วยข้อมูลที่ใช้บ่อยที่สุดโดยโปรเซสเซอร์และทำงานโดยไม่ชักช้า โดยทั่วไป จำนวนชิปหน่วยความจำ L1 จะเท่ากับจำนวนแกนประมวลผล โดยแต่ละคอร์จะเข้าถึงเฉพาะชิป L1 เท่านั้น

หน่วยความจำแคช L2 มีความเร็วต่ำกว่าหน่วยความจำ L1 แต่มีปริมาตรเหนือกว่าซึ่งมีหน่วยวัดแล้วหลายร้อยกิโลไบต์ มีไว้สำหรับการจัดเก็บข้อมูลสำคัญชั่วคราว ความน่าจะเป็นในการเข้าถึงซึ่งต่ำกว่าข้อมูลที่เก็บไว้ในแคช L1

แคชระดับที่สาม L3 - มีปริมาณมากที่สุดในสามระดับ (สามารถเข้าถึงหลายสิบเมกะไบต์) แต่ก็มีความเร็วที่ช้าที่สุดซึ่งยังคงสูงกว่าความเร็วของ RAM อย่างมาก หน่วยความจำแคช L3 นั้นเป็นเรื่องปกติสำหรับคอร์โปรเซสเซอร์ทั้งหมด ระดับหน่วยความจำ L3 ได้รับการออกแบบมาเพื่อจัดเก็บข้อมูลสำคัญเหล่านั้นชั่วคราว ความน่าจะเป็นในการเข้าถึงซึ่งต่ำกว่าข้อมูลที่จัดเก็บไว้ในสองระดับแรก L1, L2 เล็กน้อย นอกจากนี้ยังช่วยให้แน่ใจว่าแกนประมวลผลสื่อสารระหว่างกัน

โปรเซสเซอร์บางรุ่นได้รับการออกแบบให้มีหน่วยความจำแคชสองระดับ ซึ่ง L2 รวมฟังก์ชันทั้งหมดของ L2 และ L3 เข้าด้วยกัน

เมื่อแคชขนาดใหญ่มีประโยชน์

คุณจะรู้สึกถึงผลกระทบที่สำคัญจากปริมาณแคชขนาดใหญ่เมื่อใช้โปรแกรม Archiver ในเกม 3 มิติระหว่างการประมวลผลและการเข้ารหัสวิดีโอ ในโปรแกรมและแอปพลิเคชันที่ค่อนข้าง "เบา" ความแตกต่างแทบจะมองไม่เห็นเลย (โปรแกรมสำนักงาน เครื่องเล่น ฯลฯ)