คอมพิวเตอร์ Windows อินเทอร์เน็ต

บล็อกการแรสเตอร์ในแผนที่คืออะไร จำนวนหน่วยคำนวณ (shader) หรือโปรเซสเซอร์

ส่วนประกอบพื้นฐานของการ์ดวิดีโอ:

  • เอาท์พุท;
  • อินเทอร์เฟซ;
  • ระบบทำความเย็น
  • โปรเซสเซอร์กราฟิก
  • หน่วยความจำวิดีโอ

เทคโนโลยีกราฟิค:

  • พจนานุกรม;
  • สถาปัตยกรรม GPU: ฟังก์ชั่น
    หน่วยจุดยอด / พิกเซล, เฉดสี, ​​อัตราการเติม, หน่วยพื้นผิว / แรสเตอร์, ไปป์ไลน์;
  • สถาปัตยกรรม GPU: เทคโนโลยี
    กระบวนการทางเทคนิค, ความถี่ GPU, หน่วยความจำวิดีโอในเครื่อง (ขนาด, บัส, ประเภท, ความถี่), โซลูชันที่มีการ์ดแสดงผลหลายตัว
  • ฟังก์ชั่นการมองเห็น
    DirectX, ช่วงไดนามิกสูง (HDR), การลบรอยหยักแบบเต็มหน้าจอ, การกรองพื้นผิว, พื้นผิวความละเอียดสูง

อภิธานศัพท์ของคำศัพท์กราฟิกพื้นฐาน

อัตราการรีเฟรช

เช่นเดียวกับในโรงภาพยนตร์หรือทีวี คอมพิวเตอร์ของคุณจะจำลองการเคลื่อนไหวบนจอภาพโดยแสดงลำดับของเฟรม อัตราการรีเฟรชของจอภาพระบุว่าภาพจะถูกรีเฟรชบนหน้าจอกี่ครั้งต่อวินาที ตัวอย่างเช่น 75 Hz สอดคล้องกับ 75 การอัปเดตต่อวินาที

หากคอมพิวเตอร์กำลังประมวลผลเฟรมเร็วกว่าที่จอภาพสามารถแสดงได้ ปัญหาอาจปรากฏขึ้นในเกม ตัวอย่างเช่น หากคอมพิวเตอร์แสดงผล 100 เฟรมต่อวินาที และอัตราการรีเฟรชของจอภาพคือ 75 Hz ดังนั้นเนื่องจากการซ้อนทับ จอภาพจึงสามารถแสดงเฉพาะบางส่วนของภาพในช่วงระยะเวลารีเฟรช เป็นผลให้สิ่งประดิษฐ์ทางภาพปรากฏขึ้น

วิธีแก้ปัญหา คุณสามารถเปิดใช้งาน V-Sync (การซิงค์แนวตั้ง) โดยจำกัดจำนวนเฟรมที่คอมพิวเตอร์ปล่อยออกมาตามอัตราการรีเฟรชของจอภาพ ป้องกันไม่ให้เกิดสิ่งประดิษฐ์ขึ้น หากคุณเปิดใช้งาน V-Sync จำนวนเฟรมที่แสดงผลในเกมจะไม่เกินอัตราการรีเฟรช นั่นคือที่ 75 Hz คอมพิวเตอร์จะส่งออกไม่เกิน 75 เฟรมต่อวินาที

Pixel

คำว่า "พิกเซล" ย่อมาจาก " รูป ture เอล ement "เป็นองค์ประกอบภาพ ซึ่งเป็นจุดเล็กๆ บนจอแสดงผลที่สามารถเรืองแสงเป็นสีใดสีหนึ่งได้ (ในกรณีส่วนใหญ่ เฉดสีจะได้มาจากการผสมสีพื้นฐานสามสี ได้แก่ สีแดง สีเขียว และสีน้ำเงิน) หากความละเอียดหน้าจอคือ 1024 × 768 คุณจะเห็นเมทริกซ์ที่มีความกว้าง 1024 พิกเซลและสูง 768 พิกเซล พิกเซลประกอบกันเป็นภาพ รูปภาพบนหน้าจออัปเดตจาก 60 เป็น 120 ครั้งต่อวินาที ขึ้นอยู่กับประเภทของการแสดงผลและข้อมูลที่สร้างโดยเอาต์พุตของการ์ดวิดีโอ จอภาพ CRT จะอัปเดตการแสดงผลทีละบรรทัด ในขณะที่จอภาพ LCD แบบจอแบนสามารถอัปเดตแต่ละพิกเซลแยกกันได้

จุดสุดยอด

วัตถุทั้งหมดในฉาก 3 มิติประกอบด้วยจุดยอด จุดยอดเป็นจุดในพื้นที่สามมิติที่มีพิกัด X, Y และ Z จุดยอดหลายจุดสามารถจัดกลุ่มเป็นรูปหลายเหลี่ยมได้ ส่วนใหญ่มักจะเป็นรูปสามเหลี่ยม แต่รูปร่างที่ซับซ้อนกว่าก็เป็นไปได้เช่นกัน จากนั้นใช้พื้นผิวกับรูปหลายเหลี่ยม ซึ่งทำให้วัตถุดูสมจริง ลูกบาศก์ 3 มิติที่แสดงในภาพประกอบด้านบนมีจุดยอดแปดจุด วัตถุที่ซับซ้อนกว่านั้นมีพื้นผิวโค้ง ซึ่งจริงๆ แล้วประกอบด้วยจุดยอดจำนวนมาก

พื้นผิว

พื้นผิวเป็นเพียงภาพ 2 มิติขนาดใดก็ได้ที่ซ้อนทับบนวัตถุ 3 มิติเพื่อจำลองพื้นผิวของมัน ตัวอย่างเช่น ลูกบาศก์ 3 มิติของเรามีจุดยอดแปดจุด ก่อนการแมปพื้นผิวจะดูเหมือนกล่องธรรมดาๆ แต่เมื่อเราทาเท็กซ์เจอร์ กล่องจะกลายเป็นสี

Shader

โปรแกรม Pixel shader ช่วยให้กราฟิกการ์ดสร้างเอฟเฟกต์ที่น่าประทับใจ เช่น น้ำใน Elder Scrolls: Oblivion

ปัจจุบันมีเฉดสีสองประเภท: จุดยอดและพิกเซล เวอร์เท็กซ์เชเดอร์สามารถปรับเปลี่ยนหรือแปลงวัตถุ 3 มิติได้ Pixel shaders ช่วยให้คุณสามารถเปลี่ยนสีของพิกเซลตามข้อมูลได้ ลองนึกภาพแหล่งกำเนิดแสงในฉาก 3 มิติที่ทำให้วัตถุที่เรืองแสงสว่างขึ้นพร้อมกับเงาบนวัตถุอื่นๆ ไปพร้อม ๆ กัน ทั้งหมดนี้เกิดขึ้นได้ด้วยการเปลี่ยนข้อมูลสีของพิกเซล

Pixel shaders ใช้เพื่อสร้างเอฟเฟกต์ที่ซับซ้อนในเกมโปรดของคุณ ตัวอย่างเช่น รหัสเชเดอร์สามารถทำให้พิกเซลรอบๆ ดาบ 3 มิติสว่างขึ้นได้ Shader อื่นสามารถประมวลผลจุดยอดทั้งหมดของวัตถุ 3D ที่ซับซ้อนและจำลองการระเบิดได้ นักพัฒนาเกมหันมาใช้เฉดสีที่ซับซ้อนมากขึ้นเพื่อสร้างกราฟิกที่สมจริง เกมสมัยใหม่เกือบทุกเกมที่มีกราฟิกมากมายใช้เฉดสี

ด้วยการเปิดตัว Microsoft DirectX 10 Application Programming Interface (API) รุ่นถัดไป จะมีการเปิดตัว shader ประเภทที่สามที่เรียกว่า geo shaders ด้วยความช่วยเหลือของพวกเขา จะสามารถทำลายวัตถุ ดัดแปลง และทำลายมันได้ ขึ้นอยู่กับผลลัพธ์ที่ต้องการ ประเภทที่สามของ shader สามารถตั้งโปรแกรมได้ในลักษณะเดียวกับสองตัวแรก แต่บทบาทของมันจะแตกต่างกัน

อัตราการเติม

บ่อยครั้งมากในกล่องที่มีการ์ดแสดงผล คุณสามารถค้นหาค่าของอัตราการส่ง โดยทั่วไป อัตราการส่งโฆษณาจะระบุว่า GPU สามารถส่งพิกเซลได้เร็วเพียงใด ในการ์ดวิดีโอรุ่นเก่า คุณสามารถค้นหาอัตราการเติมสามเหลี่ยม แต่วันนี้มีอัตราการเติมสองประเภท: อัตราการเติมพิกเซลและอัตราการเติมพื้นผิว ดังที่กล่าวไว้ อัตราการเติมพิกเซลสอดคล้องกับอัตราการส่งออกพิกเซล คำนวณจากจำนวนการดำเนินการแรสเตอร์ (ROP) คูณด้วยความถี่สัญญาณนาฬิกา

ATi และ nVidia คำนวณอัตราการเติมพื้นผิวต่างกัน nVidia คิดว่าความเร็วนั้นได้มาจากการคูณจำนวนไพพ์ไลน์พิกเซลด้วยความเร็วสัญญาณนาฬิกา ATi คูณจำนวนหน่วยพื้นผิวด้วยความเร็วสัญญาณนาฬิกา โดยหลักการแล้ว ทั้งสองวิธีนั้นถูกต้อง เนื่องจาก nVidia ใช้หนึ่งหน่วยพื้นผิวต่อหน่วยเชเดอร์พิกเซล (นั่นคือ หนึ่งต่อไพพ์ไลน์พิกเซล)

เมื่อคำนึงถึงคำจำกัดความเหล่านี้แล้ว ให้ฉันดำเนินการต่อไปและหารือเกี่ยวกับหน้าที่ที่สำคัญที่สุดของ GPU สิ่งที่พวกเขาทำ และเหตุใดจึงมีความสำคัญมาก

สถาปัตยกรรม GPU: คุณสมบัติ

ความสมจริงของกราฟิก 3D นั้นขึ้นอยู่กับประสิทธิภาพของการ์ดแสดงผลเป็นอย่างมาก ยิ่งโปรเซสเซอร์มีบล็อกพิกเซลเชดเดอร์มากเท่าใด และความถี่ยิ่งสูงขึ้น เอฟเฟกต์ก็จะยิ่งนำไปใช้กับฉาก 3 มิติเพื่อปรับปรุงการรับรู้ทางสายตาได้ดียิ่งขึ้น

GPU มีบล็อคการทำงานที่แตกต่างกันมากมาย ด้วยจำนวนส่วนประกอบบางอย่าง คุณสามารถประมาณว่า GPU มีประสิทธิภาพเพียงใด ก่อนดำเนินการต่อ ให้ฉันตรวจสอบบล็อกการทำงานที่สำคัญที่สุด

โปรเซสเซอร์ Vertex (หน่วย Shader ของจุดสุดยอด)

เช่นเดียวกับหน่วยพิกเซลเชเดอร์ โปรเซสเซอร์ vertex รันโค้ด shader ที่สัมผัสกับจุดยอด เนื่องจากงบประมาณจุดยอดที่มากขึ้นช่วยให้คุณสร้างวัตถุ 3 มิติที่ซับซ้อนมากขึ้น ประสิทธิภาพของโปรเซสเซอร์จุดยอดจึงมีความสำคัญมากในฉาก 3 มิติที่มีวัตถุที่ซับซ้อนหรือมีวัตถุจำนวนมาก อย่างไรก็ตาม หน่วย vertex shader ยังคงไม่ส่งผลกระทบต่อประสิทธิภาพอย่างชัดเจนเท่ากับโปรเซสเซอร์พิกเซล

โปรเซสเซอร์พิกเซล (หน่วย Pixel Shader)

โปรเซสเซอร์พิกเซลเป็นส่วนประกอบหนึ่งของชิปกราฟิกสำหรับการประมวลผลโปรแกรม Pixel Shader โปรเซสเซอร์เหล่านี้ทำการคำนวณแบบพิกเซลเท่านั้น เนื่องจากพิกเซลประกอบด้วยข้อมูลสี พิกเซลเชดเดอร์จึงสามารถให้เอฟเฟกต์กราฟิกที่น่าประทับใจได้ ตัวอย่างเช่น เอฟเฟกต์น้ำส่วนใหญ่ที่คุณเคยเห็นในเกมสร้างขึ้นโดยใช้พิกเซลเชดเดอร์ โดยทั่วไป จำนวนพิกเซลโปรเซสเซอร์จะใช้เพื่อเปรียบเทียบประสิทธิภาพพิกเซลของการ์ดวิดีโอ หากการ์ดใบหนึ่งมีหน่วยเชดเดอร์แปดพิกเซลและอีกการ์ดหนึ่งมี 16 ยูนิต ก็ค่อนข้างสมเหตุสมผลที่จะสมมติว่าการ์ดวิดีโอที่มี 16 ยูนิตจะประมวลผลโปรแกรมพิกเซลที่ซับซ้อนเร็วขึ้น คุณควรพิจารณาความเร็วสัญญาณนาฬิกาด้วย แต่วันนี้การเพิ่มจำนวนโปรเซสเซอร์พิกเซลเป็นสองเท่านั้นประหยัดพลังงานมากกว่าการเพิ่มความถี่ของชิปกราฟิกเป็นสองเท่า

เฉดสีแบบครบวงจร

Unified shaders ยังไม่มาถึงในโลกของพีซี แต่มาตรฐาน DirectX 10 ที่กำลังจะมีขึ้นนั้นใช้สถาปัตยกรรมที่คล้ายคลึงกัน นั่นคือ โครงสร้างของโค้ดของโปรแกรมจุดยอด เรขาคณิต และพิกเซลจะเหมือนกัน แม้ว่าตัวแรเงาจะทำงานต่างกัน ข้อมูลจำเพาะใหม่สามารถดูได้บน Xbox 360 ซึ่ง GPU ได้รับการออกแบบมาเป็นพิเศษโดย ATi สำหรับ Microsoft การได้เห็นศักยภาพของ DirectX 10 ใหม่จะเป็นเรื่องที่น่าสนใจทีเดียว

หน่วยการทำแผนที่พื้นผิว (TMU)

ควรเลือกและกรองพื้นผิว งานนี้ทำโดยหน่วยการแมปพื้นผิวซึ่งทำงานร่วมกับหน่วยพิกเซลและจุดยอด งานของ TMU คือการนำการดำเนินการพื้นผิวไปใช้กับพิกเซล มักใช้จำนวนหน่วยพื้นผิวใน GPU เพื่อเปรียบเทียบประสิทธิภาพพื้นผิวของการ์ดวิดีโอ ค่อนข้างสมเหตุสมผลที่จะสมมติว่าการ์ดแสดงผลที่มีจำนวน TMU สูงกว่าจะให้ประสิทธิภาพพื้นผิวที่สูงขึ้น

หน่วยดำเนินการแรสเตอร์ (ROP)

RIP มีหน้าที่เขียนข้อมูลพิกเซลลงในหน่วยความจำ อัตราที่ดำเนินการนี้คืออัตราการส่งโฆษณา ในช่วงแรกๆ ของตัวเร่งความเร็ว 3 มิติ ROP และอัตราการเติมเป็นคุณลักษณะที่สำคัญมากของกราฟิกการ์ด ทุกวันนี้ ประสิทธิภาพของ ROP ยังคงมีความสำคัญ แต่ประสิทธิภาพของการ์ดแสดงผลไม่ได้ถูกจำกัดด้วยบล็อคเหล่านี้อีกต่อไป อย่างที่เคยเป็นมา ดังนั้นประสิทธิภาพ (และจำนวน) ของ ROP จึงไม่ค่อยได้ใช้ในการประมาณความเร็วของการ์ดแสดงผล

สายพานลำเลียง

ไปป์ไลน์ใช้เพื่ออธิบายสถาปัตยกรรมของการ์ดแสดงผลและให้การแสดงภาพที่ชัดเจนของประสิทธิภาพของ GPU

สายพานลำเลียงไม่ใช่ข้อกำหนดทางเทคนิคที่เข้มงวด GPU ใช้ไปป์ไลน์ที่แตกต่างกันซึ่งทำหน้าที่ต่างกัน ในอดีต ไปป์ไลน์ถูกเข้าใจว่าเป็นโปรเซสเซอร์พิกเซลที่เชื่อมต่อกับ Texture Mapping Unit (TMU) ของตัวเอง ตัวอย่างเช่น การ์ดวิดีโอ Radeon 9700 ใช้โปรเซสเซอร์แปดพิกเซล ซึ่งแต่ละอันเชื่อมต่อกับ TMU ของตัวเอง ดังนั้นการ์ดดังกล่าวจึงถือว่ามีแปดไปป์ไลน์

แต่มันยากมากที่จะอธิบายโปรเซสเซอร์สมัยใหม่ด้วยจำนวนไปป์ไลน์ เมื่อเทียบกับการออกแบบก่อนหน้านี้ โปรเซสเซอร์ใหม่ใช้โครงสร้างแบบแยกส่วน ATi ถือได้ว่าเป็นผู้ริเริ่มในด้านนี้ ซึ่งด้วยการ์ดวิดีโอ X1000 ได้เปลี่ยนไปใช้โครงสร้างแบบแยกส่วน ซึ่งทำให้สามารถบรรลุประสิทธิภาพที่เพิ่มขึ้นผ่านการเพิ่มประสิทธิภาพภายใน บล็อก CPU บางตัวถูกใช้มากกว่าตัวอื่นๆ และเพื่อปรับปรุงประสิทธิภาพของ GPU ATi ได้พยายามปรับสมดุลจำนวนบล็อกที่ต้องการและพื้นที่ดาย (ไม่ใหญ่เกินไป) ในสถาปัตยกรรมนี้ คำว่า "พิกเซลไปป์ไลน์" สูญเสียความหมายไป เนื่องจากตัวประมวลผลพิกเซลไม่ได้เชื่อมต่อกับ TMU ของตัวเองอีกต่อไป ตัวอย่างเช่น ATi Radeon X1600 GPU มี 12 Pixel Shaders และ TMU เพียงสี่ตัว ดังนั้นจึงไม่สามารถพูดได้ว่าสถาปัตยกรรมของโปรเซสเซอร์นี้มีไปป์ไลน์ 12 พิกเซลเหมือนกับที่บอกว่ามีเพียงสี่ตัวเท่านั้น อย่างไรก็ตาม ตามธรรมเนียมแล้ว ไปป์ไลน์พิกเซลยังคงถูกกล่าวถึง

เมื่อพิจารณาสมมติฐานเหล่านี้แล้ว จำนวนพิกเซลไปป์ไลน์ใน GPU มักถูกใช้เพื่อเปรียบเทียบการ์ดวิดีโอ (ยกเว้นสาย ATi X1x00) ตัวอย่างเช่น ถ้าเราใช้การ์ดวิดีโอที่มีท่อส่ง 24 และ 16 ท่อ มันก็สมเหตุสมผลที่จะสรุปว่าการ์ดที่มีท่อส่ง 24 ท่อจะเร็วกว่า

สถาปัตยกรรม GPU: เทคโนโลยี

กระบวนการทางเทคนิค

คำนี้หมายถึงขนาดของหนึ่งองค์ประกอบ (ทรานซิสเตอร์) ของชิปและความแม่นยำของกระบวนการผลิต การปรับปรุงกระบวนการทางเทคนิคช่วยให้คุณได้องค์ประกอบที่เล็กลง ตัวอย่างเช่น กระบวนการ 0.18 ไมครอนสร้างองค์ประกอบที่ใหญ่กว่ากระบวนการ 0.13 ไมครอน จึงไม่มีประสิทธิภาพ ทรานซิสเตอร์ขนาดเล็กทำงานด้วยแรงดันไฟฟ้าที่ต่ำกว่า ในทางกลับกัน แรงดันไฟฟ้าที่ลดลงจะทำให้ความต้านทานความร้อนลดลง ซึ่งทำให้ปริมาณความร้อนลดลง การปรับปรุงกระบวนการทางเทคนิคช่วยลดระยะห่างระหว่างบล็อคการทำงานของชิป และการถ่ายโอนข้อมูลใช้เวลาน้อยลง ระยะทางที่สั้นลง แรงดันไฟฟ้าที่ต่ำลง และการปรับปรุงอื่นๆ ช่วยให้ได้ความเร็วสัญญาณนาฬิกาที่สูงขึ้น

ความเข้าใจค่อนข้างซับซ้อนโดยข้อเท็จจริงที่ว่าในปัจจุบันทั้งไมโครมิเตอร์ (ไมโครเมตร) และนาโนเมตร (นาโนเมตร) ถูกใช้เพื่อแสดงกระบวนการทางเทคนิค อันที่จริงแล้ว ทุกอย่างง่ายมาก 1 นาโนเมตรเท่ากับ 0.001 ไมโครเมตร ดังนั้นกระบวนการผลิต 0.09 ไมครอนและ 90 นาโนเมตรจึงเหมือนกัน ดังที่กล่าวไว้ข้างต้น เทคโนโลยีการประมวลผลที่มีขนาดเล็กลงช่วยให้คุณได้รับความเร็วสัญญาณนาฬิกาที่สูงขึ้น ตัวอย่างเช่น หากเราเปรียบเทียบการ์ดแสดงผลกับชิป 0.18 ไมครอนและ 0.09 ไมครอน (90 นาโนเมตร) ก็ถือว่าสมเหตุสมผลมากที่จะคาดหวังความถี่ที่สูงกว่าจากการ์ด 90 นาโนเมตร

ความเร็วสัญญาณนาฬิกาของ GPU

ความเร็วสัญญาณนาฬิกาของ GPU วัดเป็นเมกะเฮิรตซ์ (MHz) ซึ่งเป็นรอบสัญญาณนาฬิกาหลายล้านรอบต่อวินาที

ความเร็วสัญญาณนาฬิกาส่งผลโดยตรงต่อประสิทธิภาพของ GPU ยิ่งสูงก็ยิ่งทำงานได้มากขึ้นในไม่กี่วินาที ตัวอย่างแรก ลองใช้การ์ดวิดีโอ nVidia GeForce 6600 และ 6600 GT: 6600 GT GPU ทำงานที่ 500 MHz ในขณะที่การ์ด 6600 ปกติทำงานที่ 400 MHz เนื่องจากโปรเซสเซอร์มีลักษณะทางเทคนิคเหมือนกัน ดังนั้นความเร็วสัญญาณนาฬิกาของ 6600 GT ที่เพิ่มขึ้น 20% จึงส่งผลให้ประสิทธิภาพดีขึ้น

แต่ความเร็วนาฬิกาไม่ใช่ทุกอย่าง โปรดทราบว่าสถาปัตยกรรมมีผลอย่างมากต่อประสิทธิภาพการทำงาน ตัวอย่างที่สอง มาดูการ์ดจอ GeForce 6600 GT และ GeForce 6800 GT GPU ของ 6600 GT โอเวอร์คล็อกที่ 500 MHz แต่ 6800 GT ทำงานที่ 350 MHz เท่านั้น ตอนนี้ ให้พิจารณาว่า 6800 GT ใช้ไปป์ไลน์ 16 พิกเซล ในขณะที่ 6600 GT ใช้เพียงแปด ดังนั้น 6800 GT ที่มี 16 ไปป์ไลน์ที่ 350 MHz จะให้ประสิทธิภาพใกล้เคียงกับโปรเซสเซอร์ที่มีท่อส่งแปดท่อและความเร็วสัญญาณนาฬิกาสองเท่า (700 MHz) จากที่กล่าวมา สามารถใช้ความเร็วนาฬิกาเพื่อเปรียบเทียบประสิทธิภาพได้

หน่วยความจำวิดีโอในเครื่อง

หน่วยความจำการ์ดแสดงผลมีผลกระทบอย่างมากต่อประสิทธิภาพ แต่พารามิเตอร์หน่วยความจำที่แตกต่างกันจะส่งผลในรูปแบบต่างๆ

ขนาดหน่วยความจำวิดีโอ

จำนวนหน่วยความจำวิดีโออาจเรียกได้ว่าเป็นพารามิเตอร์ที่ประเมินค่าสูงเกินไปที่สุดของการ์ดวิดีโอ ผู้บริโภคที่ไม่มีประสบการณ์มักใช้จำนวนหน่วยความจำวิดีโอเพื่อเปรียบเทียบการ์ดต่างๆ กัน แต่ในความเป็นจริง ปริมาณดังกล่าวมีผลเพียงเล็กน้อยต่อประสิทธิภาพเมื่อเทียบกับพารามิเตอร์ เช่น ความถี่บัสหน่วยความจำและอินเทอร์เฟซ (ความกว้างของบัส)

ในกรณีส่วนใหญ่ การ์ดที่มีหน่วยความจำวิดีโอ 128 MB จะทำงานเกือบจะเหมือนกับการ์ดที่มีขนาด 256 MB แน่นอนว่า มีบางสถานการณ์ที่หน่วยความจำมากขึ้นทำให้ประสิทธิภาพเพิ่มขึ้น แต่จำไว้ว่าหน่วยความจำที่มากขึ้นจะไม่ทำให้ความเร็วในเกมเพิ่มขึ้นโดยอัตโนมัติ

ที่ซึ่งระดับเสียงจะมีประโยชน์ในเกมที่มีพื้นผิวที่มีความละเอียดสูง ผู้พัฒนาเกมมีชุดพื้นผิวหลายชุดสำหรับเกม และยิ่งมีหน่วยความจำในการ์ดวิดีโอมากเท่าใด ความละเอียดของพื้นผิวที่โหลดก็จะยิ่งสูงขึ้นเท่านั้น พื้นผิวที่มีความละเอียดสูงให้ความคมชัดและรายละเอียดที่สูงขึ้นในเกม ดังนั้นจึงค่อนข้างสมเหตุสมผลที่จะใช้การ์ดที่มีหน่วยความจำจำนวนมากหากเกณฑ์อื่น ๆ เหมือนกันทั้งหมด ให้เราเตือนคุณอีกครั้งว่าความกว้างและความถี่บัสหน่วยความจำมีผลอย่างมากต่อประสิทธิภาพการทำงานมากกว่าจำนวนหน่วยความจำกายภาพบนการ์ด

ความกว้างบัสหน่วยความจำ

ความกว้างของบัสหน่วยความจำเป็นหนึ่งในส่วนที่สำคัญที่สุดของประสิทธิภาพของหน่วยความจำ บัสสมัยใหม่มีความกว้าง 64 ถึง 256 บิต และในบางกรณีอาจมีขนาด 512 บิต ยิ่งบัสหน่วยความจำกว้าง ข้อมูลก็ยิ่งสามารถส่งได้ต่อรอบสัญญาณนาฬิกา และส่งผลโดยตรงต่อประสิทธิภาพ ตัวอย่างเช่น หากเราใช้บัสสองตัวที่มีความถี่เท่ากัน ในทางทฤษฎีแล้ว บัส 128 บิตจะถ่ายโอนข้อมูลต่อนาฬิกาเป็นสองเท่าของ 64 บิต และบัส 256 บิตนั้นใหญ่เป็นสองเท่า

แบนด์วิดท์บัสที่สูงขึ้น (แสดงเป็นบิตหรือไบต์ต่อวินาที 1 ไบต์ = 8 บิต) ส่งผลให้ประสิทธิภาพของหน่วยความจำสูงขึ้น นั่นคือเหตุผลที่เมมโมรี่บัสมีความสำคัญมากกว่าขนาดของมัน ที่ความถี่เท่ากัน บัสหน่วยความจำ 64 บิตทำงานด้วยความเร็วเพียง 25% ของ 256 บิต!

ลองมาดูตัวอย่างต่อไปนี้ การ์ดแสดงผลที่มีหน่วยความจำวิดีโอ 128 MB แต่ด้วยบัส 256 บิต ให้ประสิทธิภาพหน่วยความจำที่สูงกว่ารุ่น 512 MB ที่มีบัส 64 บิตอย่างมาก สิ่งสำคัญคือต้องทราบว่าสำหรับการ์ด ATi X1x00 บางรุ่น ผู้ผลิตระบุข้อกำหนดของบัสหน่วยความจำภายใน แต่เราสนใจพารามิเตอร์ของบัสภายนอก ตัวอย่างเช่น ริงบัสภายในของ X1600 กว้าง 256 บิต แต่วงแหวนภายนอกกว้างเพียง 128 บิต และในความเป็นจริง บัสหน่วยความจำทำงานที่ประสิทธิภาพ 128 บิต

ประเภทหน่วยความจำ

หน่วยความจำสามารถแบ่งออกเป็นสองประเภทหลัก: SDR (การถ่ายโอนข้อมูลครั้งเดียว) และ DDR (การถ่ายโอนข้อมูลสองครั้ง) ซึ่งข้อมูลจะถูกถ่ายโอนเร็วขึ้นสองเท่าต่อนาฬิกา ทุกวันนี้ เทคโนโลยีการส่งสัญญาณเดี่ยว SDR ล้าสมัยแล้ว เนื่องจากหน่วยความจำ DDR จะถ่ายโอนข้อมูลได้เร็วกว่าหน่วยความจำ SDR ถึงสองเท่า สิ่งสำคัญคือต้องจำไว้ว่าการ์ดวิดีโอที่มีหน่วยความจำ DDR มักจะระบุที่ความถี่เป็นสองเท่า ไม่ใช่ตัวการ์ดจริง ตัวอย่างเช่น หากหน่วยความจำ DDR แสดงเป็น 1000 MHz นี่คือความถี่ที่มีประสิทธิภาพที่หน่วยความจำ SDR ปกติต้องทำงานเพื่อให้แบนด์วิดท์เท่ากัน ในความเป็นจริงความถี่ทางกายภาพคือ 500 MHz

ด้วยเหตุนี้ หลายคนจึงประหลาดใจเมื่อความถี่ของ DDR 1200 MHz สำหรับหน่วยความจำของการ์ดแสดงผล และยูทิลิตี้รายงาน 600 MHz ดังนั้นคุณต้องชินกับมัน หน่วยความจำ DDR2 และ GDDR3 / GDDR4 ทำงานในลักษณะเดียวกัน นั่นคือมีการถ่ายโอนข้อมูลเป็นสองเท่า ความแตกต่างระหว่าง DDR, DDR2, GDDR3 และ GDDR4 อยู่ที่เทคโนโลยีการผลิตและรายละเอียดบางอย่าง DDR2 สามารถทำงานที่ความถี่สูงกว่าหน่วยความจำ DDR และ DDR3 สามารถทำงานได้สูงกว่า DDR2

ความถี่บัสหน่วยความจำ

เช่นเดียวกับโปรเซสเซอร์ หน่วยความจำ (หรือที่แม่นยำกว่านั้นคือ บัสหน่วยความจำ) ทำงานที่ความเร็วสัญญาณนาฬิกาเฉพาะ ซึ่งวัดเป็นเมกะเฮิรตซ์ ที่นี่ การเพิ่มความเร็วสัญญาณนาฬิกาส่งผลโดยตรงต่อประสิทธิภาพของหน่วยความจำ และความถี่บัสหน่วยความจำเป็นหนึ่งในพารามิเตอร์ที่ใช้เปรียบเทียบประสิทธิภาพของการ์ดแสดงผล ตัวอย่างเช่น หากคุณสมบัติอื่นๆ ทั้งหมด (ความกว้างของบัสหน่วยความจำ ฯลฯ) เหมือนกัน ก็ค่อนข้างสมเหตุสมผลที่จะบอกว่าการ์ดวิดีโอที่มีหน่วยความจำ 700 MHz นั้นเร็วกว่าการ์ด 500 MHz

อีกครั้ง ความเร็วสัญญาณนาฬิกาไม่ใช่ทุกอย่าง หน่วยความจำ 700 MHz ที่มีบัส 64 บิตจะช้ากว่าหน่วยความจำ 400 MHz ที่มีบัส 128 บิต ประสิทธิภาพของหน่วยความจำ 400 MHz บนบัส 128 บิตนั้นเทียบเท่ากับหน่วยความจำ 800 MHz บนบัส 64 บิต ควรจำไว้ว่าความถี่ของ GPU และหน่วยความจำเป็นพารามิเตอร์ที่แตกต่างกันโดยสิ้นเชิงและมักจะแตกต่างกัน

อินเทอร์เฟซการ์ดจอ

ข้อมูลทั้งหมดที่ถ่ายโอนระหว่างการ์ดแสดงผลและโปรเซสเซอร์ต้องผ่านอินเทอร์เฟซการ์ดแสดงผล ปัจจุบันมีการใช้อินเทอร์เฟซสามประเภทสำหรับการ์ดวิดีโอ: PCI, AGP และ PCI Express แบนด์วิดธ์และลักษณะอื่นๆ ต่างกัน เป็นที่ชัดเจนว่ายิ่งแบนด์วิดธ์สูง อัตราแลกเปลี่ยนก็จะยิ่งสูงขึ้น อย่างไรก็ตาม เฉพาะการ์ดที่ทันสมัยที่สุดเท่านั้นที่สามารถใช้แบนด์วิดท์สูงได้ และเพียงบางส่วนเท่านั้น เมื่อถึงจุดหนึ่ง ความเร็วของอินเทอร์เฟซหยุดเป็น "คอขวด" วันนี้ก็เพียงพอแล้ว

บัสที่ช้าที่สุดที่ผลิตการ์ดแสดงผลคือ PCI (Peripheral Components Interconnect) หากคุณไม่เข้าสู่ประวัติศาสตร์แน่นอน PCI ส่งผลเสียต่อประสิทธิภาพของการ์ดแสดงผลอย่างมาก ดังนั้นพวกเขาจึงเปลี่ยนไปใช้อินเทอร์เฟซ AGP (Accelerated Graphics Port) แต่แม้แต่ข้อกำหนด AGP 1.0 และ 2x ก็จำกัดประสิทธิภาพ เมื่อมาตรฐานเพิ่มความเร็วเป็น AGP 4x เราเริ่มเข้าใกล้ขีดจำกัดในทางปฏิบัติของแบนด์วิดท์ที่การ์ดแสดงผลสามารถใช้ได้ ข้อมูลจำเพาะ AGP 8x เพิ่มแบนด์วิดท์เป็นสองเท่าอีกครั้งเมื่อเทียบกับ AGP 4x (2.16 GB / s) แต่เราไม่ได้รับประสิทธิภาพกราฟิกที่เพิ่มขึ้นอย่างเป็นรูปธรรม

บัสใหม่ล่าสุดและเร็วที่สุดคือ PCI Express การ์ดกราฟิกที่ใหม่กว่ามักใช้อินเทอร์เฟซ PCI Express x16 ซึ่งรวม 16 เลน PCI Express สำหรับแบนด์วิดท์รวม 4 GB / s (ทิศทางเดียว) ซึ่งเป็นสองเท่าของแบนด์วิดท์ของ AGP 8x บัส PCI Express ให้แบนด์วิดท์ดังกล่าวสำหรับทั้งสองทิศทาง (การถ่ายโอนข้อมูลไปยังและจากการ์ดแสดงผล) แต่ความเร็วของมาตรฐาน AGP 8x ก็เพียงพอแล้ว ดังนั้นเราจึงยังไม่พบสถานการณ์เมื่อการเปลี่ยนไปใช้ PCI Express ให้ประสิทธิภาพเพิ่มขึ้นเมื่อเทียบกับ AGP 8x (หากพารามิเตอร์ฮาร์ดแวร์อื่นเหมือนกัน) ตัวอย่างเช่น GeForce 6800 Ultra รุ่น AGP จะทำงานเหมือนกับ 6800 Ultra สำหรับ PCI Express

วันนี้เป็นการดีที่สุดที่จะซื้อการ์ดที่มีอินเทอร์เฟซ PCI Express ซึ่งจะคงอยู่ในตลาดไปอีกหลายปี การ์ดที่มีประสิทธิภาพสูงสุดไม่มีให้บริการในอินเทอร์เฟซ AGP 8x แล้ว และโดยทั่วไปแล้ว โซลูชัน PCI Express หาได้ง่ายกว่าการ์ดอนาล็อก AGP และมีราคาที่ถูกกว่า

โซลูชั่น Multi-GPU

การใช้การ์ดกราฟิกหลายตัวเพื่อเพิ่มประสิทธิภาพกราฟิกไม่ใช่แนวคิดใหม่ ในช่วงแรก ๆ ของกราฟิก 3D 3dfx เข้าสู่ตลาดด้วยการ์ดกราฟิกสองใบที่ทำงานขนานกัน แต่ด้วยการหายตัวไปของ 3dfx เทคโนโลยีการทำงานร่วมกันของการ์ดวิดีโอสำหรับผู้บริโภคหลายตัวจึงถูกลืมเลือนแม้ว่า ATi จะสร้างระบบที่คล้ายกันสำหรับการจำลองแบบมืออาชีพตั้งแต่เปิดตัว Radeon 9700 สองสามปีที่ผ่านมาเทคโนโลยีกลับสู่ตลาด: ด้วย การมาถึงของโซลูชัน nVidia SLI และ ATi Crossfire ในภายหลัง

การแชร์การ์ดกราฟิกหลายตัวให้ประสิทธิภาพเพียงพอในการรันเกมด้วยการตั้งค่าคุณภาพสูงในความคมชัดสูง แต่การเลือกวิธีแก้ปัญหาอย่างใดอย่างหนึ่งไม่ใช่เรื่องง่าย

ในการเริ่มต้น โซลูชันที่ใช้การ์ดวิดีโอหลายตัวต้องใช้พลังงานจำนวนมาก ดังนั้นแหล่งจ่ายไฟจึงต้องมีกำลังเพียงพอ ความร้อนทั้งหมดนี้จะต้องถูกลบออกจากการ์ดแสดงผล ดังนั้นคุณต้องใส่ใจกับเคสพีซีและการระบายความร้อนเพื่อไม่ให้ระบบร้อนเกินไป

นอกจากนี้ โปรดจำไว้ว่า SLI / CrossFire ต้องใช้มาเธอร์บอร์ดที่เหมาะสม (ไม่ว่าจะเป็นเทคโนโลยีอย่างใดอย่างหนึ่ง) ซึ่งมักจะมีราคาสูงกว่ารุ่นมาตรฐาน การกำหนดค่า nVidia SLI จะทำงานบนบอร์ด nForce4 บางรุ่นเท่านั้น และการ์ด ATi CrossFire จะทำงานบนเมนบอร์ดที่มีชิปเซ็ต CrossFire หรือใน Intel บางรุ่นเท่านั้น ในการทำให้เรื่องยุ่งยากซับซ้อน การกำหนดค่า CrossFire บางอย่างต้องการการ์ดตัวใดตัวหนึ่งเป็นพิเศษ: CrossFire Edition หลังจากการเปิดตัว CrossFire สำหรับการ์ดวิดีโอบางรุ่น ATi อนุญาตให้รวมเทคโนโลยีการทำงานร่วมกันผ่านบัส PCI Express และด้วยการเปิดตัวไดรเวอร์เวอร์ชันใหม่ จำนวนชุดค่าผสมที่เป็นไปได้จะเพิ่มขึ้น อย่างไรก็ตาม ฮาร์ดแวร์ CrossFire ที่มีการ์ด CrossFire Edition ที่สอดคล้องกันจะช่วยให้คุณมีประสิทธิภาพที่ดีขึ้น แต่การ์ด CrossFire Edition ก็มีราคาแพงกว่ารุ่นปกติเช่นกัน ในตอนนี้ คุณสามารถเปิดใช้งานโหมดซอฟต์แวร์ CrossFire (ไม่มีการ์ด CrossFire Edition) บนกราฟิกการ์ด Radeon X1300, X1600 และ X1800 GTO

มีปัจจัยอื่น ๆ ที่ต้องพิจารณา แม้ว่ากราฟิกการ์ดสองตัวที่ทำงานร่วมกันจะช่วยเพิ่มประสิทธิภาพ แต่มันก็ยังห่างไกลจากการเพิ่มเป็นสองเท่า แต่คุณจะให้เงินมากเป็นสองเท่า ส่วนใหญ่มักจะได้รับผลผลิต 20-60% และในบางกรณี เนื่องจากค่าใช้จ่ายในการคำนวณเพิ่มเติมสำหรับการกระทบยอด จึงไม่มีประโยชน์อะไรเลย ด้วยเหตุผลนี้ การกำหนดค่าแบบหลายการ์ดจึงไม่น่าจะพิสูจน์ตัวเองด้วยรุ่นที่ถูกกว่า เนื่องจากการ์ดแสดงผลที่มีราคาแพงกว่ามักจะมีประสิทธิภาพเหนือกว่าการ์ดที่มีราคาถูกกว่าเสมอ โดยทั่วไป มันไม่สมเหตุสมผลเลยที่จะใช้โซลูชัน SLI / CrossFire สำหรับผู้บริโภคส่วนใหญ่ แต่ถ้าคุณต้องการเปิดตัวเลือกการปรับปรุงคุณภาพทั้งหมดหรือเล่นที่ความละเอียดสูงสุด เช่น 2560 × 1600 เมื่อคุณต้องการแสดงภาพมากกว่า 4 ล้านพิกเซลต่อเฟรม คุณไม่สามารถทำได้หากไม่มีการ์ดวิดีโอที่จับคู่สองหรือสี่ตัว

ฟังก์ชั่นการมองเห็น

นอกเหนือจากข้อกำหนดเฉพาะของฮาร์ดแวร์แล้ว GPU รุ่นและรุ่นต่างๆ อาจแตกต่างกันในชุดคุณลักษณะ ตัวอย่างเช่น มักกล่าวกันว่าการ์ดรุ่น ATi Radeon X800 XT เข้ากันได้กับ Shader Model 2.0b (SM) ในขณะที่ nVidia GeForce 6800 Ultra เข้ากันได้กับ SM 3.0 แม้ว่าข้อกำหนดฮาร์ดแวร์จะใกล้เคียงกัน (16 ท่อ) ดังนั้น ผู้บริโภคจำนวนมากจึงตัดสินใจเลือกวิธีแก้ปัญหาอย่างใดอย่างหนึ่งโดยที่ไม่รู้ด้วยซ้ำว่าความแตกต่างนี้หมายถึงอะไร

เวอร์ชัน Microsoft DirectX และ Shader Model

ชื่อเหล่านี้มักใช้ในข้อพิพาท แต่มีเพียงไม่กี่คนที่รู้ว่าชื่อเหล่านี้หมายถึงอะไร เพื่อให้เข้าใจ เรามาเริ่มกันที่ประวัติของกราฟิก API กันก่อน DirectX และ OpenGL เป็น API แบบกราฟิกหรือ Application Programming Interfaces ซึ่งเป็นมาตรฐานโอเพนโค้ดที่ทุกคนสามารถใช้ได้

ก่อนการถือกำเนิดของกราฟิก API ผู้ผลิต GPU แต่ละรายใช้กลไกของตนเองในการสื่อสารกับเกม นักพัฒนาต้องเขียนโค้ดแยกกันสำหรับ GPU แต่ละตัวที่พวกเขาต้องการสนับสนุน วิธีการที่มีราคาแพงมากและไม่ได้ผล เพื่อแก้ปัญหานี้ API สำหรับกราฟิก 3 มิติได้รับการพัฒนาเพื่อให้นักพัฒนาสามารถเขียนโค้ดสำหรับ API เฉพาะได้ ไม่ใช่สำหรับการ์ดวิดีโอบางรุ่น หลังจากนั้น ปัญหาความเข้ากันได้ก็ตกอยู่ที่ไหล่ของผู้ผลิตการ์ดวิดีโอ ซึ่งต้องแน่ใจว่าไดรเวอร์จะเข้ากันได้กับ API

ความซับซ้อนเพียงอย่างเดียวคือวันนี้มีสอง API ที่แตกต่างกันคือ Microsoft DirectX และ OpenGL โดยที่ GL ย่อมาจากไลบรารีกราฟิก เนื่องจาก DirectX API เป็นที่นิยมมากขึ้นในเกมในปัจจุบัน เราจะเน้นที่มัน และมาตรฐานนี้มีอิทธิพลต่อการพัฒนาเกมอย่างมาก

DirectX คือการสร้างของ Microsoft อันที่จริง DirectX มี API หลายตัว ซึ่งหนึ่งในนั้นใช้สำหรับกราฟิก 3 มิติเท่านั้น DirectX มี API สำหรับเสียง เพลง อุปกรณ์อินพุต และอื่นๆ Direct3D API รับผิดชอบกราฟิก 3 มิติใน DirectX เมื่อพูดถึงการ์ดวิดีโอ พวกเขาหมายถึง ดังนั้น ในแง่นี้ DirectX และ Direct3D จึงใช้แทนกันได้

DirectX ได้รับการอัปเดตเป็นระยะเนื่องจากเทคโนโลยีกราฟิกก้าวหน้า และผู้พัฒนาเกมได้แนะนำวิธีใหม่ๆ ในการเขียนโปรแกรมเกม เมื่อความนิยมของ DirectX เพิ่มขึ้น ผู้ผลิต GPU ก็เริ่มปรับแต่งการออกผลิตภัณฑ์ใหม่เพื่อให้ตรงกับความสามารถของ DirectX ด้วยเหตุนี้ การ์ดแสดงผลมักจะเชื่อมโยงกับการสนับสนุนฮาร์ดแวร์สำหรับ DirectX รุ่นหนึ่งหรือรุ่นอื่น (DirectX 8, 9.0 หรือ 9.0c)

เพื่อทำให้เรื่องยุ่งยากขึ้น บางส่วนของ Direct3D API สามารถเปลี่ยนแปลงได้ตลอดเวลา โดยไม่ต้องเปลี่ยนรุ่น DirectX ตัวอย่างเช่น ข้อกำหนด DirectX 9.0 ระบุการรองรับ Pixel Shader 2.0 แต่การอัปเดต DirectX 9.0c มี Pixel Shader 3.0 ดังนั้น แม้ว่าการ์ดจะจัดอยู่ในประเภท DirectX 9 แต่ก็สามารถรองรับชุดฟังก์ชันต่างๆ ได้ ตัวอย่างเช่น Radeon 9700 รองรับ Shader Model 2.0 และ Radeon X1800 รองรับ Shader Model 3.0 แม้ว่าการ์ดทั้งสองสามารถนำมาประกอบกับรุ่น DirectX 9 ได้

โปรดจำไว้ว่าเมื่อสร้างเกมใหม่ นักพัฒนาต้องคำนึงถึงเจ้าของเครื่องเก่าและการ์ดวิดีโอด้วย เพราะหากคุณเพิกเฉยต่อกลุ่มผู้ใช้นี้ ระดับการขายจะลดลง ด้วยเหตุนี้จึงมีการฝังเส้นทางรหัสหลายเส้นทางในเกม เกมระดับ DirectX 9 อาจมีเส้นทาง DirectX 8 สำหรับความเข้ากันได้และแม้แต่เส้นทาง DirectX 7 โดยปกติ หากคุณเลือกเส้นทางเก่า เอฟเฟกต์เสมือนบางอย่างที่อยู่ในการ์ดวิดีโอใหม่จะหายไปในเกม แต่อย่างน้อยคุณก็สามารถเล่นได้แม้กระทั่งบนฮาร์ดแวร์ตัวเก่า

เกมใหม่ๆ จำนวนมากจำเป็นต้องติดตั้ง DirectX เวอร์ชันล่าสุด แม้ว่ากราฟิกการ์ดจะมาจากรุ่นก่อนก็ตาม นั่นคือเกมใหม่ที่จะใช้เส้นทาง DirectX 8 ยังคงต้องติดตั้ง DirectX 9 เวอร์ชันล่าสุดสำหรับการ์ดแสดงผล DirectX 8

Direct3D API เวอร์ชันต่างๆ ใน ​​DirectX ต่างกันอย่างไร DirectX เวอร์ชันแรกๆ - 3, 5, 6 และ 7 - ค่อนข้างง่ายในแง่ของ Direct3D API นักพัฒนาสามารถเลือกเอฟเฟกต์ภาพจากรายการแล้วทดสอบประสิทธิภาพในเกม ขั้นตอนสำคัญถัดไปในการเขียนโปรแกรมกราฟิกคือ DirectX 8 ซึ่งนำเสนอความสามารถในการตั้งโปรแกรมการ์ดวิดีโอโดยใช้เฉดสี ดังนั้นนักพัฒนาจึงได้รับอิสระในการเขียนโปรแกรมเอฟเฟกต์ตามต้องการเป็นครั้งแรก DirectX 8 รองรับ Pixel Shader 1.0 ถึง 1.3 และ Vertex Shader 1.0 DirectX 8.1 ซึ่งเป็นเวอร์ชันอัปเดตของ DirectX 8 ได้รับ Pixel Shader 1.4 และ Vertex Shader 1.1

ใน DirectX 9 คุณสามารถสร้างโปรแกรม shader ที่ซับซ้อนยิ่งขึ้นได้ DirectX 9 รองรับ Pixel Shader 2.0 และ Vertex Shader 2.0 DirectX 9c ซึ่งเป็นเวอร์ชันที่อัปเดตของ DirectX 9 มีข้อกำหนด Pixel Shader 3.0

DirectX 10 ซึ่งเป็น API เวอร์ชันใหม่นี้จะมาพร้อมกับ Windows Vista เวอร์ชันใหม่ คุณจะไม่สามารถติดตั้ง DirectX 10 บน Windows XP ได้

แสง HDR และ OpenEXR HDR

HDR ย่อมาจาก High Dynamic Range ช่วงไดนามิกสูง การเล่นด้วยแสง HDR สามารถสร้างภาพที่สมจริงมากกว่าการเล่นโดยที่ไม่มีแสง และการ์ดกราฟิกบางตัวอาจไม่รองรับแสง HDR

ก่อนการถือกำเนิดของกราฟิกการ์ด DirectX 9 GPUs ถูกจำกัดด้วยความแม่นยำในการคำนวณแสง จนถึงขณะนี้ สามารถคำนวณแสงได้ด้วยระดับภายใน 256 (8 บิต) เท่านั้น

เมื่อเปิดตัวกราฟิกการ์ด DirectX 9 พวกเขาสามารถสร้างแสงที่มีความเที่ยงตรงสูง - เต็มระดับ 24 บิตหรือ 16.7 ล้านระดับ

ด้วย 16.7 ล้านระดับและก้าวไปอีกขั้นในประสิทธิภาพกราฟิก DirectX 9 / Shader Model 2.0 ทำให้แสง HDR เป็นไปได้บนคอมพิวเตอร์ นี่เป็นเทคโนโลยีที่ค่อนข้างซับซ้อน และคุณต้องดูในไดนามิก พูดง่ายๆ ก็คือ แสง HDR จะเพิ่มคอนทราสต์ (เฉดสีเข้มจะเข้มขึ้น เฉดสีอ่อนจะสว่างขึ้น) ในขณะเดียวกันก็เพิ่มปริมาณรายละเอียดของแสงในบริเวณที่มืดและสว่าง การเล่นด้วยแสง HDR จะให้ความรู้สึกมีชีวิตชีวาและสมจริงมากกว่าที่ไม่มีแสง

GPU ที่ตรงตามข้อกำหนด Pixel Shader 3.0 ล่าสุด ให้แสงที่แม่นยำขึ้นแบบ 32 บิตและการผสมผสานจุดลอยตัว ดังนั้นการ์ดวิดีโอของคลาส SM 3.0 จึงสามารถรองรับวิธีการให้แสง OpenEXR HDR แบบพิเศษ ซึ่งออกแบบมาเป็นพิเศษสำหรับอุตสาหกรรมภาพยนตร์

เกมบางเกมที่รองรับเฉพาะแสง HDR โดยใช้ OpenEXR จะไม่ทำงานกับแสง HDR บนการ์ดกราฟิก Shader Model 2.0 อย่างไรก็ตาม เกมที่ไม่อิงตามวิธี OpenEXR จะทำงานบนการ์ดกราฟิก DirectX 9 ใดๆ ตัวอย่างเช่น Oblivion ใช้วิธี OpenEXR HDR และอนุญาตเฉพาะแสง HDR บนการ์ดกราฟิกล่าสุดที่รองรับข้อกำหนด Shader Model 3.0 ตัวอย่างเช่น nVidia GeForce 6800 หรือ ATi Radeon X1800 เกมที่ใช้เอ็นจิ้น Half-Life 2 3D, Counter-Strike: Source เดียวกันและ Half-Life 2: Aftermath ที่กำลังจะวางจำหน่าย ช่วยให้คุณเปิดใช้งานการเรนเดอร์ HDR บนการ์ดวิดีโอ DirectX 9 รุ่นเก่าที่รองรับเฉพาะ Pixel Shader 2.0 เท่านั้น ตัวอย่าง ได้แก่ GeForce 5 line หรือ ATi Radeon 9500

สุดท้าย พึงระลึกไว้เสมอว่าการเรนเดอร์ HDR ทุกรูปแบบต้องการพลังในการประมวลผลที่จริงจัง และสามารถนำ GPU ที่ทรงพลังที่สุดมาสู่หัวเข่าได้ หากคุณต้องการเล่นเกมล่าสุดด้วยแสง HDR กราฟิกที่มีประสิทธิภาพสูงเป็นสิ่งจำเป็น

การลบรอยหยักแบบเต็มหน้าจอ

การลบรอยหยักแบบเต็มหน้าจอ (ย่อมาจาก AA) ช่วยให้คุณขจัดลักษณะ "บันได" ที่ขอบเขตของรูปหลายเหลี่ยมได้ อย่างไรก็ตาม ควรระลึกไว้เสมอว่าการลบรอยหยักแบบเต็มหน้าจอนั้นใช้ทรัพยากรการประมวลผลจำนวนมาก ซึ่งทำให้อัตราเฟรมลดลง

การลบรอยหยักนั้นขึ้นอยู่กับประสิทธิภาพของหน่วยความจำวิดีโอเป็นอย่างมาก ดังนั้นการ์ดวิดีโอความเร็วสูงที่มีหน่วยความจำที่รวดเร็วจะสามารถแสดงการลบรอยหยักแบบเต็มหน้าจอได้โดยมีความเสียหายต่อประสิทธิภาพน้อยกว่าการ์ดวิดีโอราคาไม่แพง สามารถเปิดใช้งานการลบรอยหยักได้ในโหมดต่างๆ ตัวอย่างเช่น การลบรอยหยัก 4x จะให้คุณภาพของภาพที่ดีกว่าการลบรอยหยัก 2 เท่า แต่นี่จะประสบความสำเร็จอย่างมาก หากการลบรอยหยัก 2x เพิ่มความละเอียดในแนวนอนและแนวตั้งเป็นสองเท่า โหมด 4x จะเพิ่มเป็นสี่เท่า

เนื้อผ้ากรอง

พื้นผิวจะถูกนำไปใช้กับวัตถุ 3 มิติทั้งหมดในเกม และยิ่งมุมของพื้นผิวที่แสดงใหญ่ขึ้นเท่าใด พื้นผิวก็จะยิ่งดูบิดเบี้ยวมากขึ้นเท่านั้น เพื่อขจัดผลกระทบนี้ GPU จะใช้การกรองพื้นผิว

วิธีการกรองแบบแรกเรียกว่า bilinear และสร้างแถบลักษณะเฉพาะที่ไม่ค่อยสบายตา สถานการณ์ดีขึ้นด้วยการแนะนำการกรองแบบไตรลิเนียร์ ทั้งสองตัวเลือกทำงานบนการ์ดกราฟิกสมัยใหม่โดยสูญเสียประสิทธิภาพเพียงเล็กน้อยหรือไม่มีเลย

วิธีที่ดีที่สุดในการกรองพื้นผิวในปัจจุบันคือ Anisotropic Filtering (AF) เช่นเดียวกับการลบรอยหยักแบบเต็มหน้าจอ การกรองแบบแอนไอโซทรอปิกสามารถเปิดใช้งานได้ในระดับต่างๆ ตัวอย่างเช่น 8x AF ให้คุณภาพการกรองที่ดีกว่า AF 4x เช่นเดียวกับการลบรอยหยักแบบเต็มหน้าจอ การกรองแบบแอนไอโซทรอปิกต้องใช้กำลังการประมวลผลจำนวนหนึ่ง ซึ่งจะเพิ่มขึ้นเมื่อระดับ AF สูงขึ้น

พื้นผิวความละเอียดสูง

เกม 3 มิติทั้งหมดสร้างขึ้นโดยคำนึงถึงข้อกำหนดเฉพาะ และข้อกำหนดดังกล่าวอย่างหนึ่งจะกำหนดหน่วยความจำพื้นผิวที่เกมต้องการ พื้นผิวที่จำเป็นทั้งหมดจะต้องพอดีกับหน่วยความจำของการ์ดวิดีโอระหว่างเกม มิฉะนั้น ประสิทธิภาพจะลดลงอย่างมาก เนื่องจากการเข้าถึงพื้นผิวใน RAM ทำให้เกิดความล่าช้ามาก ไม่ต้องพูดถึงไฟล์เพจบนฮาร์ดดิสก์ ดังนั้น หากผู้พัฒนาเกมใช้หน่วยความจำวิดีโอ 128 MB เป็นความต้องการขั้นต่ำ ชุดของพื้นผิวที่ใช้งานไม่ควรเกิน 128 MB เมื่อใดก็ได้

เกมสมัยใหม่มีพื้นผิวหลายชุด ดังนั้นเกมจะทำงานได้อย่างราบรื่นบนการ์ดวิดีโอรุ่นเก่าที่มีหน่วยความจำวิดีโอน้อยกว่า รวมถึงการ์ดรุ่นใหม่ที่มีหน่วยความจำวิดีโอมากกว่า ตัวอย่างเช่น เกมสามารถมีพื้นผิวได้สามชุด: 128 MB, 256 MB และ 512 MB มีเกมน้อยมากที่รองรับหน่วยความจำวิดีโอ 512 MB ในปัจจุบัน แต่ก็ยังเป็นเหตุผลที่สำคัญที่สุดในการซื้อการ์ดวิดีโอที่มีหน่วยความจำจำนวนนี้ แม้ว่าหน่วยความจำที่เพิ่มขึ้นจะมีผลกระทบต่อประสิทธิภาพเพียงเล็กน้อยหรือไม่มีเลย แต่คุณจะได้ภาพที่มีคุณภาพดีขึ้นหากเกมรองรับชุดพื้นผิวที่เหมาะสม

สิ่งที่คุณต้องรู้เกี่ยวกับกราฟิกการ์ด?

ติดต่อกับ

หน่วย Shader แบบรวมศูนย์รวมหน่วยสองประเภทที่ระบุไว้ข้างต้น พวกเขาสามารถดำเนินการทั้งโปรแกรมจุดยอดและพิกเซล (เช่นเดียวกับหน่วยเรขาคณิตซึ่งปรากฏใน DirectX 10) การรวมหน่วย shader หมายความว่ารหัสของโปรแกรม shader ที่แตกต่างกัน (จุดยอด พิกเซล และเรขาคณิต) เป็นสากล และโปรเซสเซอร์แบบรวมที่สอดคล้องกันสามารถเรียกใช้โปรแกรมใดๆ ที่ระบุไว้ข้างต้นได้ ดังนั้น ในสถาปัตยกรรมใหม่ จำนวนพิกเซล จุดยอด และหน่วยเชดเดอร์เรขาคณิตจึงรวมเป็นตัวเลขเดียว - จำนวนของโปรเซสเซอร์สากล

หน่วยพื้นผิว (tmu)

หน่วยเหล่านี้ทำงานร่วมกับตัวประมวลผล shader ของประเภทที่ระบุทั้งหมด ซึ่งใช้เพื่อเลือกและกรองข้อมูลพื้นผิวที่จำเป็นในการสร้างฉาก จำนวนหน่วยพื้นผิวในชิปวิดีโอกำหนดประสิทธิภาพของพื้นผิว ความเร็วในการสุ่มตัวอย่างจากพื้นผิว และแม้ว่าการคำนวณส่วนใหญ่จะดำเนินการโดยหน่วย shader เมื่อเร็ว ๆ นี้ แต่โหลดของ TMU ยังคงค่อนข้างสูงและคำนึงถึงการเน้นของแอปพลิเคชันบางอย่างเกี่ยวกับประสิทธิภาพของหน่วยพื้นผิว เราสามารถพูดได้ว่าจำนวน TMU และค่าสูงที่สอดคล้องกัน ประสิทธิภาพของพื้นผิวเป็นหนึ่งในพารามิเตอร์ที่สำคัญที่สุด ชิปวิดีโอ พารามิเตอร์นี้มีผลพิเศษต่อความเร็วเมื่อใช้การกรองแบบไตรลิเนียร์และแอนไอโซทรอปิก ซึ่งต้องมีการเลือกพื้นผิวเพิ่มเติม

หน่วยแรสเตอร์ไรซ์ (rop)

หน่วย Rasterization ดำเนินการของพิกเซลการบันทึกที่คำนวณโดยการ์ดแสดงผลลงในบัฟเฟอร์และการทำงานของการผสม (การผสม) ดังที่กล่าวไว้ข้างต้น ประสิทธิภาพของหน่วย ROP ส่งผลต่ออัตราการส่งโฆษณา และนี่เป็นหนึ่งในคุณสมบัติหลักของการ์ดวิดีโอ และถึงแม้ว่าค่าของมันจะลดลงเล็กน้อยเมื่อเร็วๆ นี้ แต่ก็ยังมีบางกรณีที่ประสิทธิภาพของแอปพลิเคชันขึ้นอยู่กับความเร็วและจำนวน ROP เป็นอย่างมาก สาเหตุส่วนใหญ่เกิดจากการใช้ฟิลเตอร์หลังการประมวลผลและการลดรอยหยักที่การตั้งค่าภาพสูง

ขนาดหน่วยความจำวิดีโอ

ชิปวิดีโอใช้หน่วยความจำของตัวเองเพื่อเก็บข้อมูลที่จำเป็น: พื้นผิว จุดยอด บัฟเฟอร์ ฯลฯ ดูเหมือนว่ายิ่งมากยิ่งดี แต่ไม่ใช่ทุกอย่างจะง่ายนัก การประมาณประสิทธิภาพของการ์ดวิดีโอด้วยจำนวนหน่วยความจำวิดีโอเป็นข้อผิดพลาดที่พบบ่อยที่สุด! ผู้ใช้ที่ไม่มีประสบการณ์มักจะประเมินค่าขนาดหน่วยความจำสูงเกินไป ใช้เพื่อเปรียบเทียบการ์ดวิดีโอรุ่นต่างๆ นี่เป็นสิ่งที่เข้าใจได้ เนื่องจากพารามิเตอร์ที่ระบุในทุกแหล่งว่าเป็นหนึ่งในแหล่งแรกมีขนาดใหญ่เป็นสองเท่า ดังนั้นความเร็วของการแก้ปัญหาจึงควรสูงเป็นสองเท่า พวกเขาเชื่อว่า ความเป็นจริงแตกต่างไปจากตำนานที่ว่าการเติบโตของผลิตภาพนั้นเติบโตขึ้นในระดับหนึ่ง และหลังจากบรรลุถึงระดับหนึ่งแล้ว มันก็หยุดลง

แต่ละแอปพลิเคชันมีหน่วยความจำวิดีโอจำนวนหนึ่ง ซึ่งเพียงพอสำหรับข้อมูลทั้งหมด และแม้ว่าคุณจะใส่ 4 GB ไว้ที่นั่น แต่ก็ไม่มีเหตุผลที่จะต้องเร่งการเรนเดอร์ แต่ความเร็วจะถูกจำกัดโดยหน่วยดำเนินการ นั่นคือเหตุผลที่ในเกือบทุกกรณี การ์ดวิดีโอที่มีหน่วยความจำวิดีโอ 320 MB จะทำงานที่ความเร็วเท่ากับการ์ดที่มี 640 MB (สิ่งอื่นๆ ทั้งหมดเท่ากัน) มีบางสถานการณ์ที่หน่วยความจำมากขึ้นทำให้ประสิทธิภาพเพิ่มขึ้นอย่างเห็นได้ชัด ซึ่งเป็นแอพพลิเคชั่นที่มีความต้องการสูงที่ความละเอียดสูงและการตั้งค่าสูงสุด แต่กรณีดังกล่าวหายากมาก ดังนั้น แน่นอนว่าต้องคำนึงถึงจำนวนหน่วยความจำด้วย แต่อย่าลืมว่าประสิทธิภาพไม่ได้เพิ่มขึ้นเกินจำนวนที่กำหนด มีพารามิเตอร์ที่สำคัญกว่านั้น เช่น ความกว้างของบัสหน่วยความจำ และความถี่ในการทำงาน

จำนวนหน่วยคำนวณ (shader) หรือโปรเซสเซอร์

บางทีตอนนี้บล็อกเหล่านี้เป็นส่วนหลักของชิปวิดีโอ พวกเขาเรียกใช้โปรแกรมพิเศษที่เรียกว่าเชดเดอร์ ยิ่งกว่านั้นหากพิกเซลเชดเดอร์รุ่นก่อน ๆ ดำเนินการบล็อกของพิกเซลเชดเดอร์และบล็อกจุดยอด - บล็อกจุดยอด แล้วในบางครั้งสถาปัตยกรรมกราฟิกก็ถูกรวมเป็นหนึ่งเดียว และหน่วยคำนวณสากลเหล่านี้เริ่มจัดการกับการคำนวณต่างๆ: จุดยอด พิกเซล เรขาคณิต และการคำนวณสากล

สถาปัตยกรรมแบบครบวงจรถูกนำมาใช้ครั้งแรกในชิปวิดีโอของคอนโซลเกม Microsoft Xbox 360 โดย GPU นี้ได้รับการพัฒนาโดย ATI (ซึ่ง AMD ได้มาในภายหลัง) และในชิปวิดีโอสำหรับคอมพิวเตอร์ส่วนบุคคล unified shader unit ปรากฏในบอร์ด NVIDIA GeForce 8800 และตั้งแต่นั้นมา ชิปวิดีโอใหม่ทั้งหมดใช้สถาปัตยกรรมแบบครบวงจรซึ่งมีรหัสสากลสำหรับโปรแกรม shader ต่างๆ (จุดยอด, พิกเซล, เรขาคณิต, เป็นต้น) และตัวประมวลผลแบบรวมศูนย์ที่เกี่ยวข้องสามารถรันโปรแกรมใดก็ได้

ด้วยจำนวนหน่วยการคำนวณและความถี่ เราสามารถเปรียบเทียบประสิทธิภาพทางคณิตศาสตร์ของการ์ดแสดงผลต่างๆ เกมส่วนใหญ่ถูกจำกัดด้วยประสิทธิภาพของ Pixel Shader ดังนั้นจำนวนหน่วยเหล่านี้จึงมีความสำคัญมาก ตัวอย่างเช่น หากการ์ดแสดงผลรุ่นหนึ่งใช้ GPU ที่มีตัวประมวลผลเชิงคำนวณ 384 ตัวในองค์ประกอบ และอีกรุ่นจากบรรทัดเดียวกันมี GPU ที่มีหน่วยคำนวณ 192 หน่วย จากนั้นด้วยความถี่เท่ากัน ตัวที่สองจะประมวลผลเชดเดอร์ประเภทใดก็ได้ ช้าเป็นสองเท่าและโดยทั่วไปแล้วจะมีประสิทธิผลมากกว่าเท่าเดิม

แม้ว่าจะเป็นไปไม่ได้ที่จะสรุปผลที่ชัดเจนเกี่ยวกับประสิทธิภาพโดยพิจารณาจากจำนวนหน่วยคำนวณเพียงอย่างเดียว แต่จำเป็นต้องคำนึงถึงความถี่สัญญาณนาฬิกาและสถาปัตยกรรมที่แตกต่างกันของหน่วยรุ่นต่างๆ และผู้ผลิตชิป เฉพาะตัวเลขเหล่านี้เท่านั้นที่สามารถใช้เพื่อเปรียบเทียบชิปในบรรทัดเดียวกันของผู้ผลิตรายเดียว: AMD หรือ NVIDIA ในกรณีอื่นๆ คุณต้องให้ความสนใจกับการทดสอบประสิทธิภาพในเกมหรือแอปพลิเคชันที่สนใจ

หน่วยการทำแผนที่พื้นผิว (TMU)

หน่วย GPU เหล่านี้ทำงานร่วมกับโปรเซสเซอร์ที่ใช้เพื่อเลือกและกรองพื้นผิวและข้อมูลอื่น ๆ ที่จำเป็นสำหรับการสร้างฉากและการคำนวณทั่วไป จำนวนหน่วยพื้นผิวในชิปวิดีโอกำหนดประสิทธิภาพของพื้นผิว - นั่นคือความเร็วในการดึงเท็กซ์จากพื้นผิว

แม้ว่าเมื่อเร็ว ๆ นี้จะมีการเน้นที่การคำนวณทางคณิตศาสตร์มากขึ้น และพื้นผิวบางส่วนถูกแทนที่ด้วยขั้นตอนตามขั้นตอน แต่ภาระบน TMU ยังคงค่อนข้างสูง เนื่องจากนอกเหนือจากพื้นผิวหลักแล้ว การเลือกต้องทำจากแผนที่ปกติและแผนที่การเคลื่อนที่ เนื่องจาก รวมถึงบัฟเฟอร์เป้าหมายการแสดงผลนอกหน้าจอ

เมื่อพิจารณาถึงความสำคัญของเกมหลายๆ เกม รวมถึงประสิทธิภาพของหน่วยพื้นผิว เราสามารถพูดได้ว่าจำนวน TMU และประสิทธิภาพของพื้นผิวที่สูงที่สอดคล้องกันเป็นหนึ่งในพารามิเตอร์ที่สำคัญที่สุดสำหรับชิปวิดีโอ พารามิเตอร์นี้มีผลพิเศษต่อความเร็วในการแสดงผลของภาพเมื่อใช้การกรองแบบแอนไอโซโทรปิก ซึ่งต้องมีการเลือกพื้นผิวเพิ่มเติม เช่นเดียวกับอัลกอริธึมซอฟต์แชโดว์ที่ซับซ้อนและอัลกอริธึมแบบใหม่ เช่น Screen Space Ambient Occlusion

Rasterization Operations Blocks (ROP)

หน่วย Rasterization ดำเนินการของพิกเซลการบันทึกที่คำนวณโดยการ์ดแสดงผลลงในบัฟเฟอร์และการทำงานของการผสม (การผสม) ดังที่เราได้กล่าวไว้ข้างต้น ประสิทธิภาพของหน่วย ROP ส่งผลต่ออัตราการส่งโฆษณา และนี่เป็นหนึ่งในคุณสมบัติหลักของการ์ดวิดีโอตลอดกาล และถึงแม้ว่าเมื่อเร็ว ๆ นี้มูลค่าของมันจะลดลงเล็กน้อย แต่ก็ยังมีบางกรณีที่ประสิทธิภาพของแอปพลิเคชันขึ้นอยู่กับความเร็วและจำนวน ROP สาเหตุส่วนใหญ่เกิดจากการใช้งานตัวกรองหลังการประมวลผลและการป้องกันนามแฝงที่เปิดใช้งานที่การตั้งค่าเกมระดับสูง

โปรเซสเซอร์กราฟิกสมัยใหม่ประกอบด้วยบล็อกการทำงานจำนวนมาก จำนวนและคุณลักษณะที่กำหนดความเร็วในการเรนเดอร์ขั้นสุดท้าย ซึ่งส่งผลต่อความสะดวกสบายของเกม จากจำนวนบล็อกเหล่านี้ในชิปวิดีโอที่เปรียบเทียบกัน คุณสามารถประมาณความเร็วคร่าวๆ ของ GPU ตัวใดตัวหนึ่งได้ ชิปวิดีโอมีคุณสมบัติมากมาย ในส่วนนี้เราจะพิจารณาเฉพาะส่วนที่สำคัญที่สุดเท่านั้น

ความถี่สัญญาณนาฬิกาของชิปวิดีโอ

ความถี่ในการทำงานของ GPU มักจะวัดเป็นเมกะเฮิรตซ์ นั่นคือเป็นล้านรอบนาฬิกาต่อวินาที ลักษณะนี้ส่งผลโดยตรงต่อประสิทธิภาพของชิปวิดีโอ ยิ่งสูงเท่าไหร่ GPU ก็ยิ่งสามารถทำงานได้มากขึ้นต่อหน่วยเวลา ประมวลผลจุดยอดและพิกเซลมากขึ้น ตัวอย่างจากชีวิตจริง: ความถี่ของชิปวิดีโอที่ติดตั้งบน Radeon HD 6670 คือ 840 MHz และชิปตัวเดียวกันใน Radeon HD 6570 ทำงานที่ 650 MHz ดังนั้นคุณลักษณะด้านประสิทธิภาพหลักทั้งหมดจะแตกต่างกัน แต่ไม่เพียงแต่ความถี่ในการทำงานของชิปที่กำหนดประสิทธิภาพเท่านั้น ความเร็วยังได้รับอิทธิพลอย่างมากจากสถาปัตยกรรมกราฟิกด้วย เช่น อุปกรณ์และจำนวนหน่วยปฏิบัติการ ลักษณะเฉพาะ ฯลฯ

ในบางกรณี ความเร็วสัญญาณนาฬิกาของบล็อก GPU แต่ละตัวจะแตกต่างจากความเร็วนาฬิกาของชิปที่เหลือ กล่าวคือ ส่วนต่างๆ ของ GPU ทำงานที่ความถี่ต่างกัน และทำเช่นนี้เพื่อเพิ่มประสิทธิภาพ เนื่องจากบางหน่วยสามารถทำงานได้ที่ความถี่สูง ขณะที่บางหน่วยไม่สามารถทำงานได้ การ์ดกราฟิก NVIDIA GeForce ส่วนใหญ่ติดตั้ง GPU ดังกล่าว จากตัวอย่างล่าสุด เราจะอ้างถึงชิปวิดีโอในรุ่น GTX 580 ซึ่งส่วนใหญ่ทำงานที่ 772 MHz และหน่วยคำนวณสากลของชิปมีความถี่สองเท่า - 1544 MHz

อัตราการเติม (อัตราการเติม)

อัตราการส่งแสดงให้เห็นว่าชิปวิดีโอสามารถแสดงพิกเซลได้เร็วเพียงใด อัตราการเติมมีสองประเภท: อัตราการเติมพิกเซลและอัตราการเท็กซ์ อัตราการเติมพิกเซลแสดงความเร็วที่พิกเซลถูกวาดบนหน้าจอและขึ้นอยู่กับความถี่ในการทำงานและจำนวน ROP (บล็อกของการแรสเตอร์และการผสม) และพื้นผิวคือความเร็วในการดึงข้อมูลพื้นผิวซึ่งขึ้นอยู่กับความถี่ของ การทำงานและจำนวนหน่วยพื้นผิว

ตัวอย่างเช่น อัตราการเติมพิกเซลสูงสุดของ GeForce GTX 560 Ti คือ 822 (นาฬิกาชิป) × 32 (หน่วย ROP) = 26304 ล้านพิกเซลต่อวินาที และอัตราการเติมพื้นผิวคือ 822 × 64 (จำนวนหน่วยพื้นผิว) = 52608 เมกะพิกเซล / NS. ด้วยวิธีที่เรียบง่าย สถานการณ์จะเป็นดังนี้ - ยิ่งตัวเลขแรกมากเท่าไร การ์ดวิดีโอก็สามารถแสดงพิกเซลที่เสร็จแล้วได้เร็วยิ่งขึ้น และยิ่งตัวเลขที่สองมีขนาดใหญ่ขึ้นเท่าใด ข้อมูลพื้นผิวก็จะยิ่งเร็วขึ้นเท่านั้น

แม้ว่าความสำคัญของอัตราการส่งโฆษณาที่ "บริสุทธิ์" จะลดลงอย่างเห็นได้ชัดเมื่อเร็วๆ นี้ ทำให้ความเร็วของการคำนวณลดลง พารามิเตอร์เหล่านี้ยังคงมีความสำคัญมาก โดยเฉพาะอย่างยิ่งสำหรับเกมที่มีรูปทรงเรียบง่ายและการคำนวณพิกเซลและจุดยอดที่ค่อนข้างง่าย ดังนั้นพารามิเตอร์ทั้งสองยังคงมีความสำคัญสำหรับเกมสมัยใหม่ แต่ต้องมีความสมดุล ดังนั้นจำนวนหน่วย ROP ในชิปวิดีโอสมัยใหม่มักจะน้อยกว่าจำนวนหน่วยพื้นผิว

จำนวนหน่วยคำนวณ (shader) หรือโปรเซสเซอร์

บางทีตอนนี้บล็อกเหล่านี้เป็นส่วนหลักของชิปวิดีโอ พวกเขาเรียกใช้โปรแกรมพิเศษที่เรียกว่าเชดเดอร์ ยิ่งกว่านั้นหากพิกเซลเชดเดอร์รุ่นก่อน ๆ ดำเนินการบล็อกของพิกเซลเชดเดอร์และจุดยอดเชเดอร์ - บล็อกจุดสุดยอดแล้วบางครั้งสถาปัตยกรรมกราฟิกก็รวมกันเป็นหนึ่งเดียวและหน่วยคำนวณสากลเหล่านี้เริ่มจัดการกับการคำนวณต่าง ๆ : จุดยอด, พิกเซล, เรขาคณิตและการคำนวณสากล

สถาปัตยกรรมแบบครบวงจรถูกนำมาใช้ครั้งแรกในชิปวิดีโอของคอนโซลเกม Microsoft Xbox 360 โดย GPU นี้ได้รับการพัฒนาโดย ATI (ซึ่ง AMD ได้มาในภายหลัง) และในชิปวิดีโอสำหรับคอมพิวเตอร์ส่วนบุคคล unified shader unit ปรากฏในบอร์ด NVIDIA GeForce 8800 และตั้งแต่นั้นมา ชิปวิดีโอใหม่ทั้งหมดใช้สถาปัตยกรรมแบบครบวงจรซึ่งมีรหัสสากลสำหรับโปรแกรม shader ต่างๆ (จุดยอด, พิกเซล, เรขาคณิต, เป็นต้น) และตัวประมวลผลแบบรวมศูนย์ที่เกี่ยวข้องสามารถรันโปรแกรมใดก็ได้

ด้วยจำนวนหน่วยการคำนวณและความถี่ เราสามารถเปรียบเทียบประสิทธิภาพทางคณิตศาสตร์ของการ์ดแสดงผลต่างๆ เกมส่วนใหญ่ถูกจำกัดด้วยประสิทธิภาพของ Pixel Shader ดังนั้นจำนวนหน่วยเหล่านี้จึงมีความสำคัญมาก ตัวอย่างเช่น หากการ์ดแสดงผลรุ่นหนึ่งใช้ GPU ที่มีตัวประมวลผลเชิงคำนวณ 384 ตัวในองค์ประกอบ และอีกรุ่นจากบรรทัดเดียวกันมี GPU ที่มีหน่วยคำนวณ 192 หน่วย จากนั้นด้วยความถี่เท่ากัน ตัวที่สองจะประมวลผลเชดเดอร์ประเภทใดก็ได้ ช้าเป็นสองเท่าและโดยทั่วไปแล้วจะมีประสิทธิผลมากกว่าเท่าเดิม

แม้ว่าจะเป็นไปไม่ได้ที่จะสรุปผลที่ชัดเจนเกี่ยวกับประสิทธิภาพโดยพิจารณาจากจำนวนหน่วยคำนวณเพียงอย่างเดียว แต่จำเป็นต้องคำนึงถึงความถี่สัญญาณนาฬิกาและสถาปัตยกรรมที่แตกต่างกันของหน่วยรุ่นต่างๆ และผู้ผลิตชิป เฉพาะตัวเลขเหล่านี้เท่านั้นที่สามารถใช้เพื่อเปรียบเทียบชิปในบรรทัดเดียวกันของผู้ผลิตรายเดียว: AMD หรือ NVIDIA ในกรณีอื่นๆ คุณต้องให้ความสนใจกับการทดสอบประสิทธิภาพในเกมหรือแอปพลิเคชันที่สนใจ

หน่วยการทำแผนที่พื้นผิว (TMU)

หน่วย GPU เหล่านี้ทำงานร่วมกับโปรเซสเซอร์ที่ใช้เพื่อเลือกและกรองพื้นผิวและข้อมูลอื่น ๆ ที่จำเป็นสำหรับการสร้างฉากและการคำนวณทั่วไป จำนวนหน่วยพื้นผิวในชิปวิดีโอกำหนดประสิทธิภาพของพื้นผิว - นั่นคือความเร็วในการดึงเท็กซ์จากพื้นผิว

แม้ว่าเมื่อเร็ว ๆ นี้จะมีการเน้นที่การคำนวณทางคณิตศาสตร์มากขึ้น และพื้นผิวบางส่วนถูกแทนที่ด้วยขั้นตอนตามขั้นตอน แต่ภาระบน TMU ยังคงค่อนข้างสูง เนื่องจากนอกเหนือจากพื้นผิวหลักแล้ว การเลือกต้องทำจากแผนที่ปกติและแผนที่การเคลื่อนที่ เนื่องจาก รวมถึงบัฟเฟอร์เป้าหมายการแสดงผลนอกหน้าจอ

เมื่อพิจารณาถึงความสำคัญของเกมหลายๆ เกม รวมถึงประสิทธิภาพของหน่วยพื้นผิว เราสามารถพูดได้ว่าจำนวน TMU และประสิทธิภาพของพื้นผิวที่สูงที่สอดคล้องกันเป็นหนึ่งในพารามิเตอร์ที่สำคัญที่สุดสำหรับชิปวิดีโอ พารามิเตอร์นี้มีผลพิเศษต่อความเร็วในการแสดงผลของภาพเมื่อใช้การกรองแบบแอนไอโซโทรปิก ซึ่งต้องมีการเลือกพื้นผิวเพิ่มเติม เช่นเดียวกับอัลกอริธึมซอฟต์แชโดว์ที่ซับซ้อนและอัลกอริธึมแบบใหม่ เช่น Screen Space Ambient Occlusion

Rasterization Operations Blocks (ROP)

หน่วย Rasterization ดำเนินการของพิกเซลการบันทึกที่คำนวณโดยการ์ดแสดงผลลงในบัฟเฟอร์และการทำงานของการผสม (การผสม) ดังที่เราได้กล่าวไว้ข้างต้น ประสิทธิภาพของหน่วย ROP ส่งผลต่ออัตราการส่งโฆษณา และนี่เป็นหนึ่งในคุณสมบัติหลักของการ์ดวิดีโอตลอดกาล และถึงแม้ว่าเมื่อเร็ว ๆ นี้มูลค่าของมันจะลดลงเล็กน้อย แต่ก็ยังมีบางกรณีที่ประสิทธิภาพของแอปพลิเคชันขึ้นอยู่กับความเร็วและจำนวน ROP สาเหตุส่วนใหญ่เกิดจากการใช้งานตัวกรองหลังการประมวลผลและการป้องกันนามแฝงที่เปิดใช้งานที่การตั้งค่าเกมระดับสูง

โปรดสังเกตอีกครั้งว่าชิปวิดีโอสมัยใหม่ไม่สามารถประเมินได้ด้วยจำนวนบล็อกและความถี่ที่แตกต่างกันเท่านั้น GPU แต่ละซีรีส์ใช้สถาปัตยกรรมใหม่ ซึ่งหน่วยดำเนินการจะแตกต่างจากรุ่นเก่าอย่างมาก และอัตราส่วนของจำนวนหน่วยที่แตกต่างกันอาจแตกต่างกัน ดังนั้นหน่วย AMD ROP ในบางโซลูชันสามารถทำงานต่อนาฬิกาได้มากกว่าหน่วย NVIDIA และในทางกลับกัน เช่นเดียวกับความสามารถของหน่วยพื้นผิว TMU ซึ่งแตกต่างกันไปใน GPU รุ่นต่างๆ จากผู้ผลิตหลายราย และสิ่งนี้ควรนำมาพิจารณาเมื่อทำการเปรียบเทียบ

บล็อกเรขาคณิต

จนกระทั่งเมื่อไม่นานมานี้ จำนวนหน่วยประมวลผลทางเรขาคณิตไม่ได้มีความสำคัญเป็นพิเศษ บล็อก GPU หนึ่งบล็อกก็เพียงพอแล้วสำหรับงานส่วนใหญ่ เนื่องจากเรขาคณิตในเกมค่อนข้างง่าย และจุดเน้นหลักของประสิทธิภาพคือการคำนวณทางคณิตศาสตร์ ความสำคัญของการประมวลผลทางเรขาคณิตแบบคู่ขนานและจำนวนบล็อกที่เกี่ยวข้องเพิ่มขึ้นอย่างมากเมื่อได้รับการสนับสนุนสำหรับเรขาคณิต tessellation ใน DirectX 11 NVIDIA เป็นคนแรกที่ใช้การประมวลผลข้อมูลทางเรขาคณิตแบบขนาน เมื่อบล็อกที่เกี่ยวข้องหลายบล็อกปรากฏในชิป GF1xx จากนั้น AMD ก็เปิดตัวโซลูชันที่คล้ายกัน (เฉพาะในโซลูชันอันดับต้น ๆ ของสาย Radeon HD 6700 ที่ใช้ชิปเคย์แมน)

ภายในกรอบของเนื้อหานี้ เราจะไม่ลงรายละเอียด คุณสามารถอ่านได้ในเนื้อหาพื้นฐานของไซต์ของเราที่ทุ่มเทให้กับโปรเซสเซอร์กราฟิกที่เข้ากันได้กับ DirectX 11 สิ่งสำคัญสำหรับเราในกรณีนี้คือจำนวนหน่วยประมวลผลเรขาคณิตส่งผลกระทบอย่างมากต่อประสิทธิภาพโดยรวมในเกมใหม่ล่าสุดที่ใช้ tessellation เช่น Metro 2033, HAWX 2 และ Crysis 2 (พร้อมแพตช์ล่าสุด) และเมื่อเลือกการ์ดแสดงผลเกมที่ทันสมัย ​​สิ่งสำคัญคือต้องใส่ใจกับประสิทธิภาพทางเรขาคณิต

ขนาดหน่วยความจำวิดีโอ

ชิปวิดีโอใช้หน่วยความจำของตัวเองเพื่อเก็บข้อมูลที่จำเป็น: พื้นผิว จุดยอด ข้อมูลบัฟเฟอร์ ฯลฯ ดูเหมือนว่ายิ่งมีมากเท่าไหร่ก็ยิ่งดีเท่านั้น แต่ไม่ใช่ทุกอย่างจะง่ายนัก การประมาณประสิทธิภาพของการ์ดวิดีโอด้วยจำนวนหน่วยความจำวิดีโอเป็นข้อผิดพลาดที่พบบ่อยที่สุด! ผู้ใช้ที่ไม่มีประสบการณ์มักจะประเมินค่าหน่วยความจำวิดีโอสูงเกินไป โดยยังคงใช้เปรียบเทียบเพื่อเปรียบเทียบการ์ดแสดงผลรุ่นต่างๆ เป็นที่เข้าใจได้ - พารามิเตอร์นี้ระบุไว้ในรายการคุณลักษณะของระบบสำเร็จรูปแบบใดแบบหนึ่งและบนกล่องการ์ดแสดงผลจะเขียนด้วยตัวอักษรขนาดใหญ่ ดังนั้นดูเหมือนว่าผู้ซื้อที่ไม่มีประสบการณ์เนื่องจากหน่วยความจำมีขนาดใหญ่เป็นสองเท่าดังนั้นความเร็วของโซลูชันดังกล่าวจึงควรสูงเป็นสองเท่า ความเป็นจริงแตกต่างจากตำนานนี้ในความทรงจำนั้นสามารถมีได้หลายประเภทและลักษณะเฉพาะ และการเติบโตของผลิตภาพก็เพิ่มขึ้นเป็นจำนวนหนึ่งเท่านั้น และหลังจากบรรลุถึงสิ่งนั้น มันก็หยุดลง

ดังนั้นในทุกเกมและด้วยการตั้งค่าบางอย่างและฉากของเกมจะมีหน่วยความจำวิดีโอจำนวนหนึ่ง ซึ่งเพียงพอสำหรับข้อมูลทั้งหมด และแม้ว่าคุณจะใส่หน่วยความจำวิดีโอขนาด 4 GB ไว้ที่นั่น แต่ก็ไม่มีเหตุผลที่จะต้องเร่งการเรนเดอร์ ความเร็วจะถูกจำกัดโดยหน่วยการดำเนินการ ซึ่งได้กล่าวถึงข้างต้น และจะมีหน่วยความจำเพียงพอเท่านั้น นั่นคือเหตุผลที่ในหลายกรณี การ์ดวิดีโอที่มีหน่วยความจำวิดีโอ 1.5 GB ทำงานที่ความเร็วเท่ากับการ์ดที่มี 3 GB (ส่วนอื่นๆ ทั้งหมดเท่ากัน)

มีบางสถานการณ์ที่หน่วยความจำมากขึ้นนำไปสู่การเพิ่มประสิทธิภาพที่มองเห็นได้ - เกมเหล่านี้เป็นเกมที่มีความต้องการสูง โดยเฉพาะอย่างยิ่งที่ความละเอียดสูงพิเศษและการตั้งค่าคุณภาพสูงสุด แต่กรณีดังกล่าวไม่ได้เกิดขึ้นเสมอไปและต้องคำนึงถึงจำนวนหน่วยความจำด้วย อย่าลืมว่าประสิทธิภาพจะไม่เพิ่มขึ้นเกินจำนวนที่กำหนด ชิปหน่วยความจำยังมีพารามิเตอร์ที่สำคัญกว่า เช่น ความกว้างของบัสหน่วยความจำและความถี่ในการทำงาน หัวข้อนี้กว้างขวางมากจนเราจะพิจารณาตัวเลือกหน่วยความจำวิดีโอโดยละเอียดในส่วนที่หกของเนื้อหาของเรา

ความกว้างบัสหน่วยความจำ

ความกว้างบัสหน่วยความจำเป็นคุณลักษณะที่สำคัญที่สุดที่ส่งผลต่อแบนด์วิดท์หน่วยความจำ (แบนด์วิดท์หน่วยความจำ) ความกว้างที่กว้างขึ้นช่วยให้สามารถถ่ายโอนข้อมูลเพิ่มเติมจากหน่วยความจำวิดีโอไปยัง GPU และย้อนกลับต่อหน่วยเวลาได้ ซึ่งส่งผลดีต่อประสิทธิภาพในกรณีส่วนใหญ่ ในทางทฤษฎี บัส 256 บิตสามารถถ่ายโอนข้อมูลต่อนาฬิกาได้มากเป็นสองเท่าของบัส 128 บิต ในทางปฏิบัติ ความแตกต่างของความเร็วในการเรนเดอร์แม้ว่าจะไม่ถึงสองเท่า แต่ก็ใกล้เคียงกันมากในหลายกรณีโดยเน้นที่แบนด์วิดท์หน่วยความจำวิดีโอ

การ์ดแสดงผลการเล่นเกมสมัยใหม่ใช้ความกว้างของบัสที่แตกต่างกัน: ตั้งแต่ 64 ถึง 384 บิต (ก่อนหน้านี้มีชิปที่มีบัส 512 บิต) ขึ้นอยู่กับช่วงราคาและเวลาที่วางจำหน่ายของ GPU รุ่นใดรุ่นหนึ่ง สำหรับการ์ดแสดงผลระดับล่างที่ถูกที่สุด จะใช้ 64 และน้อยกว่า 128 บิต สำหรับระดับกลางตั้งแต่ 128 ถึง 256 บิต แต่การ์ดวิดีโอจากช่วงราคาบนจะใช้บัสที่มีความกว้างตั้งแต่ 256 ถึง 384 บิต ความกว้างของบัสไม่สามารถขยายได้อีกต่อไปเนื่องจากข้อจำกัดทางกายภาพ - ขนาดของ GPU die ไม่เพียงพอที่จะจัดวางมากกว่าบัส 512 บิต และนี่มีราคาแพงเกินไป ดังนั้นแบนด์วิดท์หน่วยความจำจึงเพิ่มขึ้นโดยใช้หน่วยความจำประเภทใหม่ (ดูด้านล่าง)

ความถี่หน่วยความจำวิดีโอ

พารามิเตอร์อื่นที่มีผลต่อแบนด์วิดท์หน่วยความจำคือความถี่สัญญาณนาฬิกา และการเพิ่มแบนด์วิดธ์หน่วยความจำมักจะส่งผลโดยตรงต่อประสิทธิภาพของการ์ดแสดงผลในแอปพลิเคชัน 3 มิติ ความถี่บัสหน่วยความจำในการ์ดวิดีโอสมัยใหม่มีตั้งแต่ 533 (1066, สองเท่า) MHz ถึง 1375 (5500, สี่เท่า) MHz นั่นคืออาจแตกต่างกันมากกว่าห้าเท่า! และเนื่องจากแบนด์วิดท์หน่วยความจำขึ้นอยู่กับความถี่ของหน่วยความจำและความกว้างของบัส หน่วยความจำที่มีบัส 256 บิตทำงานที่ 800 (3200) MHz จะมีแบนด์วิดท์ที่สูงกว่าเมื่อเทียบกับหน่วยความจำที่ทำงานที่ 1,000 (4000) MHz ด้วย บัส 128 บิต

ควรให้ความสนใจเป็นพิเศษกับพารามิเตอร์ของความกว้างบัสหน่วยความจำ ประเภทและความถี่ในการใช้งานเมื่อซื้อการ์ดวิดีโอที่มีราคาค่อนข้างถูก ซึ่งส่วนใหญ่ติดตั้งอินเทอร์เฟซ 128 บิตหรือ 64 บิตเท่านั้น ซึ่งส่งผลเสียอย่างมากต่อ ประสิทธิภาพของพวกเขา โดยทั่วไป เราไม่แนะนำให้ซื้อการ์ดแสดงผลโดยใช้บัสหน่วยความจำวิดีโอ 64 บิตสำหรับพีซีสำหรับเล่นเกมเลย ขอแนะนำให้ตั้งค่าอย่างน้อยระดับเฉลี่ยด้วยบัส 128- หรือ 192 บิตขั้นต่ำ

ประเภทหน่วยความจำ

มีการติดตั้งหน่วยความจำหลายประเภทในการ์ดวิดีโอสมัยใหม่ในคราวเดียว หน่วยความจำ SDR แบบเก่าที่มีอัตราการถ่ายโอนเดียวไม่มีที่ไหนเลย แต่หน่วยความจำ DDR และ GDDR ที่ทันสมัยมีลักษณะแตกต่างกันอย่างมาก DDR และ GDDR ประเภทต่างๆ ช่วยให้คุณถ่ายโอนข้อมูลได้มากขึ้นสองหรือสี่เท่าที่ความถี่สัญญาณนาฬิกาเดียวกันต่อหน่วยเวลา ดังนั้นความถี่ในการทำงานจึงมักจะระบุเป็นสองเท่าหรือสี่เท่า คูณด้วย 2 หรือ 4 ตัวอย่างเช่น หากความถี่ ถูกระบุสำหรับหน่วยความจำ DDR 1400 MHz จากนั้นหน่วยความจำนี้ทำงานที่ความถี่ทางกายภาพที่ 700 MHz แต่ระบุความถี่ที่เรียกว่า "มีประสิทธิภาพ" นั่นคือความถี่ที่หน่วยความจำ SDR ต้องทำงานเพื่อให้แบนด์วิดท์เท่ากัน . เช่นเดียวกับ GDDR5 แต่ความถี่ยังเพิ่มเป็นสี่เท่าที่นี่

ข้อได้เปรียบหลักของหน่วยความจำประเภทใหม่คือความสามารถในการทำงานที่ความเร็วสัญญาณนาฬิกาสูง ดังนั้นจึงเพิ่มแบนด์วิดท์เมื่อเทียบกับเทคโนโลยีก่อนหน้า สิ่งนี้ทำได้เนื่องจากเวลาแฝงที่เพิ่มขึ้น ซึ่งไม่สำคัญสำหรับการ์ดวิดีโอมากนัก บอร์ดแรกที่ใช้หน่วยความจำ DDR2 คือ NVIDIA GeForce FX 5800 Ultra ตั้งแต่นั้นมา เทคโนโลยีหน่วยความจำกราฟิกก็ก้าวหน้าอย่างมาก มาตรฐาน GDDR3 ได้รับการพัฒนาซึ่งใกล้เคียงกับข้อกำหนด DDR2 โดยมีการเปลี่ยนแปลงบางอย่างสำหรับการ์ดวิดีโอโดยเฉพาะ

GDDR3 เป็นหน่วยความจำที่ออกแบบมาเป็นพิเศษสำหรับการ์ดวิดีโอ โดยมีเทคโนโลยีเดียวกับ DDR2 แต่มีอัตราการกินไฟที่ดีขึ้นและคุณลักษณะการกระจายความร้อน ซึ่งทำให้สามารถสร้างไมโครเซอร์กิตที่ทำงานด้วยความถี่สัญญาณนาฬิกาที่สูงขึ้นได้ แม้ว่าที่จริงแล้วมาตรฐานได้รับการพัฒนาโดย ATI แต่การดัดแปลงครั้งที่สองของ NVIDIA GeForce FX 5700 Ultra เป็นการ์ดแสดงผลตัวแรกที่ใช้ และตัวต่อไปคือ GeForce 6800 Ultra

GDDR4 เป็นการพัฒนาเพิ่มเติมของหน่วยความจำ "กราฟิก" ที่เร็วเป็นสองเท่าของ GDDR3 ความแตกต่างที่สำคัญระหว่าง GDDR4 และ GDDR3 ซึ่งมีความสำคัญสำหรับผู้ใช้ คือความถี่การทำงานที่เพิ่มขึ้นอีกครั้งและการใช้พลังงานที่ลดลง ในทางเทคนิค หน่วยความจำ GDDR4 ไม่ได้แตกต่างจากหน่วยความจำ GDDR3 มากนัก แต่เป็นการพัฒนาแนวคิดเดียวกันเพิ่มเติม การ์ดแสดงผลตัวแรกที่มีชิป GDDR4 บนบอร์ดคือ ATI Radeon X1950 XTX ในขณะที่ NVIDIA ไม่ได้เปิดตัวผลิตภัณฑ์ที่ใช้หน่วยความจำประเภทนี้เลย ข้อดีของชิปหน่วยความจำใหม่เหนือ GDDR3 คือการใช้พลังงานของโมดูลสามารถลดลงได้ประมาณหนึ่งในสาม ทำได้โดยใช้ระดับแรงดันไฟฟ้าที่ต่ำกว่าสำหรับ GDDR4

อย่างไรก็ตาม GDDR4 ไม่ได้ใช้กันอย่างแพร่หลายแม้แต่ในโซลูชันของ AMD เริ่มต้นด้วยตระกูล GPU RV7x0 ตัวควบคุมหน่วยความจำการ์ดวิดีโอรองรับหน่วยความจำ GDDR5 ชนิดใหม่ โดยทำงานที่ความถี่สี่เท่าที่มีประสิทธิภาพสูงสุด 5.5 GHz และสูงกว่า (ความถี่ที่เป็นไปได้ในทางทฤษฎีสูงถึง 7 GHz) ซึ่งให้แบนด์วิดท์สูงสุด 176 GB / s โดยใช้อินเทอร์เฟซ 256 บิต ในขณะที่หน่วยความจำ GDDR3 / GDDR4 ต้องใช้บัส 512 บิตเพื่อเพิ่มแบนด์วิดท์หน่วยความจำ การเปลี่ยนไปใช้ GDDR5 ทำให้ประสิทธิภาพเพิ่มขึ้นเป็นสองเท่าด้วยขนาดไดย์ที่เล็กลงและสิ้นเปลืองพลังงานน้อยลง

หน่วยความจำวิดีโอประเภทที่ทันสมัยที่สุดคือ GDDR3 และ GDDR5 ซึ่งแตกต่างจาก DDR ในรายละเอียดบางอย่างและยังใช้งานได้กับการถ่ายโอนข้อมูลสองเท่า/สี่เท่า หน่วยความจำประเภทนี้ใช้เทคโนโลยีพิเศษบางอย่างเพื่อเพิ่มความถี่ในการทำงาน ดังนั้น หน่วยความจำ GDDR2 มักจะทำงานที่ความถี่ที่สูงกว่า DDR, GDDR3 - ที่สูงกว่านั้นอีก และ GDDR5 จะให้ความถี่และแบนด์วิดท์สูงสุดในขณะนั้น แต่รุ่นราคาไม่แพงยังคงมีหน่วยความจำ DDR3 แบบ "ไม่ใช่กราฟิก" ที่มีความถี่ต่ำกว่ามาก ดังนั้นคุณต้องเลือกการ์ดวิดีโออย่างระมัดระวัง

ในฟอรัมของเรา มีคนหลายสิบคนขอคำแนะนำเกี่ยวกับความทันสมัยของตนเองทุกวัน ซึ่งเรายินดีช่วยเหลือพวกเขา ทุกวัน "การประเมินการประกอบ" และตรวจสอบส่วนประกอบที่ลูกค้าของเราเลือกเพื่อความเข้ากันได้ เราเริ่มสังเกตเห็นว่าผู้ใช้ส่วนใหญ่ให้ความสนใจกับส่วนประกอบอื่นๆ ที่สำคัญอย่างไม่ต้องสงสัย และแทบไม่มีใครจำได้ว่าเมื่ออัปเกรดคอมพิวเตอร์ จำเป็นต้องอัปเดตรายละเอียดที่สำคัญไม่แพ้กัน - และวันนี้เราจะมาเล่าและแสดงว่าทำไมคุณถึงไม่ควรลืมเรื่องนี้

“… ฉันต้องการอัพเกรดคอมพิวเตอร์ ทุกอย่างกำลังบิน ฉันซื้อเปอร์เซ็นต์ของ i7-3970X และมาเธอร์บอร์ด ASRock X79 Extreme6 บวกกับ RADEON HD 7990 6GB vidyahu น่านอะไรอีก ???? 777"
- นี่คือข้อความประมาณครึ่งหนึ่งของทั้งหมดที่เกี่ยวข้องกับการอัปเดตคอมพิวเตอร์ที่อยู่กับที่ ตามงบประมาณของตนเองหรือของครอบครัว ผู้ใช้พยายามเลือกโมดูลหน่วยความจำที่เร็วและสวยงามที่สุด ในเวลาเดียวกันเชื่ออย่างไร้เดียงสาว่า 450W เก่าของพวกเขาจะรับมือกับทั้งการ์ดแสดงผลที่ตะกละและโปรเซสเซอร์ "ร้อน" ในระหว่างการโอเวอร์คล็อกในเวลาเดียวกัน

ในส่วนของเรา เราได้เขียนถึงความสำคัญของหน่วยจ่ายไฟมากกว่าหนึ่งครั้ง แต่เราขอสารภาพว่า มันอาจจะไม่ชัดเจนเพียงพอ ดังนั้น วันนี้เราได้แก้ไขตัวเอง และเตรียมบันทึกเอาไว้ว่าจะเกิดอะไรขึ้นหากคุณลืมอัปเกรดพีซีของคุณ - พร้อมรูปภาพและคำอธิบายโดยละเอียด

ดังนั้นเราจึงตัดสินใจอัปเดตการกำหนดค่า ...


สำหรับการทดลองของเรา เราตัดสินใจนำคอมพิวเตอร์ธรรมดาเครื่องใหม่มาอัปเกรดเป็น "เครื่องเล่นเกม" คุณไม่จำเป็นต้องเปลี่ยนการกำหนดค่ามากนัก แค่เปลี่ยนหน่วยความจำและการ์ดวิดีโอก็เพียงพอแล้ว เพื่อให้เรามีโอกาสเล่นเกมที่ทันสมัยมากขึ้นหรือน้อยลงด้วยการตั้งค่ารายละเอียดที่เหมาะสม การกำหนดค่าเริ่มต้นของคอมพิวเตอร์ของเรามีดังนี้:

พาวเวอร์ซัพพลาย: ATX 12V 400W

เห็นได้ชัดว่าการกำหนดค่านี้ค่อนข้างอ่อนแอสำหรับเกม ถึงเวลาต้องเปลี่ยนแปลงอะไรบางอย่างแล้ว! เราจะเริ่มด้วยสิ่งเดียวกันกับที่คนส่วนใหญ่ต้องการ "อัปเกรด" เริ่มต้นด้วย - หน้า เราจะไม่เปลี่ยนเมนบอร์ด - ตราบใดที่เราพอใจกับมัน

เนื่องจากเราตัดสินใจที่จะไม่แตะต้องเมนบอร์ด เราจะเลือกซ็อกเก็ตที่เข้ากันได้กับ FM2 (โชคดีที่มีปุ่มพิเศษบนเว็บไซต์ NIKS ในหน้าคำอธิบายเมนบอร์ด) อย่าโลภ - ลองใช้โปรเซสเซอร์ราคาไม่แพง แต่เร็วและทรงพลังด้วยความถี่ 4.1 GHz (สูงสุด 4.4 GHz ในโหมด Turbo CORE) และตัวคูณที่ปลดล็อค - เราชอบที่จะ "โอเวอร์คล็อก" เช่นกัน ไม่มีมนุษย์คนใดที่เป็นมนุษย์ต่างดาวสำหรับเรา นี่คือข้อกำหนดสำหรับโปรเซสเซอร์ที่เราเลือก:

ข้อมูลจำเพาะ
ความถี่บัสซีพียู 5000 MHz การกระจายพลังงาน 100 วัตต์ ความถี่โปรเซสเซอร์ 4.1 GHz หรือสูงสุด 4.4 GHz ในโหมด Turbo CORE แกน ริชแลนด์ แคช L1 96 KB x2 แคช L2 2048 KB x2 ทำงานที่ความถี่ของโปรเซสเซอร์ รองรับ 64 บิต ใช่ จำนวนแกน 4 การคูณ 41, ปลดล็อคตัวคูณ แกนประมวลผลวิดีโอ AMD Radeon HD 8670D @ 844 MHz; รองรับ Shader Model 5 แรมสูงสุด 64GB แม็กซ์ จำนวนจอภาพที่เชื่อมต่อ เชื่อมต่อโดยตรง 3 จอหรือจอภาพสูงสุด 4 จอโดยใช้ตัวแยก DisplayPort

แถบ 4GB หนึ่งแท่งไม่ใช่ทางเลือกของเรา ประการแรก เราต้องการ 16GB และประการที่สอง เราจำเป็นต้องใช้โหมดการทำงานแบบสองช่องสัญญาณ ซึ่งเราจะติดตั้งโมดูลหน่วยความจำสองโมดูลที่มีความจุ 8GB แต่ละโมดูลในคอมพิวเตอร์ของเรา ปริมาณงานสูง การขาดหม้อน้ำ และราคาที่เหมาะสม ทำให้ตัวเลือกเหล่านี้ "อร่อย" ที่สุดสำหรับเรา นอกจากนี้ จากเว็บไซต์ AMD คุณสามารถดาวน์โหลดโปรแกรม Radeon RAMDisk ซึ่งจะช่วยให้เราสร้างไดรฟ์เสมือนที่เร็วสุดแรงถึง 6GB ได้ฟรีโดยไม่มีค่าใช้จ่าย และทุกคนชอบสิ่งที่มีประโยชน์ฟรี


ข้อมูลจำเพาะ
หน่วยความจำ 8 GB
จำนวนโมดูล 2
มาตรฐานหน่วยความจำ PC3-10600 (DDR3 1333 MHz)
ความถี่ในการทำงาน สูงสุด 1333 MHz
เวลา 9-9-9-24
แรงดันไฟจ่าย 1.5V
แบนด์วิดธ์ 10667 Mb / s

คุณสามารถเล่นวิดีโอที่ฝังไว้ได้อย่างสะดวกสบายในฐานะ "ทหารช่าง" เท่านั้น ดังนั้น เพื่อที่จะอัพเกรดคอมพิวเตอร์ไปสู่ระดับการเล่นเกม เราจึงเลือกเครื่องที่ทันสมัยและทรงพลัง แต่ไม่ใช่เครื่องที่แพงที่สุด


เธอมีหน่วยความจำวิดีโอ 2GB รองรับ DirectX 11 และ OpenGL 4.x และระบบระบายความร้อน Twin Frozr IV ที่ยอดเยี่ยม ประสิทธิภาพของมันน่าจะเกินพอสำหรับเราที่จะเพลิดเพลินไปกับส่วนล่าสุดของแฟรนไชส์เกมยอดนิยมอย่าง Tomb Raider, Crysis, Hitman และ Far Cry คุณสมบัติของผู้ที่เลือกมีดังนี้:


ข้อมูลจำเพาะ
GPU GeForce GTX 770
ความถี่ GPU 1098 MHz หรือสูงถึง 1150 MHz ในโหมด GPU Boost
จำนวนโปรเซสเซอร์ shader 1536
หน่วยความจำวิดีโอ 2 GB
ประเภทหน่วยความจำวิดีโอ GDDR5
ความกว้างบัสหน่วยความจำวิดีโอ 256 บิต
ความถี่หน่วยความจำวิดีโอ 1753 MHz (7.010 GHz QDR)
จำนวนพิกเซลไปป์ไลน์ หน่วยสุ่มตัวอย่างพื้นผิว 128, 32 หน่วย
อินเตอร์เฟซ PCI Express 3.0 16x (รองรับ PCI Express 2.x / 1.x) พร้อมการเชื่อมต่อการ์ด SLI
พอร์ต DisplayPort, DVI-D, DVI-I, HDMI, อะแดปเตอร์ D-Sub รวมอยู่ด้วย
ระบายความร้อนการ์ดจอ Active (หม้อน้ำ + พัดลม Twin Frozr IV 2 ตัวที่ด้านหน้าของบอร์ด)
ขั้วต่อสายไฟ 8 พิน + 8 พิน
รองรับ API DirectX 11 และ OpenGL 4.x
ความยาวการ์ดจอ (วัดเป็น NIKS) 263 มม.
รองรับการประมวลผล GPU ทั่วไป DirectCompute 11, NVIDIA PhysX, CUDA, CUDA C ++, OpenCL 1.0
อัตราสิ้นเปลืองพลังงานสูงสุด FurMark + WinRar 255 วัตต์
คะแนนประสิทธิภาพ 61.5

ความยากลำบากที่ไม่คาดคิด

ตอนนี้เรามีทุกอย่างที่จำเป็นในการอัปเกรดคอมพิวเตอร์แล้ว เราจะติดตั้งส่วนประกอบใหม่ในกรณีที่มีอยู่ของเรา


เราเปิดตัว - และใช้งานไม่ได้ และทำไม? แต่เนื่องจากอุปกรณ์จ่ายไฟราคาประหยัดไม่สามารถเริ่มต้นคอมพิวเตอร์ในระดับที่น้อยที่สุดได้ ความจริงก็คือในกรณีของเราจำเป็นต้องใช้ตัวเชื่อมต่อ 8 พินสองตัวสำหรับแหล่งจ่ายไฟและหน่วยจ่ายไฟมีขั้วต่อไฟการ์ดแสดงผล 6 พินเพียงตัวเดียวในฐาน เมื่อพิจารณาถึงความต้องการตัวเชื่อมต่อมากกว่าในกรณีของเรา เห็นได้ชัดว่าจำเป็นต้องเปลี่ยนแหล่งจ่ายไฟ

แต่นี้ไม่ได้เลวร้ายมาก แค่คิดว่าไม่มีขั้วต่อสายไฟ! ในห้องปฏิบัติการทดสอบของเรา เราพบอะแดปเตอร์ที่ค่อนข้างหายากตั้งแต่ 6 พินถึง 8 พิน และจากโมเล็กซ์ไปจนถึง 6 พิน เช่นเดียวกับสิ่งเหล่านี้:


เป็นที่น่าสังเกตว่าแม้ในอุปกรณ์จ่ายไฟที่ทันสมัยราคาประหยัด ตัวเชื่อมต่อ Molex ก็มีขนาดเล็กลงทุกครั้งที่ออกใหม่ - ดังนั้นเราจึงสามารถพูดได้ว่าเราโชคดี

เมื่อมองแวบแรก ทุกอย่างเรียบร้อยดี และด้วยการปรับแต่งบางอย่าง เราก็สามารถอัปเดตยูนิตระบบเป็นการกำหนดค่า "เกม" ได้ ตอนนี้เรามาจำลองการโหลดโดยใช้ Furmark และ 7Zip ใน Xtreme Burning บนเครื่องเกมใหม่ของเราพร้อมๆ กัน เราสามารถเริ่มคอมพิวเตอร์ได้ - ดีมาก ระบบยังรอดจากการเปิดตัว Furmark เราเปิดตัวผู้จัดเก็บ - และมันคืออะไร! คอมพิวเตอร์ปิดตัวลง ทำให้เราพอใจกับเสียงคำรามของพัดลมที่เปลี่ยนเป็นระดับสูงสุด มาตรฐาน "เจียมเนื้อเจียมตัว" 400W ล้มเหลว ไม่ว่าจะพยายามมากแค่ไหนก็ตาม ในการป้อนการ์ดแสดงผลและโปรเซสเซอร์อันทรงพลัง และเนื่องจากระบบระบายความร้อนปานกลาง ระบบของเราจึงร้อนมาก และแม้แต่ความเร็วพัดลมสูงสุดก็ไม่ยอมให้ส่งอย่างน้อย 400W ที่ประกาศไว้

มีทางออก!

พวกเขาแล่นเรือ เราซื้อส่วนประกอบราคาแพงเพื่อประกอบคอมพิวเตอร์สำหรับเล่นเกม แต่กลับกลายเป็นว่าเล่นไม่ได้ มันเป็นความอัปยศ ข้อสรุปนั้นชัดเจนสำหรับทุกคน: เครื่องเก่าไม่เหมาะกับคอมพิวเตอร์เกมของเราและจำเป็นต้องเปลี่ยนเครื่องใหม่อย่างเร่งด่วน แต่อันไหนล่ะ?

สำหรับคอมพิวเตอร์ที่อัปเกรดแล้ว เราเลือกตามเกณฑ์หลักสี่ประการ:

ประการแรกคือพลังเราต้องการเลือกด้วยระยะขอบ - เราต้องการโอเวอร์คล็อกโปรเซสเซอร์และรับคะแนนในการทดสอบสังเคราะห์ เมื่อพิจารณาถึงทุกสิ่งที่เราต้องการในอนาคต เราจึงตัดสินใจเลือกกำลังไฟฟ้าอย่างน้อย 800W

เกณฑ์ที่สองคือความน่าเชื่อถือ... เราต้องการการ์ดที่ "มีระยะขอบ" เพื่อความอยู่รอดของการ์ดวิดีโอและโปรเซสเซอร์รุ่นต่อไปโดยไม่ทำให้ตัวเองหมดไฟและในขณะเดียวกันก็ไม่ต้องเผาส่วนประกอบราคาแพง (พร้อมกับไซต์ทดสอบ) ดังนั้นตัวเลือกของเราจึงมีเพียงตัวเก็บประจุของญี่ปุ่น มีเพียงการป้องกันไฟฟ้าลัดวงจรและการป้องกันโอเวอร์โหลดที่เชื่อถือได้สำหรับเอาต์พุตใดๆ

ประเด็นที่สามของความต้องการของเราคือความสะดวกและการใช้งาน... อันดับแรก เราต้องการ - คอมพิวเตอร์จะทำงานบ่อยครั้ง และโดยเฉพาะอย่างยิ่งแหล่งจ่ายไฟที่มีเสียงดัง ประกอบกับการ์ดแสดงผลและตัวระบายความร้อนของโปรเซสเซอร์ จะทำให้ผู้ใช้แทบบ้า นอกจากนี้ ความรู้สึกของความงามไม่ใช่เรื่องแปลกสำหรับเรา ดังนั้นแหล่งจ่ายไฟใหม่สำหรับคอมพิวเตอร์เกมของเราควรเป็นแบบแยกส่วนและมีสายเคเบิลและขั้วต่อที่ถอดออกได้ เพื่อไม่ให้มีสิ่งใดเกินจำเป็น

และสุดท้ายแต่ไม่ท้ายสุด เกณฑ์คือ ประสิทธิภาพการใช้พลังงาน... ใช่ เราใส่ใจเกี่ยวกับสิ่งแวดล้อมและค่าไฟฟ้าของเรา ดังนั้นแหล่งจ่ายไฟที่เราเลือกต้องเป็นไปตามมาตรฐานประสิทธิภาพการใช้พลังงานอย่างน้อย 80+ Bronze

หลังจากเปรียบเทียบและวิเคราะห์ข้อกำหนดทั้งหมดแล้ว เราได้เลือกผู้สมัครเพียงไม่กี่รายที่มีคุณสมบัติตรงตามข้อกำหนดทั้งหมดของเรา มันกลายเป็นพลังของ 850W โปรดทราบว่าในพารามิเตอร์จำนวนหนึ่ง มันเกินความต้องการของเราด้วยซ้ำ มาดูข้อมูลจำเพาะ:

ข้อมูลจำเพาะของแหล่งจ่ายไฟ
ประเภทอุปกรณ์ แหล่งจ่ายไฟพร้อมโมดูล PFC (Power Factor Correction) ที่ใช้งานอยู่
คุณสมบัติ การถักเปียแบบวนซ้ำ, ตัวเก็บประจุแบบญี่ปุ่น, การป้องกันไฟฟ้าลัดวงจร (SCP), การป้องกันแรงดันไฟเกิน (OVP), การป้องกันการโอเวอร์โหลดของเอาต์พุตยูนิตใดๆ แยกต่างหาก (OCP)
+ 3.3V - 24A, + 5V - 24A, + 12V - 70A, + 5VSB - 3.0A, -12V - 0.5A
สายไฟที่ถอดออกได้ ใช่
ประสิทธิภาพ 90%, 80 PLUS Gold ได้รับการรับรอง
หน่วยจ่ายพลังงาน 850 วัตต์
ขั้วต่อสายไฟเมนบอร์ด 24 + 8 + 8 พิน, 24 + 8 + 4 พิน, 24 + 8 พิน, 24 + 4 พิน, 20 + 4 พิน (คอนเน็กเตอร์ 24 พินแบบพับได้ 4 พินสามารถถอดออกได้หากจำเป็น คอนเน็กเตอร์ 8 พินแบบยุบได้)
ช่องเสียบไฟการ์ดแสดงผล ขั้วต่อ 6x 6/8-pin (ขั้วต่อ 8 ขาแบบพับได้ - ถอดได้ 2 ขา)
MTBF 100 พันชั่วโมง
ระบายความร้อนแหล่งจ่ายไฟ 1 พัดลม: 140 x 140 มม. (ที่ผนังด้านล่าง) ระบบระบายความร้อนแบบพาสซีฟโหลดสูงสุด 50%
การควบคุมความเร็วพัดลม จากเซ็นเซอร์ความร้อน การเปลี่ยนความเร็วพัดลมขึ้นอยู่กับอุณหภูมิภายในแหล่งจ่ายไฟ การเลือกโหมดการทำงานของพัดลมด้วยตนเอง ในโหมดปกติ พัดลมจะหมุนอย่างต่อเนื่อง และในโหมดเงียบ พัดลมจะหยุดทำงานโดยสมบูรณ์ที่โหลดต่ำ


ซึ่งเป็นหนึ่งในสิ่งที่ดีที่สุดสำหรับเงินที่จ่ายไป มาติดตั้งในคลังข้อมูลของเรา:


แล้วมีบางอย่างเกิดขึ้นที่ทำให้เราสับสนเล็กน้อย ดูเหมือนว่าทุกอย่างประกอบอย่างถูกต้องทุกอย่างเชื่อมต่อแล้วทุกอย่างทำงาน - แต่แหล่งจ่ายไฟเงียบ! โดยทั่วไปแล้ว พัดลมยังคงหยุดนิ่ง และระบบเริ่มทำงานและทำงานได้อย่างเหมาะสม ความจริงก็คือเมื่อโหลดมากถึง 50% แหล่งจ่ายไฟจะทำงานในโหมดเงียบ - โดยไม่ต้องหมุนพัดลมระบายความร้อน พัดลมจะส่งเสียงครวญครางภายใต้ภาระหนักเท่านั้น - การเปิดตัวผู้จัดเก็บพร้อมกันและ Furmark ทำให้การหมุนที่เย็นลง


แหล่งจ่ายไฟมีคอนเน็กเตอร์จ่ายไฟสำหรับการ์ดวิดีโอ 8 พิน6 พินมากถึงหกตัว โดยแต่ละอันเป็นคอนเน็กเตอร์ 8 พินแบบยุบได้ ซึ่งคุณสามารถปลดผู้ติดต่อ 2 รายออกได้หากจำเป็น ดังนั้นจึงสามารถป้อนการ์ดวิดีโอโดยไม่ต้องยุ่งยากและยุ่งยากโดยไม่จำเป็น และไม่ใช่แม้แต่อันเดียว


ระบบจ่ายไฟแบบแยกส่วนช่วยให้คุณสามารถถอดสายไฟที่ไม่จำเป็นและไม่จำเป็น ซึ่งช่วยเพิ่มการไหลเวียนของอากาศของเคส ความเสถียรของระบบ และแน่นอน ปรับปรุงรูปลักษณ์ของพื้นที่ภายในอย่างสวยงาม ซึ่งช่วยให้เราแนะนำให้ผู้ดัดแปลงได้อย่างปลอดภัย และแฟน ๆ ของเคสที่มีหน้าต่าง
ซื้อแหล่งจ่ายไฟที่เชื่อถือได้และทรงพลัง ในการตรวจสอบของเรามันกลายเป็น - และอย่างที่คุณเห็น มันไม่ใช่เรื่องบังเอิญ โดยการซื้อจาก NICS คุณจะมั่นใจได้ว่าส่วนประกอบทั้งหมดของระบบที่มีประสิทธิภาพสูงจะได้รับพลังงานที่เพียงพอและต่อเนื่อง แม้จะทำการโอเวอร์คล็อกที่รุนแรงก็ตาม


นอกจากนี้ แหล่งจ่ายไฟจะมีอายุหลายปีล่วงหน้า - จะดีกว่าด้วยมาร์จิ้น ในกรณีที่คุณจะอัปเดตระบบด้วยส่วนประกอบระดับสูงในอนาคต