Počítače Okna Internet

Co jsou rasterizační bloky v mapě. Počet výpočetních (shaderových) jednotek nebo procesorů

Základní součásti grafické karty:

  • výstupy;
  • rozhraní;
  • chladící systém;
  • grafický procesor;
  • video paměť.

Grafické technologie:

  • slovník;
  • Architektura GPU: funkce
    jednotky vrcholů / pixelů, shadery, rychlost plnění, jednotky textury / rastru, potrubí;
  • Architektura GPU: technologie
    technický proces, frekvence GPU, lokální video paměť (velikost, sběrnice, typ, frekvence), řešení s několika grafickými kartami;
  • vizuální funkce
    DirectX, vysoký dynamický rozsah (HDR), vyhlazování na celou obrazovku, filtrování textur, textury s vysokým rozlišením.

Glosář základních grafických pojmů

Obnovovací frekvence

Stejně jako v kině nebo televizi počítač simuluje pohyb na monitoru zobrazením posloupnosti snímků. Obnovovací frekvence monitoru udává, kolikrát za sekundu bude obraz obnoven na obrazovce. Například 75 Hz odpovídá 75 aktualizacím za sekundu.

Pokud počítač zpracovává snímky rychleji, než může monitor zobrazit, mohou se ve hrách objevit problémy. Pokud například počítač vykreslí 100 snímků za sekundu a obnovovací frekvence monitoru je 75 Hz, pak v důsledku překrytí může monitor během obnovovací periody zobrazit pouze část obrazu. V důsledku toho se objeví vizuální artefakty.

Jako řešení můžete povolit V-Sync (vertikální synchronizace). Omezuje počet snímků emitovaných počítačem na obnovovací frekvenci monitoru, čímž se zabrání výskytu artefaktů. Pokud povolíte V-Sync, pak počet snímků vykreslených ve hře nikdy nepřekročí obnovovací frekvenci. To znamená, že při 75 Hz počítač nevydá více než 75 snímků za sekundu.

Pixel

Slovo „Pixel“ znamená „ obr ture el ement “je obrazový prvek. Je to malá tečka na displeji, která může zářit v určité barvě (ve většině případů je odstín odvozen z kombinace tří základních barev: červené, zelené a modré). Pokud je rozlišení obrazovky 1024 × 768, pak můžete vidět matici 1024 pixelů na šířku a 768 pixelů na výšku. Pixely dohromady tvoří obraz. Obraz na obrazovce se aktualizuje 60 až 120krát za sekundu, v závislosti na typu zobrazení a datech produkovaných výstupem grafické karty. Monitory CRT aktualizují zobrazení řádek po řádku, zatímco ploché monitory LCD mohou aktualizovat každý pixel jednotlivě.

Vrchol

Všechny objekty ve 3D scéně se skládají z vrcholů. Vrchol je bod v trojrozměrném prostoru se souřadnicemi X, Y a Z. Do polygonu lze seskupit několik vrcholů: nejčastěji jde o trojúhelník, ale jsou možné i složitější tvary. Poté je na mnohoúhelník nanesena textura, díky které objekt vypadá realisticky. 3D krychle zobrazená na výše uvedeném obrázku má osm vrcholů. Složitější objekty mají zakřivené povrchy, které ve skutečnosti sestávají z velmi velkého počtu vrcholů.

Textura

Textura je jednoduše 2D obraz jakékoli velikosti, který je superponován na 3D objekt, aby simuloval jeho povrch. Například naše 3D kostka má osm vrcholů. Před mapováním textur to vypadá jako jednoduché pole. Když ale aplikujeme texturu, pole se zbarví.

Shader

Programy Pixel shader umožňují grafické kartě vytvářet působivé efekty, jako je například voda v Elder Scrolls: Oblivion.

Dnes existují dva typy shaderů: vertex a pixel. Vrcholové shadery mohou upravovat nebo transformovat 3D objekty. Pixel shadery vám umožňují měnit barvy pixelů na základě dat. Představte si zdroj světla ve 3D scéně, který rozzáří osvětlené objekty a současně vrhá stíny na jiné objekty. To vše je realizováno změnou barevných informací pixelů.

Pixel shadery se používají k vytváření komplexních efektů ve vašich oblíbených hrách. Například kód shaderu může zajistit, aby pixely obklopující 3D meč zářily jasněji. Další shader dokáže zpracovat všechny vrcholy složitého 3D objektu a simulovat výbuch. Vývojáři her se stále častěji obracejí k propracovaným programům shaderů, aby vytvořili realistickou grafiku. Téměř každá moderní hra s bohatou grafikou používá shadery.

S vydáním dalšího rozhraní Microsoft DirectX 10 Application Programming Interface (API) bude existovat třetí typ shaderu s názvem shadery geometrie. S jejich pomocí bude možné objekty lámat, upravovat a dokonce i ničit, v závislosti na požadovaném výsledku. Třetí typ shaderu lze naprogramovat stejným způsobem jako první dva, ale jeho role bude odlišná.

Rychlost plnění

Velmi často na krabici s grafickou kartou najdete hodnotu míry naplnění. V zásadě míra naplnění udává, jak rychle může GPU poskytovat pixely. U starších grafických karet můžete najít míru naplnění trojúhelníku. Dnes však existují dva typy rychlosti výplně: rychlost vyplňování pixelů a rychlost vyplňování textur. Jak již bylo zmíněno, míra naplnění pixelu odpovídá výstupní rychlosti pixelu. Vypočítává se jako počet rastrových operací (ROP) vynásobený hodinovou frekvencí.

ATi a nVidia vypočítávají míry vyplnění textur odlišně. nVidia si myslí, že rychlost je získána vynásobením počtu kanálů pixelů rychlostí hodin. ATi vynásobí počet jednotek textury rychlostí hodin. V zásadě jsou obě metody správné, protože nVidia používá jednu jednotku textury na jednotku shaderu pixelů (tj. Jednu na kanál pixelu).

S ohledem na tyto definice se přesunu dále a prodiskutuji nejdůležitější funkce GPU, co dělají a proč jsou tak důležité.

Architektura GPU: funkce

Realita 3D grafiky je velmi závislá na výkonu grafické karty. Čím více bloků pixelových shaderů procesor obsahuje a čím vyšší je frekvence, tím více efektů lze na 3D scénu použít ke zlepšení jejího vizuálního vnímání.

GPU obsahuje mnoho různých funkčních bloků. Podle počtu některých komponent můžete odhadnout, jak výkonný je GPU. Než se pohneme dál, dovolte mi prozkoumat nejdůležitější funkční bloky.

Vertex procesory (vertex shader jednotky)

Stejně jako pixelové shaderové jednotky i vertexové procesory spouští shaderový kód, který se dotýká vrcholů. Vzhledem k tomu, že větší rozpočet vrcholů umožňuje vytvářet složitější 3D objekty, je výkon vertexových procesorů velmi důležitý u 3D scén se složitými objekty nebo s velkým počtem z nich. Vertex shader jednotky však stále nemají tak zjevně vliv na výkon jako pixelové procesory.

Procesory Pixel (jednotky Pixel Shader)

Pixelový procesor je součástí grafického čipu určeného pro zpracování programů pixel shader. Tyto procesory provádějí výpočty pouze v pixelech. Protože pixely obsahují informace o barvách, mohou pixelové shadery dosáhnout působivých grafických efektů. Například většina efektů vody, které jste viděli ve hrách, je vytvořena pomocí pixelových shaderů. Počet procesorů pixelů se obvykle používá ke srovnání výkonu pixelů grafických karet. Pokud je jedna karta vybavena osmi jednotkami shaderů pixelů a druhá 16 jednotkami, pak je celkem logické předpokládat, že grafická karta se 16 jednotkami zpracuje komplexní pixelové programy rychleji. Měli byste také zvážit rychlost hodin, ale dnes je zdvojnásobení počtu procesorů pixelů energeticky účinnější než zdvojnásobení frekvence grafického čipu.

Sjednocené shadery

Sjednocené shadery zatím do světa PC nedorazily, ale nadcházející standard DirectX 10 je založen na podobné architektuře. To znamená, že struktura kódu vrcholů, geometrických a pixelových programů bude stejná, i když shadery budou dělat různé úlohy. Novou specifikaci lze zobrazit na Xboxu 360, kde byl grafický procesor speciálně navržen společností ATi pro Microsoft. Bude velmi zajímavé sledovat, jaký potenciál nový DirectX 10 má.

Texturovací mapovací jednotky (TMU)

Textury by měly být vybrány a filtrovány. Tuto práci provádějí jednotky mapování textur, které fungují ve spojení s jednotkami pixel a vertex shader. Úkolem TMU je aplikovat texturové operace na pixely. Počet jednotek textur v GPU se často používá ke srovnání výkonu textur grafických karet. Je celkem rozumné předpokládat, že grafická karta s vyšším počtem TMU poskytne vyšší výkon textur.

Rastrové operátorské jednotky (ROP)

RIP jsou zodpovědné za zápis dat pixelu do paměti. Rychlost, s jakou se tato operace provádí, je míra naplnění. V počátcích 3D akcelerátorů byly ROP a míry plnění velmi důležitými charakteristikami grafických karet. Dnes je výkon ROP stále důležitý, ale výkon grafické karty již není omezen těmito bloky, jako tomu bylo dříve. Proto se výkon (a počet) ROP již zřídka používá k odhadu rychlosti grafické karty.

Dopravníky

Potrubí se používá k popisu architektury grafických karet a poskytuje velmi vizuální znázornění výkonu GPU.

Dopravník není přísný technický termín. GPU používá různé kanály, které vykonávají různé funkce. Historicky byl kanál chápán jako procesor pixelů, který byl připojen k vlastní jednotce mapování textur (TMU). Například grafická karta Radeon 9700 používá osm pixelových procesorů, z nichž každý je připojen k vlastní TMU, takže se má za to, že karta má osm kanálů.

Je ale velmi obtížné popsat moderní procesory podle počtu potrubí. Ve srovnání s předchozími návrhy používají nové procesory modulární fragmentovanou strukturu. ATi lze v této oblasti považovat za inovátora, který s řadou grafických karet X1000 přešel na modulární strukturu, která díky interní optimalizaci umožňovala dosáhnout nárůstu výkonu. Některé bloky CPU se používají více než jiné a aby se zlepšil výkon GPU, ATi se pokusil najít kompromis mezi počtem požadovaných bloků a oblastí matrice (nelze ji příliš zvětšit). V této architektuře ztratil termín „pixelový kanál“ svůj význam, protože pixelové procesory již nejsou připojeny k vlastním TMU. Například GPU ATi Radeon X1600 má 12 pixel shaderů a jen čtyři TMU. Nelze tedy říci, že architektura tohoto procesoru má 12 pixelových kanálů, stejně jako tvrzení, že jsou pouze čtyři. Tradičně jsou však stále zmiňovány pixelové kanály.

Když vezmeme tyto předpoklady v úvahu, počet pixelových kanálů v GPU se často používá ke srovnání grafických karet (s výjimkou řady ATi X1x00). Pokud například vezmeme grafické karty s 24 a 16 kanály, pak je celkem rozumné předpokládat, že karta s 24 kanály bude rychlejší.

Architektura GPU: technologie

Technický postup

Tento termín označuje velikost jednoho prvku (tranzistoru) čipu a přesnost výrobního postupu. Zlepšení technických procesů vám umožní získat menší prvky. Například proces 0,18 mikronu produkuje větší prvky než proces 0,13 mikronu, takže není tak účinný. Menší tranzistory pracují na nižších napětích. Pokles napětí zase vede ke snížení tepelného odporu, což vede ke snížení množství generovaného tepla. Vylepšení technického postupu umožňuje zmenšit vzdálenost mezi funkčními bloky čipu a přenos dat trvá kratší dobu. Kratší vzdálenosti, nižší napětí a další vylepšení umožňují dosáhnout vyšších hodin.

Porozumění je poněkud komplikované skutečností, že dnes se pro označení technického postupu používají jak mikrometry (μm), tak nanometry (nm). Ve skutečnosti je vše velmi jednoduché: 1 nanometr se rovná 0,001 mikrometru, takže výrobní procesy 0,09 mikronů a 90 nm jsou jedno a totéž. Jak bylo uvedeno výše, menší procesní technologie vám umožní dosáhnout vyšších hodin. Pokud například porovnáme grafické karty s čipy 0,18 mikronu a 0,09 mikronu (90 nm), pak je celkem rozumné očekávat vyšší frekvenci od 90 nm karty.

Rychlost hodin GPU

Taktovací frekvence GPU se měří v megahertzech (MHz), což jsou miliony hodinových taktů za sekundu.

Rychlost hodin přímo ovlivňuje výkon GPU. Čím výše je, tím více práce lze udělat za sekundu. Pro první příklad si vezměme grafické karty nVidia GeForce 6600 a 6600 GT: GPU 6600 GT běží na 500 MHz, zatímco běžná karta 6600 běží na 400 MHz. Jelikož jsou procesory technicky totožné, 20% nárůst hodin 6600 GT se promítá do lepšího výkonu.

Rychlost hodin ale není všechno. Je třeba mít na paměti, že architektura výrazně ovlivňuje výkon. Jako druhý příklad si vezměme grafické karty GeForce 6600 GT a GeForce 6800 GT. 6600 GT má frekvenci GPU 500 MHz, ale 6800 GT běží pouze na 350 MHz. Nyní vezměme v úvahu, že 6800 GT používá 16 pixelových kanálů, zatímco 6600 GT používá pouze osm. Proto 6800 GT se 16 kanály na 350 MHz poskytne přibližně stejný výkon jako procesor s osmi kanály a dvojnásobným taktem (700 MHz). S ohledem na to lze rychlost hodin použít k porovnání výkonu.

Místní video paměť

Paměť grafické karty má obrovský vliv na výkon. Ale různé parametry paměti ovlivňují různými způsoby.

Velikost videopaměti

Množství grafické paměti lze pravděpodobně nazvat nejvíce nadhodnoceným parametrem grafické karty. Nezkušení spotřebitelé často používají množství videopaměti ke vzájemnému porovnávání různých karet, ale ve skutečnosti má toto množství malý vliv na výkon ve srovnání s parametry, jako je frekvence paměťové sběrnice a rozhraní (šířka sběrnice).

Ve většině případů bude karta se 128 MB video paměti fungovat téměř stejně jako karta s 256 MB. Samozřejmě existují situace, kdy více paměti vede ke zvýšení výkonu, ale pamatujte, že více paměti nepovede automaticky ke zvýšení rychlosti ve hrách.

Objem, který přijde vhod, je ve hrách s texturami s vysokým rozlišením. Vývojáři her poskytují pro hru několik sad textur. A čím více paměti je na grafické kartě, tím vyšší rozlišení mohou mít načtené textury. Textury s vysokým rozlišením poskytují vyšší rozlišení a detaily ve hře. Proto je docela rozumné vzít kartu s velkým množstvím paměti, pokud jsou všechna ostatní kritéria stejná. Ještě jednou připomeňme, že šířka paměťové sběrnice a její frekvence mají na výkon mnohem silnější vliv než množství fyzické paměti na kartě.

Šířka paměťové sběrnice

Šířka paměťové sběrnice je jedním z nejdůležitějších aspektů výkonu paměti. Moderní autobusy mají šířku 64 až 256 bitů a v některých případech dokonce 512 bitů. Čím širší je paměťová sběrnice, tím více informací může přenášet za hodinový cyklus. A to přímo ovlivňuje výkon. Pokud například vezmeme dvě sběrnice se stejnými frekvencemi, pak teoreticky 128bitová sběrnice přenese dvakrát tolik dat za hodiny než 64bitová. A 256bitová sběrnice je dvakrát tak velká.

Vyšší šířka pásma sběrnice (vyjádřená v bitech nebo bajtech za sekundu, 1 bajt = 8 bitů) má za následek vyšší výkon paměti. Proto je paměťová sběrnice mnohem důležitější než její velikost. Při stejných frekvencích pracuje 64bitová paměťová sběrnice rychlostí pouze 25% z 256bitové!

Vezměme si následující příklad. Grafická karta se 128 MB grafické paměti, ale s 256bitovou sběrnicí, poskytuje mnohem vyšší paměťový výkon než model 512 MB se 64bitovou sběrnicí. Je důležité si uvědomit, že u některých karet ATi X1x00 udávají výrobci specifikace vnitřní paměťové sběrnice, ale zajímají nás parametry externí sběrnice. Například vnitřní prstencová sběrnice X1600 je široká 256 bitů, ale externí je široká pouze 128 bitů. A ve skutečnosti paměťová sběrnice pracuje se 128bitovým výkonem.

Typy paměti

Paměť lze rozdělit do dvou hlavních kategorií: SDR (jeden přenos dat) a DDR (dvojitý přenos dat), ve kterých jsou data přenášena dvakrát rychleji za hodiny. Dnes je technologie jediného přenosu SDR zastaralá. Protože paměť DDR přenáší data dvakrát rychleji než paměť SDR, je důležité si uvědomit, že grafické karty s pamětí DDR jsou obvykle indikovány s dvojnásobnou frekvencí, a nikoli fyzickou. Pokud je například paměť DDR uvedena jako 1 000 MHz, pak je to efektivní frekvence, na které musí běžná paměť SDR pracovat, aby poskytovala stejnou šířku pásma. Ve skutečnosti je fyzická frekvence 500 MHz.

Z tohoto důvodu jsou mnozí překvapeni, když je pro paměť jejich grafické karty uvedena frekvence 1 200 MHz DDR a obslužné programy hlásí 600 MHz. Takže si na to musíte zvyknout. Paměti DDR2 a GDDR3 / GDDR4 fungují stejným způsobem, tedy s dvojnásobným přenosem dat. Rozdíl mezi DDR, DDR2, GDDR3 a GDDR4 spočívá ve výrobní technologii a některých detailech. DDR2 může běžet na vyšších frekvencích než paměť DDR a DDR3 může běžet ještě vyšší než DDR2.

Frekvence paměťové sběrnice

Stejně jako procesor, paměť (nebo přesněji paměťová sběrnice) pracuje se specifickými hodinami, měřenými v megahertzech. Zde zvýšení rychlosti hodin přímo ovlivňuje výkon paměti. A frekvence paměťové sběrnice je jedním z parametrů, které slouží ke srovnání výkonu grafických karet. Pokud jsou například všechny ostatní charakteristiky (šířka sběrnice paměti atd.) Stejné, pak je celkem logické říci, že grafická karta s pamětí 700 MHz je rychlejší než 500 MHz.

Rychlost hodin opět není všechno. Paměť 700 MHz se 64bitovou sběrnicí bude pomalejší než paměť 400 MHz se 128bitovou sběrnicí. Výkon paměti 400 MHz na 128bitové sběrnici je zhruba ekvivalentní paměti 800 MHz na 64bitové sběrnici. Mělo by se také pamatovat na to, že frekvence GPU a paměti jsou zcela odlišné parametry a obvykle se liší.

Rozhraní grafické karty

Všechna data přenášená mezi grafickou kartou a procesorem procházejí rozhraním grafické karty. Dnes se pro grafické karty používají tři typy rozhraní: PCI, AGP a PCI Express. Liší se šířkou pásma a dalšími charakteristikami. Je jasné, že čím vyšší je šířka pásma, tím vyšší je směnný kurz. Pouze nejmodernější karty však mohou využívat velkou šířku pásma, a to dokonce jen částečně. V určitém okamžiku přestala být rychlost rozhraní „úzkým hrdlem“, dnes to prostě stačí.

Nejpomalejší sběrnicí, pro kterou byly grafické karty vyráběny, je PCI (Peripheral Components Interconnect). Pokud nepůjdete do historie, samozřejmě. PCI opravdu poškodilo výkon grafických karet, proto přešli na rozhraní AGP (Accelerated Graphics Port). Ale i specifikace AGP 1.0 a 2x omezovaly výkon. Když standard zvýšil rychlost na AGP 4x, začali jsme se přibližovat k praktické hranici šířky pásma, kterou mohou grafické karty používat. Specifikace AGP 8x zdvojnásobila šířku pásma ve srovnání s AGP 4x (2,16 GB / s), ale nezaznamenali jsme žádný znatelný nárůst grafického výkonu.

Nejnovější a nejrychlejší sběrnice je PCI Express. Novější grafické karty obvykle používají rozhraní PCI Express x16, které kombinuje 16 linek PCI Express pro celkovou šířku pásma 4 GB / s (jeden směr). To je dvojnásobek šířky pásma oproti AGP 8x. Sběrnice PCI Express poskytuje zmíněnou šířku pásma pro oba směry (přenos dat do a z grafické karty). Rychlost standardu AGP 8x už ale byla dostačující, takže jsme se ještě nesetkali se situací, kdy by přechod na PCI Express přinesl zvýšení výkonu oproti AGP 8x (pokud jsou ostatní hardwarové parametry stejné). Například verze GeForce 6800 Ultra AGP bude fungovat stejně jako 6800 Ultra pro PCI Express.

Dnes je nejlepší koupit kartu s rozhraním PCI Express, na trhu vydrží několik dalších let. Nejproduktivnější karty již nejsou k dispozici s rozhraním AGP 8x a řešení PCI Express se zpravidla hledají snáze než analogová AGP a jsou levnější.

Řešení s více GPU

Využití více grafických karet ke zvýšení grafického výkonu není nový nápad. V počátcích 3D grafiky vstoupil 3dfx na trh se dvěma paralelně běžícími grafickými kartami. Ale se zmizením 3dfx byla technologie spolupráce několika spotřebitelských grafických karet zapomenuta, ačkoli ATi vydává podobné systémy pro profesionální simulátory od vydání Radeonu 9700. Před několika lety se technologie vrátila do trh: s příchodem řešení nVidia SLI a o něco později ATi Crossfire.

Sdílení více grafických karet poskytuje dostatečný výkon pro spuštění hry ve vysokém nastavení kvality ve vysokém rozlišení. Vybrat jedno nebo druhé řešení však není tak snadné.

Za prvé, řešení založená na více grafických kartách vyžadují hodně energie, takže napájecí zdroj musí být dostatečně výkonný. Všechno toto teplo bude muset být odstraněno z grafické karty, takže musíte věnovat pozornost skříni počítače a chlazení, aby se systém nepřehřál.

Pamatujte také, že SLI / CrossFire vyžaduje vhodnou základní desku (ať už pro jednu nebo jinou technologii), která obvykle stojí více než standardní modely. Konfigurace nVidia SLI bude fungovat pouze na určitých deskách nForce4 a karty ATi CrossFire budou fungovat pouze na základních deskách s čipovou sadou CrossFire nebo na určitých modelech Intel. Abychom to zkomplikovali, některé konfigurace CrossFire vyžadují, aby jedna z karet byla speciální: CrossFire Edition. Po vydání CrossFire pro některé modely grafických karet umožnila ATi začlenění technologie spolupráce prostřednictvím sběrnice PCI Express a s vydáním nových verzí ovladačů se počet možných kombinací zvyšuje. Hardwarový CrossFire s odpovídající kartou CrossFire Edition vám přesto poskytne lepší výkon. Karty CrossFire Edition jsou ale také dražší než běžné modely. Prozatím můžete na grafických kartách Radeon X1300, X1600 a X1800 GTO povolit softwarový režim CrossFire (bez karty CrossFire Edition).

Je třeba vzít v úvahu i další faktory. Zatímco dvě grafické karty spolupracují, zvyšují výkon, zdaleka to není dvojnásobek. Ale dáte dvakrát tolik peněz. Zvýšení produktivity je nejčastěji 20–60%. A v některých případech kvůli dodatečným výpočetním nákladům na usmíření není žádný zisk. Z tohoto důvodu je nepravděpodobné, že by se konfigurace více karet ospravedlnila levnějšími modely, protože dražší grafická karta obvykle vždy překoná pár levnějších karet. Obecně pro většinu spotřebitelů nemá smysl používat řešení SLI / CrossFire. Pokud ale chcete povolit všechny možnosti vylepšení kvality nebo hrát v extrémních rozlišeních, například 2560 × 1600, když potřebujete vykreslit více než 4 miliony pixelů na snímek, pak se neobejdete bez dvou nebo čtyř spárovaných grafických karet.

Vizuální funkce

Kromě čistě hardwarových specifikací se různé generace a modely GPU mohou lišit v sadě funkcí. Například se často říká, že karty generace ATi Radeon X800 XT jsou kompatibilní se Shader Model 2.0b (SM), zatímco nVidia GeForce 6800 Ultra je kompatibilní s SM 3.0, přestože jejich hardwarové specifikace jsou si navzájem blízké (16 potrubí). Mnoho spotřebitelů se proto rozhoduje pro jedno nebo druhé řešení, aniž by věděli, co tento rozdíl znamená.

Verze Microsoft DirectX a Shader Model

Tato jména se nejčastěji používají ve sporech, ale jen málo lidí ví, co ve skutečnosti znamenají. Abychom porozuměli, začněme historií grafických API. DirectX a OpenGL jsou grafická rozhraní API nebo rozhraní pro programování aplikací, což jsou standardy otevřeného kódu dostupné každému.

Před příchodem grafických API používal každý výrobce GPU svůj vlastní mechanismus pro komunikaci s hrami. Vývojáři museli napsat samostatný kód pro každý GPU, který chtěli podporovat. Velmi nákladný a neefektivní přístup. K vyřešení tohoto problému byla vyvinuta API pro 3D grafiku, aby vývojáři mohli psát kód pro konkrétní API, a ne pro konkrétní grafickou kartu. Poté padly problémy s kompatibilitou na bedra výrobců grafických karet, kteří museli zajistit, aby ovladače byly kompatibilní s API.

Jedinou komplikací je, že dnes existují dvě různá API, a to Microsoft DirectX a OpenGL, kde GL znamená Graphics Library. Protože je dnes rozhraní DirectX API ve hrách populárnější, zaměříme se na něj. A tento standard ovlivnil vývoj her silněji.

DirectX je výtvor společnosti Microsoft. DirectX ve skutečnosti obsahuje několik API, z nichž pouze jedno se používá pro 3D grafiku. DirectX obsahuje API pro zvuk, hudbu, vstupní zařízení a další. Rozhraní Direct3D API je zodpovědné za 3D grafiku v DirectX. Když mluví o grafických kartách, myslí to vážně, proto jsou v tomto ohledu koncepce DirectX a Direct3D zaměnitelné.

DirectX je pravidelně aktualizován, jak postupuje grafická technologie a vývojáři her zavádějí nové způsoby programování her. Jak popularita DirectX stoupala, začali výrobci GPU upravovat nová vydání produktů tak, aby odpovídala možnostem DirectX. Z tohoto důvodu jsou grafické karty často vázány na hardwarovou podporu pro jednu nebo jinou generaci DirectX (DirectX 8, 9.0 nebo 9.0c).

Aby se věci zkomplikovaly, mohou se části rozhraní Direct3D API v průběhu času měnit, aniž by se měnily generace DirectX. Specifikace DirectX 9.0 například specifikuje podporu Pixel Shader 2.0. Aktualizace DirectX 9.0c ale obsahuje Pixel Shader 3.0. Přestože jsou karty klasifikovány jako DirectX 9, mohou podporovat různé sady funkcí. Například Radeon 9700 podporuje Shader Model 2.0 a Radeon X1800 podporuje Shader Model 3.0, ačkoli obě karty lze přičíst generaci DirectX 9.

Pamatujte, že při vytváření nových her vývojáři berou v úvahu majitele starých strojů a grafických karet, protože pokud budete tento segment uživatelů ignorovat, úroveň prodeje bude nižší. Z tohoto důvodu je ve hrách vloženo více cest kódu. Hra třídy DirectX 9 má pravděpodobně cestu DirectX 8 pro kompatibilitu a dokonce i cestu DirectX 7. Obvykle pokud zvolíte starou cestu, pak ve hře zmizí některé virtuální efekty, které jsou na nových grafických kartách. Ale alespoň můžete hrát i na starém hardwaru.

Mnoho nových her vyžaduje instalaci nejnovější verze DirectX, i když je grafická karta z předchozí generace. To znamená, že nová hra, která bude používat cestu DirectX 8, stále vyžaduje instalaci nejnovější verze DirectX 9 pro grafickou kartu DirectX 8.

Jaké jsou rozdíly mezi různými verzemi rozhraní Direct3D API v DirectX? Dřívější verze DirectX - 3, 5, 6 a 7 - byly z hlediska rozhraní Direct3D API relativně jednoduché. Vývojáři si mohli vybrat vizuální efekty ze seznamu a poté vyzkoušet svůj výkon ve hře. Dalším důležitým krokem v grafickém programování byl DirectX 8. Představil možnost programovat grafickou kartu pomocí shaderů, takže vývojáři poprvé dostali svobodu programovat efekty tak, jak chtějí. DirectX 8 podporoval Pixel Shader 1.0 až 1.3 a Vertex Shader 1.0. DirectX 8.1, aktualizovaná verze DirectX 8, obdržela Pixel Shader 1.4 a Vertex Shader 1.1.

V DirectX 9 můžete vytvářet ještě složitější shaderové programy. DirectX 9 podporuje Pixel Shader 2.0 a Vertex Shader 2.0. DirectX 9c, aktualizovaná verze DirectX 9, obsahuje specifikaci Pixel Shader 3.0.

DirectX 10, nadcházející verze API, bude doprovázet novou verzi Windows Vista. V systému Windows XP nebudete moci nainstalovat DirectX 10.

HDR osvětlení a OpenEXR HDR

HDR znamená High Dynamic Range, vysoký dynamický rozsah. Hraní s osvětlením HDR může poskytnout mnohem realističtější obraz než hraní bez něj a ne všechny grafické karty podporují osvětlení HDR.

Před příchodem grafických karet DirectX 9 byly GPU vážně omezeny přesností výpočtů osvětlení. Doposud bylo možné osvětlení vypočítat pouze s 256 (8bitovými) interními úrovněmi.

Když byly představeny grafické karty DirectX 9, dokázaly produkovat vysoce věrné osvětlení-celých 24bitových nebo 16,7 milionu úrovní.

S 16,7 miliony úrovní a dalším krokem v grafickém výkonu DirectX 9 / Shader Model 2.0 je nyní možné osvětlení HDR na počítačích. Jedná se o poměrně složitou technologii, kterou musíte sledovat v dynamice. Jednoduše řečeno, HDR osvětlení zvyšuje kontrast (tmavé odstíny vypadají tmavší, světlejší odstíny jasnější) a současně zvyšují množství světelných detailů v tmavých a světlých oblastech. Hra s osvětlením HDR je živější a realističtější než bez něj.

GPU, které splňují nejnovější specifikaci Pixel Shader 3.0, umožňují vyšší 32bitové přesné osvětlení a míchání s plovoucí desetinnou čárkou. Videokarty třídy SM 3.0 tak mohou podporovat speciální metodu osvětlení OpenEXR HDR speciálně navrženou pro filmový průmysl.

Některé hry, které podporují pouze osvětlení HDR pomocí OpenEXR, nebudou fungovat s osvětlením HDR na grafických kartách Shader Model 2.0. Hry, které nespoléhají na metodu OpenEXR, však poběží na jakékoli grafické kartě DirectX 9. Oblivion například používá metodu OpenEXR HDR a umožňuje osvětlení HDR pouze na nejnovějších grafických kartách, které podporují specifikaci Shader Model 3.0. Například nVidia GeForce 6800 nebo ATi Radeon X1800. Hry, které používají 3D engine Half-Life 2, stejný Counter-Strike: Source a nadcházející Half-Life 2: Aftermath, vám umožňují povolit vykreslování HDR na starších grafických kartách DirectX 9, které podporují pouze Pixel Shader 2.0. Mezi příklady patří řada GeForce 5 nebo ATi Radeon 9500.

Nakonec mějte na paměti, že všechny formy vykreslování HDR vyžadují seriózní výpočetní výkon a mohou srazit na kolena i ty nejvýkonnější GPU. Pokud chcete hrát nejnovější hry s osvětlením HDR, pak se bez vysoce výkonné grafiky neobejdete.

Vyhlazování na celou obrazovku

Vyhlazování na celou obrazovku (zkráceně AA) vám umožňuje eliminovat charakteristické „žebříky“ na hranicích polygonů. Je však třeba mít na paměti, že vyhlazování na celou obrazovku spotřebovává mnoho výpočetních prostředků, což vede k poklesu snímkové frekvence.

Vyhlazování je velmi závislé na výkonu grafické paměti, takže vysokorychlostní grafická karta s rychlou pamětí bude schopna vykreslit vyhlazování na celou obrazovku s menším poškozením výkonu než levná grafická karta. Anti-aliasing lze povolit v různých režimech. Například 4x vyhlazení poskytne lepší kvalitu obrazu než 2x vyhlazení, ale bude to velký výkonnostní hit. Pokud 2x vyhlazení zdvojnásobí horizontální a vertikální rozlišení, 4x režim jej zčtyřnásobí.

Filtrování textur

Textury jsou aplikovány na všechny 3D objekty ve hře a čím větší je úhel zobrazené plochy, tím bude textura vypadat zkresleněji. K odstranění tohoto efektu používají GPU filtrování textur.

První filtrační metoda se nazývala bilineární a vytvářela charakteristické pruhy, které nebyly pro oko příliš příjemné. Situace se zlepšila zavedením trilineárního filtrování. Obě možnosti fungují na moderních grafických kartách s malou nebo žádnou ztrátou výkonu.

Nejlepší způsob, jak dnes filtrovat textury, je anizotropní filtrování (AF). Stejně jako vyhlazení na celou obrazovku lze anizotropní filtrování povolit na různých úrovních. Například 8x AF poskytuje filtrování vyšší kvality než 4x AF. Stejně jako vyhlazování na celou obrazovku vyžaduje anizotropní filtrování určité množství výpočetního výkonu, který se zvyšuje se stoupající úrovní AF.

Textury s vysokým rozlišením

Všechny 3D hry jsou postaveny s ohledem na specifické specifikace a jeden takový požadavek určuje paměť textur, kterou hra bude potřebovat. Všechny potřebné textury se musí během hry vejít do paměti grafické karty, jinak se výkon dramaticky sníží, protože přístup k textuře v RAM dává značné zpoždění, nemluvě o stránkovacím souboru na pevném disku. Pokud tedy vývojář hry počítá se 128 MB video paměti jako minimálním požadavkem, pak by sada aktivních textur neměla nikdy překročit 128 MB.

Moderní hry mají několik sad textur, takže hra poběží hladce na starších grafických kartách s menší video pamětí, stejně jako na novějších kartách s větší video pamětí. Například hra může obsahovat tři sady textur: 128 MB, 256 MB a 512 MB. Existuje jen velmi málo her, které dnes podporují 512 MB grafické paměti, ale stále jsou tím nejobjektivnějším důvodem pro koupi grafické karty s tímto množstvím paměti. Přestože zvýšení paměti má malý nebo žádný vliv na výkon, lepší vizuální kvalitu získáte, pokud hra podporuje příslušnou sadu textur.

Co potřebujete vědět o grafických kartách?

V kontaktu s

Jednotné shaderové jednotky kombinují dva výše uvedené typy jednotek, mohou spouštět vertexové i pixelové programy (stejně jako geometrické, které se objevily v DirectX 10). Sjednocení shaderových jednotek znamená, že kód různých shaderových programů (vertexových, pixelových a geometrických) je univerzální a odpovídající unifikované procesory mohou spustit jakýkoli z výše uvedených programů. V nových architekturách se tedy počet jednotek pixelů, vrcholů a geometrických shaderů sloučí do jednoho čísla - počtu univerzálních procesorů.

Texturovací jednotky (tmu)

Tyto bloky fungují ve spojení s procesory shaderů všech uvedených typů, slouží k výběru a filtrování dat textur potřebných k sestavení scény. Počet jednotek textur ve video čipu určuje výkon textur, rychlost vzorkování z textur. A přestože v poslední době většinu výpočtů provádějí shaderové jednotky, zatížení TMU je stále poměrně vysoké a s přihlédnutím k důrazu některých aplikací na výkon texturových jednotek můžeme říci, že počet TMU a odpovídající vysoký výkon textur je jedním z nejdůležitějších parametrů. video čipy. Tento parametr má zvláštní vliv na rychlost při použití trilineárního a anizotropního filtrování, které vyžadují další výběr textur.

Rastrovací jednotky (lano)

Rastrovací jednotky provádějí operace záznamu pixelů vypočítaných grafickou kartou do vyrovnávacích pamětí a operace jejich míchání (míchání). Jak je uvedeno výše, výkon jednotek ROP ovlivňuje rychlost plnění a to je jedna z hlavních charakteristik grafických karet. A přestože se jeho hodnota v poslední době mírně snížila, stále existují případy, kdy výkon aplikace silně závisí na rychlosti a počtu ROP. To je nejčastěji způsobeno aktivním používáním filtrů následného zpracování a povoleným vyhlazováním při vysokém nastavení obrazu.

Velikost videopaměti

Video čipy používají k ukládání potřebných dat vlastní paměť: textury, vrcholy, vyrovnávací paměti atd. Zdálo by se, že čím více toho bude, tím lépe. Ale ne všechno je tak jednoduché, odhadnout výkon grafické karty podle množství grafické paměti je nejčastější chybou! Nezkušení uživatelé často nadhodnocují hodnotu velikosti paměti a používají ji k porovnávání různých modelů grafických karet. Je to pochopitelné - protože parametr uvedený ve všech zdrojích jako jeden z prvních je dvakrát tak velký, pak by podle nich měla být rychlost řešení dvakrát vyšší. Realita se od tohoto mýtu liší v tom, že růst produktivity roste do určitého objemu a po jeho dosažení se jednoduše zastaví.

Každá aplikace má určité množství videopaměti, které stačí na všechna data, a i když tam dáte 4 GB, nebude mít důvod zrychlovat vykreslování, rychlost bude omezena prováděcími jednotkami. To je důvod, proč téměř ve všech případech bude grafická karta s 320 MB grafické paměti pracovat stejnou rychlostí jako karta s 640 MB (všechny ostatní věci jsou stejné). Existují situace, kdy více paměti vede k viditelnému zvýšení výkonu, jedná se o velmi náročné aplikace při vysokých rozlišeních a při maximálním nastavení. Takové případy jsou však velmi vzácné, proto je samozřejmě třeba vzít v úvahu množství paměti, ale nezapomínáme, že výkon se nad určitou částku jednoduše nezvyšuje, existují důležitější parametry, jako je šířka paměťové sběrnice a jeho pracovní frekvenci.

Počet výpočetních (shaderových) jednotek nebo procesorů

Možná jsou nyní tyto bloky hlavními částmi video čipu. Spouštějí speciální programy známé jako shadery. Navíc, pokud dřívější pixelové shadery prováděly bloky pixelových shaderů a vertexové - vrcholové bloky, pak se na nějakou dobu sjednotily grafické architektury a tyto univerzální výpočetní jednotky se začaly zabývat různými výpočty: vrcholovými, pixelovými, geometrickými a dokonce univerzálními výpočty.

Sjednocená architektura byla poprvé použita ve video čipu herní konzoly Microsoft Xbox 360, tento GPU vyvinula společnost ATI (později zakoupila AMD). A ve video čipech pro osobní počítače se jednotné shader jednotky objevily na desce NVIDIA GeForce 8800. A od té doby jsou všechny nové video čipy založeny na jednotné architektuře, která má univerzální kód pro různé shaderové programy (vertex, pixel, geometric, atd.) a odpovídající unifikované procesory mohou spustit jakýkoli program.

Podle počtu výpočetních jednotek a jejich frekvence lze porovnat matematický výkon různých grafických karet. Většina her je nyní omezena výkonem pixel shaderů, takže počet těchto jednotek je velmi důležitý. Pokud je například jeden model grafické karty založen na GPU s 384 výpočetními procesory a jiný ze stejného řádku má GPU se 192 výpočetními jednotkami, pak druhý se stejnou frekvencí zpracuje jakýkoli typ shaderu. dvakrát pomalejší a obecně bude stejně produktivnější.

Přestože není možné vyvozovat jednoznačné závěry o výkonu pouze na základě počtu samotných výpočetních jednotek, je nutné vzít v úvahu taktovací frekvenci a různou architekturu jednotek různých generací a výrobců čipů. Pouze tyto údaje lze použít k porovnání čipů pouze ve stejné řadě jednoho výrobce: AMD nebo NVIDIA. V ostatních případech je třeba věnovat pozornost testům výkonu ve hrách nebo aplikacích, které vás zajímají.

Texturové mapovací jednotky (TMU)

Tyto jednotky GPU pracují ve spojení s výpočetními procesory pro výběr a filtrování textur a dalších dat potřebných pro konstrukci scény a obecné použití. Počet jednotek textur ve video čipu určuje výkon textur - tedy rychlost načítání textů z textur.

Přestože byl v poslední době kladen větší důraz na matematické výpočty a některé textury jsou nahrazeny procedurálními, zatížení TMU je stále poměrně vysoké, protože kromě hlavních textur je třeba provádět výběr z normálních a výtlakových map, jako stejně jako vyrovnávací paměti vykreslování mimo obrazovku.

Když vezmeme v úvahu důraz mnoha her, včetně výkonu jednotek texturování, můžeme říci, že počet TMU a odpovídající vysoký výkon textur jsou také jedním z nejdůležitějších parametrů pro video čipy. Tento parametr má zvláštní vliv na rychlost vykreslování obrazu při použití anizotropního filtrování, které vyžaduje další výběr textur, stejně jako u složitých algoritmů měkkých stínů a nových algoritmů, jako je například okolní okluze prostoru obrazovky.

Bloky Rasterization Operations (ROP)

Rastrovací jednotky provádějí operace záznamu pixelů vypočítaných grafickou kartou do vyrovnávacích pamětí a operace jejich míchání (míchání). Jak jsme si poznamenali výše, výkon jednotek ROP ovlivňuje rychlost plnění a to je jedna z hlavních charakteristik grafických karet všech dob. A ačkoli se v poslední době jeho hodnota také mírně snížila, stále existují případy, kdy výkon aplikace závisí na rychlosti a počtu ROP. Je to nejčastěji kvůli aktivnímu používání filtrů postprocesingu a povolenému vyhlazování při vysokých nastaveních hry.

Moderní grafické procesory obsahují mnoho funkčních bloků, jejichž počet a charakteristiky určují konečnou rychlost vykreslování, která ovlivňuje pohodlí hry. Srovnávacím počtem těchto bloků v různých video čipech můžete zhruba odhadnout, jak rychlý je ten či onen GPU. Video čipy mají spoustu vlastností, v této části budeme zvažovat pouze ty nejdůležitější z nich.

Taktovací frekvence video čipu

Pracovní frekvence GPU se obvykle měří v megahertzech, to znamená v milionech hodinových cyklů za sekundu. Tato charakteristika přímo ovlivňuje výkon video čipu - čím vyšší je, tím více práce může GPU vykonat za jednotku času, zpracovat více vrcholů a pixelů. Příklad ze skutečného života: frekvence video čipu nainstalovaného na Radeonu HD 6670 je 840 MHz a přesně stejný čip v Radeonu HD 6570 běží na 650 MHz. V souladu s tím se budou lišit všechny hlavní výkonnostní charakteristiky. Ale nejen provozní frekvence čipu určuje výkon, jeho rychlost je silně ovlivněna samotnou grafickou architekturou: zařízením a počtem prováděcích jednotek, jejich charakteristikami atd.

V některých případech se hodinová rychlost jednotlivých bloků GPU liší od hodinové rychlosti zbytku čipu. To znamená, že různé části GPU pracují na různých frekvencích, a to se děje za účelem zvýšení účinnosti, protože některé jednotky jsou schopné pracovat na vyšších frekvencích, zatímco jiné ne. Takovými GPU je vybavena většina grafických karet NVIDIA GeForce. Z nedávných příkladů uvedeme video čip v modelu GTX 580, z nichž většina pracuje na frekvenci 772 MHz, a univerzální výpočetní jednotky čipu mají dvojnásobnou frekvenci - 1544 MHz.

Rychlost plnění (rychlost plnění)

Rychlost plnění ukazuje, jak rychle je video čip schopen vykreslovat pixely. Existují dva typy výplně: rychlost vyplňování pixelů a rychlost texelu. Rychlost výplně obrazových bodů udává rychlost, jakou jsou pixely kresleny na obrazovku, a závisí na pracovní frekvenci a počtu ROP (bloky rastrování a míchání) a textura je rychlost načítání dat textury, která závisí na frekvenci operace a počet jednotek textur.

Například maximální rychlost vyplňování pixelů GeForce GTX 560 Ti je 822 (takt hodin) × 32 (jednotky ROP) = 26304 megapixelů za sekundu a rychlost vyplňování textur je 822 × 64 (počet jednotek textury) = 52608 megatexelů / s. Zjednodušeně je situace následující - čím větší je první číslo, tím rychleji může grafická karta vykreslit hotové pixely a čím větší je druhé, tím rychleji jsou vzorkována data textur.

Přestože v poslední době význam „čisté“ rychlosti plnění znatelně klesá, čímž ustupuje rychlosti výpočtů, jsou tyto parametry stále velmi důležité, zejména pro hry s jednoduchou geometrií a relativně jednoduchými pixelovými a vrcholovými výpočty. Oba parametry tedy zůstávají pro moderní hry důležité, ale je třeba je vyvážit. Proto je počet jednotek ROP v moderních video čipech obvykle menší než počet jednotek textur.

Počet výpočetních (shaderových) jednotek nebo procesorů

Možná jsou nyní tyto bloky hlavními částmi video čipu. Spouštějí speciální programy známé jako shadery. Navíc, pokud dřívější pixelové shadery prováděly bloky pixelových shaderů a vertex shadery - vrcholové bloky, pak se nějakou dobu grafické architektury sjednotily a tyto univerzální výpočetní jednotky se začaly zabývat různými výpočty: vrcholovými, pixelovými, geometrickými a dokonce univerzálními výpočty.

Sjednocená architektura byla poprvé použita ve video čipu herní konzoly Microsoft Xbox 360, tento GPU vyvinula společnost ATI (později zakoupila AMD). A ve video čipech pro osobní počítače se jednotné shader jednotky objevily na desce NVIDIA GeForce 8800. A od té doby jsou všechny nové video čipy založeny na jednotné architektuře, která má univerzální kód pro různé shaderové programy (vertex, pixel, geometric, atd.) a odpovídající unifikované procesory mohou spustit jakýkoli program.

Podle počtu výpočetních jednotek a jejich frekvence lze porovnat matematický výkon různých grafických karet. Většina her je nyní omezena výkonem pixel shaderů, takže počet těchto jednotek je velmi důležitý. Pokud je například jeden model grafické karty založen na GPU s 384 výpočetními procesory a jiný ze stejného řádku má GPU se 192 výpočetními jednotkami, pak druhý se stejnou frekvencí zpracuje jakýkoli typ shaderu. dvakrát pomalejší a obecně bude stejně produktivnější.

Přestože není možné vyvozovat jednoznačné závěry o výkonu pouze na základě počtu samotných výpočetních jednotek, je nutné vzít v úvahu taktovací frekvenci a různou architekturu jednotek různých generací a výrobců čipů. Pouze tyto údaje lze použít k porovnání čipů pouze ve stejné řadě jednoho výrobce: AMD nebo NVIDIA. V ostatních případech je třeba věnovat pozornost testům výkonu ve hrách nebo aplikacích, které vás zajímají.

Texturové mapovací jednotky (TMU)

Tyto jednotky GPU pracují ve spojení s výpočetními procesory pro výběr a filtrování textur a dalších dat potřebných pro konstrukci scény a obecné použití. Počet jednotek textur ve video čipu určuje výkon textur - tedy rychlost načítání textů z textur.

Přestože byl v poslední době kladen větší důraz na matematické výpočty a některé textury jsou nahrazeny procedurálními, zatížení TMU je stále poměrně vysoké, protože kromě hlavních textur je třeba provádět výběr z normálních a výtlakových map, jako stejně jako vyrovnávací paměti vykreslování mimo obrazovku.

Když vezmeme v úvahu důraz mnoha her, včetně výkonu jednotek texturování, můžeme říci, že počet TMU a odpovídající vysoký výkon textur jsou také jedním z nejdůležitějších parametrů pro video čipy. Tento parametr má zvláštní vliv na rychlost vykreslování obrazu při použití anizotropního filtrování, které vyžaduje další výběr textur, stejně jako u složitých algoritmů měkkých stínů a nových algoritmů, jako je například okolní okluze prostoru obrazovky.

Bloky Rasterization Operations (ROP)

Rastrovací jednotky provádějí operace záznamu pixelů vypočítaných grafickou kartou do vyrovnávacích pamětí a operace jejich míchání (míchání). Jak jsme si poznamenali výše, výkon jednotek ROP ovlivňuje rychlost plnění a to je jedna z hlavních charakteristik grafických karet všech dob. A ačkoli se v poslední době jeho hodnota také mírně snížila, stále existují případy, kdy výkon aplikace závisí na rychlosti a počtu ROP. Je to nejčastěji kvůli aktivnímu používání filtrů postprocesingu a povolenému vyhlazování při vysokých nastaveních hry.

Ještě jednou si všimněte, že moderní video čipy nelze hodnotit pouze počtem různých bloků a jejich frekvencí. Každá řada GPU používá novou architekturu, ve které se prováděcí jednotky velmi liší od starých a poměr počtu různých jednotek se může lišit. Jednotky AMD ROP v některých řešeních tedy mohou vykonávat více práce za hodiny než jednotky NVIDIA a naopak. Totéž platí pro schopnosti texturových jednotek TMU - liší se v různých generacích GPU od různých výrobců, a to je třeba při porovnávání zohlednit.

Geometrické bloky

Až do nedávné doby nebyl počet jednotek pro zpracování geometrie nijak zvlášť důležitý. Na většinu úkolů stačil jeden blok GPU, protože geometrie ve hrách byla celkem jednoduchá a hlavním zaměřením výkonu byly matematické výpočty. Důležitost paralelního zpracování geometrie a počtu odpovídajících bloků dramaticky vzrostla s příchodem podpory teselace geometrie v DirectX 11. NVIDIA byla první, která paralelizovala zpracování geometrických dat, když se v jejích čipech GF1xx objevilo několik odpovídajících bloků. Poté podobné řešení vydala společnost AMD (pouze v špičkových řešeních řady Radeon HD 6700 na základě čipů Cayman).

V rámci tohoto materiálu se nebudeme zabývat podrobnostmi, lze je přečíst v základních materiálech našich stránek věnovaných grafickým procesorům kompatibilním s DirectX 11. Pro nás je v tomto případě důležité, že počet jednotek pro zpracování geometrie výrazně ovlivňuje celkový výkon v nejnovějších hrách, které používají mozaikování, jako je Metro 2033, HAWX 2 a Crysis 2 (s nejnovějšími patche). A při výběru moderní herní grafické karty je velmi důležité věnovat pozornost geometrickému výkonu.

Velikost videopaměti

Video čipy používají k ukládání potřebných dat vlastní paměť: textury, vrcholy, data vyrovnávací paměti atd. Zdálo by se, že čím více jich bude, tím lépe. Ale ne všechno je tak jednoduché, odhadnout výkon grafické karty podle množství grafické paměti je nejčastější chybou! Nezkušení uživatelé často přeceňují hodnotu grafické paměti a stále ji používají k porovnávání různých modelů grafických karet. Je to pochopitelné - tento parametr je uveden v seznamech charakteristik hotových systémů jeden z prvních a na polích grafických karet je napsán velkým písmem. Nezkušenému kupujícímu se proto zdá, že protože paměť je dvakrát tak velká, pak by rychlost takového řešení měla být dvakrát vyšší. Realita se od tohoto mýtu liší v tom, že paměť může být různých typů a charakteristik a růst produktivity roste jen do určité výše a po jejím dosažení se jednoduše zastaví.

Takže v každé hře a s určitým nastavením a herními scénami existuje určité množství videopaměti, které stačí na všechna data. A přestože tam dáte 4 GB videopaměti, nebude to mít důvod zrychlovat vykreslování, rychlost bude omezena prováděcími jednotkami, o nichž byla řeč výše, a paměti bude prostě dost. To je důvod, proč v mnoha případech grafická karta s 1,5 GB grafické paměti pracuje stejnou rychlostí jako karta se 3 GB (všechny ostatní věci jsou stejné).

Existují situace, kdy více paměti vede k viditelnému zvýšení výkonu - jedná se o velmi náročné hry, zejména při ultravysokých rozlišeních a při nastavení maximální kvality. Ale takové případy se nevyskytují vždy a je třeba vzít v úvahu množství paměti, nezapomínat, že výkon se nad určitou částku jednoduše nezvýší. Paměťové čipy mají také důležitější parametry, jako je šířka paměťové sběrnice a její pracovní frekvence. Toto téma je tak obsáhlé, že se výběrem videopaměti zabýváme podrobněji v šesté části našeho materiálu.

Šířka paměťové sběrnice

Šířka paměťové sběrnice je nejdůležitější charakteristikou ovlivňující šířku pásma paměti (šířka pásma paměti). Širší šířka umožňuje přenos více informací z grafické paměti do GPU a zpět za jednotku času, což má ve většině případů pozitivní vliv na výkon. Teoreticky může 256bitová sběrnice přenášet dvakrát tolik dat za hodiny než 128bitová sběrnice. V praxi je rozdíl v rychlosti vykreslování, ačkoliv nedosahuje dvakrát, v mnoha případech velmi blízký tomu s důrazem na šířku pásma video paměti.

Moderní herní grafické karty používají různé šířky sběrnice: od 64 do 384 bitů (dříve existovaly čipy s 512bitovou sběrnicí), v závislosti na cenovém rozpětí a době vydání konkrétního modelu GPU. Pro nejlevnější grafické karty nižší úrovně se používá 64 a méně často 128 bitů, pro střední úroveň od 128 do 256 bitů, ale grafické karty z vyšší cenové kategorie používají sběrnice široké 256 až 384 bitů. Šířka sběrnice již nemůže růst čistě kvůli fyzickým omezením - velikost matrice GPU nestačí k rozložení více než 512bitové sběrnice, a to je příliš drahé. Šířka pásma paměti se proto nyní zvyšuje používáním nových typů paměti (viz níže).

Frekvence video paměti

Dalším parametrem, který ovlivňuje šířku pásma paměti, je jeho taktovací frekvence. A zvýšení šířky pásma paměti často přímo ovlivňuje výkon grafické karty ve 3D aplikacích. Frekvence paměťové sběrnice na moderních grafických kartách se pohybuje od 533 (1066, zdvojnásobení) MHz do 1375 (5500, čtyřnásobně) MHz, to znamená, že se může lišit více než pětkrát! A protože šířka pásma paměti závisí jak na frekvenci paměti, tak na šířce její sběrnice, bude mít paměť s 256bitovou sběrnicí pracující na 800 (3200) MHz větší šířku pásma ve srovnání s pamětí pracující na 1000 (4000) MHz s 128bitová sběrnice.

Zvláštní pozornost by měla být věnována parametrům šířky paměťové sběrnice, jejímu typu a pracovní frekvenci při nákupu relativně levných grafických karet, z nichž mnohé jsou vybaveny pouze 128bitovým nebo dokonce 64bitovým rozhraním, což má extrémně negativní vliv na jejich výkon. Obecně nedoporučujeme pro herní PC kupovat grafickou kartu pomocí 64bitové sběrnice video paměti vůbec. Doporučuje se upřednostnit alespoň průměrnou úroveň s minimálně 128 nebo 192bitovou sběrnicí.

Typy paměti

Na moderní grafické karty je nainstalováno několik různých typů paměti najednou. Stará paměť SDR s jedinou přenosovou rychlostí není nikde k nalezení, ale moderní typy pamětí DDR a GDDR mají výrazně odlišné vlastnosti. Různé typy DDR a GDDR vám umožňují přenášet dvakrát nebo čtyřikrát více dat se stejnou hodinovou frekvencí za jednotku času, a proto je pracovní frekvence často označována jako dvojnásobná nebo čtyřnásobná, vynásobená 2 nebo 4. Například pokud je frekvence je indikováno pro paměti DDR 1400 MHz, pak tato paměť pracuje na fyzické frekvenci 700 MHz, ale označuje takzvanou „efektivní“ frekvenci, tj. tu, na které musí paměť SDR pracovat, aby poskytovala stejnou šířku pásma . To samé je u GDDR5, ale frekvence je zde dokonce čtyřnásobná.

Hlavní výhodou nových typů paměti je schopnost pracovat s vysokými hodinovými rychlostmi a podle toho zvýšit šířku pásma ve srovnání s předchozími technologiemi. Toho je dosaženo díky zvýšené latenci, které však nejsou pro grafické karty tak důležité. První deskou, která používala paměť DDR2, byla NVIDIA GeForce FX 5800 Ultra. Od té doby technologie grafické paměti výrazně pokročily, byl vyvinut standard GDDR3, který se blíží specifikacím DDR2, s některými změnami specificky pro grafické karty.

GDDR3 je paměť speciálně navržená pro grafické karty, se stejnými technologiemi jako DDR2, ale se zlepšenými charakteristikami spotřeby a odvodu tepla, což umožnilo vytvářet mikroobvody pracující na vyšších taktovacích frekvencích. Navzdory skutečnosti, že standard vyvinula společnost ATI, byla druhá modifikace NVIDIA GeForce FX 5700 Ultra první grafickou kartou, která ji používala, a další byla GeForce 6800 Ultra.

GDDR4 je dalším vývojem „grafické“ paměti, která je až dvakrát rychlejší než GDDR3. Hlavní rozdíly mezi GDDR4 a GDDR3, významné pro uživatele, jsou opět zvýšené pracovní frekvence a snížená spotřeba energie. Technicky se paměť GDDR4 příliš neliší od paměti GDDR3, je to další vývoj stejných myšlenek. První grafické karty s čipy GDDR4 na palubě byly ATI Radeon X1950 XTX, zatímco NVIDIA nevydávala produkty založené na tomto typu paměti vůbec. Výhodou nových paměťových čipů oproti GDDR3 je, že spotřeba energie modulů může být zhruba o třetinu nižší. Toho je dosaženo za cenu nižšího napětí pro GDDR4.

GDDR4 však není široce používán ani v řešeních AMD. Počínaje řadou GPU RV7x0 podporují řadiče paměti grafické karty nový typ paměti GDDR5 pracující na efektivní čtyřnásobné frekvenci až 5,5 GHz a vyšší (teoreticky možné frekvence až 7 GHz), což dává šířku pásma až 176 GB / s pomocí 256bitového rozhraní. Zatímco paměť GDDR3 / GDDR4 musela ke zvýšení šířky pásma paměti použít 512bitovou sběrnici, přechod na GDDR5 umožnil zdvojnásobit výkon s menší velikostí matric a nižší spotřebou energie.

Nejmodernějšími typy video paměti jsou GDDR3 a GDDR5, v některých detailech se liší od DDR a funguje také s dvojitým / čtyřnásobným přenosem dat. Tyto typy paměti používají některé speciální technologie ke zvýšení provozní frekvence. Paměť GDDR2 tedy obvykle pracuje na vyšších frekvencích než DDR, GDDR3 - na ještě vyšších a GDDR5 v tuto chvíli poskytuje maximální frekvenci a šířku pásma. Ale levné modely jsou stále vybaveny „negrafickou“ pamětí DDR3 s mnohem nižší frekvencí, takže je třeba pečlivě vybrat grafickou kartu.

Na našem fóru desítky lidí každý den žádají o radu ohledně jejich vlastní modernizace, ve které jim ochotně pomáháme. Každý den, „vyhodnocování sestavy“ a kontroly kompatibility komponent vybraných našimi zákazníky, jsme si začali všímat, že uživatelé věnují pozornost hlavně dalším, bezpochyby důležitým součástem. A jen zřídka si někdo pamatuje, že při aktualizaci počítače je nutné aktualizovat stejně důležitý detail -. A dnes vám řekneme a ukážeme, proč byste na to neměli zapomenout.

"... Chci upgradovat svůj počítač, všechno letělo, koupil jsem procento i7-3970X a matku ASRock X79 Extreme6, plus RADEON HD 7990 6GB vidyahu." Co jiného nan ???? 777 "
- takto začíná zhruba polovina všech zpráv souvisejících s aktualizací stacionárního počítače. Na základě vlastního nebo rodinného rozpočtu se uživatelé snaží vybrat nejvíce, nejvíce a nejrychlejší a nejkrásnější paměťové moduly. Přitom naivně věřit, že si jejich staré 450W poradí při přetaktování současně s nenasytnou grafickou kartou i „horkým“ procesorem.

Z naší strany jsme již psali o důležitosti napájecího zdroje více než jednou - ale přiznáváme, že to pravděpodobně nebylo dost jasné. Dnes jsme se proto opravili a připravili jsme pro vás poznámku o tom, co se stane, když na upgrade počítače zapomenete - s obrázky a podrobnými popisy.

Rozhodli jsme se tedy aktualizovat konfiguraci ...


Pro náš experiment jsme se rozhodli vzít úplně nový průměrný počítač a upgradovat ho na úroveň „herního automatu“. Konfiguraci nebudete muset moc měnit - bude stačit změnit paměť a grafickou kartu, abychom měli možnost hrát více či méně moderní hry se slušným nastavením detailů. Počáteční konfigurace našeho počítače je následující:

Zdroj napájení: ATX 12V 400W

Je jasné, že u her je taková konfigurace, mírně řečeno, spíše slabá. Je tedy na čase něco změnit! Začneme tímtéž, čím většina lidí toužících po „upgradu“ začne - p. Základní desku měnit nebudeme - pokud jsme s ní spokojení.

Protože jsme se rozhodli nedotýkat se základní desky, vybereme zásuvku kompatibilní s FM2 (naštěstí je na stránce NIKS na stránce s popisem základní desky speciální tlačítko). Nebuďme chamtiví - vezměme si cenově dostupný, ale rychlý a výkonný procesor s frekvencí 4,1 GHz (až 4,4 GHz v režimu Turbo CORE) a odemčený multiplikátor - také rádi „přetaktujeme“, nic lidského nám není cizí. Zde jsou specifikace pro námi zvolený procesor:

Specifikace
Frekvence sběrnice CPU 5000 MHz Ztráta výkonu 100 wattů Frekvence procesoru 4,1 GHz nebo až 4,4 GHz v režimu Turbo CORE Jádro Richland Mezipaměť L1 96 kB x2 Mezipaměť L2 2048 KB x2, taktováno na frekvenci procesoru 64bitová podpora Ano Počet jader 4 Násobení 41, odemčený multiplikátor Video jádro procesoru AMD Radeon HD 8670D @ 844 MHz; Podpora Shader Model 5 Max RAM 64 GB Max. počet připojených monitorů 3 přímo připojené nebo až 4 monitory pomocí rozbočovačů DisplayPort

Jedna 4GB lišta není naše volba. Za prvé chceme 16 GB a za druhé musíme použít dvoukanálový režim provozu, pro který do počítače nainstalujeme dva paměťové moduly s kapacitou 8 GB každý. Vysoká propustnost, nedostatek radiátorů a slušná cena z nich činí pro nás tu „nejchutnější“ volbu. Kromě toho si z webových stránek AMD můžete stáhnout program Radeon RAMDisk, který nám umožní vytvořit superrychlý virtuální disk až do velikosti 6 GB zdarma, zcela zdarma - a každý miluje užitečné užitečné věci zdarma.


Specifikace
Paměť 8 GB
Počet modulů 2
Paměťový standard PC3-10600 (DDR3 1333 MHz)
Funkční frekvence až 1333 MHz
Časování 9-9-9-24
Napájecí napětí 1,5V
Šířka pásma 10667 Mb / s

Vložené video můžete pohodlně přehrávat pouze jako „sapper“. Proto jsme za účelem upgradu počítače na herní úroveň vybrali moderní a výkonný, ale ne nejdražší.


Stala se 2 GB video paměti, podporou DirectX 11 a OpenGL 4.x. a vynikající chladicí systém Twin Frozr IV. Jeho výkon by měl být více než dost, abychom si mohli užít nejnovější díly nejpopulárnějších herních franšíz jako Tomb Raider, Crysis, Hitman a Far Cry. Vlastnosti zvoleného jsou následující:


Specifikace
GPU GeForce GTX 770
Frekvence GPU 1098 MHz nebo až 1150 MHz v režimu GPU Boost
Počet shaderových procesorů 1536
Video paměť 2 GB
Typ videopaměti GDDR5
Šířka sběrnice video paměti 256 bitů
Frekvence video paměti 1753 MHz (7,010 GHz QDR)
Počet pixel pipelines 128, 32 jednotek vzorkování textur
Rozhraní PCI Express 3.0 16x (kompatibilní s PCI Express 2.x / 1.x) s propojením karty SLI.
Porty Včetně adaptéru DisplayPort, DVI-D, DVI-I, HDMI, D-Sub
Chlazení grafické karty Aktivní (chladič + 2 ventilátory Twin Frozr IV na přední straně desky)
Napájecí konektor 8 pinů + 8 pinů
Podpora API DirectX 11 a OpenGL 4.x
Délka grafické karty (měřeno v NIKS) 263 mm
Podporuje obecné použití GPU DirectCompute 11, NVIDIA PhysX, CUDA, CUDA C ++, OpenCL 1.0
Maximální spotřeba energie FurMark + WinRar 255 wattů
Hodnocení výkonu 61.5

Nečekané potíže

Nyní máme vše, co potřebujeme k upgradu našeho počítače. V našem stávajícím případě nainstalujeme nové komponenty.


Spouštíme jej - a nefunguje. A proč? Ale protože levné napájecí zdroje nejsou fyzicky schopné spustit počítač ani v nejmenším. Faktem je, že v našem případě jsou pro napájení zapotřebí dva 8pinové konektory a napájecí zdroj má v základně pouze jeden 6pinový napájecí konektor grafické karty. Vzhledem k tomu, že mnohem více potřebuje ještě více konektorů než v našem případě, je jasné, že je třeba změnit napájecí zdroj.

Ale to není tak špatné. Jen si pomyslete, neexistuje žádný napájecí konektor! V naší testovací laboratoři jsme našli celkem vzácné adaptéry od 6kolíkových po 8pinové a od molexových po 6pinové. Jako tyto:


Stojí za zmínku, že i na levných moderních napájecích zdrojích se konektory Molex s každým novým vydáním zmenšují - takže můžeme říci, že jsme měli štěstí.

Na první pohled je vše v pořádku a některými vychytávkami jsme mohli aktualizovat systémovou jednotku na „herní“ konfiguraci. Nyní simulujeme zátěž spuštěním Furmark a 7Zip v Xtreme Burning na našem novém herním automatu současně. Mohli bychom spustit počítač - to je dobře. Systém také přežil start Furmark. Spustíme archivátor - a co to je? Počítač se vypnul a potěšil nás řevem ventilátoru zapnutým na maximum. „Skromný“ standard 400W selhal, bez ohledu na to, jak moc se snažil, nakrmit grafickou kartu a výkonný procesor. A kvůli průměrnému chladicímu systému se náš velmi zahřál a ani maximální rychlost ventilátoru mu nedovolila dodat alespoň deklarovaných 400W.

Existuje východ!

Pluli. Koupili jsme drahé komponenty pro sestavení herního počítače, ale ukázalo se, že na něm nelze hrát. Je to ostuda. Závěr je každému jasný: starý není vhodný pro náš herní počítač a je naléhavě nutné jej vyměnit za nový. Ale který?

Pro náš upgradovaný počítač jsme vybrali podle čtyř hlavních kritérií:

Tou první je samozřejmě síla. Raději jsme vybírali s rezervou - rádi bychom také přetaktovali procesor a získali body v syntetických testech. S přihlédnutím ke všemu, co bychom mohli v budoucnu potřebovat, jsme se rozhodli zvolit výkon minimálně 800W.

Druhým kritériem je spolehlivost... Opravdu chceme, aby ten, který byl vzat „s rezervou“, přežil další generaci grafických karet a procesorů, nespálil se a zároveň nespálil drahé součásti (spolu s testovacím místem). Proto jsou naší volbou pouze japonské kondenzátory, pouze ochrana proti zkratu a spolehlivá ochrana proti přetížení pro jakýkoli z výstupů.

Třetím bodem našich požadavků je pohodlí a funkčnost.... Nejprve potřebujeme - počítač bude pracovat často a zejména hlučné napájecí zdroje ve spojení s grafickou kartou a chladičem procesoru poblázní každého uživatele. Smysl pro krásu nám navíc není cizí, takže nový napájecí zdroj pro náš herní počítač by měl být modulární a měl by mít odpojitelné kabely a konektory. Aby nebylo nic nadbytečného.

A v neposlední řadě je kritériem energetická účinnost... Ano, záleží nám na životním prostředí a na našich účtech za elektřinu. Proto zvolený napájecí zdroj musí splňovat minimálně 80+ Bronze standard energetické účinnosti.

Po porovnání a analýze všech požadavků jsme vybrali z několika uchazečů, kteří plně uspokojili všechny naše požadavky. Stal se výkonem 850W. Všimněte si, že v řadě parametrů dokonce předčil naše požadavky. Podívejme se na jeho specifikaci:

Specifikace napájecího zdroje
Typ zařízení Napájení s aktivním modulem PFC (Power Factor Correction).
Vlastnosti Smyčka, japonské kondenzátory, ochrana proti zkratu (SCP), ochrana proti přepětí (OVP), ochrana proti přetížení některého z výstupů jednotky samostatně (OCP)
+ 3.3V - 24A, + 5V - 24A, + 12V - 70A, + 5VSB - 3.0A, -12V - 0.5A
Odpojitelné napájecí kabely Ano
Účinnost 90%, 80 PLUS certifikováno zlatem
Napájecí jednotka 850 wattů
Napájecí konektor základní desky 24 + 8 + 8 pinů, 24 + 8 + 4 pinů, 24 + 8 pinů, 24 + 4 pinů, 20 + 4 pinů (skládací 24pinový konektor. 4pinový lze v případě potřeby odpojit, skládací 8pinový konektor)
Napájecí konektor grafické karty 6x 6/8 pinových konektorů (skládací 8pinový konektor-2 piny odpojitelné)
MTBF 100 tisíc hodin
Chlazení napájecího zdroje 1 ventilátor: 140 x 140 mm (na spodní stěně) Pasivní chladicí systém až do 50% zátěže.
Regulace otáček ventilátoru Z teplotního čidla. Změna rychlosti ventilátoru v závislosti na teplotě uvnitř napájecího zdroje. Ruční výběr provozního režimu ventilátoru. V normálním režimu se ventilátor otáčí nepřetržitě a v tichém režimu se při nízkém zatížení zcela zastaví.


, jeden z nejlepších za ty peníze. Pojďme to nainstalovat do našeho korpusu:


Pak se stalo něco, co nás trochu zmátlo. Zdálo by se, že vše bylo sestaveno správně, vše bylo připojeno, vše fungovalo - ale napájení je tiché! To znamená obecně: ventilátor stále stojí a systém je správně spuštěn a funguje. Faktem je, že při zatížení až 50%pracuje napájecí zdroj v takzvaném tichém režimu - bez roztočení chladicího ventilátoru. Ventilátor bude hučet pouze při velkém zatížení - souběžné spouštění archivátorů a Furmarku vedlo k roztočení chladiče.


Napájecí zdroj má až šest 8kolíkových 6kolíkových napájecích konektorů grafické karty, z nichž každý je skládací 8kolíkový konektor, ze kterého v případě potřeby můžete uvolnit 2 kontakty. Je tedy schopen napájet jakoukoli grafickou kartu bez zbytečných potíží a obtíží. A dokonce ani jeden.


Modulární systém napájecího zdroje umožňuje odpojit nepotřebné a nepotřebné napájecí kabely, což zlepšuje proudění vzduchu v pouzdře, stabilitu systému a samozřejmě esteticky zlepšuje vzhled vnitřního prostoru, což nám umožňuje bezpečně doporučit modelářům a fanoušci pouzder s okny.
kupte si spolehlivý a výkonný napájecí zdroj. V naší recenzi se to stalo. - a jak vidíte, není to náhoda. Zakoupením jednoho z NICS si můžete být jisti, že všechny součásti vašeho vysoce výkonného systému budou vybaveny dostatečným a nepřerušovaným výkonem, a to i při extrémním přetaktování.


Napájení navíc vydrží několik let dopředu - je lepší s rezervou, v případě, že se v budoucnu chystáte aktualizovat systém pomocí komponent na vysoké úrovni.