strana 88
Autor: Michal Rybka
ATI Radeon versus GeForce 2 GTS versus Voodoo 5 5500
Prototyp, vládce a dinosaurus
Sbohem, 3dfx, a pozdravuj v pekle – skoro to by se mi chtělo říci poté, co jsem otestoval tři nejlepší grafárny, které jsou v současnosti k mání. Tedy – dvě z nich bych označil slovy „grafická karta“ (ATI Radeon a GeForce 2 GTS), protože jako grafické karty doopravdy vypadají, a dvouprocesorové dílo od firmy 3dfx bych s ocelovým klidem pojmenoval spíše „technická kuriozita“. Voodoo 5 totiž mnohem zajímavěji vypadá než funguje... Je to takový malý dinosaurus, kterého je třeba připojit k nezávislému vnitřnímu napájení a který při práci pěkně usrkává šťávu harddiskům a dalším konvenčním zařízením. Tohle monstrum, jehož napěchování do počítače způsobí řadě nadšenců VELKÉ problémy, připomíná svým řešením, rozměry (a zbytečností) Voodoo 2 SLI v jednom – Obsidian. Že Obsidian neznáte? Inu, asi tak za měsíc ho převálcovala nVidia TNT, a to v jaksi kompaktnějším provedení. Nu, stále to ještě není ono fascinující řešení s externím napájecím zdrojem, které má tu výhodu, že pokud ho náhodou nezasunete do záložního zdroje, vybourá vám při výpadku proudu chcíplá grafická karta celý systém, i když máte UPS, neboli záložní zdroj. BRRRRRRR, hnus!
Dosti jízlivého úvodního komentáře, který jsem si prostě nemohl odpustit, sorry.
Nuže, ke strojům.
ATI Radeon
ATI je známá jako výrobce velmi rozšířených grafických čipů, které nikdy nezískaly pověst výkonového krále, ale vždy nabízely ohromující množství funkcí – zvláště pro práci s videem. Politika ATI se zaměřuje do oblasti integrovaných grafických čipů notebooků, levných grafických karet a specializovaných zařízení pro práci s videem. ATI videu prostě věří a předpokládá, že v budoucnosti dojde ke spojení televize, interaktivního vysokorychlostního internetu a počítačových her. Zatím se čipům ATI většina „power-hungry“ hráčů spíše pošklebovala, ale faktem zůstává, že v oblasti návrhu čipu a funkcí pro práci s videem má ATI velmi slušný náskok.
Radeon je ovšem čip, který se rozhodl zaútočit až na samotnou výkonovou špičku dneška – nVidia GeForce 2 GTS – a to nejen po stránce výkonové, ale rovněž funkční. Základem Radeonu je cosi, co má romantický název Charisma engine a co nabízí funkce T&L (Transform&Lighting), podobně jako má GeForce – což naznačuje, že „opravdové“ hry s podporou těchto funkcí už budou brzo na spadnutí a vývojáři začnou mít pozvolna těžkou hlavu s dalšími předělávkami už odložených titulů

Radeon přitom sází na nový design a nové technologie, které nikdo nemá – například technologie s podivným názvem 4-Matrix Skinning dovoluje vytvářet realistické přechody mezi pohybujícími se klouby končetin příšerek. Jejich obličejům naopak pomůže technologie Keyframe Interpolation, která dovoluje vypočítat „mezistavy“ mezi obličejem mračícím se a usmívajícím se – stačí mít vytvořené pouze dva krajní stavy a zbytek zařídí karta sama. (Keyframe Interpolation ovšem může sloužit k dopočtu mezistavů mezi libovolnými rámci, ale u velmi vzdálených stavů by vypadala podivně, hodí se spíš pro „dohlazování“ pohybů – a tím pádem je na vyjádření emocí jak dělaná.)
Podle ATI disponuje T&L jednotka Radeonu schopností zpracovat až 30 milionů trojúhelníků za sekundu, o 5 milionů více, než dovede nominálně zpracovat GeForce 2 GTS. Ve skutečnosti ale není snadné zjistit, zda je jednotka Radeonu výkonnější než jednotka GeForce. Zásadní problémem moderních grafických karet totiž není počet trojúhelníků zpracovaných za sekundu, ale fakt, že paměťová propustnost karty stojí ohromnému výkonu grafických čipů doslova na životodárné žíle. Paměti prostě a jednoduše nestíhají zásobovat procesory grafických karet s dostatečným odpichem a podle všeho je nepůjde jen tak snadno urychlit, alespoň ne levně, a to znamená, že se v levných herních kartách hned tak neobjeví. V důsledcích tak mají moderní grafické karty naprosto neuvěřitelná framerate v nízkých rozlišeních (190 fps, heh, heh, to nikdy nikdo neuvidí, mimo jiné proto, že nestíhá nejen oko, ale ve většině případů i monitor), ale začínají se tvrdě dusit v případě, že je scéna komplexní, anebo když vykreslují ve velkých rozlišeních – pokud jste simulátoroví fanatici, určitě se alespoň na okamžik pozastavíte nad myšlenkou, že byste si měli pořídit 21“ monitor, a v takovém případě to chce akceleraci v rozlišení alespoň 1280 x 1024. Obrázek v tomto rozlišení a v truecoloru (32bitové barvy) má ale už více než pět megabyte, a pokud má být vykreslen třicetkrát za sekundu, proteče mezi čipem a pamětí minimálně 150 MB za sekundu, a to nepočítáme detaily, jako práci se Z-bufferem, texturami apod., apod.
Právě Z-buffer je nejčastěji používanou paměťovou strukturou. Udává, jak „hluboko ve scéně“ je namalovaný daný pixel, a slouží asi k tomu nejdůležitějšímu – výpočtu zákrytů. Pokud při vykreslování akcelerátor zjistí, že už namalovaný pixel je podle údajů Z-bufferu hlouběji od pozorovatele než ten, který bude nakreslen nyní, přepíše původní pixel novým a změní údaj v Z-bufferu. Jednoduché, ale velmi náročné na paměťovou propustnost. Strategií, jak eliminovat náročná čtení a zápisy, je celá řada, např. je možné enkapsulovat (zapouzdřit) paměť pro Z-buffer přímo do čipu nebo vymyslet nějaký efektivní způsob, jak se použití Z-bufferu vyhýbat, seč to jde. Na technologii enkapsulace pracovní paměti pro Z-buffer je založena řada profesionálních čipů a měla by se objevit i v čipu Glaze 3D (pokud se tedy někdy objeví čip Glaze, o čemž osobně začínám mít jisté pochybnosti).
ATI se vydala druhou cestou a vytvořila HyperZ technologii, systém tří nezávislých metod, jak co nejvíc urychlit práci se Z-bufferem. Proč o této pasáži, která zaujme spíše konstruktéry čipů, vlastně mluvím? Má totiž zajímavý důsledek: HyperZ snižuje nároky na paměťovou propustnost a právě to dovoluje Radeonu, aby ve vysokých rozlišeních konkuroval i GeForce 2 GTS!
Radeon na vlastní oči
ATI Radeon jsme dostali zapůjčen na krátkou dobu ve formě předvýrobního (opravdu těsně předvýrobního) prototypu. Díky (nebo spíše běda) tomu jsem se nestihl seznámit se všemi detaily tohoto mazlíčka, ale i tak je mi jasné, že kdo chce počítač používat nejen ke hraní, má o čem přemýšlet. Radeon vás už v prvním okamžiku zaujme nejen běžnou kombinací výstupů monitor – composite – S-VHS, ale také composite VSTUPEM. Composite vstup znamená řadu věcí – pokud si například pořídíte solidní hyperbandové stereovideo, nepotřebujete televizní tuner. (A věřte mi, že vaše osobní video připojené k vašemu osobnímu počítači je věc suprovní a totálně libová. Žádné tahanice s rodinou, sourozenci, díváte se, na co chcete, kdy chcete, a když se na to dívat nemůžete, tak si to naprogramujete a podíváte se později. P-O-H-O-D-A.) O kvalitě a funkcích ovladačů ATI už snad nemá smysl mluvit, v oblasti digitálního zpracování videa prostě nemá konkurenci a po stránce výkonů (nahrávání videa ve formátu MPEG na harddisk) a užitečnosti (video desktop je zkrátka cool) všichni ostatní jen blednou závistí.
Jádro Radeonu vytvořené na procesu 18 μm (tedy jako nové Durony nebo nové Celerony) je taktováno na 183 MHz a spotřebovává přijatelných 6 wattů. Radeonů se objeví několik typů, od sociálních modelů se 32 MB RAM po nadupané 64MB modely (my jsme měli zapůjčen 32MB model). Paměť je 5,5 ns 183 MHz DDR RAM – cokoliv pomalejšího by výkon čipu brzdilo; podle informací ATI ovšem plánují i levnou SDR RAM verzi, ale tam mám důrazné pochybnosti o rozumnosti koupě.
Můžeme se jenom a jenom těšit na nový All-In-Wonder, vůči němuž bude jen stěží možné mít z výkonového hlediska nějaké námitky, a jeho famózní schopnost simulovat videorekordér a nahrát do 5 GB diskového prostoru 7 hodin filmu ve formátu MPEG-1 (kvalita videa) nebo 3 hodiny filmu ve formátu MPEG-2 (kvalita DVD !!!) rozklepe každého – mladého, starého, hluchého i němého (jenom slepý si radši koupí DATku nebo SB Live...).
Death-match: One must fall!
Dobře, pověděli jsme si něco o Radeonu. Ale jak si stojí tenhle čip vedle dvou největších současných konkurentů – GeForce 2 GTS a Voodoo 5 5500? Vzal jsem proto svůj systém s Pentiem III 770/140 Coppermine a 128 MB RAM a týral dlouhou dobu (12 hodin) 3DMark 2000 a následně mnoho hodin ještě Excel a vrtal se v hoře čísel, která z testů vylezla.
Po provedení testů je třeba říci, že Radeon je velmi, velmi, VELMI solidní karta. Vcelku není lepší než GeForce 2 GTS, ale nakládačka, kterou udělila Voodoo 5, je více než jednoznačná. nVidia znovu dokázala, že to s grafickými kartami myslí vážně, a její akcie rostou – a rostou oprávněně. Fanoušci ATI mohou poukázat na to, že se Radeon GeForce 2 GTS v některých okamžicích nejen vyrovná, ale dokonce jej i předčí. GeForce 2 GTS už ale dnes není „performance king“, to po ní převzala GeForce 2 Ultra – tu jsem však zatím nikde prodávat neviděl. GeForce 2 Ultra ovšem zcela jasně a bez debat překonává jak Radeon, tak i GeForce 2 GTS o více než koňskou délku; cena za rychlost rozhodně patří nVidii...
Pokud Pán Bůh dal a laskaví grafici někde kolem zalámali grafy, stojí pohled na ně za to. GeForce 2 GTS je vcelku vítěz a opravdoví fanatici ať si spoří na jeho Ultra verzi, ale Radeon se drží velmi, velmi statečně, a pokud má scéna jen málo detailů a přitom vysoké rozlišení, dokáže trhnout i GeForce. Pokud je na scéně detailů hodně, omezuje hodně výsledný výkon procesor, paměťový subsystém a AGP; při nižším počtu detailů jde spíše o záležitost paměťového subsystému grafické karty – a ano, zde se projevuje HyperZ technologie a tam, kde supervýkonné jádro GeForce zoufale lapá po datech, nemajíc nic na práci, ušetří HyperZ onu pětinu propustnosti a dá Radeonu kompetitivní výhodu nad GeForce.
Jde ale jen o určitý podpřípad; ve většině situací je GeForce rychlejší a pro hráče tedy atraktivnější, po příchodu Ultry není co řešit. Uvidíme ještě, jaká bude cenová politika ATI – přece jenom mít velmi výkonnou kartu s videovstupem a super podporou videa za solidní peníze může být pro většinu „obyčejných“ uživatelů akceptovatelnější varianta než výkonnější dražší karta bez přídavných funkcí – speciálně když Radeon není ochuzen o funkce T&L.
Podle Tom’s Hardware ovšem nad GeForce vyniká Radeon ještě v jednom významném aspektu, který jsem během krátké doby testování jaksi nepostřehl, a proto ho neověřil – dovoluje FSAA (Full Screen Anti Aliasing), tedy to, čím se chlubí nová Voodoo 5. V režimu FSAA (Full Scene Anti Aliasing) je Radeon ale prý téměř dvakrát rychlejší než Voodoo 5 5500 (!!!) a zdá se, že se na tom podílí jak HyperZ, tak celkově lepší architektura čipu. Pokud je tato informace pravdivá, pak je to jen další nános haňby na nepovedené dinosauří mnohoprocesorové řešení, které dle všeho má jediný praktický smysl, a to ten, že vám po zapnutí elegantně vyhodí domovní pojistky. Běda ti, 3dfx!
Jaký je vliv Transform&Lighting?
Nastal čas zamyslet se nejen nad konkrétními čipy, ale také nad technologií, která se objevila poprvé u GeForce – Transform&Lighting. Tato technologie má za úkol zjednodušit výpočty transformace 3D modelu na 2D obraz a nasvícení modelu. Zjednodušeně řečeno, tato technologie dovoluje odebrat rutinní grafické výpočty procesoru, a zatímco se o ně stará sama, může procesor dělat něco jiného. Specializované T&L jednotky nejen ulehčí práci systému, ale rovněž dovolují používat mnohem složitější modely složené z většího počtu základních stavebních kamenů 3D modelů – trojúhelníků. Objekt vytvořený z velkého počtu trojúhelníčků je kulatější, vyhlazenější a prostě sexy – a přiznejme si, většina objektů, které se nám líbí, jsou kulaté a vyhlazené, ať už to jsou ženy, sportovní auta anebo letadla. (Jedinou výjimku spatřuji u Panzerwaffe, ovšem ta neslouží k fascinaci a případnému ošahávání, nýbrž k odstrašení. A proto tanky nebývají vyhlazené.)
Vliv T&L na celkový výkon karty je opravdu značný a nelze ho zanedbat ani náhodou. V nízkých rozlišeních může akcelerace T&L přidat až téměř 100 % (!) výkonu – a to není zrovna málo. Pokud nemají nová Voodoo 5 podporu pro T&L, nasazují oslí uši sama sobě – na jednu stranu na nich nepoběží nové, hezké, pro T&L upravené tituly, ve kterých budou panáci pěkně kynutí a kulaťoučcí a Lara výjimečně vyhlazená, a na druhou stranu jiným titulům, „jenom“ využívajícím T&L přidají GeForce a Radeon tak trochu forsáž, a Voodoo 5 ne. Běda.
Míra využitelnosti T&L není ale vždy tak skvělá – i zde je karta omezena paměťovou propustností, a když už přes zahlcenou sběrnici neprocpete další data, framerate prostě a jednoduše nezvednete. 100 % nárůstu výkonu uvidíte jen v nízkých rozlišeních a u některých her – subtest Helicopter běžel ve vysokých detailech na Radeonu i GeForce téměř dvakrát rychleji a zisk rostl s mírou detailů, zatímco subtest Adventure se choval přesně obráceně a s mírou detailů zisk klesal. Orientačně ale můžete počítat asi s třetinovým zrychlením do rozlišení 1024 x 768; dál už se projevuje brzdivý vliv paměťové propustnosti a nepomůže vám ani Zlý Bůh Pamětí a Vládce Horkých Čipů Bambus Rambus.
Při srovnávání míry zisku T&L u GeForce a Radeonu vyplynul zajímavý fakt: GeForce získává ze své T&L jednotky více v 16bitových barvách, zatímco Radeon ve 32bitových barvách. Mluvím o rozdílech v řádu jednotek procent, které nemají praktický vliv na rozhodování o koupi té či oné karty, ale rozdíl tu prostě je a souvisí patrně s odlišnou architekturou čipů. ATI se vždy zaměřovalo na truecolor a vida, ani zde nevidíme výjimku

Závěr: Dobré zprávy pro overclockery
Dámy a pánové, vcelku optimistické povídání (až na milovníky 3dfx, kteří mi už jistě připravují poštovní bombu) zakončím ještě jednou mimořádně optimistickou pasáží – všechny karty jedou na přetaktovaném BX čipsetu bez sebemenšího zadrhnutí. Všechny testy jsem provedl na 770/140 MHz Coppermine a tam, kde se starší akcelerátory zakousávaly, odmítaly pracovat na 92 MHz AGP, padaly, zlobily, bortily obraz anebo pro jistotu vůbec nenabootovaly – tak tam VŠECHNY testované karty fungovaly bez sebemenšího náznaku újmy. No a co si budeme povídat, 140MHz paměťová sběrnice má nominálně o 40 % vyšší propustnost než 100MHz, že