nVidia G(T)300
- no-X
- Administrátor
- Příspěvky: 6912
- Registrován: stř dub 28, 2004 9:02 am
- Bydliště: Č. Budějovice
- Kontaktovat uživatele:
Termín geometrický výkon je velice široký.
To, co prudce rostlo u předchozích čipů, byl výkon vertex shaderu; tzn. schopnost zpracovávat programy přiřazené jednotlivým vertexům (vrcholům).
To, co rostlo pomalu, je triangle-rate, tzn. schopnost vůbec zpracovávat trojúhelníky. Tohle bylo omezeno výkonem CPU, protože vertexy generuje CPU. Bylo tedy zbytečné navyšovat výkon GPU, protože by stejně nebylo jak ho využít.
Přisla teselace = schopnost, díky níž je GPU schopno vertexy generovat samo. Tzn. možnost nárůstu počtu polygonů na mnohonásobek toho, co by zvládal CPU. Teoreticky. Praxe má dva zádrhely:
1. Triangle-rate. Triangle setup na to není dimenzovaný, byl dimenzovaný na množství polygonů, které stíhalo dodávat CPU. Triangle setup jako jednotka běží na základní frekvenci, za takt obvykle dokáže zpracovat 1 polygon. Tzn. frekvence v MHz obvykle = miliony trojúhelníků za sekundu. Má to ale výjimky - třeba R600 měla klasicky 1 trojúhelník za takt, ale RV670 v některých situacích potřebovala na 1 trojúhelník dva takty. Nebyl to moc problém, protože G80 a první generace G8x čipů měla poddimenzovaný (nebo zabugovaný) front-end čipu (tzn. buďto triangle setup, nebo rasterizér; detaily nevím), takže taky měla problémy s vysokým množstvím polygonů. Proto se zezačátku říkalo, že u G8x nefunguje unifikace jak by měl, protože výkon vertex shaderu při vysokém množství polygonů není o moc větší, než u starých čipů. Unifikace ve skutečnosti fungovala, ale pomalý front-end nezvládal unifikované jádro zásobovat polygony. Tohle ale pro nVidii nebyl problém; tehdejší hry - psané tak, aby běhaly i na unifikovaných čipech - náročné na geometrii nebyly, R6xx byla zabržděná bugy a drivery, takže do toho nikdo moc neryl.
Druhý limit je, že nVidia má základní frekvenci GPU nízkou, takže i triangle-setup běží na nižší frekvenci. Proto nVidia byla z tohohle hlediska víc limitovaná, než ATi a musela to začít řešit dříve.
ATi to zatím řešila tak nějak průběžně pozvolna - RV670 měla 1 polygon za 2 takty, RV770 zvládá 1 polygon za takt (tzn. dvojnásobek). RV870 má ještě dvojitý rasterizér, takže hrubý triangle-rate nevzrostl (resp. jen co se týče rozdílu frekvence), ale dokáže se ním nakládat o něco efektivněji.
Další řešení ATi je multi-GPU. AFR přes všechny své zápory má jeden velký klad a to je, že efektivně násobí triangle-rate. Tzn. zatímco nVidia se při návrhu velkého čipu musela pachtit s řešením problému, jak ho "nakrmit" dostatkem polygonů, tak ATi pro "nakrmení" menšího čipu stačil klasický způsob a high-end, který tradičně řeší přes AFR, které triangle-rate násobí, jako problém odpadl.
Nemůžu si pomoct, ale tahle genialita jednoduchosti se mi fakt líbí.
2. Zádrhel číslo dvě je, že když máme nějakou tu teselaci, kdy se zněkolikanásobí počet polygonů, není kladena zvýšená zátěž jen na teselátor a triangle-setup, ale na celý čip. Protože více polygonů = více stínů, které je třeba spočítat, složitější HDAO/SSAO (které je v módě a jehož obliba s DX11/compute-shadery poroste), několikanásobně více hran, které musí MSAA vyhladit. Tzn. s teselací rostou navíc nároky na unifikované jádro, texturovací jednotky i ROPs.
Nevím, jestli tohle nVidii uniklo, nebo co, ale dávat vlastní geometrickou jednotku do každého ze 16 bloků, ze kterých se čip skládá, je blbost. Výkon se projeví jen v syntetických testech; v reálných hrách bude návratnost mizivá - jak jsem zmínil, teselace není jen o polygonech navíc, stoupají nároky i na zbytek čipu. Takže zvýšit geometrický výkon o 800% je úplná zbytečnost, když výkon zbytku čipu jde nahoru jen o 40-100%.
ATi už se poučila z R5xx a R6xx a technologie, který se projevujou jen na papíře, nechala plavat (dynamic branching u R5xx atp...) a řeší věci, které mají vliv na 90% her. nVidia místo toho řeší nesmysly jako PhysX, "čistě" skalární architekturu a předimenzované geometrické jednotky, které se projeví v pár vybraných hrách, zatímco většinu titulů to neovlivní nijak...
To, co prudce rostlo u předchozích čipů, byl výkon vertex shaderu; tzn. schopnost zpracovávat programy přiřazené jednotlivým vertexům (vrcholům).
To, co rostlo pomalu, je triangle-rate, tzn. schopnost vůbec zpracovávat trojúhelníky. Tohle bylo omezeno výkonem CPU, protože vertexy generuje CPU. Bylo tedy zbytečné navyšovat výkon GPU, protože by stejně nebylo jak ho využít.
Přisla teselace = schopnost, díky níž je GPU schopno vertexy generovat samo. Tzn. možnost nárůstu počtu polygonů na mnohonásobek toho, co by zvládal CPU. Teoreticky. Praxe má dva zádrhely:
1. Triangle-rate. Triangle setup na to není dimenzovaný, byl dimenzovaný na množství polygonů, které stíhalo dodávat CPU. Triangle setup jako jednotka běží na základní frekvenci, za takt obvykle dokáže zpracovat 1 polygon. Tzn. frekvence v MHz obvykle = miliony trojúhelníků za sekundu. Má to ale výjimky - třeba R600 měla klasicky 1 trojúhelník za takt, ale RV670 v některých situacích potřebovala na 1 trojúhelník dva takty. Nebyl to moc problém, protože G80 a první generace G8x čipů měla poddimenzovaný (nebo zabugovaný) front-end čipu (tzn. buďto triangle setup, nebo rasterizér; detaily nevím), takže taky měla problémy s vysokým množstvím polygonů. Proto se zezačátku říkalo, že u G8x nefunguje unifikace jak by měl, protože výkon vertex shaderu při vysokém množství polygonů není o moc větší, než u starých čipů. Unifikace ve skutečnosti fungovala, ale pomalý front-end nezvládal unifikované jádro zásobovat polygony. Tohle ale pro nVidii nebyl problém; tehdejší hry - psané tak, aby běhaly i na unifikovaných čipech - náročné na geometrii nebyly, R6xx byla zabržděná bugy a drivery, takže do toho nikdo moc neryl.
Druhý limit je, že nVidia má základní frekvenci GPU nízkou, takže i triangle-setup běží na nižší frekvenci. Proto nVidia byla z tohohle hlediska víc limitovaná, než ATi a musela to začít řešit dříve.
ATi to zatím řešila tak nějak průběžně pozvolna - RV670 měla 1 polygon za 2 takty, RV770 zvládá 1 polygon za takt (tzn. dvojnásobek). RV870 má ještě dvojitý rasterizér, takže hrubý triangle-rate nevzrostl (resp. jen co se týče rozdílu frekvence), ale dokáže se ním nakládat o něco efektivněji.
Další řešení ATi je multi-GPU. AFR přes všechny své zápory má jeden velký klad a to je, že efektivně násobí triangle-rate. Tzn. zatímco nVidia se při návrhu velkého čipu musela pachtit s řešením problému, jak ho "nakrmit" dostatkem polygonů, tak ATi pro "nakrmení" menšího čipu stačil klasický způsob a high-end, který tradičně řeší přes AFR, které triangle-rate násobí, jako problém odpadl.
Nemůžu si pomoct, ale tahle genialita jednoduchosti se mi fakt líbí.
2. Zádrhel číslo dvě je, že když máme nějakou tu teselaci, kdy se zněkolikanásobí počet polygonů, není kladena zvýšená zátěž jen na teselátor a triangle-setup, ale na celý čip. Protože více polygonů = více stínů, které je třeba spočítat, složitější HDAO/SSAO (které je v módě a jehož obliba s DX11/compute-shadery poroste), několikanásobně více hran, které musí MSAA vyhladit. Tzn. s teselací rostou navíc nároky na unifikované jádro, texturovací jednotky i ROPs.
Nevím, jestli tohle nVidii uniklo, nebo co, ale dávat vlastní geometrickou jednotku do každého ze 16 bloků, ze kterých se čip skládá, je blbost. Výkon se projeví jen v syntetických testech; v reálných hrách bude návratnost mizivá - jak jsem zmínil, teselace není jen o polygonech navíc, stoupají nároky i na zbytek čipu. Takže zvýšit geometrický výkon o 800% je úplná zbytečnost, když výkon zbytku čipu jde nahoru jen o 40-100%.
ATi už se poučila z R5xx a R6xx a technologie, který se projevujou jen na papíře, nechala plavat (dynamic branching u R5xx atp...) a řeší věci, které mají vliv na 90% her. nVidia místo toho řeší nesmysly jako PhysX, "čistě" skalární architekturu a předimenzované geometrické jednotky, které se projeví v pár vybraných hrách, zatímco většinu titulů to neovlivní nijak...
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
-
- Certifikovaný fanATik
- Příspěvky: 889
- Registrován: ned pro 16, 2007 8:38 pm
- Bydliště: ne
- Kontaktovat uživatele:
Tohle jste viděli?
http://pc.watch.impress.co.jp/docs/colu ... 43352.html
http://pc.watch.impress.co.jp/docs/colu ... 43352.html
- no-X
- Administrátor
- Příspěvky: 6912
- Registrován: stř dub 28, 2004 9:02 am
- Bydliště: Č. Budějovice
- Kontaktovat uživatele:
Ne. Ale pozor, má tam chyby. Nečetl jsem to všechno (všude bych je asi ani neodhalil), ale slajd 16 (přklepy u sběrnice, špatně TMUs u GT200/GF100) a slajd 17 (špatně TMUs u GT200 a podle toho, o čem se mluví, tak i u GF100)
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
- DOC_ZENITH/XAN
- Senior member
- Příspěvky: 1922
- Registrován: stř říj 20, 2004 9:37 pm
- Bydliště: Praha - Hloubětín
Cím blíže ta karta je, tím měně robustní a velkej dojem budí. Chladič bude mít menší výměnou plochu jak ten u GTX280 a z bedny prej niak extra horkej vzduch nešel. + 2x6-pin, odhadovaná 470.
Takže fakt nevim, ale TSMC asi nebude ten kdo zavinil zdržení... spíš tam byla ňáká kritická bota v architektuře jako měla R600 u HW resolve ale NV radši než aby dopadla jak ATI s R600 to prostě nevydala a radši to opravila tudiž to zpoždění.
Bude to úplně normální karta konkurence k 5870, jen o půl roku později, pok NV nedá cenu jako konkurenci k 5870, bude to zaslouženej propadák.
Takže fakt nevim, ale TSMC asi nebude ten kdo zavinil zdržení... spíš tam byla ňáká kritická bota v architektuře jako měla R600 u HW resolve ale NV radši než aby dopadla jak ATI s R600 to prostě nevydala a radši to opravila tudiž to zpoždění.
Bude to úplně normální karta konkurence k 5870, jen o půl roku později, pok NV nedá cenu jako konkurenci k 5870, bude to zaslouženej propadák.
-
- ex certifié fanATIque
- Příspěvky: 2045
- Registrován: stř pro 01, 2004 7:18 pm
já ti nevím docente, mě přijde, že fakt moc sázíš na hry. to mi nepřijde zajímavý už od dob 4850, kterej jsem měl možnost proklepnout v 2560x1600. spíš jsem zvědav na to, co udělá nebo neudělá Fermi s GPGPU světem, zejména s ohledem na C++/Nexus a tak vůbec. jestli bude tesselátor/dx11 takový nebo makový, je mi zcela u řiti, hry nejsou u supercoolsexy grafice, ta může být pěkná už od dob DX9.0c, na to DX11 není nezbytně nutné. pokud má "jen" 2x6pin, pak to kvituji s povděkem, rozhodně bude nadále možné živit s 1200W zdrojem (pc power&cooling ) 4 tyto karty v "supercomputer" deskách, což ocení jistá (velmi omezená) skupinka uživatelů (nemluvě o nižším TDP Tesla/Quadro karet. ale chápu, že už asi zním jako nvidiot, že mi igor vymyl mozek, jenže to tak opravdu není. na GTX480 jsem hodně zvědavej z jiných aspektů než herních, ty byly dobré už u generace 200/4800.
- no-X
- Administrátor
- Příspěvky: 6912
- Registrován: stř dub 28, 2004 9:02 am
- Bydliště: Č. Budějovice
- Kontaktovat uživatele:
DOC_ZENITH/XAN: podle obou modelů výtěžnosti výroby (které znám) vychází, že GF100 má čistě z důvodu defektů daných výrobním procesem výtěžnost oproti RV870 poloviční... druhá věc je, že tam můžou být nějaké důvody navíc (nVidia mohla něco podcenit), ale už ta polovina vůči RV870 mohla stačit
btw. ta karta na obrázku je opravdu osekaná verze - má 320bit sběrnici
btw. ta karta na obrázku je opravdu osekaná verze - má 320bit sběrnici
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
-
- Certifikovaný fanATik
- Příspěvky: 889
- Registrován: ned pro 16, 2007 8:38 pm
- Bydliště: ne
- Kontaktovat uživatele:
Počítají ty modely i s možností redundance? Nechce se mi věřit, že by nVidia naplánovala high-endový čip na nevyzkoušený výrobní postup a nepočítala s tím, že výtěžnost nemusí být ideální. Takže plně funkční Fermi může být dost vzácná, ale třeba usilovali právě o to, aby měli slabší verzi s 448 SP a silnější se 480.
- no-X
- Administrátor
- Příspěvky: 6912
- Registrován: stř dub 28, 2004 9:02 am
- Bydliště: Č. Budějovice
- Kontaktovat uživatele:
Ne, počítá se se 100% funkčními čipy. Tzn. pokud by třeba RV870 měla 22%, pak by to mělo znamenat, že 22% čipů je použitelných na HD5870 a ze zbytku se vypaběrkuje na HD5850 a HD5830. Pokud se vyrábějí v poměru 1:1:1, pak ATi využije 66% (2/3) čipů.
Pro 1,5x větší čip by to znamenalo 11% plně funkčních čipů... GTX470 zřejmě bude mít deaktivováno méně jednotek, než HD5830/5850, takže by s těmito čísly byla celková výtěžnost možná 25-30%.
Pro 1,5x větší čip by to znamenalo 11% plně funkčních čipů... GTX470 zřejmě bude mít deaktivováno méně jednotek, než HD5830/5850, takže by s těmito čísly byla celková výtěžnost možná 25-30%.
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
- no-X
- Administrátor
- Příspěvky: 6912
- Registrován: stř dub 28, 2004 9:02 am
- Bydliště: Č. Budějovice
- Kontaktovat uživatele:
GTX470 je pomalejší než HD5870 v DiRT2 i STALKERovi COP [o 20%?]
ve 1920x1200 je pomalejší než HD5870 1GB o 10%
ve 2560x1600 je stejně rychlá jako HD5870 1GB [zřejmě kvůli větší kapacitě paměti?]
TDP GTX470 je výrazně pod 300W, ale karta je výrazně víc rozpálená než HD5870
http://we.pcinlife.com/thread-1369198-1-1.html
ve 1920x1200 je pomalejší než HD5870 1GB o 10%
ve 2560x1600 je stejně rychlá jako HD5870 1GB [zřejmě kvůli větší kapacitě paměti?]
TDP GTX470 je výrazně pod 300W, ale karta je výrazně víc rozpálená než HD5870
http://we.pcinlife.com/thread-1369198-1-1.html
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
-
- ex certifié fanATIque
- Příspěvky: 2045
- Registrován: stř pro 01, 2004 7:18 pm
- no-X
- Administrátor
- Příspěvky: 6912
- Registrován: stř dub 28, 2004 9:02 am
- Bydliště: Č. Budějovice
- Kontaktovat uživatele:
Bob: Pokud to nezměnili... ale asi ne. Vypadá to, že GTX470 je docela krátká, takže pasivní část chladiče je poměrně malá, a proto se hřeje...
Jinak TDP může být 225W, ale nedávno jsem narazil na zajímavou diskusi, kde byly vypsané TDP předešlých modelů nVidie + linky na různé recenze, kde naměřili i o desítky wattů víc. Takže nVidia se s tímhle asi moc netrápí.
Lukfi: Taky mi to tak přijde... navíc všude samá GTX470 - o GTX480 nic.
Jinak TDP může být 225W, ale nedávno jsem narazil na zajímavou diskusi, kde byly vypsané TDP předešlých modelů nVidie + linky na různé recenze, kde naměřili i o desítky wattů víc. Takže nVidia se s tímhle asi moc netrápí.
Lukfi: Taky mi to tak přijde... navíc všude samá GTX470 - o GTX480 nic.
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
http://www.pcgameshardware.com/aid,7434 ... ws/?page=2
že nejsou teploty/spotřeba/hluk špatné mno u gtx 480 určitě ano
zato ta 470 nevypadá po této stránce nejhůř
že nejsou teploty/spotřeba/hluk špatné mno u gtx 480 určitě ano
zato ta 470 nevypadá po této stránce nejhůř
Naposledy upravil(a) chosen dne ned bře 28, 2010 10:54 am, celkem upraveno 1 x.
Voodoo1, Voodoo2, Velocity 100, 2*Voodoo3 2000 AGP, 2*Voodoo3 3000 AGP, Voodoo3 2000 PCI SGR, Voodoo3 3500TV (včetně chobotnice)