ATI/AMD NextGen
- no-X
- Administrátor
- Příspěvky: 6912
- Registrován: stř dub 28, 2004 9:02 am
- Bydliště: Č. Budějovice
- Kontaktovat uživatele:
ATI/AMD NextGen
http://www.diit.cz/clanek/amd-odhalila- ... ipu/38375/
http://www.hardware.fr/news/11648/afds- ... s-amd.html
skoro to vypadá, že ATI/AMD po letech recyklace vytvořilo od začátku novou architekturu, která na papíře vypadá velice zajímavě... a ještě víc mě překvapuje, že informujou o architektuře, když je produkt bůh ví jak daleko (pochybuju, že by v GF tajně běžela výroba)... wtf?
http://www.hardware.fr/news/11648/afds- ... s-amd.html
skoro to vypadá, že ATI/AMD po letech recyklace vytvořilo od začátku novou architekturu, která na papíře vypadá velice zajímavě... a ještě víc mě překvapuje, že informujou o architektuře, když je produkt bůh ví jak daleko (pochybuju, že by v GF tajně běžela výroba)... wtf?
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
- DOC_ZENITH/XAN
- Senior member
- Příspěvky: 1922
- Registrován: stř říj 20, 2004 9:37 pm
- Bydliště: Praha - Hloubětín
- DOC_ZENITH/XAN
- Senior member
- Příspěvky: 1922
- Registrován: stř říj 20, 2004 9:37 pm
- Bydliště: Praha - Hloubětín
Tak jsem si trochu pročítal ty materiály a mam takovou otázku proč? Proč to kráčení k GPGPU, neni lepší tam používat prostě strašně silné čipy typu POWER Gen.7 od IBM? Či specializované jednotky? OK, GPU můžou bejt levná, to jedině. Ale efektivní? To si nemyslim. To ale neni problém, GPGPU vidim jako dobrou věc. Ale tohle, jdou přesně tim směrem co NV, což na jednu stranu chápu ale co na tom nechápu je x86. Proč to dělaj tak aby to bylo schopno zpracovat x86 kód. X86 je ten nejhorší neoptimalizovanej balast, ten nejhorší hnůj kterýmu by se měl každej kdo chce efektivní kód vyhnout. Proč to tam dávaj. Tomu nerozumim.
GPGPU se nám stejně vyvinulo trochu do slepý uličky. Resp dvou uliček. Čekalo se že OpenCL věci sjednotí ale nestalo se. Když se totiž napíše kód "prostě pro OpenCL, to je jako psát kód "prostě pro x86, nebo prostě v C++. Takovej kód je na GPU neefektivní. GPU si neumí věci přebrat jak CPU. Umí vůbec GPU něco jako je prefetch či out of order zpracování? Umí so jeden thread rozdělit na svejch 512SP? Jde o to že GPGPU situace je dnes taková, že aby to dobře fungovalo, tak ten SW musí bejt psanej přímo na tu architekturu. Když ho napíšu neutrálně, nejede dobře na ničem a jede pomalejc jak na CPU. Když ho napíšu pro NV, jede nepoužitelně na ATI. Když ho napíšou na ATI, jede nepoužitelně na NV, i když je to oboje pod OpenCL. Open CL je jen záštita a standard, optimalizace a rychlost/efektivita je úplně jiné téma a to v současné době je velkej problém. Architektury obou výrobců jsou natolik rozdílné jak ještě nikdy nebyly a spíš se nám ty nůžky kompatibility rozevíraj než aby se to sjednocovalo. Jednotné API nám nepomůže když k tomu aby to fungovalo efektivně se ten SW musí napsat stejně na konkrétní architekturu. Výrobci GPU dle mého názoru se tam snažej narvat co možná nejvíc i naprosto hnojáckejch (x86) technologií aby prostě našly uplatnění, protože PC jako herní paltfmorma umírá, novej rychlejší HW nikdo už moc nechce/nepotřebuje, tak dělaj sebevětší nelogické prasárny aby si zajistili odbyt.
GPGPU se nám stejně vyvinulo trochu do slepý uličky. Resp dvou uliček. Čekalo se že OpenCL věci sjednotí ale nestalo se. Když se totiž napíše kód "prostě pro OpenCL, to je jako psát kód "prostě pro x86, nebo prostě v C++. Takovej kód je na GPU neefektivní. GPU si neumí věci přebrat jak CPU. Umí vůbec GPU něco jako je prefetch či out of order zpracování? Umí so jeden thread rozdělit na svejch 512SP? Jde o to že GPGPU situace je dnes taková, že aby to dobře fungovalo, tak ten SW musí bejt psanej přímo na tu architekturu. Když ho napíšu neutrálně, nejede dobře na ničem a jede pomalejc jak na CPU. Když ho napíšu pro NV, jede nepoužitelně na ATI. Když ho napíšou na ATI, jede nepoužitelně na NV, i když je to oboje pod OpenCL. Open CL je jen záštita a standard, optimalizace a rychlost/efektivita je úplně jiné téma a to v současné době je velkej problém. Architektury obou výrobců jsou natolik rozdílné jak ještě nikdy nebyly a spíš se nám ty nůžky kompatibility rozevíraj než aby se to sjednocovalo. Jednotné API nám nepomůže když k tomu aby to fungovalo efektivně se ten SW musí napsat stejně na konkrétní architekturu. Výrobci GPU dle mého názoru se tam snažej narvat co možná nejvíc i naprosto hnojáckejch (x86) technologií aby prostě našly uplatnění, protože PC jako herní paltfmorma umírá, novej rychlejší HW nikdo už moc nechce/nepotřebuje, tak dělaj sebevětší nelogické prasárny aby si zajistili odbyt.
- swarm
- debílek nahoněnej
- Příspěvky: 1189
- Registrován: čtv úno 10, 2005 11:10 am
- Bydliště: Praha (vesnice 30km od ní)
- Kontaktovat uživatele:
S tou rozdílností architektur GPU kolem OpenCL sis sám odpověděl na to, proč chtěj implementovat i x86 a proč se x86 stále používá, přestože všechny "x86" procesory jsou už dávno uvnitř něco úplně jiného. X86 je extrémně výhodné, neboť se dá dobře používat tak, že si každý procesor původní instrukce rozloží takovým způsobem, aby svou architekturu nejlépe využil, a přímo se s tím počítá.
Nevýhody x86 chápe každý, ale jeho výhody si uvědomuje jen málokdo.
Nevýhody x86 chápe každý, ale jeho výhody si uvědomuje jen málokdo.
Diagon Swarm - Můj NOVÝ "NOTEBOOK" blog [WWW]
Je těžké být debilem, konkurence je příliš velká.
14" Lenovo ThinkPad T400 - Core2 Duo T9900 3,1GHz, 8GB DDR3, 300GB Intel 320 SSD, WWAN, 1440x900 LED + Advanced Mini-dock + ThinkPad UltraNAV USB Keyboard + 2x 24" LCD
Je těžké být debilem, konkurence je příliš velká.
14" Lenovo ThinkPad T400 - Core2 Duo T9900 3,1GHz, 8GB DDR3, 300GB Intel 320 SSD, WWAN, 1440x900 LED + Advanced Mini-dock + ThinkPad UltraNAV USB Keyboard + 2x 24" LCD
- DOC_ZENITH/XAN
- Senior member
- Příspěvky: 1922
- Registrován: stř říj 20, 2004 9:37 pm
- Bydliště: Praha - Hloubětín
OK, ale GPU tohle nezvádaj a nebudou. Nebudou. Tečka. Co fermi? Ta umí zpracovat plně 32-bit x86. Jak je rychlá? 4x pomalejší jak Core2 duo? Kdyby GPU uměly dělat x86 a bejt v tom efektivní, byly by to CPU. K tomu aby v tom byly rycheljší jak CPU a jejich použítí by se vyplatilo, musely by na to vyčlenit asi tolik tranzistorů co maj CPU. Myslí si tady někdo že Nvidia či ATI najednou z ničeho nic bude efektivnější v exekuci x86 instrukcí než CPU čip Intelu? Ne. Nebude, bude x-násobně pomalejší, tudiž je to naprosto na nic. To samé CPU, když SW cestou renderuje 3D scénu je x-krát pomalejší než GPU. Proto tu taky ty GPU máme že, protože to CPU nestíhaly tak 3DFX měla dobrej nápad spoustu toho loadu přesunout jinam.
Čim víc o tom přemejšlim, tim víc k ničemu a jako mrhání tranzistory mi ta x86 podpora tam přijde. Nefuguje to dobře, je to pomalé, ten čip to nedává a nebude dávat. Pokud jsou tak dokonalí a udělaj čip co zpracuje x86 a zároveň to bude dobré GPU, tak se k nim začnu modlit. Ale už předem říkám že ne, nepovede se jim to. Nvidia na tom ztratila velký prachy + kus své reputace. Intel na to kapituloval a teď i AMD/ATI musí udělat svůj pokus, a bude to stejnej epic fail. Procesory se vyvíjely 20 let aby to byly out-of-order stroje co jsou optimalizovaný na zpracování x86 kódu. A neuměj nic jinýho, nemaj nic jinýho, celá ta tuna tranziustorů se soustředí na tu jednu věc, na tohle jedno použití. Nelze vzít Cell a naučit jej emulovat x86 aby ten výkon byl ok a ne jak P3 coppermine. Je nemožné vzít PowerPC a udělat to ačkoliv to jsou hrubou silou silnější čipy než x86. A také nelze vzít GPU a naučit jej to.Ano naučit se to může, ňák ten kód zpracuje, ale bude to neefektinví a pomalé, bude v tom prostě suxxovat. Je to jako provádět SW místo HW renderingu a chtít aby to mělo použitelnou rychlost.
Ne, nejde to. Jediná možnost jak využít síly GPU je napsat tu aplikaci přímo na něj, na to v čem vyniká, aby se na to ta jeho architektura chytla. A to bohužel u GPU znamená, že to poběží dobře jen na jedný rodině čipů a bude to naprosto suxxovat na všem ostatním. Tak to prostě dnes je a nevidim z toho cestu ven. Na Fermi jsou to téměř mrtvé tranzistory, užití to nenašlo. Tady to bude to samé. Stačí se jen podívat třeba na takovej Physx a jak taková amulace je "efektivní" . To bylo něco snažšího než x86, Nvidia to portla na Cudu, ten původní čip byl total pomalá kravinka do klasického PCI slotu. A přesto emulovat tohle, na GPU co jsou 100x silnější hrubym výkonem, způsobí velice citelnej performance hit. Nejde to a neni to efektivní.
GPU se už v určitejch výpočetních farmách pro určité operace používají, ale je to opět kód psanej přímo na to GPU, čistě jednoúčelovej kód. Neni to standardizovaný a nejde to momentálně standardizovat. Toť můj názor.
Čim víc o tom přemejšlim, tim víc k ničemu a jako mrhání tranzistory mi ta x86 podpora tam přijde. Nefuguje to dobře, je to pomalé, ten čip to nedává a nebude dávat. Pokud jsou tak dokonalí a udělaj čip co zpracuje x86 a zároveň to bude dobré GPU, tak se k nim začnu modlit. Ale už předem říkám že ne, nepovede se jim to. Nvidia na tom ztratila velký prachy + kus své reputace. Intel na to kapituloval a teď i AMD/ATI musí udělat svůj pokus, a bude to stejnej epic fail. Procesory se vyvíjely 20 let aby to byly out-of-order stroje co jsou optimalizovaný na zpracování x86 kódu. A neuměj nic jinýho, nemaj nic jinýho, celá ta tuna tranziustorů se soustředí na tu jednu věc, na tohle jedno použití. Nelze vzít Cell a naučit jej emulovat x86 aby ten výkon byl ok a ne jak P3 coppermine. Je nemožné vzít PowerPC a udělat to ačkoliv to jsou hrubou silou silnější čipy než x86. A také nelze vzít GPU a naučit jej to.Ano naučit se to může, ňák ten kód zpracuje, ale bude to neefektinví a pomalé, bude v tom prostě suxxovat. Je to jako provádět SW místo HW renderingu a chtít aby to mělo použitelnou rychlost.
Ne, nejde to. Jediná možnost jak využít síly GPU je napsat tu aplikaci přímo na něj, na to v čem vyniká, aby se na to ta jeho architektura chytla. A to bohužel u GPU znamená, že to poběží dobře jen na jedný rodině čipů a bude to naprosto suxxovat na všem ostatním. Tak to prostě dnes je a nevidim z toho cestu ven. Na Fermi jsou to téměř mrtvé tranzistory, užití to nenašlo. Tady to bude to samé. Stačí se jen podívat třeba na takovej Physx a jak taková amulace je "efektivní" . To bylo něco snažšího než x86, Nvidia to portla na Cudu, ten původní čip byl total pomalá kravinka do klasického PCI slotu. A přesto emulovat tohle, na GPU co jsou 100x silnější hrubym výkonem, způsobí velice citelnej performance hit. Nejde to a neni to efektivní.
GPU se už v určitejch výpočetních farmách pro určité operace používají, ale je to opět kód psanej přímo na to GPU, čistě jednoúčelovej kód. Neni to standardizovaný a nejde to momentálně standardizovat. Toť můj názor.
-
- ex certifié fanATIque
- Příspěvky: 2045
- Registrován: stř pro 01, 2004 7:18 pm
-
- ex certifié fanATIque
- Příspěvky: 2045
- Registrován: stř pro 01, 2004 7:18 pm
jinak tu chybí zásadní prolink, nejlepší cs rozbor architektury:
Vše o Radeonech HD 7000 aneb architektura GCN detailně (@diit.cz)
Vše o Radeonech HD 7000 aneb architektura GCN detailně (@diit.cz)