Technologie Gigapixel
Moderátor: Moderátoři
Technologie Gigapixel
Tohle tema me vzdy zajimalo. Stranka gigapixelu uz neni ani v a cokoliv kolem GP je zastreno jistou rouskou tajemstvi. Vime,ze jejich prvni cip GP1 predvedeny v roce 99 byl necim prevratnym a ukazoval skvele vysledky. (Ten prototyp by me hodne potesil ) Ale bylo neco z jejich technologie pouzito nVidii? Chytnul se nekdo z nV projektu MOJO a aspon trochu z toho narval do NV40? Treba ATI HyperZ je takova "mala" ukazka, ale TBR pouziva jen PVR a nikdo vic.
Mate nekdo vic info o Gigapixelu? ...
Mate nekdo vic info o Gigapixelu? ...
AGP2PCI,Voodoo4 4200 AGP(Daytona VSA-101)
Jindra Semenec
Jindra Semenec
GigaPixel's GP-1
GigaPixel's GP-1TM, based on our Giga3DTM architecture, is a high performance, high visual quality, and low cost 3D graphics core available for licensing. GP-1 verilog models, C-sim models, test suites and software drivers are available for integration into our customers' final product. GP-1 is extremely flexible and programmable. Features are configurable to meet requirements in different market segments.
GP-1's patent pending technology has an advanced tiling, visibility and rendering subsystem that tiles the frame, determines visible pixels and renders the tiles. The rendering engine processes only visible pixels. Setup, shading and texturing is done only on visible pixels.
This greatly reduces internal processing and memory bandwidth requirements. GP-1 is fully compatible with Direct3D and OpenGL. The core performs full scene anti-aliasing at speed-NO SPEED PENALITY even at high screen resolutions! Framebuffer reads, Z buffer reads, large number of polygons within a tile, transparency problems have been solved with our Giga3DTM architecture. GP-1 correctly implements the pipeline to insure full 3D API compatibility. GP-1 does not require any CPU overhead in the driver or software applications to support the underlying hardware.
GP-1 Features
* Fully compatible with Direct3D and OpenGL
* Full scene anti-aliasing (No speed penalty)
* 32 bit color rendering
* Full Triangle Setup
* Supports triangle strips and fans
* On chip Z buffer (24 bits)
* Specular highlights and diffuse shading
* Alpha blending
* Fog Vertex and table based
* 128 bit wide internal bus
* Low gate count
* Extremely low memory bandwidth
* Direct3D and OpenGL drivers
* Supports all memory types
* Supports different CPU's (x86 and others)
GigaPixel's GP-1TM, based on our Giga3DTM architecture, is a high performance, high visual quality, and low cost 3D graphics core available for licensing. GP-1 verilog models, C-sim models, test suites and software drivers are available for integration into our customers' final product. GP-1 is extremely flexible and programmable. Features are configurable to meet requirements in different market segments.
GP-1's patent pending technology has an advanced tiling, visibility and rendering subsystem that tiles the frame, determines visible pixels and renders the tiles. The rendering engine processes only visible pixels. Setup, shading and texturing is done only on visible pixels.
This greatly reduces internal processing and memory bandwidth requirements. GP-1 is fully compatible with Direct3D and OpenGL. The core performs full scene anti-aliasing at speed-NO SPEED PENALITY even at high screen resolutions! Framebuffer reads, Z buffer reads, large number of polygons within a tile, transparency problems have been solved with our Giga3DTM architecture. GP-1 correctly implements the pipeline to insure full 3D API compatibility. GP-1 does not require any CPU overhead in the driver or software applications to support the underlying hardware.
GP-1 Features
* Fully compatible with Direct3D and OpenGL
* Full scene anti-aliasing (No speed penalty)
* 32 bit color rendering
* Full Triangle Setup
* Supports triangle strips and fans
* On chip Z buffer (24 bits)
* Specular highlights and diffuse shading
* Alpha blending
* Fog Vertex and table based
* 128 bit wide internal bus
* Low gate count
* Extremely low memory bandwidth
* Direct3D and OpenGL drivers
* Supports all memory types
* Supports different CPU's (x86 and others)
AGP2PCI,Voodoo4 4200 AGP(Daytona VSA-101)
Jindra Semenec
Jindra Semenec
High-performance graphics cores developed by Stellar Semiconductor Inc. and GigaPixel Corp., both of Santa Clara, Calif., provide 128-bit pipelines to accelerate 2D and 3D graphics applications. Stellar's TX2DIII core uses a triple 128-bit pipeline to accelerate 2D graphics. It can support screen-to-screen bit-block transfer rates of 860 Mbytes/s and block fills at 5.4 Gbytes/s. Able to support all standard 2D operations, such as bit-block transfers, block fills, vector drawing, color keying and patterns, monochrome bitmaps, and fonts, the triple-pipeline architecture permits any 2D operation to have three operands (three sources combined to any destination). Additional core features let it perform font scaling, transparency, hardware-assisted highlighting, and other functions. The front-end scaling logic supports both RGB and YUV 4:2:2 (YCrCb) formats. Also, it employs dual Bresenham algorithms to determine when to add or drop pixels when scaling from 0.5 to 4 times the source image size. When implemented in various 0.25-µm CMOS processes, the core can run at clock speeds of 135 MHz. The core, along with drivers for Windows 95, 98, and NT, is available for licensing. The company provides a C-level emulator, a low-level hardware-abstraction-layer model, a test bench, and full regression test suites. Contact Alex Aali at Stellar, (408) 955-9663 ext. 123, or go to
Fully compatible with Direct 3D and OpenGL interfaces, GigaPixel's GP-1 graphics core employs the company's SmartTile architecture. The processor tiles the frame, determines the visible pixels, and renders the tiles. By processing just the visible pixels for setup, shading, and filtering, the processor greatly reduces internal computational requirements and memory bandwidth needs. Special effects such as specular highlights, diffuse shading, alpha blending, and many others are supported by the core as well. A single GP-1 core can effectively process four pixels per clock, with each pixel texture mapped, trilinear filtered, full-scene antialiased, and Z-buffered. Multiple GP-1 cores also can be integrated into a single design to further accelerate the graphics performance. Contact Keith Uhlin at GigaPixel, (408) 654-8005, or on the web at
Fully compatible with Direct 3D and OpenGL interfaces, GigaPixel's GP-1 graphics core employs the company's SmartTile architecture. The processor tiles the frame, determines the visible pixels, and renders the tiles. By processing just the visible pixels for setup, shading, and filtering, the processor greatly reduces internal computational requirements and memory bandwidth needs. Special effects such as specular highlights, diffuse shading, alpha blending, and many others are supported by the core as well. A single GP-1 core can effectively process four pixels per clock, with each pixel texture mapped, trilinear filtered, full-scene antialiased, and Z-buffered. Multiple GP-1 cores also can be integrated into a single design to further accelerate the graphics performance. Contact Keith Uhlin at GigaPixel, (408) 654-8005, or on the web at
AGP2PCI,Voodoo4 4200 AGP(Daytona VSA-101)
Jindra Semenec
Jindra Semenec
- no-X
- Administrátor
- Příspěvky: 6912
- Registrován: stř dub 28, 2004 9:02 am
- Bydliště: Č. Budějovice
- Kontaktovat uživatele:
Moc zajímavý...
Nejvíc mě ale na GP fascinuje ten FSAA with no performance cost. To má zjevně co s TBR dělat, protože to nabízelo tuším i PowerVR snad na Series4. Kdyby se vzala v úvahu už první generace home karet s podporou SS (GeForce / Voodoo5 / Kyro), tak co do stránky výkonnosti AA na tom bylo nejlíp Kyro, protože celý kouzlo spočívalo v tom, že sice obraz vykreslovalo ve dvojnásobném rozlišení, ale postupně. Každá dlaždice (čtvereček několik pixelů velký) se vykreslila ve dvojnásobném rozlišení, ale hotový obraz se neukládal do grafické paměti, ale do interního bufferu v čipu; pak byl tento čtvereček obrazu (v jádře) zmenšen na původní velikost a až potom šel přes sběrnici do paměti, takže nároky na paměťovou sběrnici nebyly čtyřnásobný, ale stejný jako kdyby se FSAA nepoužil...
Na Voodoo5 každý čip vykresloval obraz v základním rozlišení, přičemž měl každý VSA-100 k dispozici vlastní 128bit sběrnici, takže při FSAA2x (5500) nebo 4x (pro 6000) nijak nevzrůstaly nároky na sběrnici. Až při FSAA4x (5500) nebo 8x (6000) jsou nároky na sběrnici dvojnásobné....
No a GeForce vykreslovala obraz ve dvojnásobným rozlišení, uložila velký obraz do paměti a pak znovu načetla a zmenšila; takže přes sběrnici šel čtyřnásobek dat oproti Kyru a dvojnásobek/čytřnásobek oproti V5 (co se týče frame bufferu).
Ale protože šlo o SuperSampling, tak všechny tyhle karty při FSAA potřebovaly x-násobný fillrate. Když ale "moderní" multi-sampling "užere" jen na sběrnici, tak by přece nemohl být problém použít opět onchip cache pro MultiSampling třeba s 512bit (nebo širší?) sběrnicí, do které by byl rychlý přístup a do video-ram by se ukládal až hotový obraz. To by pak mohl být FSAA bez ztráty výkonu; jenže kdo si dneska troufne tak výrazně překopat architekturu čipu, navíc implementovat drahou EDRAM nebo SRAM (či co to dneska vůbec používají) a vyrábět takový čipy
Nejvíc mě ale na GP fascinuje ten FSAA with no performance cost. To má zjevně co s TBR dělat, protože to nabízelo tuším i PowerVR snad na Series4. Kdyby se vzala v úvahu už první generace home karet s podporou SS (GeForce / Voodoo5 / Kyro), tak co do stránky výkonnosti AA na tom bylo nejlíp Kyro, protože celý kouzlo spočívalo v tom, že sice obraz vykreslovalo ve dvojnásobném rozlišení, ale postupně. Každá dlaždice (čtvereček několik pixelů velký) se vykreslila ve dvojnásobném rozlišení, ale hotový obraz se neukládal do grafické paměti, ale do interního bufferu v čipu; pak byl tento čtvereček obrazu (v jádře) zmenšen na původní velikost a až potom šel přes sběrnici do paměti, takže nároky na paměťovou sběrnici nebyly čtyřnásobný, ale stejný jako kdyby se FSAA nepoužil...
Na Voodoo5 každý čip vykresloval obraz v základním rozlišení, přičemž měl každý VSA-100 k dispozici vlastní 128bit sběrnici, takže při FSAA2x (5500) nebo 4x (pro 6000) nijak nevzrůstaly nároky na sběrnici. Až při FSAA4x (5500) nebo 8x (6000) jsou nároky na sběrnici dvojnásobné....
No a GeForce vykreslovala obraz ve dvojnásobným rozlišení, uložila velký obraz do paměti a pak znovu načetla a zmenšila; takže přes sběrnici šel čtyřnásobek dat oproti Kyru a dvojnásobek/čytřnásobek oproti V5 (co se týče frame bufferu).
Ale protože šlo o SuperSampling, tak všechny tyhle karty při FSAA potřebovaly x-násobný fillrate. Když ale "moderní" multi-sampling "užere" jen na sběrnici, tak by přece nemohl být problém použít opět onchip cache pro MultiSampling třeba s 512bit (nebo širší?) sběrnicí, do které by byl rychlý přístup a do video-ram by se ukládal až hotový obraz. To by pak mohl být FSAA bez ztráty výkonu; jenže kdo si dneska troufne tak výrazně překopat architekturu čipu, navíc implementovat drahou EDRAM nebo SRAM (či co to dneska vůbec používají) a vyrábět takový čipy
Naposledy upravil(a) no-X dne sob led 08, 2005 12:05 am, celkem upraveno 1 x.
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
- no-X
- Administrátor
- Příspěvky: 6912
- Registrován: stř dub 28, 2004 9:02 am
- Bydliště: Č. Budějovice
- Kontaktovat uživatele:
Nějaké další specifikace GP-1 (pár se jich opakuje)
Giga3D tiling architecture
4 pixel pipelines
183MHz core-speed
732 MPxl/s single-texturing
5900 MTxl/s multi-texturing
HW Triangle Setup w/strips & fans
Trilinear Mipmapping
32bit color rendering
FSAA with no performance penalty
support for all memory types (SDRAM, SGRAM, DirectRDRAM and DDR)
Multitexturing fillrate vyšší než Radeon X800PRO a GeForce 6800GT Otázkou je, jestli už nezapočítali owerdraw
A kdyby se někomu zdály ostatní parametry "ne zrovna oslňující", tak nezapomeňte, že je to návrh z roku 1999 předvedený na Comdexu 16.11.1999 8)
Giga3D tiling architecture
4 pixel pipelines
183MHz core-speed
732 MPxl/s single-texturing
5900 MTxl/s multi-texturing
HW Triangle Setup w/strips & fans
Trilinear Mipmapping
32bit color rendering
FSAA with no performance penalty
support for all memory types (SDRAM, SGRAM, DirectRDRAM and DDR)
Multitexturing fillrate vyšší než Radeon X800PRO a GeForce 6800GT Otázkou je, jestli už nezapočítali owerdraw
A kdyby se někomu zdály ostatní parametry "ne zrovna oslňující", tak nezapomeňte, že je to návrh z roku 1999 předvedený na Comdexu 16.11.1999 8)
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz
By me zajimalo zda neco pouzili v nV GoForce
Mimochodem sem se kdysi ptal Jindry jestli by se dal tenhle prototyp sehnat a bohuzel o zadnem nevedel. Jedine sehnat kontakt na nejakeho inzenyra z GP. Zrovinka tenhle HW by se mi libil a jeste sem neslysel,ze by ho nekdo mel. Takova raritka jako mit doma Glaze3D
Mimochodem sem se kdysi ptal Jindry jestli by se dal tenhle prototyp sehnat a bohuzel o zadnem nevedel. Jedine sehnat kontakt na nejakeho inzenyra z GP. Zrovinka tenhle HW by se mi libil a jeste sem neslysel,ze by ho nekdo mel. Takova raritka jako mit doma Glaze3D
AGP2PCI,Voodoo4 4200 AGP(Daytona VSA-101)
Jindra Semenec
Jindra Semenec
- no-X
- Administrátor
- Příspěvky: 6912
- Registrován: stř dub 28, 2004 9:02 am
- Bydliště: Č. Budějovice
- Kontaktovat uživatele:
Re: RE
Ty mi dáváš zabratVykupitel píše:By me zajimalo zda neco pouzili v nV GoForce ... &sid=18627The Baron at Beyond3D píše:Okay. Time to end the speculation.
Note that you haven't seen a mobile NV40. Now, you're all thinking, "Oh, it's obviously because of the NV40's massive heat output and thermal requirements." WRONG!
Enter NVM1. The first use of Gigapixel IP. It's a mobile-only chip that has absolutely nothing in common with NV40 (or at least, the NV40 you know now--remember that eight-pipe "NV40" making the rounds earlier this year? that wasn't an NV40, that was an NVM1 in handy AGP form for developers to play with.).
If you're doing rotated grid SSAA (call it sparse grid if you wish but most often your samples will be in the "rotated" position) : then this AA is better than sex. ---Blazkowicz