|
关于G80 shader performance的疑问
传闻中每个Shader Unit的执行能力为1D,这样只能单周期ADD/MUL
而G71每个Shader Unit就有两个能4D/3D+1D/2D+2D的ALU,每个都能FMA,一共算下来单周期吞吐到16FLops
就算算上频率的巨大差别,打散的1D array执行效能方面的优势,"传闻中的G80"的shader performance无论如何也赶不上高频的G71
但是有很多消息已经证实G80+3.6G Conroe跑Mark06可以到12000
Mark06的alu:tex大概接近6:1左右,也没有太复杂的分支和循环shader,G80最大的优势GigaThread根本没有发挥的余地
我对G80是如何在这种执行吃重的程序中获得如此大的优势感兴趣
从NV给的图上来看,单比纯粹的暴力运算能力,G80相对G71是没有任何优势的
PS:我不希望这贴有任何灌水和攻击行为发生,各位回贴前请尊重我,也尊重自己,不喜勿回,谢谢 |
|