用户
 找回密码
 立即注册
搜索

关于G80 shader performance的疑问

[复制链接]
发表于 2006-10-17 13:28:00
原帖由 来不及思考 于 2006-10-17 13:21 发表
RacingPHT 的那个测试太诡异了
6600居然只能跑跟P4 3.0相同的性能
原因我已经解释过了, 如果GPU真有天文数字般的性能, 那么GPGPU不会是今天的局面的.
事实上, 对于RayTrace这种并行的图象应用,  一个顶级的SM3的GPU, 实际应用中很少超过一个CPU的性能.
再说, 你难道认为CPU的设计者全是傻子么...思考不要被IHV给hype掉了.
使用道具 举报 回复 支持 反对
发表于 2006-10-17 13:29:00
原帖由 RacingPHT 于 2006-10-17 13:26 发表


按照现在的情报, G80每秒可以执行的指令数量高达172G, 虽然是1D指令.
如果co-issue无效(其实大多数情况就是这样), 那么G71只能执行15.6G, R580只能执行31.2G.

这个是比较有趣的.
RacingPHT兄的意思是,SIMD硬件单元的并行性,太容易被破坏了吗?
使用道具 举报 回复 支持 反对
发表于 2006-10-17 13:33:00
并不是单纯SIMD的问题...即使SIMD有效, SIMD指令序列间的指令类型, 依赖和限制仍然会破坏co-issue的发生. 而这恰恰是G7x能够算出这样高的flops的前提.
使用道具 举报 回复 支持 反对
发表于 2006-10-17 16:52:00
話說照RacingPHT兄提示的IPC指向,
算起來R600的指令發射數大約
是73G,我在想會不會反而是R600跑
DX9會比G80好,DX10相反?
使用道具 举报 回复 支持 反对
发表于 2006-10-17 17:05:00
不知道G80会不会把宣传重点放在IPC这边  ...GigaThread究竟是什么意思呢?

反正现在看起来R600似乎没有理由跑Dx9很差拉. 毕竟C1的Dx9+也没有什么人抱怨.. 73G的5D, flops应该蛮吓人的.

ps: 其实我说的那个GPU vs CPU比较也十分粗糙, 因为算法数据结构本身不同, CPU的SIMD是SOA, 而GPU则是AOS.
Cell跑这个的话, 性能似乎是R580的接近3倍, 2750M/s...(我不大相信)
使用道具 举报 回复 支持 反对
发表于 2006-10-17 17:13:00
原帖由 RacingPHT 于 2006-10-17 17:05 发表
不知道G80会不会把宣传重点放在IPC这边  ...GigaThread究竟是什么意思呢?

反正现在看起来R600似乎没有理由跑Dx9很差拉. 毕竟C1的Dx9+也没有什么人抱怨.. 73G的5D, flops应该蛮吓人的.

ps: 其实我说的那个 ...
GigaThread 应该只是G80 引入的thread manage技术的名称吧
使用道具 举报 回复 支持 反对
发表于 2006-10-17 17:15:00
由于编译器的问题,在包含了shading和shadows的作ray casting时候,K8 VS 单个SPE会有一定的优势。
使用道具 举报 回复 支持 反对
发表于 2006-10-17 17:25:00
原帖由 HECATE 于 2006-10-17 17:17 发表
我比较倾向于12K这个分数

结构上的东西,讨论的意义不大

毕竟还是要塞晶体管算数的
没有优秀的结构赛晶体管就可以了?
那芯片太简单了 XGI,S3一流就不会混这么惨了
晶体管少不了多少 效率差一大截
使用道具 举报 回复 支持 反对
发表于 2006-10-17 17:39:00
可能GS的1D比重大一点...难道是"未来趋势"吗....
原帖由 Edison 于 2006-10-17 17:15 发表
由于编译器的问题,在包含了shading和shadows的作ray casting时候,K8 VS 单个SPE会有一定的优势。
恩, 128个reg的威力很大呀. 我是没有数出来32.5个周期如何跑完4个相交测试的.
使用道具 举报 回复 支持 反对
发表于 2006-10-17 17:59:00
原帖由 HECATE 于 2006-10-17 17:58 发表



结构当然很重要,但要讲GPU的结构如何优秀恐怕不见得,基本上现在还是并行化的结构,以塞晶体管为主.


我的意思是现在可靠消息很少,捕风捉影的谈没有证实的结构多此一举

GPU发展过来这一路,效能基本还 ...
比如r300 vs nv30?
使用道具 举报 回复 支持 反对
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则