关于G80 shader performance的疑问

gl008 · gl008

原帖由 来不及思考 于 2006-10-17 13:21 发表
RacingPHT 的那个测试太诡异了
6600居然只能跑跟P4 3.0相同的性能

原因我已经解释过了, 如果GPU真有天文数字般的性能, 那么GPGPU不会是今天的局面的.
事实上, 对于RayTrace这种并行的图象应用, 一个顶级的SM3的GPU, 实际应用中很少超过一个CPU的性能.
再说, 你难道认为CPU的设计者全是傻子么...思考不要被IHV给hype掉了.

forthequeen · forthequeen

原帖由 RacingPHT 于 2006-10-17 13:26 发表

按照现在的情报, G80每秒可以执行的指令数量高达172G, 虽然是1D指令.
如果co-issue无效(其实大多数情况就是这样), 那么G71只能执行15.6G, R580只能执行31.2G.

这个是比较有趣的.

RacingPHT兄的意思是，SIMD硬件单元的并行性，太容易被破坏了吗？

maomiguairen · maomiguairen

并不是单纯SIMD的问题...即使SIMD有效, SIMD指令序列间的指令类型, 依赖和限制仍然会破坏co-issue的发生. 而这恰恰是G7x能够算出这样高的flops的前提.

saxxp · saxxp

話說照RacingPHT兄提示的IPC指向，
算起來R600的指令發射數大約
是73G，我在想會不會反而是R600跑
DX9會比G80好，DX10相反?

6286365

不知道G80会不会把宣传重点放在IPC这边 ...GigaThread究竟是什么意思呢?

反正现在看起来R600似乎没有理由跑Dx9很差拉. 毕竟C1的Dx9+也没有什么人抱怨.. 73G的5D, flops应该蛮吓人的.

ps: 其实我说的那个GPU vs CPU比较也十分粗糙, 因为算法数据结构本身不同, CPU的SIMD是SOA, 而GPU则是AOS.
Cell跑这个的话, 性能似乎是R580的接近3倍, 2750M/s...(我不大相信)

110120

原帖由 RacingPHT 于 2006-10-17 17:05 发表
不知道G80会不会把宣传重点放在IPC这边 ...GigaThread究竟是什么意思呢?

反正现在看起来R600似乎没有理由跑Dx9很差拉. 毕竟C1的Dx9+也没有什么人抱怨.. 73G的5D, flops应该蛮吓人的.

ps: 其实我说的那个 ...

GigaThread 应该只是G80 引入的thread manage技术的名称吧

rufeng12 · rufeng12

由于编译器的问题，在包含了shading和shadows的作ray casting时候，K8 VS 单个SPE会有一定的优势。

001QIAO · 001QIAO

原帖由 HECATE 于 2006-10-17 17:17 发表
我比较倾向于12K这个分数

结构上的东西,讨论的意义不大

毕竟还是要塞晶体管算数的

没有优秀的结构赛晶体管就可以了？
那芯片太简单了 XGI,S3一流就不会混这么惨了
晶体管少不了多少效率差一大截

zhadongjing · zhadongjing

可能GS的1D比重大一点...难道是"未来趋势"吗....

原帖由 Edison 于 2006-10-17 17:15 发表
由于编译器的问题，在包含了shading和shadows的作ray casting时候，K8 VS 单个SPE会有一定的优势。

恩, 128个reg的威力很大呀. 我是没有数出来32.5个周期如何跑完4个相交测试的.

moonlong · moonlong

原帖由 HECATE 于 2006-10-17 17:58 发表

结构当然很重要,但要讲GPU的结构如何优秀恐怕不见得,基本上现在还是并行化的结构,以塞晶体管为主.

我的意思是现在可靠消息很少,捕风捉影的谈没有证实的结构多此一举

GPU发展过来这一路,效能基本还 ...

比如r300 vs nv30?

		自动登录	找回密码
密码			立即注册