热点科技

标题: 关于G80 shader performance的疑问 [打印本页]

作者: topsz    时间: 2006-10-16 14:05
标题: 关于G80 shader performance的疑问
关于G80 shader performance的疑问
传闻中每个Shader Unit的执行能力为1D,这样只能单周期ADD/MUL
而G71每个Shader Unit就有两个能4D/3D+1D/2D+2D的ALU,每个都能FMA,一共算下来单周期吞吐到16FLops
就算算上频率的巨大差别,打散的1D array执行效能方面的优势,"传闻中的G80"的shader performance无论如何也赶不上高频的G71
但是有很多消息已经证实G80+3.6G Conroe跑Mark06可以到12000
Mark06的alu:tex大概接近6:1左右,也没有太复杂的分支和循环shader,G80最大的优势GigaThread根本没有发挥的余地
我对G80是如何在这种执行吃重的程序中获得如此大的优势感兴趣

从NV给的图上来看,单比纯粹的暴力运算能力,G80相对G71是没有任何优势的



PS:我不希望这贴有任何灌水和攻击行为发生,各位回贴前请尊重我,也尊重自己,不喜勿回,谢谢
作者: zhaozuwen    时间: 2006-10-16 14:11
128*1*1350
24*4*2*650
单看ALU指标,提升确实少得可怜
作者: chenmin12345    时间: 2006-10-16 14:15
在没有找到对G80 ALU能力的合理解释之前
我只能认为那个12000分的所谓3DMark06成绩纯粹是扯谈
作者: sbepl001    时间: 2006-10-16 14:19
不懂,学习中
8个字
作者: ygi    时间: 2006-10-16 14:19
前几天完全被谣言蒙蔽了眼睛,根本没有仔细去推敲ALU执行能力这一最基本要素
这样看来,R600的那个11600分的3DMark06得分也很不容乐观
作者: andylol    时间: 2006-10-16 14:22
原帖由 大死人花 于 2006-10-16 14:19 发表
不懂,学习中
8个字
你可以理解为,按目前曝光的规格来看,G80增加的那点ALU运算能力根本不值得一提,虽然我不愿意承认这样的事
当然,这也只是影响性能的一个方面,但跑当前的程序,拼的基本就是ALU,所以,那个MARK06 12000分根本是扯谈
作者: kieth123    时间: 2006-10-16 14:26
原帖由 孤石 于 2006-10-16 14:24 发表
G80难道是G71的简单增肥版本?显然不是。
因此,不能单纯的拿G80里面的数字来和G71来套公式。
思考拿到G80核心的PDF没有?
不是这样
我刚才一再强调了,比的仅仅是ALU运算能力,这仅仅是决定性能的一个方面
R580的ALU运算能力超过R520三倍,这没有吹半点牛,但实际性能有超过R520三倍?
作者: japan    时间: 2006-10-16 14:26
不是有2个核心吗  另外个做什么用的
作者: fang11597    时间: 2006-10-16 14:29
原帖由 airforce18 于 2006-10-16 14:26 发表
不是有2个核心吗  另外个做什么用的
现在还在说2核心的人,要打屁股了
作者: weshf    时间: 2006-10-16 14:32
来不及思考你不想活了么?
作者: pi4pi    时间: 2006-10-16 14:34
原帖由 phk 于 2006-10-16 14:32 发表
来不及思考你不想活了么?
改过来了
那图什么都看不清放心
作者: xxz10815    时间: 2006-10-16 14:35
原帖由 来不及思考 于 2006-10-16 14:34 发表


改过来了
那图什么都看不清放心
在我的79GT盒子上7900为30X,7600为20X
作者: jh0306    时间: 2006-10-16 14:36
楼主到更专业的论坛问吧....
作者: iloveoov    时间: 2006-10-16 14:37
原帖由 Lein 于 2006-10-16 14:36 发表
楼主到更专业的论坛问吧....
02年的时候,这里放眼望去全是这种帖子
作者: trisunboy    时间: 2006-10-16 14:39
原帖由 phk 于 2006-10-16 14:35 发表


在我的79GT盒子上7900为30X,7600为20X
我暂时只能认为,Mark06双方都在扯谈
从现在已经曝光的一些消息来看,R600也根本没把重点放在增加ALU能力上
作者: coolirving    时间: 2006-10-16 14:40
原帖由 来不及思考 于 2006-10-16 14:37 发表


02年的时候,这里放眼望去全是这种帖子
记得以前上gz.. 帖子基本都看不懂..非常专业
可现在..唉....

(   )
作者: liyanghong    时间: 2006-10-16 14:43
原帖由 来不及思考 于 2006-10-16 14:39 发表


我暂时只能认为,Mark06双方都在扯谈
从现在已经曝光的一些消息来看,R600也根本没把重点放在增加ALU能力上
其实MARK可以作弊.........................
作者: zfk0625    时间: 2006-10-16 14:44
原帖由 zl841226 于 2006-10-16 14:43 发表


其实MARK可以作弊.........................
beta驱动把重心放到这种问题上是极其愚蠢的
还有很多更重要的事情要做
作者: tmzdxz    时间: 2006-10-16 14:47
06 MARK是集成显卡的27X。。貌似没比7900强多少嘛
作者: wuyixiao    时间: 2006-10-16 14:49
原帖由 来不及思考 于 2006-10-16 14:44 发表


beta驱动把重心放到这种问题上是极其愚蠢的
还有很多更重要的事情要做
很多人看分买卡的,而且作弊又不是多难~~~~~~~~~~根本不用放重心在这,05没出几天A就出了个分数暴涨的驱动
MARK那些场景几乎不会出现什么突发的现象~~~~
作者: weichengu    时间: 2006-10-16 14:57
现在的疑问集中在:
1. US在跑DX9这种固定比例的shader时,驱动的效率
2. 分散的1D Array相对于4D在效率上的优势
3. GigaThread对跑DX9下shader的帮助
4. G80 FPU本身的改进
作者: dumbthumb    时间: 2006-10-16 15:03
意思是不是說G80的Shader和G71 Shader比較起來有弱化的情形
俺係菜鳥,別笑我啊,只是想請教一下
作者: AAAB    时间: 2006-10-16 15:07
有没有可能是全free 根据程序的需要自组
这样的话结构可变 那就太bt类
作者: lijiandong91881    时间: 2006-10-16 15:09
原帖由 NONO 于 2006-10-16 15:03 发表
意思是不是說G80的Shader和G71 Shader比較起來有弱化的情形
俺係菜鳥,別笑我啊,只是想請教一下
"shader"这个词包含的东西太多了..尤其是在DX10时代
我指的是纯粹理论上的运算单元的算术运算能力,G80提升得很少,跟G71的比例大概是1.38:1左右
作者: caixinyu    时间: 2006-10-16 15:11
原帖由 back 于 2006-10-16 15:07 发表
有没有可能是全free 根据程序的需要自组
这样的话结构可变 那就太bt类
MIMD大概就是这个意思,它能粉碎现有流水线渲染过程中的局限性
不过这还得打半个问号
作者: ywy1688    时间: 2006-10-16 15:48
原帖由 来不及思考 于 2006-10-16 15:11 发表


MIMD大概就是这个意思,它能粉碎现有流水线渲染过程中的局限性
不过这还得打半个问号
如果真是这样 恐怕g80的架构可能比目前所谓的统一渲染架构还要极端一点 纯粹一点

完全类似搭积木 塞进去一定比例的三角形,圆形,正方形 可以根据需要搭出不同的东西来 呵呵
潜力无穷喽
作者: blnq    时间: 2006-10-16 15:50
原帖由 来不及思考 于 2006-10-16 15:11 发表


MIMD大概就是这个意思,它能粉碎现有流水线渲染过程中的局限性
不过这还得打半个问号
驱动小组要累死了
作者: 78816078    时间: 2006-10-16 15:51
原帖由 back 于 2006-10-16 15:48 发表

如果真是这样 恐怕g80的架构可能比目前所谓的统一渲染架构还要极端一点 纯粹一点

完全类似搭积木 塞进去一定比例的三角形,圆形,正方形 可以根据需要搭出不同的东西来 呵呵
潜力无穷喽
那个....DX10的GS就是干这个事的
其他的嘛,关注下近期的MC
作者: lastflight    时间: 2006-10-16 16:29
原帖由 TANJT 于 2006-10-16 16:21 发表
88 27/20 X于 79???

提升那么少??

76相当于68 #而79 是 2X 于 76

那个表是所谓ALU的性能对比?

不明白,学习
那是跑3DMARK的分
作者: y33y33y33    时间: 2006-10-16 16:29
回复 #30 来不及思考 的帖子
会不会是线程调度部分开了窍?不过应该不会这么牛的提升。
作者: life16858    时间: 2006-10-16 16:40
理论运算能力?
按照上面G80:G71=1.38:1的说法
那么可以看作R580:G71=2:1

作者: SGFD1983    时间: 2006-10-16 16:53
原帖由 只为你存在 于 2006-10-16 16:40 发表
理论运算能力?
按照上面G80:G71=1.38:1的说法
那么可以看作R580:G71=2:1
实在看不出来
作者: 522271147    时间: 2006-10-16 16:57
真怀念以前的GZ
作者: xbs19850714    时间: 2006-10-16 17:55
原帖由 Gfans23 于 2006-10-16 16:57 发表
真怀念以前的GZ
我也是, 顺便问问, 以前的 SM 女王到哪去了? 是换了ID还是彻底消失了?
作者: fdsfasdfasdg    时间: 2006-10-16 18:00
这里的牛人还是有的啊

某个在 nVIDIA 搞技术的小白领还是经常来这里

可惜他从来不发言
作者: zhhy2912878    时间: 2006-10-16 18:17
[quote]原帖由 梦游的猪
2006-10-16 16:29 发表
会不会是线程调度部分开了窍?不
过应该不会这么牛的提升。 [/
quote]
和G71相比G80的thread數了約五
倍,ALU同時脈效率約1.8倍。
作者: ttx886    时间: 2006-10-16 18:23
马上要变成怀旧贴了
作者: shw791110    时间: 2006-10-16 18:31
原帖由 Eji 于 2006-10-16 18:17 发表
原帖由 梦游的猪 于
2006-10-16 16:29 发表
会不会是线程调度部分开了窍?不
过应该不会这么牛的提升。 [/
quote]
和G71相比G80的thread數了約五
倍,ALU同時脈效率約1.8倍。
同时脉效率180%?
Eji大可以讲解一下吗?搬板凳学习中
作者: zeroo    时间: 2006-10-16 18:48
原帖由 ghrs2010
2006-10-16 18:31 发表
同时脉效率180%?
Eji大可以讲解一下吗?搬板凳学习中
好像是16ALU內可以任意結合,
跑FMA吧。
-----------------------------
不過剛剛看到數字了,DX9超慘
@-@。
作者: 47210467    时间: 2006-10-16 19:09
DX9超惨??
作者: clwang    时间: 2006-10-16 19:22
原帖由 来不及思考 于 2006-10-16 14:39 发表


我暂时只能认为,Mark06双方都在扯谈
从现在已经曝光的一些消息来看,R600也根本没把重点放在增加ALU能力上
Geforce 3和Geforce 2 Ultra相比......
两者的规格很多人应该很清楚的吧
作者: idclnli    时间: 2006-10-16 19:23
原帖由 来不及思考 于 2006-10-16 14:05 发表
传闻中每个Shader Unit的执行能力为1D,这样只能单周期ADD/MUL
而G71每个Shader Unit就有两个能4D/3D+1D/2D+2D的ALU,每个都能FMA,一共算下来单周期吞吐到16FLops
就算算上频率的巨大差别,打散的1D array执行效 ...
难道NV觉得G80每个shader unit 执行能力为1D的结构要好过G71 的 4D/3D+1D/2D+1D?
作者: jinshen1    时间: 2006-10-16 19:27
原帖由 XDR3 于 2006-10-16 19:23 发表


G80为什么每个shader unit的执行能力为1D呢? 为何不延续G71中的4D/3D+1D/2D+3D呢?难道NV有什么秘密?
老大....
你提问前至少先对状况有个大概的了解啊 #
作者: 410640074    时间: 2006-10-16 19:29
原帖由 来不及思考 于 2006-10-16 19:27 发表


老大....
你提问前至少先对状况有个大概的了解啊 #
我只是不理解NV为什么要把原先成熟的结构做那么大的改动?
作者: istel    时间: 2006-10-16 19:30
原帖由 Eji 于 2006-10-16 18:48 发表

好像是16ALU內可以任意結合,
跑FMA吧。
-----------------------------
不過剛剛看到數字了,DX9超慘
@-@。
洗耳恭听
作者: leejacky    时间: 2006-10-16 19:41
原帖由 Eji 于 2006-10-16 18:48 发表

好像是16ALU內可以任意結合,
跑FMA吧。
-----------------------------
不過剛剛看到數字了,DX9超慘
@-@。
G80跑DX9超惨?
作者: 5261370    时间: 2006-10-16 19:48
再惨也不会比G71差
作者: 2007flower    时间: 2006-10-16 20:01
原帖由 XDR3 于 2006-10-16 19:29 发表


我只是不理解NV为什么要把原先成熟的结构做那么大的改动?
打个广告
06年微型机算计11月上,应该有类似文章,具体怎么样就不知道了
作者: lengbing079927    时间: 2006-10-16 20:33
原帖由 来不及思考 于 2006-10-16 14:11 发表
128*1*1350
24*4*2*650
单看ALU指标,提升确实少得可怜
我怎么感觉应该是G71 24*4*2*2 *650  249.6Gflops的样子
r520  48*(4*2+4) *650  374.4Gflops

G80 每个Shader只能做1D MUL/ADD?
作者: 552wyl    时间: 2006-10-16 20:36
原帖由 anglelo
2006-10-16 19:48 发表
再惨也不会比G71差
可能是Driver有關係,現在AIC手上
的卡,05,06跑起來都和G71差不
多,無視記憶體頻寬G80明明比較
大的狀況,所以看來兩邊在XP底下
都有問題。

現在G80核心時脈是已經降到比G71
還低了,不過記憶體頻寬至少還比
較大.....所以很怪。
作者: wjmimiyan    时间: 2006-10-16 20:44
原帖由 killpmp
2006-10-16 19:22 发表

Geforce 3和Geforce 2 Ultra相比......
两者的规格很多人应该很清楚的吧
現在G80頗像當初GF3初期跑不贏
GF2的狀況?
-------
進來幸災樂禍的我會刪喔。
紅字最好克制點。
作者: hewy035anns    时间: 2006-10-16 20:50
原帖由 Eji 于 2006-10-16 18:48 发表

好像是16ALU內可以任意結合,
跑FMA吧。
-----------------------------
不過剛剛看到數字了,DX9超慘
@-@。
那么可能会出现的情况
8 TCP* (2*16) *1350 =345.6Gflops? 或者说有更复杂的工作模式?
作者: Courage007    时间: 2006-10-16 20:51
提示: 作者被禁止或删除 内容自动屏蔽
作者: lkdeyq    时间: 2006-10-16 21:05
原帖由 R600KillG80 于 2006-10-16 21:03 发表
又见烟雾
G80没有强到哪里,也没有弱到哪里 #
产品表现也不是光看FLOPS就知道什么情况的
作者: qhdyr    时间: 2006-10-16 21:17
应该现在SM3.0 使用FP来渲染,和整数关系不大的吧,主要是看FP的速度。
对VPU一无所知,随便说的……
作者: qzh008    时间: 2006-10-16 21:18
又搞烟雾
简直给我们泼冷水
作者: 3124504    时间: 2006-10-16 21:18

一直没想过这个方面的东西
被思考提醒了……
不过我倾向于相信分数是真的。
作者: helloboy    时间: 2006-10-16 21:20
原帖由 R600KillG80 于 2006-10-16 21:14 发表
E大说频率比7900GTX还低

8800GTX
575MHz Core Clock
900MHz Mem Clock
768MB GDDR3 memory
384-bit memory interface (86GB/s)
128 unified shaders clocked at 1350 MHz
38.4 billion pixels per sec ...
38.4 billion pixels per sec
ROP数量是多少呢??
作者: redye    时间: 2006-10-16 21:20
原帖由 Eji 于 2006-10-16 18:48 发表


不過剛剛看到數字了,DX9超慘
@-@。
会吗?我看到的是05 22000阿
当然,U是X6800@5G
作者: 86852550    时间: 2006-10-16 21:21
原帖由 itany 于 2006-10-16 21:17 发表
应该现在SM3.0 使用FP来渲染,和整数关系不大的吧,主要是看FP的速度。
对VPU一无所知,随便说的……
上面Shader Op/s 全部都能执行FP32 和INT/FP没啥关系
作者: lyc1976    时间: 2006-10-16 21:31
原帖由 Eji 于 2006-10-16 20:44 发表

現在G80頗像當初GF3初期跑不贏
GF2的狀況?
-------
進來幸災樂禍的我會刪喔。
紅字最好克制點。
我有幸灾乐祸吗?
我是说不应该单纯比PS能力
GF2U和GF3单纯比填充率从而得出GF3性能不济的结论是错误的吧?
这个道理同样适用G80
如果只是说G80 PS能力不强,所以认为G80很烂,那就实在是……

当然,8500的确是张好卡,只是R600能否成为第二个8500,就难说了
作者: kejiweilai    时间: 2006-10-16 21:34
原帖由 ghrs2010 于 2006-10-16 21:20 发表


会吗?我看到的是05 22000阿
当然,U是X6800@5G
对VSMark05来说的确很强
作者: jiang041111    时间: 2006-10-16 21:50
原帖由 ghrs2010 于 2006-10-16 21:20 发表


会吗?我看到的是05 22000阿
当然,U是X6800@5G
因为G80可以根据05的需求随机量身订做架构,这也算US的一个优势吧
作者: nonolovekid    时间: 2006-10-16 21:54
别放烟雾了,最最开始说超强,然后说明显不如r600,前一段说秒杀2个现在的高端卡,现在又说甚至有些地方还不如g71? 谁信啊。
nv再笨也不会2年都弄不出来个好东西吧,g70,71基本没用nv多大精力。如果两年这么大的投入都憋不出来个好东西,我都不信。
作者: cdong007    时间: 2006-10-16 21:57
原帖由 mato9999 于 2006-10-16 21:54 发表
别放烟雾了,最最开始说超强,然后说明显不如r600,前一段说秒杀2个现在的高端卡,现在又说甚至有些地方还不如g71? 谁信啊。
nv再笨也不会2年都弄不出来个好东西吧,g70,71基本没用nv多大精力。如果两年这么 ...
老大,你们都不看帖子的?
我有说G80弱?
我只说,单就算术运算能力这一个方面来讲,G80并没有想象的那么好!
作者: goupibushi    时间: 2006-10-16 22:06
怎么没看,后来Eji 大不是也说跑分不行么,我说的也是有些地方。
作者: yuanhai    时间: 2006-10-16 22:23
原帖由 mato9999 于 2006-10-16 22:06 发表
怎么没看,后来Eji 大不是也说跑分不行么,我说的也是有些地方。
这个帖子讨论的东西可不是跑分那么简单的事情
作者: lyj51018    时间: 2006-10-16 22:25
早说了分数是可以作弊的
作者: carnation    时间: 2006-10-16 22:28
原帖由 zl841226 于 2006-10-16 22:25 发表
早说了分数是可以作弊的
现在这个阶段NV还没有功夫去做这种毫无实际意义的事情
作者: bbgocccc    时间: 2006-10-16 22:29
原帖由 killpmp
2006-10-16 21:31 发表

我有幸灾乐祸吗?
我是说不应该单纯比PS能力
GF2U和GF3单纯比填充率从而得出
GF3性能不济的结论是错误的吧?
这个道理同样适用G80
如果只是说G80 PS能力不强,所以
认为G80很烂,那就实在是……

当然,8 ...
抱歉,我講的是把我發文quote起來
然後打洗耳恭聽的。
作者: 254113125    时间: 2006-10-16 22:29
原帖由 ayanamei 于 2006-10-16 22:28 发表


现在这个阶段NV还没有功夫去做这种毫无实际意义的事情
当然不是现在呀,大哥
作者: jiangtianhong    时间: 2006-10-16 22:31
一直在想g80 是256+128 还是可以直接算为384
256与128到底是什么关系呢?
作者: yyyuf    时间: 2006-10-16 22:34
一直没搞明白思考大是Pro-A还是Pro-N

借此贴问问 :)
作者: wsyxp0825    时间: 2006-10-16 22:39
原帖由 lasia 于 2006-10-16 22:34 发表
一直没搞明白思考大是Pro-A还是Pro-N

借此贴问问 :)
明显是pro-$~~~~
作者: zhdong    时间: 2006-10-16 22:43
原帖由 zl841226 于 2006-10-16 22:39 发表

明显是pro-$~~~~
中立人士
作者: sktao    时间: 2006-10-16 22:44
算了,我這樣打真的很累,我把我看到的分數打出來,剩下禮拜四放假再說。06:60xx@A64 4000+,05:138xx@E6600未超。話說ghrs看到的x6800@5G,這種時脈底下真的能跑0506?
作者: jin6659216    时间: 2006-10-16 22:47
原帖由 lasia 于 2006-10-16 22:34 发表
一直没搞明白思考大是Pro-A还是Pro-N

借此贴问问 :)
偶也不知道呀
应该是RMB FAN吧?


作者: glacierzb    时间: 2006-10-16 22:49
原帖由 Eji 于 2006-10-16 22:44 发表
算了,我這樣打真的很累,我把我看到的分數打出來,剩下禮拜四放假再說。06:60xx@A64 4000+,05:138xx@E6600未超。話說ghrs看到的x6800@5G,這種時脈底下真的能跑0506?
US本身就可以自动对应用程序做最佳化
05独特的VS/PS比例让G80或R600这种卡去是最合适了
作者: cbsmail    时间: 2006-10-16 22:50
原帖由 来不及思考 于 2006-10-16 22:47 发表
偶也不知道呀
应该是RMB FAN吧?
嬾手不见了
作者: wuqian    时间: 2006-10-16 22:50
原帖由 killpmp 于 2006-10-16 22:50 发表

嬾手不见了
我才XX岁   
作者: ironsword    时间: 2006-10-16 22:52
嗯,这样的帖子比那些纯口水帖有营养多了,

先顶起再仔细看。
作者: 52vip    时间: 2006-10-16 22:59
原帖由 killpmp 于 2006-10-16 22:50 发表

手不见了
这是..........
作者: keqiduan    时间: 2006-10-16 23:03
原帖由 R600KillG80
2006-10-16 22:46 发表


如所料也
不过保守了一点
驱动问题 本就是DX10的卡
照理來說,同等CPU的話,應該有
G71的1.35倍左右才對(宣傳)。現在
的Driver看來還蠻糟的。
作者: lzq0475    时间: 2006-10-16 23:37
原帖由 Eji 于 2006-10-16 23:03 发表

照理來說,同等CPU的話,應該有
G71的1.35倍左右才對(宣傳)。現在
的Driver看來還蠻糟的。

G80 345.6Gflops /G71 249.6Gflops  约是1.38   有些巧合阿 hoho
不过 345.6Gflops 完全是基于1TCP 16 Shader(1D ALU) 可以任意组合 FMA的无责任猜想下的推测
作者: hjt120    时间: 2006-10-16 23:39
原帖由 来不及思考 于 2006-10-16 22:49 发表


US本身就可以自动对应用程序做最佳化
05独特的VS/PS比例让G80或R600这种卡去是最合适了
2G  G80 6K
3.6G  G80 12K

????

Driver問題...
作者: gswxj888    时间: 2006-10-16 23:42
原帖由 samsung 于 2006-10-16 23:39 发表



2G  G80 6K
3.6G  G80 12K

????

Driver問題...
这两组数字里面肯定有一个是假的
作者: whitesh37    时间: 2006-10-16 23:44
原帖由 zl841226 于 2006-10-16 22:59 发表
这是..........

上次思考放出的图中他的手真的好嫩

两块卡都好YY,有点抢的冲动
不过想想G80......算啦
作者: wenlearning    时间: 2006-10-16 23:46
原帖由 killpmp 于 2006-10-16 23:44 发表

嫩啊
上次思考放出的图中他的手真的好嫩

两块卡都好YY,有点抢的冲动
不过想想G80......算啦
汗,原来是繁体字
作者: lugqiang    时间: 2006-10-16 23:47
原帖由 samsung 于 2006-10-16 23:39 发表



2G  G80 6K
3.6G  G80 12K

????

Driver問題...
可能是数据错误。
也可能是G80对CPU性能的依赖非常严重~~~~~~~~~~
作者: weishang8211    时间: 2006-10-16 23:49
原帖由 zl841226 于 2006-10-16 23:47 发表


可能是数据错误。
也可能是G80对CPU性能的依赖非常严重~~~~~~~~~~
这个是不可能的
作者: nnncai    时间: 2006-10-16 23:49
原帖由 ayanamei 于 2006-10-16 23:49 发表

这个是不可能的
所以才用
作者: zhoujin    时间: 2006-10-16 23:51
原帖由 samsung 于 2006-10-16 23:39 发表
2G  G80 6K
3.6G  G80 12K

????
Driver問題...
这么夸张?
还是3DMark06测U测得太厉害的原因?
不过CPU分数的比重也不是很多的说
难道G80目前性能的发挥真的这么依赖CPU
作者: wyhccm    时间: 2006-10-17 07:50
原帖由 ayanamei
2006-10-16 23:42 发表

这两组数字里面肯定有一个是假的
同感。不過用夠快的CPU的話,能
跑高分應該沒有疑問,因為GPU本
身的極限應該還沒到。
作者: huaboo    时间: 2006-10-17 10:47
老实说, 这样的结构真的很怪...
1D搭配MIMD, 没有co-issue, 这么多thread, 也就是说, 每个flops的开销比G71大好几倍.
真的不像nVidia的作风。
作者: real7758    时间: 2006-10-17 11:05
不过, 前阵子我和来不及思考讨论过, 对于GPU的计算能力, 有一个比较有趣的结论, 就是计算繁重的任务中, GPU的性能基本和flops无关, 而与单shader指令发射数量有关.
比如,
一个3G P4, 只有3G 指令吞吐量(SSE, 假设有co-issue), 能跑110M Ray-Triangle求交测试,
一个R580, 等效为625 x 48 = 30G吞吐, 相应结果大概是1100M.
反过来看, R580的flops高达P4的50倍。也就是说, 实际flops/性能发挥为20%左右。

其实天文数字的flops完全是MAD的结果, 实际应用中更有效的其实是CPI之类的东西。OpenRT的Ingo Wald, 在一个CELL的实际应用中的结论是, 单个SPE的性能大致和同频K8相当。而flops的差距为4倍。主要原因是x86很长一段时间没有MAD的能力。但是MAD, 理想的co-issue其实不是那么实用的。

flops/性能比的上升空间非常大, 如果G80能够提高这个比例, 那么还是完全可以期待的。
作者: xiaokan3825    时间: 2006-10-17 11:25
原帖由 Eji 于 2006-10-16 22:44 发表
算了,我這樣打真的很累,我把我看到的分數打出來,剩下禮拜四放假再說。06:60xx@A64 4000+,05:138xx@E6600未超。話說ghrs看到的x6800@5G,這種時脈底下真的能跑0506?
早就能5G跑Pi32M,很有希望能跑05、06
作者: wzhong123    时间: 2006-10-17 11:33
G80的beta驱动会不会未完成整合分成DX9,DX10两个优化版?跑0506用DX9版,跑farsis用DX10版?
作者: weiweigougou1    时间: 2006-10-17 13:16
原帖由 RacingPHT 于 2006-10-17 11:05 发表
不过, 前阵子我和来不及思考讨论过, 对于GPU的计算能力, 有一个比较有趣的结论, 就是计算繁重的任务中, GPU的性能基本和flops无关, 而与单shader指令发射数量有关.
比如,
一个3G P4, 只有3G 指令吞吐量(SSE ...
放弃一部分账面上的东西 而多一些可以切实吃到的资源么?
作者: tanglaoyatt    时间: 2006-10-17 13:21
RacingPHT 的那个测试太诡异了
6600居然只能跑跟P4 3.0相同的性能
作者: 503967305    时间: 2006-10-17 13:26
原帖由 ayanamei 于 2006-10-17 13:16 发表

放弃一部分账面上的东西 而多一些可以切实吃到的资源么?
按照现在的情报, G80每秒可以执行的指令数量高达172G, 虽然是1D指令.
如果co-issue无效(其实大多数情况就是这样), 那么G71只能执行15.6G, R580只能执行31.2G.

这个是比较有趣的.




欢迎光临 热点科技 (http://www.itheat.com/activity/) Powered by Discuz! X3.2