用户
 找回密码
 立即注册
搜索

关于G80 shader performance的疑问

[复制链接]
发表于 2006-10-16 19:22:00
原帖由 来不及思考 于 2006-10-16 14:39 发表


我暂时只能认为,Mark06双方都在扯谈
从现在已经曝光的一些消息来看,R600也根本没把重点放在增加ALU能力上
Geforce 3和Geforce 2 Ultra相比......
两者的规格很多人应该很清楚的吧
使用道具 举报 回复 支持 反对
发表于 2006-10-16 19:23:00
原帖由 来不及思考 于 2006-10-16 14:05 发表
传闻中每个Shader Unit的执行能力为1D,这样只能单周期ADD/MUL
而G71每个Shader Unit就有两个能4D/3D+1D/2D+2D的ALU,每个都能FMA,一共算下来单周期吞吐到16FLops
就算算上频率的巨大差别,打散的1D array执行效 ...
难道NV觉得G80每个shader unit 执行能力为1D的结构要好过G71 的 4D/3D+1D/2D+1D?
使用道具 举报 回复 支持 反对
发表于 2006-10-16 19:27:00
原帖由 XDR3 于 2006-10-16 19:23 发表


G80为什么每个shader unit的执行能力为1D呢? 为何不延续G71中的4D/3D+1D/2D+3D呢?难道NV有什么秘密?
老大....
你提问前至少先对状况有个大概的了解啊 #
使用道具 举报 回复 支持 反对
发表于 2006-10-16 19:29:00
原帖由 来不及思考 于 2006-10-16 19:27 发表


老大....
你提问前至少先对状况有个大概的了解啊 #
我只是不理解NV为什么要把原先成熟的结构做那么大的改动?
使用道具 举报 回复 支持 反对
发表于 2006-10-16 19:30:00
原帖由 Eji 于 2006-10-16 18:48 发表

好像是16ALU內可以任意結合,
跑FMA吧。
-----------------------------
不過剛剛看到數字了,DX9超慘
@-@。
洗耳恭听
使用道具 举报 回复 支持 反对
发表于 2006-10-16 19:41:00
原帖由 Eji 于 2006-10-16 18:48 发表

好像是16ALU內可以任意結合,
跑FMA吧。
-----------------------------
不過剛剛看到數字了,DX9超慘
@-@。
G80跑DX9超惨?
使用道具 举报 回复 支持 反对
发表于 2006-10-16 19:48:00
再惨也不会比G71差
使用道具 举报 回复 支持 反对
发表于 2006-10-16 20:01:00
原帖由 XDR3 于 2006-10-16 19:29 发表


我只是不理解NV为什么要把原先成熟的结构做那么大的改动?
打个广告
06年微型机算计11月上,应该有类似文章,具体怎么样就不知道了
使用道具 举报 回复 支持 反对
发表于 2006-10-16 20:33:00
原帖由 来不及思考 于 2006-10-16 14:11 发表
128*1*1350
24*4*2*650
单看ALU指标,提升确实少得可怜
我怎么感觉应该是G71 24*4*2*2 *650  249.6Gflops的样子
r520  48*(4*2+4) *650  374.4Gflops

G80 每个Shader只能做1D MUL/ADD?
使用道具 举报 回复 支持 反对
发表于 2006-10-16 20:36:00
原帖由 anglelo
2006-10-16 19:48 发表
再惨也不会比G71差
可能是Driver有關係,現在AIC手上
的卡,05,06跑起來都和G71差不
多,無視記憶體頻寬G80明明比較
大的狀況,所以看來兩邊在XP底下
都有問題。

現在G80核心時脈是已經降到比G71
還低了,不過記憶體頻寬至少還比
較大.....所以很怪。
使用道具 举报 回复 支持 反对
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则