热点科技

标题: 昨夜好梦连连,祝各位都心平气和 好好反省自己 [打印本页]

作者: ylbo2478    时间: 2007-2-1 16:32
标题: 昨夜好梦连连,祝各位都心平气和 好好反省自己
昨夜好梦连连,祝各位都心平气和 好好反省自己
1。先说大家都关心的那个:上代旗舰R580是48/16/16/16 ATCZ ALU/TEX/COLOR/ZOUTPUT,而这代的玩意 梦中好像是 A多一点 T/C还是一样 Z么多一点
具体性能大概是这样地 并且不断优化中
2。5X Z  non-AA than R580
2。7 X FP16 blend fillrate than R580
3.9 X FP32 blend fillrate than R580
8 x FP16 filtering than R580
都是做梦 都是做梦 千万别当真
2。65UM的低档版128BITDX10显卡竟然用了GDDR4 和DIGIT PWM奢侈啊 PCB用了8层 太过分鸟
3。这代的旗舰注定用猴票版本了,即将大批量,目前没有采用更先进工艺的计划,这个也是做梦,胡扯的。
4。希望大家好好讨论,不用贬低对手,河蟹社会
作者: ssc306796813    时间: 2007-2-1 16:46
R580不存在HW的fp filtering,是采用shader执行。

过去消耗在双线性过滤的操作 数是:4 multiplies+3 adds+2 subs=9 ops x4 channels = 36 ops,不考虑存取延迟等因素,大概需要9个周期完成一个pixel的texture bi-linear filtering。

现在8倍,就是大约1个(加上存取延迟或者别的因素=两个?)周期完成,所以肯定是硬件bi-linear fp texture filtering。
作者: need    时间: 2007-2-1 16:48
rv630

dual pwm for gpu

single pwm for memory

2x256MB 128bit ddr4@B101 PCB model

rv610

single pwm for gpu

256MB/128MB 64bit ddr2@B169 PCB medel
作者: whpp    时间: 2007-2-1 16:49
原帖由 Edison 于 2007-2-1 16:46 发表
R580不存在HW的fp filtering,是采用shader执行。

过去消耗在双线性过滤的操作 数是:4 multiplies+3 adds+2 subs=9 ops x4 channels = 36 ops,大概需要9个周期完成一个pixel的texture bi-linear filtering ...
这么一说,R5XX的FP16 HDR AA是用shader方式实现的?我以前听Eji也是这么一说的,请教请教
作者: tomblack    时间: 2007-2-1 16:49
快上市了,不用做梦了
原帖由 催化剂 于 2007-2-1 16:48 发表
rv630

dual pwm for gpu

single pwm for memory

2x256MB 128bit ddr4@B101 PCB model

rv610

single pwm for gpu

256MB/128MB 64bit ddr2@B169 PCB medel
这个够可以的
作者: smogcn    时间: 2007-2-1 16:49
我看是有小道消息但不放心随便说出来所以托梦吧
作者: yong880    时间: 2007-2-1 16:50
原帖由 催化剂 于 2007-2-1 16:48 发表
rv630

dual pwm for gpu

single pwm for memory

2x256MB 128bit ddr4@B101 PCB model

rv610

single pwm for gpu

256MB/128MB 64bit ddr2@B169 PCB medel
和G86/84一样的MC位宽
作者: coolhd    时间: 2007-2-1 16:51
原帖由 phk 于 2007-2-1 16:49 发表


这么一说,R5XX的FP16 HDR AA是用shader方式实现的?我以前听Eji也是这么一说的,请教请教
用Shader 作filter
作者: pengjia2010    时间: 2007-2-1 16:57
催化剂童子估计是AIB厂商地,因为63/61已放出来了,哈哈 不过泻小米要泻的有艺术,不要被AMD抓住辫子,小心为妙
催童子看不到新旗舰地GERBER和SPEC,我这有,哪天私下探讨,哈
俺是奉旨泄密,没关系
作者: jyguofan    时间: 2007-2-1 17:02
提示: 作者被禁止或删除 内容自动屏蔽
作者: 344375655    时间: 2007-2-1 17:06
GDDR4 是YY的
DPWM大批量买是有特惠的,实在不行就买NEXSEM和INTERSIL的货 便宜啊
真正大批量上市的肯定是各厂想方设法COST DOWN的版本
作者: chenlei0214    时间: 2007-2-1 17:06
从z roll-out能力来看,我认为这里的x是在812MHz上衡量的理论值。

R580的架构是16个render back-end,每个可以做到2 Zixel per cycle。

R580@650MHz的zixel roll out能力就是 16*2*650MHz=20800M zixle/second。

5倍就是20800*5=104000M zixle/second。

DX10的要求是做到8RT的MRT能力,假设R600具备8 Zixel per cycle的能力,per back end的Z-roll out能力就是,104000M zixle/second /8 = 13000M zixle/second。

这个时候,有16、24、32 render back end的选择。。

13000/16=812MHz
13000/24=541MHz
13000/32=406MHz

根据之前的报道,R600不可能低于700MHz的规格,可以估计出这里衡量的R600峰值规格应该是在812MHz*16(8 Zixel per cycle)或者812MHz*32(4 Zixel per cycle)的水平。


修正:

从z roll-out能力来看,我认为这里的x是在812MHz上衡量的理论值。

R580的架构是16个render back-end,non-AA的时候每个可以做到1 Zixel per cycle。

R580@650MHz的zixel roll out能力就是:16*1*650MHz=10400M zixle/second。

2.5倍就是10400M*2.5=26000M zixle/second。

DX10的要求是做到8RT的MRT能力,假设R600具备8 Zixel per cycle的能力,per back end的Z-roll out能力就是,26000M zixle/second /8 = 3250M zixle/second;倘若是4 Zixel per cycle,就是6500M zixle/second;倘若是2 Zixel per second,就是13000M zixle/second。

这个时候,有16、24、32 render back end的选择。。

noAA render back-end的能力为1 zixels per second、render back-end为32时的频率:26000/32= 812 MHz
noAA render back-end的能力为1 zixels per second、render back-end为16时的频率:26000/16= 1625 MHz
noAA render back-end的能力为1 zixels per second、render back-end为24时的频率:13000/24= 1083 MHz

noAA render back-end的能力为2 zixels per second、render back-end为32时的频率:13000/32= 406MHz
noAA render back-end的能力为2 zixels per second、render back-end为16时的频率:13000/16= 812MHz
noAA render back-end的能力为2 zixels per second、render back-end为24时的频率:13000/24= 542MHz

noAA render back-end的能力为4 zixels per second、render back-end为32时的频率:6500/16= 203MHz
noAA render back-end的能力为4 zixels per second、render back-end为16时的频率:6500/16= 406MHz
noAA render back-end的能力为4 zixels per second、render back-end为24时的频率:6500/24= 271MHz


根据之前的报道,R600不可能低于700MHz的规格,可以估计出这里衡量的R600峰值规格应该是在812MHz*32(1 Zixel per cycle)、812MHz*16(2 Zixel per cycle)的水平。

作者: ayta    时间: 2007-2-1 17:09
原帖由 kidding 于 2007-2-1 17:06 发表
GDDR4 是YY的
DPWM大批量买是有特惠的,实在不行就买NEXSEM和INTERSIL的货 便宜啊
真正大批量上市的肯定是各厂想方设法COST DOWN的版本
发布日期具体说说啊
作者: alongskin    时间: 2007-2-1 17:12
G84

dual pwm for gpu

single pwm for memory

2x256MB 128bit ddr3@P40x PCB model
作者: hhyhhy790    时间: 2007-2-1 17:27
CHO童子猜得真满准地,哈
催童子猜测能力更可观,把PCB编号的个位数都猜对了 不改行做6合彩真可惜
作者: starck    时间: 2007-2-1 17:31
原帖由 kidding 于 2007-2-1 17:27 发表
CHO童子猜得真满准地,哈
催童子猜测能力更可观,把PCB编号的个位数都猜对了 不改行做6合彩真可惜
老编之前报导双G说法,不攻自破
作者: aa123bb    时间: 2007-2-1 17:32
ELWIN童子 我这些消息都是听NV的童子说的 不知道准不准
作者: dnntgerm    时间: 2007-2-1 17:35
破双G是没问题的,关键是良率控制在多少,这个P童子不要抓住别人辫子不放,一旦到65后猴版的600都有破G的版本鸟

作者: asp    时间: 2007-2-1 17:49
原帖由 kidding 于 2007-2-1 17:35 发表
破双G是没问题的,关键是良率控制在多少,这个P童子不要抓住别人辫子不放,一旦到65后猴版的600都有破G的版本鸟
65nm的代号不叫R600
作者: longe    时间: 2007-2-1 17:58
1。所以俺说猴版的600
2。NIWEI童子的预测好像和NV透露的不太一样
作者: 273531523    时间: 2007-2-1 19:50
G84的PCB莫非是P406?
之前有报道暗示了
作者: lilongya    时间: 2007-2-1 20:27
只能来支持 看不懂
作者: DIYtsj    时间: 2007-2-1 20:32
这梦怎么不再梦得具体点?
作者: heevip    时间: 2007-2-1 20:47
进来学习一下
作者: haibo38    时间: 2007-2-1 20:48
第一步由RV570走出
作者: plumbear    时间: 2007-2-1 20:57
原帖由 来不及思考 于 2007-2-1 20:48 发表
第一步由RV570走出
这是什么意思?
作者: 11111111az    时间: 2007-2-1 21:00
原帖由 大死人花 于 2007-2-1 20:57 发表

这是什么意思?
RV570的Double-Z
作者: kinseysun    时间: 2007-2-1 21:26
前面的算法可能有些问题。

non-AA的时候R580XTX实际测试是10.199 GPix/s,5倍就是50.995 GZix/s=50995M Zixel/s。

32 render back-end:50995M/s / 32 R-BE = 1593.59375M /s,这个时候的Render back-end数应该是2 zixels/cycle,频率是797MHz。

16 render back-end:50995M/s / 16 R-BE = 3187.1875M /s,这个时候的Render back-end数应该是4 zixels/cycle,频率同样是797MHz。

基本上,以这些资料看,R600的规格在800MHz正负5% 。

G80GTX实际测试是69.407 GPix/s z only (fw 96.94)。


见12楼修正
作者: haibing9616    时间: 2007-2-1 21:26
看过很多测试,采用DDR4的1950xtx的确比DDR3的1900xtx快一点,可要是除去核心频率的不同,两者的差距并没有想象中的那么明显。再加上DDR4的价格……中低端采用DDR4怎么有点像自杀行为……
作者: wrs1301    时间: 2007-2-1 21:32
G80是8 Z/cyc
不过Stencil吞吐效率相比GX7无任何进步
作者: fengvx    时间: 2007-2-1 21:38
原帖由 clockrun 于 2007-2-1 21:26 发表
看过很多测试,采用DDR4的1950xtx的确比DDR3的1900xtx快一点,可要是除去核心频率的不同,两者的差距并没有想象中的那么明显。再加上DDR4的价格……中低端采用DDR4怎么有点像自杀行为……
为什么这样说呢?

128bit 2GHz的成本说不定和266bit 1.2GHz的成本差不多甚至更低。
作者: soso2001    时间: 2007-2-1 22:11
现在DDR4的产量应该还比不上DDR3吧,价格应该也偏高。所以性价比不是很高啊……
不过要是把2Ghz起跳的DDR4用在中低端上面,还是有点看头的……至于高端顶级之类的,只能算是锦上添花了吧
作者: gzp82    时间: 2007-2-1 22:15
4颗GDDR4的价格要比8颗GDDR3便宜,厂商订内存的时候,颗粒数是最大的成本指标,远高于频率。
作者: xwwstar    时间: 2007-2-1 22:56
提示: 作者被禁止或删除 内容自动屏蔽
作者: dnmmq9471    时间: 2007-2-1 23:04
ic数只是成本之一,PCB呢?128bit和256-bit相差不少了。
作者: discover7    时间: 2007-2-2 02:25
近来病缠身,无料可暴……不过你们一过1月31日就暴显然不太HD吧……虽然说卡延期这个1.31的期限没改可也不至于……
作者: road007    时间: 2007-2-2 08:43
连低端的版本都要8层PCB 太奢侈了
作者: szbkad    时间: 2007-2-2 10:53
既然8层PCB,为什么还64BIT呢?
作者: hanjiqiu    时间: 2007-2-2 11:22
GDDR4  16*32现在价格还远高于10美元
而16*32的GDDR3大概6美元多
8*32的GDDR3是3美元多
CHO认为哪种方案便宜呢 ?哈
作者: canipass    时间: 2007-2-2 13:29
原帖由 kidding 于 2007-2-2 11:22 发表
GDDR4  16*32现在价格还远高于10美元
而16*32的GDDR3大概6美元多
8*32的GDDR3是3美元多
CHO认为哪种方案便宜呢 ?哈
这得看频率吧,不一样的频率,价格可不是这么比的
作者: pztvlzy    时间: 2007-2-2 13:35
原帖由 zzhang 于 2007-2-2 13:29 发表

这得看频率吧,不一样的频率,价格可不是这么比的
你头像看到就吓死人滴
作者: 17737    时间: 2007-2-2 17:08
楼主的梦未免太长了吧
作者: DJLIU123    时间: 2007-2-2 23:18
原帖由 kidding 于 2007-2-2 11:22 发表
GDDR4  16*32现在价格还远高于10美元
而16*32的GDDR3大概6美元多
8*32的GDDR3是3美元多
CHO认为哪种方案便宜呢 ?哈
4*32 DDR4和8*32 DDR3那个便宜呢
作者: m6327702    时间: 2007-2-3 14:02
DDR4 没有4x32的规格
作者: jyq2311663    时间: 2007-2-3 14:24
原帖由 Edison 于 2007-2-1 16:46 发表
R580不存在HW的fp filtering,是采用shader执行。

过去消耗在双线性过滤的操作 数是:4 multiplies+3 adds+2 subs=9 ops x4 channels = 36 ops,不考虑存取延迟等因素,大概需要9个周期完成一个pixel的textu ...


原来如此哇
CHO的话记住了




欢迎光临 热点科技 (http://www.itheat.com/activity/) Powered by Discuz! X3.2