热点科技

标题: 昨夜好梦连连，祝各位都心平气和好好反省自己 [打印本页]

作者: ylbo2478 时间: 2007-2-1 16:32
标题: 昨夜好梦连连，祝各位都心平气和好好反省自己
昨夜好梦连连，祝各位都心平气和好好反省自己
1。先说大家都关心的那个：上代旗舰R580是48/16/16/16 ATCZ ALU/TEX/COLOR/ZOUTPUT，而这代的玩意梦中好像是 A多一点 T/C还是一样 Z么多一点
具体性能大概是这样地并且不断优化中
2。5X Z non-AA than R580
2。7 X FP16 blend fillrate than R580
3.9 X FP32 blend fillrate than R580
8 x FP16 filtering than R580
都是做梦都是做梦千万别当真
2。65UM的低档版128BITDX10显卡竟然用了GDDR4 和DIGIT PWM奢侈啊 PCB用了8层太过分鸟
3。这代的旗舰注定用猴票版本了，即将大批量，目前没有采用更先进工艺的计划，这个也是做梦，胡扯的。
4。希望大家好好讨论，不用贬低对手，河蟹社会

作者: ssc306796813 时间: 2007-2-1 16:46
R580不存在HW的fp filtering，是采用shader执行。

过去消耗在双线性过滤的操作数是：4 multiplies+3 adds+2 subs=9 ops x4 channels = 36 ops，不考虑存取延迟等因素，大概需要9个周期完成一个pixel的texture bi-linear filtering。

现在8倍，就是大约1个（加上存取延迟或者别的因素=两个？）周期完成，所以肯定是硬件bi-linear fp texture filtering。

作者: need 时间: 2007-2-1 16:48
rv630

dual pwm for gpu

single pwm for memory

2x256MB 128bit ddr4@B101 PCB model

rv610

single pwm for gpu

256MB/128MB 64bit ddr2@B169 PCB medel

作者: whpp 时间: 2007-2-1 16:49

原帖由 Edison 于 2007-2-1 16:46 发表
R580不存在HW的fp filtering，是采用shader执行。

过去消耗在双线性过滤的操作数是：4 multiplies+3 adds+2 subs=9 ops x4 channels = 36 ops，大概需要9个周期完成一个pixel的texture bi-linear filtering ...

这么一说，R5XX的FP16 HDR AA是用shader方式实现的？我以前听Eji也是这么一说的，请教请教

作者: tomblack 时间: 2007-2-1 16:49
快上市了，不用做梦了

原帖由 催化剂 于 2007-2-1 16:48 发表
rv630

dual pwm for gpu

single pwm for memory

2x256MB 128bit ddr4@B101 PCB model

rv610

single pwm for gpu

256MB/128MB 64bit ddr2@B169 PCB medel

这个够可以的

作者: smogcn 时间: 2007-2-1 16:49
我看是有小道消息但不放心随便说出来所以托梦吧

作者: yong880 时间: 2007-2-1 16:50

原帖由 催化剂 于 2007-2-1 16:48 发表
rv630

dual pwm for gpu

single pwm for memory

2x256MB 128bit ddr4@B101 PCB model

rv610

single pwm for gpu

256MB/128MB 64bit ddr2@B169 PCB medel

和G86/84一样的MC位宽

作者: coolhd 时间: 2007-2-1 16:51

原帖由 phk 于 2007-2-1 16:49 发表

这么一说，R5XX的FP16 HDR AA是用shader方式实现的？我以前听Eji也是这么一说的，请教请教

用Shader 作filter

作者: pengjia2010 时间: 2007-2-1 16:57
催化剂童子估计是AIB厂商地，因为63/61已放出来了，哈哈不过泻小米要泻的有艺术，不要被AMD抓住辫子，小心为妙
催童子看不到新旗舰地GERBER和SPEC，我这有，哪天私下探讨，哈
俺是奉旨泄密，没关系

作者: jyguofan 时间: 2007-2-1 17:02
提示: 作者被禁止或删除内容自动屏蔽

作者: 344375655 时间: 2007-2-1 17:06
GDDR4 是YY的
DPWM大批量买是有特惠的，实在不行就买NEXSEM和INTERSIL的货便宜啊
真正大批量上市的肯定是各厂想方设法COST DOWN的版本

作者: chenlei0214 时间: 2007-2-1 17:06
从z roll-out能力来看，我认为这里的x是在812MHz上衡量的理论值。

R580的架构是16个render back-end，每个可以做到2 Zixel per cycle。

R580@650MHz的zixel roll out能力就是 16*2*650MHz=20800M zixle/second。

5倍就是20800*5=104000M zixle/second。

DX10的要求是做到8RT的MRT能力，假设R600具备8 Zixel per cycle的能力，per back end的Z-roll out能力就是，104000M zixle/second /8 = 13000M zixle/second。

这个时候，有16、24、32 render back end的选择。。

13000/16=812MHz
13000/24=541MHz
13000/32=406MHz

根据之前的报道，R600不可能低于700MHz的规格，可以估计出这里衡量的R600峰值规格应该是在812MHz*16(8 Zixel per cycle)或者812MHz*32(4 Zixel per cycle)的水平。

修正：

从z roll-out能力来看，我认为这里的x是在812MHz上衡量的理论值。

R580的架构是16个render back-end，non-AA的时候每个可以做到1 Zixel per cycle。

R580@650MHz的zixel roll out能力就是：16*1*650MHz=10400M zixle/second。

2.5倍就是10400M*2.5=26000M zixle/second。

DX10的要求是做到8RT的MRT能力，假设R600具备8 Zixel per cycle的能力，per back end的Z-roll out能力就是，26000M zixle/second /8 = 3250M zixle/second；倘若是4 Zixel per cycle，就是6500M zixle/second；倘若是2 Zixel per second，就是13000M zixle/second。

这个时候，有16、24、32 render back end的选择。。

noAA render back-end的能力为1 zixels per second、render back-end为32时的频率：26000/32= 812 MHz
noAA render back-end的能力为1 zixels per second、render back-end为16时的频率：26000/16= 1625 MHz
noAA render back-end的能力为1 zixels per second、render back-end为24时的频率：13000/24= 1083 MHz

noAA render back-end的能力为2 zixels per second、render back-end为32时的频率：13000/32= 406MHz
noAA render back-end的能力为2 zixels per second、render back-end为16时的频率：13000/16= 812MHz
noAA render back-end的能力为2 zixels per second、render back-end为24时的频率：13000/24= 542MHz

noAA render back-end的能力为4 zixels per second、render back-end为32时的频率：6500/16= 203MHz
noAA render back-end的能力为4 zixels per second、render back-end为16时的频率：6500/16= 406MHz
noAA render back-end的能力为4 zixels per second、render back-end为24时的频率：6500/24= 271MHz

根据之前的报道，R600不可能低于700MHz的规格，可以估计出这里衡量的R600峰值规格应该是在812MHz*32(1 Zixel per cycle)、812MHz*16(2 Zixel per cycle)的水平。

作者: ayta 时间: 2007-2-1 17:09

原帖由 kidding 于 2007-2-1 17:06 发表
GDDR4 是YY的
DPWM大批量买是有特惠的，实在不行就买NEXSEM和INTERSIL的货便宜啊
真正大批量上市的肯定是各厂想方设法COST DOWN的版本

发布日期具体说说啊

作者: alongskin 时间: 2007-2-1 17:12
G84

dual pwm for gpu

single pwm for memory

2x256MB 128bit ddr3@P40x PCB model

作者: hhyhhy790 时间: 2007-2-1 17:27

CHO童子猜得真满准地，哈
催童子猜测能力更可观，把PCB编号的个位数都猜对了不改行做6合彩真可惜

作者: starck 时间: 2007-2-1 17:31

原帖由 kidding 于 2007-2-1 17:27 发表
CHO童子猜得真满准地，哈
催童子猜测能力更可观，把PCB编号的个位数都猜对了不改行做6合彩真可惜

老编之前报导双G说法，不攻自破

作者: aa123bb 时间: 2007-2-1 17:32
ELWIN童子我这些消息都是听NV的童子说的不知道准不准

作者: dnntgerm 时间: 2007-2-1 17:35
破双G是没问题的，关键是良率控制在多少，这个P童子不要抓住别人辫子不放，一旦到65后猴版的600都有破G的版本鸟

作者: asp 时间: 2007-2-1 17:49

原帖由 kidding 于 2007-2-1 17:35 发表
破双G是没问题的，关键是良率控制在多少，这个P童子不要抓住别人辫子不放，一旦到65后猴版的600都有破G的版本鸟

65nm的代号不叫R600

作者: longe 时间: 2007-2-1 17:58
1。所以俺说猴版的600
2。NIWEI童子的预测好像和NV透露的不太一样

作者: 273531523 时间: 2007-2-1 19:50
G84的PCB莫非是P406？
之前有报道暗示了

作者: lilongya 时间: 2007-2-1 20:27

只能来支持看不懂

作者: DIYtsj 时间: 2007-2-1 20:32
这梦怎么不再梦得具体点？

作者: heevip 时间: 2007-2-1 20:47
进来学习一下

作者: haibo38 时间: 2007-2-1 20:48
第一步由RV570走出

作者: plumbear 时间: 2007-2-1 20:57

原帖由 来不及思考 于 2007-2-1 20:48 发表
第一步由RV570走出

这是什么意思？

作者: 11111111az 时间: 2007-2-1 21:00

原帖由 大死人花 于 2007-2-1 20:57 发表

这是什么意思？

RV570的Double-Z

作者: kinseysun 时间: 2007-2-1 21:26
前面的算法可能有些问题。

non-AA的时候R580XTX实际测试是10.199 GPix/s，5倍就是50.995 GZix/s=50995M Zixel/s。

32 render back-end：50995M/s / 32 R-BE = 1593.59375M /s，这个时候的Render back-end数应该是2 zixels/cycle，频率是797MHz。

16 render back-end：50995M/s / 16 R-BE = 3187.1875M /s，这个时候的Render back-end数应该是4 zixels/cycle，频率同样是797MHz。

基本上，以这些资料看，R600的规格在800MHz正负5% 。

G80GTX实际测试是69.407 GPix/s z only (fw 96.94)。

见12楼修正

作者: haibing9616 时间: 2007-2-1 21:26
看过很多测试，采用DDR4的1950xtx的确比DDR3的1900xtx快一点，可要是除去核心频率的不同，两者的差距并没有想象中的那么明显。再加上DDR4的价格……中低端采用DDR4怎么有点像自杀行为……

作者: wrs1301 时间: 2007-2-1 21:32
G80是8 Z/cyc
不过Stencil吞吐效率相比GX7无任何进步

作者: fengvx 时间: 2007-2-1 21:38

原帖由 clockrun 于 2007-2-1 21:26 发表
看过很多测试，采用DDR4的1950xtx的确比DDR3的1900xtx快一点，可要是除去核心频率的不同，两者的差距并没有想象中的那么明显。再加上DDR4的价格……中低端采用DDR4怎么有点像自杀行为……

为什么这样说呢？

128bit 2GHz的成本说不定和266bit 1.2GHz的成本差不多甚至更低。

作者: soso2001 时间: 2007-2-1 22:11
现在DDR4的产量应该还比不上DDR3吧，价格应该也偏高。所以性价比不是很高啊……
不过要是把2Ghz起跳的DDR4用在中低端上面，还是有点看头的……至于高端顶级之类的，只能算是锦上添花了吧

作者: gzp82 时间: 2007-2-1 22:15
4颗GDDR4的价格要比8颗GDDR3便宜，厂商订内存的时候，颗粒数是最大的成本指标，远高于频率。

作者: xwwstar 时间: 2007-2-1 22:56
提示: 作者被禁止或删除内容自动屏蔽

作者: dnmmq9471 时间: 2007-2-1 23:04
ic数只是成本之一，PCB呢？128bit和256-bit相差不少了。

作者: discover7 时间: 2007-2-2 02:25

近来病缠身，无料可暴……不过你们一过1月31日就暴显然不太HD吧……虽然说卡延期这个1.31的期限没改可也不至于……

作者: road007 时间: 2007-2-2 08:43
连低端的版本都要8层PCB 太奢侈了

作者: szbkad 时间: 2007-2-2 10:53
既然8层PCB，为什么还64BIT呢？

作者: hanjiqiu 时间: 2007-2-2 11:22
GDDR4 16*32现在价格还远高于10美元
而16*32的GDDR3大概6美元多
8*32的GDDR3是3美元多
CHO认为哪种方案便宜呢？哈

作者: canipass 时间: 2007-2-2 13:29

原帖由 kidding 于 2007-2-2 11:22 发表
GDDR4 16*32现在价格还远高于10美元
而16*32的GDDR3大概6美元多
8*32的GDDR3是3美元多
CHO认为哪种方案便宜呢？哈

这得看频率吧，不一样的频率，价格可不是这么比的

作者: pztvlzy 时间: 2007-2-2 13:35

原帖由 zzhang 于 2007-2-2 13:29 发表

这得看频率吧，不一样的频率，价格可不是这么比的

你头像看到就吓死人滴

作者: 17737 时间: 2007-2-2 17:08
楼主的梦未免太长了吧

作者: DJLIU123 时间: 2007-2-2 23:18

原帖由 kidding 于 2007-2-2 11:22 发表
GDDR4 16*32现在价格还远高于10美元
而16*32的GDDR3大概6美元多
8*32的GDDR3是3美元多
CHO认为哪种方案便宜呢？哈

4*32 DDR4和8*32 DDR3那个便宜呢

作者: m6327702 时间: 2007-2-3 14:02
DDR4 没有4x32的规格

作者: jyq2311663 时间: 2007-2-3 14:24

原帖由 Edison 于 2007-2-1 16:46 发表
R580不存在HW的fp filtering，是采用shader执行。

过去消耗在双线性过滤的操作数是：4 multiplies+3 adds+2 subs=9 ops x4 channels = 36 ops，不考虑存取延迟等因素，大概需要9个周期完成一个pixel的textu ...

哦

原来如此哇
CHO的话记住了

欢迎光临热点科技 (http://www.itheat.com/activity/)