原帖由 jhj9 于 2006-6-29 11:16 发表
A记爱好者s恐怕对这些根本就不屑一顾,这些根本就用不到的U的性能对比再怎么样也无关痛痒。
因为他们fan的好产品,自己能买到用到的东西,而不是幼稚的单纯fan品牌,fan这个品牌下的自己用不到的东西且拼命拿这些 ...
原帖由 xywarii 于 2006-6-29 11:34 发表
A记爱好者里头有一多半好像都喜欢引fx的成绩吧
原帖由 jhj9 于 2006-6-29 11:37 发表
那是因为很多测试都喜欢用默认频率来对比。
而很多用A U的都是超到2.7G以上的,他们想要知道手里的U超频后能和什么对手作对比,当然只能以FX的默认成绩来参考。比如那些用着2.7G OP165,甚至3G OP165的,不用 ...
原帖由 jhj9 于 2006-6-29 11:16 发表
A记爱好者s恐怕对这些根本就不屑一顾,这些根本就用不到的U的性能对比再怎么样也无关痛痒。
因为他们fan的好产品,自己能买到用到的东西,而不是幼稚的单纯fan品牌,fan这个品牌下的自己用不到的东西且拼命拿这些 ...
原帖由 Edison 于 2006-6-29 11:50 发表
Intel的人向PathScale EKOPath投降了![]()
原帖由 Edison 于 2006-6-29 11:53 发表
ICC 9.1里提供了QxT,怎么说不知道Core2的存在呢?
原帖由 hopetoknow2 于 2006-6-29 12:09 发表
这里没有用QxT
http://www.spec.org/osg/cpu2000/ ... 20060612-06166.html
QxT可能是最新的v9.1开始. 原来的9.1好像还没有
原帖由 还在读童话 于 2006-6-29 12:13 发表
不是说扣肉在64位下的性能提升相当有限吗?
原帖由 Edison 于 2006-6-29 12:31 发表
我从7.x的就开始不断收集intel compiler,9.1的最大改进就是Core2的支持,第一个公开的bulid旧有QxT,之前我在讨论区就发表过这个信息了。
9.1的-fast优化选项集的-qx是-QxP,-QxT不是默认选项,用户可以自 ...
原帖由 RacingPHT 于 2006-6-29 15:15 发表
ICC也有比MSC慢不少的时候。
原帖由 RacingPHT 于 2006-6-29 11:21 发表
Xeon processor 5160 貌似还没"FXxx"贵。
FXxx的价钱确实很Fxxx.
原帖由 hopetoknow2 于 2006-6-29 15:16 发表
正确使用,一般不会吧?
原帖由 RacingPHT 于 2006-6-29 15:22 发表
最慢的是以前测过一个程序,CPU是P4 3.0C,ICC9.0比MSC慢2x%。当然那个程序优化得比较烂(主要是跳转),只能说ICC对质量不高的代码的适应力不一定如MSC强。
Quake3差别不是特别大。印象中ICC稍快一点。
原帖由 hopetoknow2 于 2006-6-29 15:27 发表
上编译参数
原帖由 RacingPHT 于 2006-6-29 15:30 发表
重做了系统,现在机器没有ICC了,没办法马上给你。
ICC编译参数是在ICC9.0 for VC 7.1 IDE环境下设置的。
原帖由 Edison 于 2006-6-29 12:59 发表
Montecito的整数性能也不赖,同频性能比较接近Conroe了(输16%):
CPU: Itanium 2 Processor 9050 1600 MHz FSB 533MHz
SPECint2000 = 1474
SPECint_base2000 = 1474
http://www.spec.org/ ...
原帖由 hopetoknow2 于 2006-6-29 15:36 发表
建议考虑一下用用FDO方式
原帖由 Edison 于 2006-6-29 15:42 发表
不会是拿了ICC的debug和MSC的release来比较吧。
原帖由 RacingPHT 于 2006-6-29 15:48 发表
确实当时只是一个简单编译测试,没有尝试FDO这样的优化,对ICC的观点当然很不全面
顺便说的我自己也遇到过ICC比MSC快几十倍的情况,不过应该是P4的特殊情况。
但是编译器开启一些高级优化选项反而速度 ...
原帖由 hopetoknow2 于 2006-6-29 15:55 发表
如果你觉得有点烦, 最简单, 不考虑太多,P4C可以先用用最简单的方式-QxN -Qipo -O3,加上FDO或者不加FDO,来试一试。
原帖由 ArkShElL 于 2006-6-29 11:04 发表
堪称x86的奇迹啊![]()
原帖由 Edison 于 2006-6-29 17:20 发表
RacingPHT,能发来让我跑跑吗?^^
原帖由 hopetoknow2 于 2006-6-29 11:00 AM 发表
上次我说在EM64T下, Core的浮点性能还有很大空间,预计浮点性能Specfp2000达到2900以上没有问题。
Core不仅实现了单周期吞吐的128位SIMD浮点指令,同时实现了目前x86处理器最高的浮点吞吐能力和最高的浮点执行效 ...
原帖由 complexmind 于 2006-6-29 20:30 发表
其实在很多方面X86要比RISC好的多
我当然不是指某些用不到的测试工具![]()
原帖由 RacingPHT 于 2006-6-29 15:22 发表
最慢的是以前测过一个程序 当然那个程序优化得比较烂(主要是跳转)
原帖由 Edison 于 2006-6-29 23:05 发表
K8的分支预测器的确很烂,连PIII都不如,使用分支偏重的测试出现1/2的性能不是什么奇怪的事情。
原帖由 hopetoknow2 于 2006-6-29 22:30 发表
既然主要是跳转, 分支很多的程序,应该是对P4很不利的测试
为什么P4E还很强? K8 2500+ 1.4G耗时221.1秒
而P4E 3200M才124秒? 看样子K8 3200+都跑不过P4E了。
在对K8有利而P4最不利的测试中,K8连同PR的 ...
原帖由 RacingPHT 于 2006-6-30 09:50 发表
分支比较多,那个程序是一个视频codec,按照Intel的P4优化建议,Block matching应该使用SSE2暴力算法, 避免中途退出这样的取巧。我那个程序并没有刻意这样优化。
另外codec的特点是小整数运算比较多, ICC ...
原帖由 hopetoknow2 于 2006-6-30 09:54 发表
什么叫做SSE2暴力算法?
原帖由 hopetoknow2 于 2006-6-30 10:54 发表
Some algorithms use an “early return” threshold.
没啥暴力的啊? 不就是, 最好使用非跳转的指令,而少用分支来解决问题吗? 对所有A或I都一样很有用啊。
这就叫做聪明反被聪明误, 一些采用“early ret ...
原帖由 RacingPHT 于 2006-6-30 11:21 发表
?
比如查找一个电话号码, 明明已经找到了, 却要坚持把号码本翻完吗?
明知道不需要计算的东西, 却还要坚持计算完, 不有些暴力的感觉么.
事实上, 在P4之前, 这一直是一个优化手段, 往往可以提高100%的速度.
原帖由 hopetoknow2 于 2006-6-30 11:56 发表
这是P3就... (对I和A都通用的,一种原则, 谁说是专门为P4呢?)
The second step in speedup of the ME algorithm came with the introduction of the Pentium® III
processor with SSE and specifically w ...
原帖由 hopetoknow2 于 2006-6-29 10:23 PM 发表
兼容性x86好一些。 而x86中的Core能强到如此地步, 还是极有成就的。
你说这些话是建立在什么基础上的, 你发现什么即可以在x86上执行又可以在RISC上执行的测试工具? 而且是更有用和公平的测试手段?
原帖由 RacingPHT 于 2006-6-30 11:21 发表
?
比如查找一个电话号码, 明明已经找到了, 却要坚持把号码本翻完吗?
明知道不需要计算的东西, 却还要坚持计算完, 不有些暴力的感觉么.
事实上, 在P4之前, 这一直是一个优化手段, 往往可以提高100%的速度.
原帖由 Tanknet 于 2006-7-2 11:03 发表
哪里需要Branch了?
abs(eax)
mov ebx,eax
neg ebx
cmp eax,0
cmovl eax,ebx
不就可以拉
原帖由 Prescott 于 2006-7-2 12:30 发表
本来就只有16条指令就能完成的小loop,16个cycle,每个Cycle之后都要判断一下是不是已经过了阈值然后决定是不是break,还真不如算完算了。
原帖由 Edison 于 2006-6-29 11:05 PM 发表
K8的分支预测器的确很烂,连PIII都不如,使用分支偏重的测试出现1/2的性能不是什么奇怪的事情。
原帖由 ambition38 于 2006-7-9 18:42 发表
还没有上市就和POWER5比,搞笑
原帖由 mxyou 于 2006-6-29 12:41 发表
这年头居然还有人信pcpop里的文章~~
=========================================
P.S.
http://www.hardware.fr/articles/ ... -2-duo-dossier.html
原帖由 Edison 于 2006-6-29 23:05 发表
K8的分支预测器的确很烂,连PIII都不如,使用分支偏重的测试出现1/2的性能不是什么奇怪的事情。
原帖由 Loongson 于 2006-12-7 08:38 发表
请问扣肉的分支预测器要比k8的先进在什么地方呢?
从这个帖子里面是不是可以得出这样一个结论,intel得itanium已经被自己的小弟残杀了呢?/
原帖由 hopetoknow2 于 2006-12-7 10:46 发表
Intel酷睿系的分支预测器, 是从Netburst的分支预测器,逐步衍生和扩展而来。是目前世界上x86处理器中最为先进的分支预测器。
酷睿整数性能不是杀IA64,而是杀遍全世界无敌手。
至于浮点性能, 参照最 ...
原帖由 Tanknet 于 2006-7-2 11:03 发表
哪里需要Branch了?
abs(eax)
mov ebx,eax
neg ebx
cmp eax,0
cmovl eax,ebx
不就可以拉
原帖由 Rivan500 于 2006-12-7 11:17 发表
不管什么快,只记住一句话,没有竞争就没有发展,没有各个品牌的竞争,估计现在U的技术也不会发展这么快的~!~同时还是喜欢A 和I 还有其他的品牌都能不断的更新,不断的开创新纪元~!~
原帖由 Loongson 于 2006-12-7 11:03 发表
扣肉的整数性能为什么这样强?
原帖由 potomac 于 2006-12-7 12:30 发表
你记错了。![]()
![]()
RAM厂商更多,竞争更激烈。攻守同盟控制价格也做的更好。
结果你得到实惠了么?
竞争只是厂商在赚取利润过程中表现出的一种形式。而不是根本目的。
根本目的只有一个,就是要 ...
原帖由 hopetoknow2 于 2006-12-7 12:44 发表
酷睿2 具有 最强的整数效率, 而IA64具有 最强的浮点执行效率, 是有点神秘哦。 只有好好学习,力争天天能更接近真像一点
整数、浮点超级执行效能都是Intel的独门秘技, IBM都未必能掌握的了,要不然怎么会没 ...
原帖由 ghrs2010 于 2006-12-7 14:24 发表
不要做梦了,POWER5+的浮点比Montecito要强太多
整数?Montecito的数字很好看么,照样被POWER5+踩
POWER6马上出来了,他的对手在哪里?Tukwila?先不说性能怎么样,但愿不要碰上POWER6+才好
原帖由 potomac 于 2006-12-7 14:38 发表
你以为VLIW已经定型了?
Tukwila的变化恐怕和NetBurst有的一拼。
POWER 6要2007年,POWER 6+要2008。
到时候你再来看。![]()
原帖由 ghrs2010 于 2006-12-7 14:48 发表
那你以为POWER6是什么![]()
原帖由 potomac 于 2006-12-7 14:56 发表
2008年,看巅峰对决。
单元POWER 6+能够跑到5G+![]()
原帖由 ghrs2010 于 2006-12-7 14:58 发表
5G+?除非IBM是弱智![]()
巅峰对决阿,恐怕成色会有些不足
原帖由 potomac 于 2006-12-7 15:03 发表
工艺第一的,曾经是TI,曾经是IBM。
不过现在是intel。
2008年POWER 6+真能跑个5G的频率。
就算不错了。
不过好像听说XXX家准备的是全套液冷。![]()
原帖由 ghrs2010 于 2006-12-7 15:17 发表
最好不要随便评价IBM的工艺,5G的频率对于POWER6来说都没有任何难度
并且POWER5@5G的TDP也不过160W上下,很惊人吗?
不过现在是INTEL?我倒想看看INTEL什么时候可以拿出实用化的第三代SOI+区域相变+伪二元 ...
原帖由 ghrs2010 于 2006-12-7 14:45 发表
POWER5+ 2.2G
SPECfp2000=3513
http://www.spec.org/cpu/results/ ... 20060213-05581.html
SPECint2000=1765
http://www.spec.org/osg/cpu2000/ ... 20060213-05583.html
原帖由 ghrs2010 于 2006-12-7 15:17 发表
最好不要随便评价IBM的工艺,5G的频率对于POWER6来说都没有任何难度
并且POWER5@5G的TDP也不过160W上下,很惊人吗?
不过现在是INTEL?我倒想看看INTEL什么时候可以拿出实用化的第三代SOI+区域相变+伪二元 ...
原帖由 potomac 于 2006-12-7 15:27 发表
65nm的NetBurst风冷上5G。(至少是接近5G)已经是不争的事实。
POWER 5+就不多说了,和构架有关。
但是IBM的最高频的CELL能跑多少呢?这个可是按照3.2G设计的哦。
功耗,俺们也不谈。
偶支持高级货高 ...
欢迎光临 热点科技 (http://www.itheat.com/activity/) | Powered by Discuz! X3.2 |