近年来改变最大的一代:英特尔Meteor Lake处理器架构解析

近年来改变最大的一代:英特尔Meteor Lake处理器架构解析

白猫 / 2023-09-19 23:3573774

英特尔酷睿处理器系列可以说是十几年来最为成功的处理器之一,凭借着出色的架构为英特尔的开疆拓土立下了汗马功劳。不过毕竟是十几年前的总体设计,英特尔传统的酷睿处理器已经不能满足如今的算力需求,尤其是从去年下半年开始的AI狂潮让整个行业都被深深地震撼,其中也包括这家蓝色巨人。

图片1.jpg

作为半导体巨头的英特尔自然是不会放过这一轮的AI浪潮,在CPU发展的十字路口上推出了Meteor Lake处理器,不但彻底改变了CPU的设计思路,同时也将分离式模块带入其中,更为重要的是,英特尔这一次内置了NPU AI引擎,让AI协助处理器,让计算事半功倍。可以说Meteor Lake处理器的出现让整个行业焕然一新。我们也提前了解到了Meteor Lake处理器的架构,在这里我们为大家带来Meteor Lake处理器的解析,看看这颗引领CPU未来方向的先驱有什么特别的黑科技。

分离式模块与Forveros封装:让CPU跟搭积木一样

对于Meteor Lake来说,最重要的改变就是采用了全新的分离式模块。过去英特尔在设计CPU的时候,则是按照整体进行设计,包括P核、E核、GPU等,在一个CPU内放置不同的计算单元。而到了Meteor Lake处理器,设计思路则完全变化,由英特尔提供CPU的基底,并在这个基底上放置不同的计算单元,而各自的计算单元实际上相互独立,通过基底的总线进行数据通信和交换。

图片2.jpg

如今的Meteor Lake将会分为四个模块,包括性能核、能效核、I/O核以及图形核。其中性能核相信大家都十分地熟悉,英特尔将P核放置其中,从而让其从事繁琐复杂的高性能计算任务,这部分跟以往的CPU还是一样的。

图片3.jpg

不过在能效核上,英特尔就做了比较大的改变,除了E核之外,还加入了人工智能的加速引擎也就是NPU,另外包括WiFi连接模块以及编码器等媒体处理模块也放在了这里,英特尔表示你甚至可以让能效核看作是一款迷你CPU,换句话说就类似于手机中的基带。

图片4.jpg

除此之外考虑到目前核显性能提速幅度越来越大,英特尔也单独为图形处理器设置了一个图形核,从事图形的渲染,并且英特尔这一次还额外增加了I/O模块,专门负责PCIe以及雷电5等高速接口的连接和沟通,英特尔表示这种设计带来的优势就是让配置更加地灵活。

图片5.jpg

英特尔官方对CPU这样的布局也进行了解释,表示未来的CPU应该朝着更高的性能以及更低的功耗发展,因此英特尔的设计团队对Meteor Lake进行彻底的更新,包括对计算的密集型IP进行了重新划分、I/O进行了扩展,引入了低功耗的核心,并且电源管理算法也进行了优化,也就是说原本大锅饭的局面变成了各立炉灶,相互配合。这种设计能够极大地增加CPU的能效比,同时借助更加优秀的电源管理让CPU的运行效率更加高效,最终延长笔记本的续航时间。

图片6.jpg

想要实现分离式模块,除了CPU的总体设计之外,英特尔也将全新的Forveros封装带入其中。Foveros封装技术相比传统基于基板的连接,它具有更好的叠加性以及更高的密度。它实现了DIEDIE的连接,从而可以在芯片层级实现低功耗和高密度的芯片连接,毕竟在Meteor Lake上各个计算单元独立运行,这时候就需要通过新封装工艺来确保计算单元之间能有一个极低的延迟,并且3D封装工艺还可以非常小的Tile去组成一个非常大的处理器芯片,这对于追求更高集成度的移动处理器来说十分地重要。

图片7.jpg

正是因为有着全新的封装工艺以及分离式模块设计,英特尔Meteor Lake布局更加灵活,甚至未来也可以通过升级某个模块从而让新一代处理器尽快地跟大家见面。

Intel 4:EUV加持,晶体管密度更高

如今处理器的功能越来越多,而CPU的芯片面积又不可能无限增加,甚至为了确保功耗还要有所减小,因此更先进的制程工艺毫无疑问成为每家半导体制造商毕生追求的白月光。即使是作为蓝色巨人的英特尔也如此。在推出Intel 7制程工艺之后,为了满足Meteor Lake,英特尔终于带来了Intel 4,能够为Meteor Lake提供理想的晶体管密度。

图片8.jpg

近年来光刻工艺成为了全球关注的热点,先进制程离不开卓越的光源,这一次英特尔在Intel 4上终于采用了EUV光源,在更大能量密度的加持下,Intel 4制程工艺在电气性能上也取得了飞跃的进步。并且英特尔也表示借助EUV大幅简化工艺流程,减少总掩模数和工艺总步骤数同时支持微缩,对于芯片的设计起到了重要的作用。

图片9.jpg

想要实现更高的晶体管密度,就需要对晶体管进行不断地优化,减少晶体管的面积。与目前的Intel 7相比,Intel 4接触式栅极间距减少了17%,鳍片间距减少了12%M0间距减少了25%,高性能库间距减少了41%,进而让高性能逻辑库的面积减少了约2倍,进而带来更高的晶体管密度。同时在材质上,Intel也抛弃了过去的氮化钽以及带钴线的钽隔离层,转而在Intel 4中使用/钴与增强,从而供健康的电磁可靠性。 

图片10.jpg

图片11.jpg

当然上述这些都是晶体管的理论密度,而处理器性能的影响实际上还是取决于其他的因素,不过英特尔也给了具体的性能对比,表示Intel 4将会比Intel 7在能效上有着20%左右的幅度提升。至于其他额外的晶体管,大概率用在了NPU的构建上。

图片12.jpg

而且英特尔也带来了一个好消息,那就是经过优化之后的Intel 4即使是初代也可以达到相当让人满意的能效比,而不是跟14nm以及Intel 7一样,需要2-3代才可以把制程吃透,生产出让人满意的终端产品。可以说有了基于EUV加持下的Intel 4工艺制程,英特尔在设计芯片时才能显得游刃有余。

改良的线程调度器:资源调配更加灵活

英特尔在12代酷睿处理器上由于采用了基于P核以及E核打造的混合架构,为了让资源得到更加高效地运用,英特尔在CPU中加入了线程调度器,与Win11相配合,来让12代酷睿处理器充分发挥作用,只不过由于这代是初代混合架构,因此在许多软件上线程调度并不成熟,闹出了不少笑话,而到了13代酷睿处理器这种情况才得到了有效的改观。

图片13.jpg

这一次的Meteor Lake处理器由于采用了全新的设计思路,因此对于线程调度的精准性和延迟提出了更高的要求。自然英特尔也对线程调度器进行了特别的优化与改良,以满足全新设计的处理器架构。

就跟我们之前说过的一样,Meteor Lake处理器的模块化设计专门打造了“低功耗岛”,这是为了在追求极致性能的前提下去强调能耗,延长电池使用时间。而英特尔也将部分低功耗的E核放到了“低功耗岛”上,而且包括像多媒体显示,AI计算单元,Wi-Fi等模块也在“低功耗岛”上,如果平时从事的是低功耗的任务,那么毫无疑问关闭计算或者图形芯片便可以极大地增加设备的续航时间。

图片14.jpg

英特尔在Meteor Lake处理器中设置了三个不同的计算单元,包括传统的P核、E核,此外增加的便是面向低功耗的LP-E核,英特尔的硬件线程调度器并不是直接控制软件的进程,而是介于处理器硬件和Windows操作系统中间的这一层,它提供P核、E核、LP E核的实时硬件能力,然后反馈给操作系统的线程调度器。

图片15.jpg

英特尔与微软首先对三种核心进行分类和打分,并将其分为Class 0-Class 3四个类型,而在实际应用运行中,英特尔会对每一个核心打两个分数,包括E核分数以及P核的分数,分数最高的就代表着英特尔对操作系统的推荐。如果说你要追求性能,英特尔就会推荐你用P,如果说OS你在这个线程上追求的是低功耗,系统就会使用E核。

 而在Meteor Lake处理器上,英特尔增强了对操作系统的反馈。在其他IP占用功耗的时候,核心的功耗会被动态分配。Meteor Lake上,英特尔做到更准确的去做内部能耗比的评估和判断,提供更加精确的表格给到操作系统。此外NPU的加入也让英特尔的线程调度更加地得心应手。

当然与以往的线程调度器一样,想要让Meteor Lake发挥最大的作用就必须使用最新版本的Win11系统,只不过现在英特尔和微软都没有表示应该使用哪一个版本的Win11系统,或许23H2版本更加适合。

NPU:打造生态系统更重要

如果说这两年的科技行业什么最火,无疑就是AI,尤其是以OpenAI为主的GPT模型更是改变了整个行业。对于英特尔来说,AI这个行业的风口显然是不能失去的。之前我们就提到了,英特尔在采用Intel 4制程工艺后原本应该有很多的晶体管用于计算单元的打造上,而实际并非这样,那么这些额外的晶体管,更多的用在了NPU的打造上。

图片16.jpg

考虑到英特尔在CPUGPU上拥有极强的研发实力,因此英特尔对终端侧AI所秉承的一个方法其实不是一个单一的架构,英特尔推动的是XPU,也就是CPUGPU以及新增的NPU都可以从事AI的运算,英特尔认为不同的应用场景应该让不同的AI单元去推理和运算,比如说轻量级的应用只需要CPU就可以完成,而复杂AI则需要高性能的GPU。至于NPU,则主打高效与低功耗场合,当然英特尔主打的是混合AI运算,从而获得最为高效的AI产出。

图片18.jpg

英特尔也举了现在大红大紫的Stable Diffusion的例子,以SD推理中的文本解码器、UnetVAE三个步骤为例,如果全部放置在CPU上,所花费的时间为43秒。如果全部跑在GPU上,耗时仅14.5秒,功耗是37W,而如果说将部分步骤放置在NPU其他的在CPU,那么耗时为20.7秒,功耗更是只有20W,这对于移动平台来说还是相当重要的。正因为有了NPU的介入,用户可以得到近8倍的效率提升。NPUGPU 混载可以得到5倍效率的提升。因此合理利用NPU,可以让AI的效率得到巨大的提升。

图片19.jpg

不过AI毕竟是一个专用计算极强的项目,除了硬件给力之外,软件的配合同样重要,如果能够打造属于自己的AI生态系统,那么显然AI运算就可以事半功倍。现在英特尔有超过100多家合作伙伴做各种各样终端侧AI的应用,来丰富整个PC用户使用体验。而英特尔也已经和微软合作,共同打造基于office下的AI应用,利用英特尔的NPU可以实现更高效的生产力,当然具体如何就需要产品正式落地后才知道。

图形引擎:让核显也有独显实力

过去英特尔的核心一直都为人所诟病,当然其中一个重要的原因就是性能的不给力,尤其是对于游戏玩家来说,即使是1080P也不能很好地满足。而到了Meteor Lake一代,这种观念就应该被打破。

图片20.jpg

图片21.jpg

首先是规格,得益于Intel 4等先进的制程工艺,英特尔可以堆放更多的规格。相比上一代显卡,这一代核显有更高的主频,同时电压更低此外,英特尔的对于内部模块也在做架构上的更新,包括缓存的优化与增加。目前英特尔的核显拥有8Xe GPU核心128个渲染引擎,与上代相比翻倍同时还增加了8个硬件的光追单元。 此外英特尔也从独显上移植了异步拷贝,乱序采样等功能,以及对于DX12U的优化。

图片23.jpg

通过上述种种努力,英特尔称新一代核显在性能上可以达到上代的两倍,而在Blender等渲染软件上,其成绩也同样可以翻倍,可以说生产力水平大幅提升。而在音视频解码上,全新的核显也支持VP9AVCHEVCAV1等新老格式,最高支持8K@60Hz 10bit HDR的解码和8K@30Hz 10bit HDR的编码,基本上可以满足绝大部分视频从事者的使用需求。而对外输出上,支持HDMI 2.1DP 2.1以及完整的eDP 1.4,包括8K@60HzHDR,亦或是44K@60Hz显示器的输出。

总结:引领未来Intel设计方向

Meteor Lake的推出,改变了过去处理器的设计思路,从大的处理单元变成了去中心化的小型处理单元,同时借助先进的制程以及封装工艺让单元之间的传输仍然保持高速度和低延迟,这种设计也让处理器的布局更加灵活与便捷。

图片24.jpg

此外NPU的加入也让AI真真实实地假如到了日常的运算之中,让CPU的运算事半功倍,进而降低CPU的整体能耗,从而让笔记本终端的续航以及发热达到一个理想的程度。可以说Meteor Lake是近年来改变最大的一代产品,它将引领未来Intel处理器的设计与发展方向。

不过目前英特尔仅仅介绍了Meteor Lake处理器架构的优势,并没有公布Meteor Lake与上一代处理器之间的性能对比,具体Meteor Lake落地表现如何,软件能否能够完美配合Meteor Lake,还需要时间的考验。另外全新的架构对于桌面用户来说又是那么遥不可及,桌面用户想要品尝最新的制程架构,还需要再等等。


发表评论