摩尔线程举办MUSA开发者大会:"花港"新架构与万卡集群让AI得心应手

摩尔线程举办MUSA开发者大会:"花港"新架构与万卡集群让AI得心应手

白猫 / 2025-12-20 21:5815070

想要打造性能出色的GPU并不是一件容易的时期,首先企业要在众多专利壁垒中打造一条属于自己的图形思路,此外你还要构建属于自己的生态系统并且为行业所接受,因此一直以来玩得转GPU的厂商寥寥无几,更不用说基于自研GPU打造成熟的生态系统。不过这几年国内还是涌现了一批自研GPU企业,例如摩尔线程。

摩尔线程在今天举办首届MUSA开发者大会,公布了国产GPU生态发展的关键进展与未来蓝图。此外摩尔线程还展示了全新的GPU架构“花港”以及未来芯片路线“华山”、“庐山”芯片与夸娥万卡智算集群,面向下一代超大规模智算中心的MTT C256超节点架构规划以及面向开发者的MTT AIBOOK等产品。

IMG_20251220_131221_0478655958.png

IMG_20251220_131213_2f620cc65e_副本.png

作为GPU的核心,架构的好坏将会决定GPU是否能够高效地运行各种各样的任务,摩尔线程在今天推出了全功能GPU架构“花港”,该架构让GPU在计算密度、能效、精度支持、互联能力及图形技术等方面实现全面突破。根据摩尔线程官方的介绍,“花港”采用了新一代的指令集,算力密度提升50%,并且也能大幅优化能效,同时考虑到AI计算需要不同的精度,因此“花港”GPU将会实现从FP4到FP64的全精度计算,同时包括MTFP6/MTFP4等混合低精度计算也将被“花港”GPU所支持,从而让AI开发者开发更加顺利。并且“花港”还支持MTLink高速互联技术,从而让十万卡以上规模智算集群扩展成为可能。

IMG_3037.JPG.png

IMG_3043.JPG.png

摩尔线程今天还公布了两款基于“花港”架构打造的两款芯片路线,包括“华山”以及“庐山”,其中“华山”主打AI训推一体与超大规模智能计算,其浮点算力,访问带宽、访存容量以及高速互联带宽均达到了行业领先的水准,至于“庐山”专注于图形渲染,相比较初代架构,其几何处理性能能够提升16倍,光线追踪性能提升50倍,AI性能提升64倍,最终让3A游戏性能提升15倍,并且庐山GPU还可以让纹理填充率更高,集成AI生成式渲染、UniTE统一渲染架构及全新硬件光追引擎,未来可以为3A大作以及高端图形创作提供坚实的算力支持。

IMG_20251220_131220_552123e945_副本.png

IMG_20251220_131153_7afa32bfba_副本.png

2025-12-20 132939.png

针对AI训练所需要的超大模型,摩尔线程也推出了夸娥万卡集群,其浮点算力最高可以达到10Exa-Flops,并且借助高效的架构,让训练算力利用率、训练有效时间等关键指标不断提升,同时也可以兼容国际主流生态,从而更好地应用于国内外的大模型训练与推理。

2025-12-20 132837.png

IMG_20251220_131220_019fd1c63f_副本.png

摩尔线程还与硅基流动合作,通过系统级的优化,实现了MTT S5000单卡4000 Tokens/s的壮举,此外Decode吞吐突破1000 tokens/s,这个成绩远超同行的计算卡,可以说创下了国产推理的新标杆。

IMG_20251220_131215_fd4ae5a3aa_副本.png

对于游戏玩家来说,摩尔线程旗下的游戏显卡能够支持更多的游戏才最为实际,对此摩尔线程也对游戏显卡进行了展望,称如今的摩尔线程显卡已经支持DirectX 12、OpenGL 4.6、Vulkan 1.3等主流图形与计算API,预计在2026年将支持DirectX 12 Ultimate,同时基于“花港”架构的硬件光线追踪加速引擎可以支持DXR API,从而让游戏更加真实,此外摩尔线程也推出了全自研MTAGR 1.0,为下一代数字创作构建国产技术基座。

IMG_3079.JPG.png

2025-12-20 132808.png

摩尔线程也在现场公布了“长江”智能SoC芯片,这颗芯片采用了8个全大核,主频最高拥有2.65GHz,同时还搭载高性能3D渲染,支持LLM端侧推理,此外还支持VPU、DPU以及DSP等多种解码单元,会后我们也看到了基于“长江”智能SoC打造的MTT E300 AI模组,拥有最高50TOPS的异构AI算力,可以有效地应用于工业、能源、教育等行业。

IMG_3095.JPG.png

IMG_20251220_131219_6649a98a92_副本.png

2025-12-20 132832.png

并且摩尔线程还积极布局下一代技术,包括MT Lambda具身智能仿真训练平台,融合物理、渲染与AI三大引擎,能够为具身智能带来全栈赋能,此外MUSA架构也在量子科技、AI for 6G等前沿交叉领域展开探索工作,不断拓展技术边界。此外摩尔线程还推出了MTT AICube以及MTT AIBOOK,能够为开发者提供快速且高效的开发环境,赋能开发者在AI时代成为“超级个体”。

IMG_20251220_131202_23974c4298_副本.png

首届MUSA开发者大会上,摩尔线程全面展示了目前已有的技术,还展示了摩尔线程对于未来AI和图形技术的提前布局,推出了全新的架构以及GPU,还包括众多的终端产品,可以说目前爆发的AI行业给了摩尔线程更多的展示机会,此外行业朝着自主化前进也让摩尔线程的GPU生态建设有了更多的伙伴支持,为今后打造成熟且自主的生态系统奠定了基础。


发表评论注册|