用户
 找回密码
 立即注册
搜索

除了跑分和数框框,下一代处理器还能做什么--人工智能

[复制链接]

1077

主题

1056

帖子

5089

积分

论坛元老

Rank: 8Rank: 8

积分
5089
发表于 2022-5-10 15:35:53
前言:
相信早期接触计算机的朋友都听说过图灵法则,图灵法则指机器回答人提出的问题,其答案与人回答同样问题没有差异时,即可认为这台机器具备人工智能。
时至今天,人工智能其实早就应用在我们生活的方方面面。比方说:导航,就是通过大数据检测路况;信息推送也是根据大数据以及”采集“到的信息进行持续推送;以图识物,通过图片搜索相关的信息、商品也是一种人工智能。
1.jpg
我们平时接触到的处理器,包括CPU、GPU以及手机处理器一类的SOC,本质他们都是通过强大的运算能力实现某一方面的计算实现对数据的处理。只不过,从最早期一个CPU中央处理器分出来一个专门对图形处理的GPU,不仅仅图形处理器,还有各种专精的处理器,而SOC倒是把各种各样专精的处理器打包在一起。
2.jpg
要说到最为经典和传奇的处理器,莫过于1976年美国Zilog公司推出的微处理器(microprocessor)Z80。
Z840006和Z840008因其卓越的性能,强大的输入/出接口能力,快速的运算速度(Z840008时钟频率可达8MHz,同时期的其他产品如Intel的8085、Motorola的M6802等时钟频率为2~5MHz),品种多样的外设支持而迅速被业内人士关注。
3.jpg
而和z80同样经典的处理器6502,更加被广泛用到苹果公司的Apple I和 APPLE II甚至后面的文曲星上面。这颗处理器的年纪比我还大,但是我相信很多7080和我一样都接触过这颗处理器的产品。没错,那就是任天堂红白机。
4.jpg
严格来说,NES (任天堂红白机的代号)中使用的 6502 是Ricoh的第二个源版本,它是部分片上系统,没有二进制编码的十进制模式,但添加了 22 个内存映射寄存器和用于声音生成、游戏手柄读取和精灵列表DMA的片上硬件。称为2A03在NTSC控制台和2A07在PAL控制台(区别在于存储器分隔为音频采样率比和查找表),该处理器被独家生产用于任天堂。
在中国大陆,上世纪末红遍大江南北的FC兼容机/小霸王学习机们和后来几乎人手一台的文曲星都采用了6502 CPU。小霸王们多采用台湾联华电子生产的UA6527,可以说这块CPU陪伴了中国80后和90后的童年和少年时代。
5.jpg
说了那么多,我目的不是吹处理器的,要说这些老古董,我随便可以再水另外一篇出来。我只是想表达,处理器本质就是用于运算的,不同的算法会让其担当不一样的职能。而专用的处理器或者专精的处理器,属于特殊用途的偏科生,比方说早期国产平板普遍实用的全志CPU,性能不咋地,但是在台式机普遍不能软解1080P高清的时候,全志处理器就可以硬解部分4K分辨率的超清视频。
人工智能本质就是模拟人类的思考方式,选择更好的方法去解决问题的。比方说,早期的深蓝电脑打败国际象棋冠军,以及前阵子打败围棋冠军的AlphaGo,就是人工智能发展的一个里程碑事件。
1、Nvidia
6.jpg
其实,各大科技公司一直都有布局人工智能方面的发展,前面提到人工智能也应用到我们生活的方方面面。
说到nVidia,大家第一时间想到的就是游戏显卡。其实,早在上一代的图灵架构GPU,就已经正儿八经把人工智能模块加进去了。
诸君看看上图,教主给大家做演示的时候提供的Pascal架构和图灵架构的区别。图灵架构同样有传统的光栅和纹理处理单元,但是加入了RT Core光线追踪单元以及Tensor Core单元。
Rt core光线追踪说白了还是和图形相关的部分,今天不谈这个,我们继续聊Tensor Core单元。
7.jpg
Tensor Core 可实现混合精度计算,动态调整算力,从而在保持准确性的同时提高吞吐量。在应对更广泛的 AI 和高性能计算 (HPC) 任务时,新一代 Tensor Core 的速度更胜以往。从 Transformer 网络训练速度提升 6 倍到所有应用程序性能提升 3 倍,NVIDIA Tensor Core 可以赋予各种工作负载新能力。
8.jpg
Tensor Core并不是仅仅应用在DLSS深度学习超级采样技术上面,更重要的是已经可以应用在AI修图、AI抠像等方面。其中,nvidia canvas就是一款神奇的AI图形软件。
nvidia canvas,利用生成的对抗网络(GANs)将语意分割图转换为逼真的图像,能够将人类的绘画方式和过程进行编译,在几秒钟内画出草图,并将其转换为逼真的照片,非常有意思!
简单来说,就是哪怕毕加索一样抽象的几笔就能变成写实派的图像,这样的操作是不是很厉害。
2、Intel
9.jpg
早在2019年的Ice Lake处理器上就首次集成了AI加速,当时是通过DL Boost指令集实现的。
所谓DL Boost,指的是DeepLearning Boost(深度学习加速),深度学习是目前最火热的AI技术之一,但它与CPU、GPU常规的运算指令又有所不同,按照常规方法跑效率很低,而DLBoost是专门用于加速AI运算的指令,因此运算效率非常高,速度要快很多。
10.jpg
在Ice Lake小试牛刀之后,Intel在第二代10nm处理器Tiger Lake上进一步加强了AI性能,除了原有的DL Boost及低功耗加速器之外,Tiger Lake上这次的Xe图形架构GPU进一步提升GPU对AI的加速性能,将Ice Lake上的CPU+GPU+GNA的AI加速性能提升到新的高度。
在CES现场,Intel邀请了Adobe公司的开发人员上台,演示了Photoshop软件的AI加速,上图中原图是一张分辨率较低、噪点较多的照片,通过AI加速可以在几秒钟内变成一张个高分辨率、高画质的大图片,细节分明、效果锐利。
11.jpg
而最终,是为了oneAPI服务的。简单来说就是通过一套开发工具满足不同平台、不同芯片的软件开发。
据称,Intel将会在十四代酷睿上面直接塞入人工智能芯片。相信,这是一个值得期待的事件,虽然十三代酷睿还没有上市。
3、AMD与苹果
12.jpg
相比而言,AMD的态度是观望和关注,AMD尚未发布任何关于深度学习潜在市场的预测,因为它更专注于从Intel和NVIDIA获得市场份额。因此,也没有看到AMD有专注于人工智能的芯片。
不过,AMD首席执行官苏姿丰(苏姿丰)表示,AMD正在努力成为人工智能领域更重要的参与者。
简单来说,就是AMD还没有实物用于人工智能方面。同样,苹果有人工智能方面的应用,但并没有人工智能专攻的硬件模块。
苹果 CEO 库克辩解称:“苹果公司的 AI 不被看好是,我们不喜欢谈论未实现的东西。苹果除了为刷脸开屏的 FaceID 和 语音助理Siri 等功能,比如对照片册进行人脸识别,Apple Music的歌曲推荐, 从记录中知道机主的音乐偏好,电源管理系统也使用人工智能来研究电池使用情况并优化,以延长电池的待机时间。”
4、华为
要说人工智能应用,国内科技公司里面,华为必然是走得最远的一个,可惜因为某些原因,海思的处理器已经不能生产。
13.png
华为从服务器、云计算以及智能终端上面有着完整的一套人工智能方案。
华为从2004年开始投资研发第一颗嵌入式处理芯片,历经15年,目前投入超过2万名工程师,形成了以“鲲鹏+昇腾”为核心的基础芯片族。华为将以鲲鹏和昇腾作为根基,打造“一云两翼双引擎”的计算产业布局,持续构建开放生态:
一云是指华为云。华为云通过全栈创新提供安全可靠的混合云,成为生态伙伴的黑土地,为世界提供普惠算力。本次华为发布了基于“鲲鹏+昇腾”112款华为云云服务,涵盖了IaaS、PaaS、EI、数据库、安全、IoT等领域,帮助客户加速业务创新,实现普惠AI。
两翼分别指智能计算业务、智能数据与存储业务。在智能计算领域,华为面向端、边、云,提供“鲲鹏+昇腾+x86+GPU”的多样性算力。此次华为还发布了全球训练最快的AI训练集群Atlas 900、算力强劲的AI推理和训练卡Atlas 300和AI训练服务器Atlas 800。在智能数据与存储领域,融合了存储、大数据、数据库、AI,围绕。
14.jpg
鲲鹏处理器采用7nm工艺的鲲鹏920,该款芯片基于多核架构,主频最高2.6GHz,最高集成64个物理核,最大64GB内存。除此之外,YueLu-T110还拥有高性能的独立显卡,且全部使用我国自主知识产权的麒麟/UOS操作系统,是基于鲲鹏处理器研发生产的PC产品。
15.jpg
华为也有专精于AI人工智能的处理器、--升腾910,早在2019年就推出了。昇腾910是一款具有超高算力的AI处理器,其最大功耗为310W,华为自研的达芬奇架构大大提升了其能效比。八位整数精度(INT8)下的性能达到640TOPS,16位浮点数(FP16)下的性能达到320 TFLOPS。
作为一款高集成度的片上系统(SoC),除了基于达芬奇架构的AI核外,昇腾910还集成了多个CPU、DVPP和任务调度器(Task Scheduler),因而具有自我管理能力,可以充分发挥其高算力的优势。
昇腾910集成了HCCS、PCIe 4.0和RoCE v2接口,为构建横向扩展(Scale Out)和纵向扩展(Scale Up)系统提供了灵活高效的方法。HCCS是华为自研的高速互联接口,片内RoCE可用于节点间直接互联。最新的PCIe 4.0的吞吐量比上一代提升一倍。
可能是专业性太强或者其他原因,更多的消息就找不到了。无可置疑的是,国内的科技公司里面,华为对于人工智能这一块的投入是不少的。
而国内其他的科技公司,虽然有人工智能技术,但并没有自己的硬件支持。国内实用的AI技术,基本上是基于高通的。
总结:
不得不说,现在投资人工智能处理模块,确实是一项见不到收益的项目。毕竟除了nVidia的DLSS应用外,人工智能模块基本上不能让你的处理器跑分变高,发热量降低,而常规的人工智能项目,采用通用方案都可以解决了,就好像所谓的AI识物,近两年的手机都有类似的功能了。
但相信,随着硬件的发展,必然推进人工智能的进步。以后的人工智能会不会就像电影里面描述的的一样,仅仅通过照片的一角就能通过海量资料的比对找到所在的具体位置,又或者人工智能能根据你的生活、工作习惯给你做真正的智能提醒,我相信7080这一代都有机会亲身体验到的。

使用道具 举报 回复
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则