在此前的CES 2026展会中,英伟达发布了下一代的AI超级计算平台,Vera Rubin系统。在目前的环境体系中,此类LLM智能体需要依赖大量的长期记忆,并存储下跨越多轮的对话,以及会话内容的上下文,以便AI能够基于此前已经生成的推理内容进行继承构建,而非从头再来。这些内容也被称之为KV缓存,按照传统的做法这些缓存会被存储在GPU的HBM缓存中,但很显然以Vera Rubin那恐怖的算力来说,AI集群的数据需求增长,HBM已经无法承受。

因此,英伟达推出了全新的Bluefield-4 DPU来成为Vera Rubin平台中新的推理上下文记忆存储平台(ICMS),从而提供更为高效的KV缓存复用。虽然这对于处理能力有着明显的提升,但是大概率会对NAND产能引发新一波的短缺问题。

根据花旗的分析,一台Vera Rubin系统,每颗GPU就大约需要配备16TB的NAND容量,这意味着单单一套Vera Rubin NVL72配置就需要消耗掉1152TB。而根据推算,Vera Rubin的出货量在2027年可能达到10万台,如果按照这个数量级来看的话,那就需要占到未来几年全球NAND总需求的9.3%。这样算来,英伟达凭借一己之力就可以造成供应链冲击,但似乎NAND行业目前还没有考虑好在现阶段用哪些措施去应对如此庞大的增长需求。

无论是从DRAM还是NAND来看,一台AI系统所消耗的DRAM就差不多相当于100台普通家用PC,NAND也差不多相当于3台普通PC。对于存储生产厂商而言,自然是优先保障能获得大量订单且高利润的企业级用户需求,剩下的边角料才会来提供给本就处于优先级末尾的消费级PCDIY市场。这对于电脑玩家来说无疑是个非常不利的困境,前有堪比金条的内存,现在还得搭上固态SSD来作伴,更加雪上加霜。所以如果近期有着购买SSD的意向的话,建议还是从现在起就早早囤货吧。
一波未平一波又起,英伟达Vera Rubin可能加剧NAND存储短缺
鳕鱼堡














沪公网安备 31010702005758号
发表评论注册|登录