采用华为昇腾国产算力,价格大幅下调,性能比肩顶级闭源模型,DeepSeek V4终于来了!

4月24日,DeepSeek官方正式发文,称DeepSeek V4的预览版本正式上线并同步开源。
DeepSeek V4拥有Pro与Flash两个版本模型,分别对应网页端/App上的“专家模式”与“快速模式”。

DeepSeek V4 Pro的参数达到1.6T,激活参数49B,预训练数据33T,上下文长度达到1M。
DeepSeek V4 Flash的参数达到284B,激活参数13B,预训练数据32T,上下文长度同样达到1M。
那么DeepSeek V4的性能表现如何呢?根据DeepSeek公布的测试数据:
在Agent能力方面,DeepSeek V4 Pro在Agentic Coding测评中,是开源模式中最佳水平,交付质量接近Opus 4.6非思考模式,与Opus思考模式还存在一定差距。

在世界知识方面,DeepSeek V4 Pro仅稍落后于闭源模型Gemini-Pro-3.1。
而在推理性能方面,DeepSeek V4 Pro在已公开评测的开源模型中排名第一。

DeepSeek V4 Pro与V4 Flash的API已经同步上线,价格上Pro版本每百万token输入(缓存未命中)12元,输出24元,而Flash版本则是每百万Token输入(缓存未命中)1元,输出2元。
不过DeepSeek表示,受限于高端算力,目前Pro的服务吞吐十分有限,预计下半年昇腾950超节点批量上市后,Pro的价格还会大幅下调。

实际上目前DeepSeek V4的价格已经在行业内非常有竞争力,而通过这番注解,可以看到DeepSeek V4并未采用CUDA生态,而是实现了国产化适配,因此价格有望一降再降。
虽然发布比大家想象中要更晚一些,但是DeepSeek V4的意义还是比较重大的,它意味着国产顶级开源大模型在推理环节已经摆脱对英伟达GPU的依赖。
华为背后助力,DeepSeek V4正式发布,摆脱英伟达GPU依赖?
Viking














沪公网安备 31010702005758号
发表评论注册|登录