这两年AI的发展可谓是相当的迅速,从各家的大模型,到Open Claw、Hermes这样的Agent,以及像是OpenAI的Codex、Claude Code、Minimax Code之类的Coding Agent,满足不同用户不同的使用需求。
大模型、Agent大家都知道是干嘛的,比较特殊的,是那些Coding Agent,看到MiniMax Code、OpenAI Codex这些名字,很多人的第一反应可能是,这不就是给程序员用的吗?跟我有什么关系?

说实话,Code这个词,确实挺误导人的,我一开始也觉得,它就不过是一个编程用的工具罢了。
其实,这些工具早已不再局限于编程本身,在工作和学习中也能发挥作用。接下来,我们通过几个例子看看 Coding Agent 到底能做些什么。
Coding Agent 到底是什么?
对于大多数用户来说,接触最多的依旧还是大模型,而普通聊天模型和Coding Agent的区别,我们可以举个例子。

比如,你跟普通聊天模型说:“我想吃番茄炒蛋。”
大模型给你的,会是一份详细的菜谱,需要备什么食材,每一步需要怎么操作写的非常明白,但你还得亲自去厨房搞定这一切。
Coding Agent更像是直接接过围裙的那个人。它会看看冰箱里有什么,缺什么材料,开始切菜、开火;做好以后还会自己尝一口,发现太咸了,再想办法调整。

换到电脑上,它不只告诉你这件事应该怎么做,而是可以读取文件、修改代码、运行程序、查看报错,再根据结果继续修。
你给它的不再只是一个问题,而是一个任务。而这也是Agent最重要的变化,从给答案,变成交作业。
MiniMax Code:我让它从一段文案开始做视频
那这些Coding Agent工具,究竟可以做些什么?我们以几个实例来展示一下。Minimax作为国产大模型,它所推出的Minimax Code,应该也是大家相对来说使用难度较低的一个Coding Agent了。

它背后使用的MiniMax M3,是一款面向Coding和Agent任务的原生多模态模型。按照MiniMax的官方介绍,M3支持最高1M上下文,可以读取图片和视频,也具备操作电脑的能力。

听起来有些复杂,我们来尝试让它生成一段视频看下效果。因为MiniMax M3是原生支持多模态的,所以我们可以文生图、文生视频、图生视频。为了内容相对可控,我们直接把脚本拆解成几个画面,然后针对性地给每个画面先生成静态的关键帧,以确保画面的可控。
这里有一个小技巧,很多人说,好像不太会写精准、好用的prompt,其实很简单,一并交给大模型就好了。

根据我们提供的prompt,Minimax Code生成了对应的关键帧。在确认画面符合想要的风格之后,就可以继续描述视频化prompt,来生成视频了。

生成视频效果
这里要补充一句,尽管有AI的帮助,也不代表一键生成就能直接用。画面风格可能不统一,节奏也可能偏离预期,整个过程还是需要你不断调整和把控。
当然,相比过去,这极大地降低了视频制作的门槛,也提升了制作效率。
Codex:零基础也能开发APP
接下来是OpenAI的Codex。OpenAI对它的定义很直接,一个用于软件开发 的Coding Agent。它可以读取和修改文件、理解已有项目、运行测试、排查问题,也可以从零开始搭一个应用。

听着还是很像一个程序员的,那就结合我的喜好,来给它一个非常生活化的任务,做一个咖啡豆管理APP,并且是鸿蒙版的。
日常咖啡豆买多以后,管理起来其实挺麻烦。豆子什么时候烘的?产地是哪里?用了多少?适合手冲还是意式?养豆养到第几天?如果全靠脑子记,很容易出现的情况就是,在柜子角落里翻出来一包存放了很久的豆子。

所以我把需求告诉 Codex,基于鸿蒙系统做一个咖啡豆管理APP,可以记录豆子的名称、产地、烘焙日期、风味、库存和冲煮记录;临近最佳赏味期时要有提醒,界面不要做得像仓库管理系统。
然后它就开始干活了。它会先搭出基本的页面,再补充录入、筛选、库存和详情功能。运行之后,如果按钮有问题、页面显示不对,它还能继续检查和修改。甚至,在这个过程中,会把鸿蒙开发环境,像是DevEco Studio之类的一并协助安装好。

咖啡豆管理APP界面
我们先看下效果,实际上达到目前的程度,仅仅是花了2个晚上的时间而已,整个效率是非常高的。后续只需要再优化一下UI,确保没有BUG,就已经是一个非常成熟的APP了。
而在这个过程中,用户就好像是那个产品经理,去提供APP的优化思路:这个页面信息太挤了;豆子快喝完时给个提醒;首页别放那么多卡片,我只想先看到最近在喝什么……

我不需要告诉它具体应该改哪一行代码,只需要把哪里不好用讲清楚。这也是Coding Agent对普通人而言最有意思的地方。它没有让编程知识突然消失,但它把很多需求翻译成了日常语言,以及让每个人,都能够变成开发人员。
Codex:不仅是编程
其实,究竟要怎么去使用Coding Agent,想象力很重要。

比如,我们可以让它帮我搭建一个股票看板。它需要有大盘相应的指标、趋势、分析。也可以添加自己关注的股票,来做针对性的分析。


股票看板实例
其实整个过程很简单,你只要和Codex说清楚你的想法,它就会帮你完成任务,甚至还能主动去寻找合适的数据源作为分析支撑。整个过程不需要太多的时间,但取得效果,还是非常显著的。
真正变化的,不是人人都会编程
用完这几个案例,我觉得Coding Agent 容易被误解的一点,就是大家总在问,以后是不是不用学编程了?
这个问题有点像相机自动对焦出现以后,问摄影师是不是没用了。工具确实变简单了,但做什么、为什么做、好不好用,依然需要人来判断。

做咖啡豆管理APP时,你得知道自己真正需要管理什么;做股票看板时,你得知道哪些信息值得留下;做视频时,你也要判断什么镜头有用,什么画面只是看起来热闹。Agent降低的是执行门槛,不是思考门槛。
而且它也会犯错,它可能做出一堆你没要的功能,也可能误判问题所在,总之在这个过程中,你需要不断的去协助Agent去调整、优化。

但不管怎么说,带来的变化依旧是显而易见的。过去,一个想法到成品之间,隔着代码、设计、部署、剪辑和各种软件操作。很多想法不是不够好,而是还没动手,就已经被流程劝退了。
现在这堵墙正在变矮。你不必成为程序员,也不需要精通各种软件。你只需要学会一件事,把模糊的想法,清晰地表达成可执行的任务。
所以,选择一个趁手的Coding Agent,去迎接新的时代吧。
别被Code这几个字母骗了,这些AI工具,能干的不只是写代码
顾亭亭














沪公网安备 31010702005758号
发表评论注册|登录