
国产大模型,正从“秀肌肉”的新奇尝试,向真正能干累活、干大活加速升级。2月11日深夜,总部位于北京海淀的大模型明星企业智谱发布新一代旗舰模型GLM-5,基于该系列模型的国产AI编程模型付费套餐甚至出现“一码难求”。马年春节前夕,多家京企密集发布新款大模型,收获业界好评,跑出国产大模型“加速度”。以智谱GLM-5、字节Seedance 2.0为代表的国产AI大模型春节档双子星,引发全球关注。
从炫酷玩具到可靠的生产力工具,AI大模型正加速迈过这一临界点。“学界与业界正逐渐形成一种共识,大模型在从写代码、写前端网页,进化到写工程、完成大任务。”智谱相关负责人表示。通俗而言,以AI编程为例,模型不再只是个手速快的程序员,而是要把自己当成能把一个项目从头盯到尾的“总工程师”。

在全球权威的Artificial Analysis榜单中,GLM-5位居全球第四、开源模型第一
过去两年,大模型在代码生成能力方面的进展业界有目共睹。但代码和工程之间,始终横亘着一道鸿沟。“写代码是单次对话的事,而做工程复杂得多——涉及调研、架构设计、分阶段实现、持续测试、遇到问题调整方向、记录决策以便后续衔接。”智谱上述负责人介绍。而通过多个智能体并行协作,大模型正在跨越从“对话”到“执行工程任务”的边界。
如今,在由 GLM 模型开发的AI编程平台Z Code上,用户只需把需求说清楚,模型会自动拆解任务,调派多个智能体同时出动,完成代码、跑命令、调试、预览和提交等开发全流程。比如,有开发者仅靠对话式的语言指令,就做出了智能体交互世界、“论文版抖音”等复杂应用。人们甚至可以用手机远程指挥电脑桌面智能体,完成过去需要耗时许久的工程任务。
大模型甚至还能“做生意”。在考验AI模型经营与长期规划能力的基准测试Vending Bench 2中,GLM-5在所有开源模型里斩获第一。这项测试要求模型在为期一年的周期内独立经营一台模拟自动售货机。GLM-5最终账户余额达到4432美元,经营表现接近国际顶尖同行的Claude Opus 4.5,展现了出色的长期规划和资源管理能力。
由于GLM系列模型受到全球开发者的追捧,用户量激增,智谱编程助手套餐GLM Coding Plan近日上线即售罄——一个国产AI编程模型的付费套餐被抢空,这在行业历史上尚属首次。
“每天一睁眼,世界就变了模样,即使自己每天16个小时都泡在AI里,也追不上AI进化的速度……”科技媒体从业者冷先生感慨,近日来国产大模型的频频突破令人惊叹。
字节旗下视频生成模型Seedance 2.0凭借电影级视频生成能力刷屏,生数科技与清华大学联合开源统一世界模型Motus,走红海外开发者社区的匿名模型“Pony Alpha”被证实是智谱GLM-5的测试版本……国产大模型正以“加速度”闯入全球舞台的聚光灯下。

“Seedance 2.0和GLM-5的接连发布表明,美国没有放慢脚步的余地,中国正紧追不舍,放弃不是选项。这场风暴只会愈演愈烈、加速到来。”专注全球AI技术发展的海外科技博主Chubby如是说。(孙奇茹)
来源:北京日报
迎尚网提示:文章来自网络,不代表本站观点。