
海外炸场的开源狠角色MoE + 原生智能体国产最强实锤?
应用介绍
7月28日晚,智谱悄无声息的开源了新一代旗舰模型 GLM-4.5,发布仅10小时,便引发全球媒体高度聚焦。
CNBC、路透社、Bloomberg等海外重量级媒体第一时间跟进报道。CNBC在报道中指出:“中国企业正在研发的人工智能模型不仅智能化水平提升,使用成本也持续降低,这与深度求索(DeepSeek)当年震动市场的突破核心优势相呼应。”
智谱此次发布GLM-4.5 系列(355B 以及 106B) 两个参数版本,源码和权重全部开源,采用极为宽松的MIT License协议。
GLM家族并非首次引发关注,之前的GLM-130B、ChatGLM3系列都因为是首个突破和首个开源,曾在开源圈掀起过波澜。这次模型亮点在于:
首款原生融合模型:这是其最大亮点之一。GLM-4.5首次在单个模型中实现了将推理、编码和智能体能力原生融合。正如技术博客所阐释,大语言模型的终极目标是在广泛领域达到人类认知水平,但现有模型往往各有所长(编程、数学、推理),却难以成为真正的“全优生”。GLM-4.5 正是朝着统一各种能力这一目标迈进,力证大模型的下一个范式,必然是深度整合多维度能力于一体。
更高的参数效率:GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一,但在多项标准基准测试中表现更为出色。特别是在衡量模型代码能力的权威榜单 SWE-bench Verified 上,GLM-4.5 系列位于性能/参数比的帕累托前沿——这意味着在同等参数规模下,它实现了当前已知的最佳性能。
它们都采用了混合专家结构(MoE),这个架构说白了就是“每次推理只激活部分参数”,在保证多样能力的同时大大降低了计算消耗。
代码能力(Coding):广泛适用于数据处理、日志分析、工具开发、前端交互、算法原型等复杂场景;
Agentic能力:具备任务自主拆解 + 工具调用 + 多轮完成任务的原生能力,无需外挂流程控制器。
小编尝试了以下几种使用方式实测了多个「模型原生可落地Agent场景」,覆盖从文本工具、搜索型应用,到交互式网页与多人游戏,验证GLM-4.5的真实可部署性与连贯性,一口气构建了5个专业的应用,已经沉寂多年的开发能力突然以另一种形式觉醒,我又觉得我行了!
帮我生成一个游戏应用贪吃蛇,风格是像素风格,玩家可以驱动游戏内的小蛇,同时游戏内可随机出现不同其它的玩家,以及实物。并且右上角有当前对局的得分榜单。使用Agent帮我模拟其它的玩家。
经常做PPT的小伙伴可能知道,做一套好看实用的PPT有多么麻烦,搜索信息、贴内容、正确配图,确保信息准确、审美在线、字体配色,最终代码生成PPT...
这些能力已不止于“文本生成”,而是完成了从自然语言 → 工具控制 → 应用部署的全流程闭环。突然想起昨天刚刚开源的Coze,此刻会不会也开始沉思,Agent工作流是否只是大模型过渡期的产物,可能尽头依然ALL IN CHAT!!
GLM-4.5不仅擅长处理复杂代码,同时也具有优秀的数据精准处理、交互动画设计能力。以下是GLM-4.5制作的一个3D 交互式地球网页,用户可以点击地点查看详情,并伴有平滑的缩放动画。
现在市面上的大部分LLM,其实还是以“增强问答系统”为核心思路,即便加了插件、记忆系统、函数调用,也还是“在模型外面堆功能”。
但GLM-4.5开始做的,是在模型训练过程中就让模型具备智能体行为的能力。GLM-4.5 和 GLM-4.5-Air 使用了相似的训练流程:首先在 15 万亿令牌的通用数据上进行了预训练。然后在代码、推理、智能体等领域的数据上进行了针对性训练,最后通过强化学习进一步增强了模型的推理、代码与智能体能力。
GLM-4.5可以理解是具备实战能力的“多步任务执行者”,在未来 AI 工作助手、多任务智能客服、财务分析等场景中具备天然优势。
这也是为什么它能在TAU-Bench、BrowseComp这种原本只适合专用Agent系统的任务中跑出好成绩——它是“原生具备智能体能力”的。
当看到GLM-4.5自动拆解这个需求时,不需要Manus,不需要Flowith,更不需要抢各种邀请码!小编知道智能体赛道要变天了:
为了测试模拟真实开发工作流,小编特意选了一个针对以往多Agent智能体协同开发才能实现的多任务的复杂开发需求,让它开发一个自动分析上市公司财报并支持财报分析、下载报告、甚至增加用户自然语言对话返回财报分析结果的复杂多功能的网站。
帮我开发一个自动分析上市公司财报的网站,以下是具体的流程:1、用户输入一个上市公司名称或者股票代码(支持中国的A股或者美股公司),2、可以选择什么时间段的财报,或者默认是最新的财报。3、根据用户的输入自动抓取这个公司的财报。4、调用大模型能力分析财报,5、生成财报分析报告,财务报告可在线浏览,也支持自动成图文并茂的ppt报告,可供用户下载。提供下载地址 6、用户可进行对话,大模型根据用户输入自动寻找财报内的内容,并输出对应的图表。
然后GLM-4.5开始了它的思考和动作,创建了一个基本的Next.js项目结构,并使用TodoWrite来规划整个项目的开发步骤:
后续就是根据每一个细分的目标进行思考、拆分、执行。如果后边有对前边共用的文件有修改,它会自动找到对应的代码文件以及对应的位置更新。
最后完成整个代码构建后,它还会回顾并检查整体的代码质量,检查开发日志,并且做一些用户体验优化,代码开发这么细心负责,这让人类开发者情何以堪...
最终整个项目完成之后,GLM-4.5会在服务器端命令行启动项目,整个窗口会分成左右两大窗口,左侧是与大模型交互以及动态输出日志交互信息,右侧就是实际运行起来的网站预览。如果对生成的功能或者UI不满意,或者运行过程有出现错误问题,可以随时在左侧交互框中告诉它,非常方便和易用!
它还会贴心的把整个项目的功能点、技术架构、使用指南都整理成文字信息告诉你,后续小编又让它增加了原始报告下载、投资建议功能,基本一次就可以完成功能更新。
现在,人人都可以是一个全栈开发者!就像左下角那个“全栈开发”按钮在告诉你的事情:不用再管什么瀑布流开发,不用再有产品经理、前端开发、后端开发、数据DBA...产品经理与开发也不用再天天吵架了,你只需要关注需求本身,有什么想法直接告诉GLM-4.5,一键上线不用复杂工作流,你只需要喝着咖啡等待!
随后,小编又顺手做了一个AI营销的网站,几分钟之后,我感觉明天可以汇报老板,公司可以再开设一条AI营销的业务线了...升职加薪指日可待!!
帮我开发一个AI营销的网站,以下是具体的流程和功能描述:1、文案写作功能,根据指定的文案风格或者预制的一些文案风格进行生成文案。2、文案风格改写功能,输入给定的文案,选择不同风格进行改写。3、风格图片生成:根据用户输入的自动生成不同风格的图片。4、文案错字和修改建议功能。5、根据给定的文案,自动生成视频脚本
高速版本实测超过 100 Tokens / 秒,支持低延迟、高并发的实际部署需求,兼顾成本效益与交互体验。
现在智谱仅需 50 元即可包月爽用 GLM-4.5,调用量上不封顶!这样的价格,性价比直接拉满!!小伙伴千万别错过这难得的薅羊毛机会~
从性能、参数、结构、生态,到开源方式、使用门槛、场景适配,GLM-4.5几乎把目前一个通用大模型应该具备的一切全拉满了。