海外炸场的开源狠角色MoE + 原生智能体国产最强实锤？

分类：开源社区
大小：未知
支持：

发布： 2025-08-01 02:36:01
人气： 15
评论： 0

标签：

开源社区

应用介绍

　　7月28日晚，智谱悄无声息的开源了新一代旗舰模型 GLM-4.5，发布仅10小时，便引发全球媒体高度聚焦。

　　CNBC、路透社、Bloomberg等海外重量级媒体第一时间跟进报道。CNBC在报道中指出：“中国企业正在研发的人工智能模型不仅智能化水平提升，使用成本也持续降低，这与深度求索（DeepSeek）当年震动市场的突破核心优势相呼应。”

　　智谱此次发布GLM-4.5 系列（355B 以及 106B）两个参数版本，源码和权重全部开源，采用极为宽松的MIT License协议。

　　GLM家族并非首次引发关注，之前的GLM-130B、ChatGLM3系列都因为是首个突破和首个开源，曾在开源圈掀起过波澜。这次模型亮点在于：

　　首款原生融合模型：这是其最大亮点之一。GLM-4.5首次在单个模型中实现了将推理、编码和智能体能力原生融合。正如技术博客所阐释，大语言模型的终极目标是在广泛领域达到人类认知水平，但现有模型往往各有所长（编程、数学、推理），却难以成为真正的“全优生”。GLM-4.5 正是朝着统一各种能力这一目标迈进，力证大模型的下一个范式，必然是深度整合多维度能力于一体。

　　更高的参数效率：GLM-4.5的参数量仅为一些主流模型的一半甚至三分之一，但在多项标准基准测试中表现更为出色。特别是在衡量模型代码能力的权威榜单 SWE-bench Verified 上，GLM-4.5 系列位于性能/参数比的帕累托前沿——这意味着在同等参数规模下，它实现了当前已知的最佳性能。

　　它们都采用了混合专家结构（MoE），这个架构说白了就是“每次推理只激活部分参数”，在保证多样能力的同时大大降低了计算消耗。

　　代码能力（Coding）：广泛适用于数据处理、日志分析、工具开发、前端交互、算法原型等复杂场景；

　　Agentic能力：具备任务自主拆解 + 工具调用 + 多轮完成任务的原生能力，无需外挂流程控制器。

　　小编尝试了以下几种使用方式实测了多个「模型原生可落地Agent场景」，覆盖从文本工具、搜索型应用，到交互式网页与多人游戏，验证GLM-4.5的真实可部署性与连贯性，一口气构建了5个专业的应用，已经沉寂多年的开发能力突然以另一种形式觉醒，我又觉得我行了！

　　帮我生成一个游戏应用贪吃蛇，风格是像素风格，玩家可以驱动游戏内的小蛇，同时游戏内可随机出现不同其它的玩家，以及实物。并且右上角有当前对局的得分榜单。使用Agent帮我模拟其它的玩家。

　　经常做PPT的小伙伴可能知道，做一套好看实用的PPT有多么麻烦，搜索信息、贴内容、正确配图，确保信息准确、审美在线、字体配色，最终代码生成PPT...

　　这些能力已不止于“文本生成”，而是完成了从自然语言 → 工具控制 → 应用部署的全流程闭环。突然想起昨天刚刚开源的Coze，此刻会不会也开始沉思，Agent工作流是否只是大模型过渡期的产物，可能尽头依然ALL IN CHAT！！

　　GLM-4.5不仅擅长处理复杂代码，同时也具有优秀的数据精准处理、交互动画设计能力。以下是GLM-4.5制作的一个3D 交互式地球网页，用户可以点击地点查看详情，并伴有平滑的缩放动画。

　　现在市面上的大部分LLM，其实还是以“增强问答系统”为核心思路，即便加了插件、记忆系统、函数调用，也还是“在模型外面堆功能”。

　　但GLM-4.5开始做的，是在模型训练过程中就让模型具备智能体行为的能力。GLM-4.5 和 GLM-4.5-Air 使用了相似的训练流程：首先在 15 万亿令牌的通用数据上进行了预训练。然后在代码、推理、智能体等领域的数据上进行了针对性训练，最后通过强化学习进一步增强了模型的推理、代码与智能体能力。

　　GLM-4.5可以理解是具备实战能力的“多步任务执行者”，在未来 AI 工作助手、多任务智能客服、财务分析等场景中具备天然优势。

　　这也是为什么它能在TAU-Bench、BrowseComp这种原本只适合专用Agent系统的任务中跑出好成绩——它是“原生具备智能体能力”的。

　　当看到GLM-4.5自动拆解这个需求时，不需要Manus，不需要Flowith，更不需要抢各种邀请码！小编知道智能体赛道要变天了：

　　为了测试模拟真实开发工作流，小编特意选了一个针对以往多Agent智能体协同开发才能实现的多任务的复杂开发需求，让它开发一个自动分析上市公司财报并支持财报分析、下载报告、甚至增加用户自然语言对话返回财报分析结果的复杂多功能的网站。

　　帮我开发一个自动分析上市公司财报的网站，以下是具体的流程：1、用户输入一个上市公司名称或者股票代码（支持中国的A股或者美股公司），2、可以选择什么时间段的财报，或者默认是最新的财报。3、根据用户的输入自动抓取这个公司的财报。4、调用大模型能力分析财报，5、生成财报分析报告，财务报告可在线浏览，也支持自动成图文并茂的ppt报告，可供用户下载。提供下载地址 6、用户可进行对话，大模型根据用户输入自动寻找财报内的内容，并输出对应的图表。

　　然后GLM-4.5开始了它的思考和动作，创建了一个基本的Next.js项目结构，并使用TodoWrite来规划整个项目的开发步骤：

　　后续就是根据每一个细分的目标进行思考、拆分、执行。如果后边有对前边共用的文件有修改，它会自动找到对应的代码文件以及对应的位置更新。

　　最后完成整个代码构建后，它还会回顾并检查整体的代码质量，检查开发日志，并且做一些用户体验优化，代码开发这么细心负责，这让人类开发者情何以堪...

　　最终整个项目完成之后，GLM-4.5会在服务器端命令行启动项目，整个窗口会分成左右两大窗口，左侧是与大模型交互以及动态输出日志交互信息，右侧就是实际运行起来的网站预览。如果对生成的功能或者UI不满意，或者运行过程有出现错误问题，可以随时在左侧交互框中告诉它，非常方便和易用！

　　它还会贴心的把整个项目的功能点、技术架构、使用指南都整理成文字信息告诉你，后续小编又让它增加了原始报告下载、投资建议功能，基本一次就可以完成功能更新。

　　现在，人人都可以是一个全栈开发者！就像左下角那个“全栈开发”按钮在告诉你的事情：不用再管什么瀑布流开发，不用再有产品经理、前端开发、后端开发、数据DBA...产品经理与开发也不用再天天吵架了，你只需要关注需求本身，有什么想法直接告诉GLM-4.5，一键上线不用复杂工作流，你只需要喝着咖啡等待！

　　随后，小编又顺手做了一个AI营销的网站，几分钟之后，我感觉明天可以汇报老板，公司可以再开设一条AI营销的业务线了...升职加薪指日可待！！

　　帮我开发一个AI营销的网站，以下是具体的流程和功能描述：1、文案写作功能，根据指定的文案风格或者预制的一些文案风格进行生成文案。2、文案风格改写功能，输入给定的文案，选择不同风格进行改写。3、风格图片生成：根据用户输入的自动生成不同风格的图片。4、文案错字和修改建议功能。5、根据给定的文案，自动生成视频脚本

　　高速版本实测超过 100 Tokens / 秒，支持低延迟、高并发的实际部署需求，兼顾成本效益与交互体验。

　　现在智谱仅需 50 元即可包月爽用 GLM-4.5，调用量上不封顶！这样的价格，性价比直接拉满！！小伙伴千万别错过这难得的薅羊毛机会~

　　从性能、参数、结构、生态，到开源方式、使用门槛、场景适配，GLM-4.5几乎把目前一个通用大模型应该具备的一切全拉满了。