开源社区

万字长文讲透人工智能全产业链发展

万字长文讲透人工智能全产业链发展

  • 发布:
  • 人气: 6
  • 评论: 0

应用介绍

  万字长文,全面分析人工智能领域发展,涵盖产业趋势、技术演进、市场预测、发展机遇与挑战等核心要点。

  2024年全球信息技术(IT)总支出达5万亿美元,同比增长6.8%。其中,IT服务占比30.0%、通信服务占比29.5%、软件服务支出占比为20.6%、设备占比为5.2%以及数据中心系统占比为5.2%。

  展望未来,随着数字基建的完善,在通信服务、数据中心系统设备的支持将趋于稳定而GenAl带来对于软件层面的投入及IT服务的需求会大幅增长。至2075年,软件与IT服务的支出有望接近全球IT支出的50%。

  2024年中国信息技术(IT)总支出将达到3.9万亿元人民币,同比增长6.2%。其中,通信服务与设备支出占比分别为25.5%和39.0%,位居各细分领域之首;数据中心系统与IT服务支出分别占10.3%和18.5%,居于其次;软件支出占比偏低,仅为6.7%。

  展望未来,生成式人工智能(GenAI)的迅猛发展将为IT产业带来革命性变革。数据中心系统作为GenAl运行的能源枢纽”,软件则作为人机交互的核心载体,二者预计将成为产业增长的主要受益者。在此驱动下,中国IT产业规模预计将在未来50年内以3%-5%的年均速度持续扩大。

  中国人工智能产业在京津冀、长三角和珠三角三大区域呈现显著集聚:北京依托海淀智算中心打造全球创新策源地,2035年智算规模力争达45 EFLOPS,已备案105款大模型核心产业规模超3,000亿元;上海一杭州通过张江、徐汇、临港及37个数据中心形成基础研究一技术转化一场景应用”闭环,2024年产业规模逾4,000亿元、算力超54 EFLOPS,力争2025年突破100 EFLOPS;深圳一广州双核驱动,深圳聚焦硬件与垂直大模型,产业规模超3,600亿元,广州应用企业占比80%,并布局“1+5+N算力中心,目标2027年算力破100EFLOPS。

  目前,中国已形成覆盖基础层、技术层、应用层的完整人工智能产业体系。从企业数量看,企查查数据显示,2019-2024年,中国人工智能相关企业注册数量由8.4万家增至53.7万家;截至2025年4月28日,2025年已新增21.4万家人工智能相关企业,较2024年同期增长36%。

  此外,中国已累计培育400余家人工智能领域国家级专精特新“小巨人企业占据全球10%的人工智能产业规模。

  从专利申请情况看,截至2025年4月9日,中国人工智能专利申请数超157万项,占全球申请量的38.6%,位居全球首位,其中智能体领域专利申请数从2019年的653项增至2,787项,年均复合增长率为33.7%,呈现爆发式增长态势。

  中国互联网与移动互联网的渗透率在过去五年间迎来了飞速上涨,从60.2%上升至75.6%。渗透率飞速上涨的原因包括中国 *** 基础设施建设的不断迭代、互联网消费模式的持续升级以及终端设备的智能化提升与性价比增强。预计至2075年,中国将成为全民互联网化的国家,为全球互联网发展起到建设引领作用。

  中国是全球范围内互联网用户数量排名之一的国家,也是在全球范围内首个互联网用户数破11亿人次的国家。排在第二位的印度拥有8.8亿互联网用户,第三位的美国拥有3.1亿用户。庞大的互联网用户基础为人工智能在中国的蓬勃发展奠定了坚实的基础。在中国,人工智能能够以更低的成本和更快的速度触及更广泛的用户群体。作为全球数据中心、 *** 覆盖最完善的国家,中国拥有全球更好的人工智能发展土壤之一。

  在全球计算机科学论文发表数量方面,中国在论文发表量、覆盖广度和研究深度上均位居全球首位,显著领先于其他国家。全球计算机科学领域,23.2%的发表论文来源于中国学者。其中,中国科学院在过去十年中始终位居论文发表数量榜首。

  全球获批的人工智能专利中,绝大多数来自中国(69.7%)和美国(14.2%)。来自美国的人工智能专利占比已从 2015 年的峰值(42.8%)有所下降。而中国则连续五年保持高增长的趋势。

  从近年来中央政治经济会议和 *** 工作报告的政策演进可以看出,人工智能被置于国家发展全局的核心位置。2023年中央经济工作会议提到“加快推动人工智能发展;2024年 *** 工作报告首次提到人工智能+概念,将“开展人工智能+’行动列为年度重点任务强调以人工智能技术推动产业智能化升级;2024年中央经济会议明确将人工智能作为培育未来产业的关键路径,并提到开展新技术新产品新场景大规模应用示范;2025年两会进一步深化这一战略, *** 工作报告不仅明确提出持续推进人工智能+行动,还将其与优化全国算力布局、发展智能终端等举措相结合,凸显人工智能在推动新型工业化、构建现代化产业体系中的核心作用。这一系列政策信号表明,人工智能已成为国家抢占科技制高点、实现高质量发展的战略性抓手。

  2025年政策对人工智能的重视更体现在对技术安全、应用场景和产业链协同的全方位布局。中央政治局会议多次强调促进人工智能安全发展”,要求统筹技术创新与风险防范完善算法治理和数据安全法规。 *** 工作报告明确将具身智能纳入国家战略,推动A从虚拟算法向实体交互延伸。同时,国家通过优化算力资源布局、支持大模型开源生态等举措,强化底层技术自主可控能力。此外,政策还鼓励人工智能在医疗、教育、交通等民生领域的深度应用,并提出打造具有国际竞争力的数字产业集群。这一系列政策组合拳,标志着人工智能已从技术探索转向系统性赋能,成为驱动新质生产力发展的核心引擎。

  自2015年起,AI行业融资数量由501起攀升至2018年峰值1024起,随后进入调整期,2021年再次冲高至1,076起,但在宏观经济环境影响下,2022-2024年逐年回落,2024年降至696起,显示市场趋于理性。从轮次和层次来看,大型、AIGC与具身智能等前沿技术的快速演进,使早期项目凭借创新技术或独特商业模式吸引资本;而医疗、汽车等垂直领域仍无垄断龙头,海量细分场景待开发,促使投资重心从“技术验证转向商业闭环”。2024年应用层融资超过500亿元,占比达55%,且国资正逐步成为A领域投融资的重要驱动力。

  目前,公众对人工智能的认知度显著提升,超95%的受访者表示“了解AI”,而在使用率更高的AI产品中,国产大模型已占据领先地位。

  从AI产品需求看,文本写作、搜索查询、图片生成或处理需求更高,而使用率更高的TOP5中,有4款都是国产品牌,其中豆包、DeepSeeK和文心一言分别以71.7%、65.7%和34.8%的使用率位居前三。

  人工智能产业链通过标准化与平台化手段重构A开发与部署流程。一方面,它以高性能、可扩展的计算与存储资源降低算力门槛,提升资源利用效率;另一方面,通过模型即服务平台聚合模型资产、优化微调链路、强化MLOps管理,加速AI能力的交付与选代。最终,使企业得以以更低成本、更快速度将AI能力嵌入业务实现从流程优化到产品创新的跃迁,为各行业智能化升级提供可复制、可持续的技术底座。

  大模型算力需求可分为训练与推理两阶段。传统大模型因参数规模庞大、训练成本高昂使算力高度集中于训练环节;而DeepSeek利用高效模型架构与分布式训练框架,大幅降低了训练门槛,让中小企业也能承担定制化训练需求。同时,其推理阶段凭借高吞吐量和低功耗特性,推动算力需求从“以训练为主向训练与推理并重甚至以推理为主转变。随着训练成本下降,更多行业将由租用预训练模型转向自主训练+本地推理部署;而边缘计算与实时交互等场景的爆发式增长,使推理算力成为增量来源。

  算力可分为通用算力、智能算力和超算算力,其中通用算力和智能算力规模占算力总规模98%左右。而随着生成式A爆发,导致市场对于高并行计算能力的需求激增,推动中国智能算力规模以76.3%的平均增速从2020年的75EFLOPS增长至2024年的725EFLOPS,远超同期通用算力的平均增速。

  中国数据存储能力正经历高速增长预计从2020年的640EB增至2025年的1,800EB,这得益于数字化转型、云计算、AI等技术的推动,以及5G和AI发展带来的内容 *** 、影像视听等行业非结构化数据的激增。

  然而,数据生产量巨大与存储及管理效率低下形成鲜明对比;2023年实际存储数据仅占总产量的2.9%,大量数据在源头被丢弃,且存储数据中约40%长期闲置,造成资源浪费。

  大模型参数规模与训练数据量、质量和多样性呈指数级正相关:参数越多对海量且跨语言、跨领域、高质量数据的依赖越强;因此,必须通过数据增强、合成生成与高效采集处理技术,配合大数据存储、算力扩展及优化算法创新,才能支撑超亿级参数模型的高效训练与泛化能力。

  大模型虽是当前AI主流技术,但在受业务约束的垂直场景,传统机器学习、语音、知识图谱、NLP与计算机视觉等传统小模型,以更优的可控性和成本优势,仍能实现更高效且可量化的商业收益。

  ●机器学习:全球机器学习技术发展格局中,美国企业凭借长期技术积累占据领先地位。以谷歌、Meta为代表的科技巨头,依托深度学习与神经 *** 领域的核心优势,通过开源框架(如TensorFlow)和前沿技术(如Transformer架构、Gemini多模态模型)构建全球生态。谷歌聚焦多模态融合(如Gemini系列模型)与自监督学习(如SimCLR),并探索通用AI的边界;Meta则通过Llama系列模型的开源策略推动技术普惠,同时强化AI伦理治理(如AI安全评估框架)。相比之下,中国企业如百度(文心一言)、阿里巴巴(电商推荐系统)以场景驱动为核心,通过模型小型化(如模型蒸馏和参数高效微调技术,使小型模型性能接近大模型的同时降低计算成本)和高效化部署(如边缘端轻量化方案)实现技术落地。同时,中国在人机协作(如AdaptiveVIO系统结合在线持续学习与传统优化算法,提升机器人动态环境适应性)与可持续性发展(如联邦学习在隐私保护中的应用)领域展现出独特优势。机器学习的未来趋势正加速向多模态融合(跨模态任务协同)、自监督与无监督学习(减少标注依赖)模型小型化与高效化(边缘端部署)演进,中美企业通过差异化路径共同塑造这一智能化浪潮。

  ●知识图谱:目前,中国知识图谱技术已进入规模化应用阶段,成为人工智能和大数据领域的核心基础设施。政策层面,十四五规划及《人工智能知识图谱知识交换协议》等标准的发布,为行业提供明确的政策支持和技术规范。技术方面,多模态知识图谱隐私计算与动态更新技术逐步成熟,推动知识图谱在金融、医疗、政务等领域的深度落地。例如,阿里云依托通义千问大模型生态,通过知识图谱增强模型推理能力(如结合图神经 *** ),并用于电商个性化推荐、供应链风险分析等场景;在金融和政务领域,海致星图通过图模融合技术(如动态知识更新)解决金融风控中的复杂关系分析问题(如企业关联图谱和反欺诈场景);柯基数据知识图谱平台已针对医疗、文旅、军工、政务、出版等各个领域的痛点,提出相应解决方案(如医疗领域的MedicalCopilot产品线,包括医疗智能信息库产品、医疗学术ChatBot产品和Clinicallnsight情报平台)。

  未来,图模融合将成为核心方向:(1)大模型将提升对复杂知识图谱的构建能力以及增强对复杂知识图谱的理解能力;(2)探索多态大模型与知识图谱的融合,以及多模态知识图谱的构建和应用,并研究其在大模型中的应用;(3)发展模型对复杂知识图谱的知识表示和推理能力,如基于大模型的知识问题和推理,开发基于大模型的知识问答系统,使其能够理解复杂问题,并在知识图谱上进行推理,给出答案。

  ●自然语言处理:自然语言处理技术(NLP)正以“场景无界化和技术平民化的双重势能重构产业格局,预计2025年中国NLP市场规模将突破400亿元,占全球份额26%成为仅次于美国的第二大市场。技术创新上,清华大学联合中南大学、北京邮电大学及腾讯微信AI实验室提出APB框架,通过稀疏注意力机制与局部KV缓存压缩技术,解决了长上下文远距离语义依赖问题,在无性能损失的前提下大幅度提升超长文本预填充效率。模型架构上,预训练语言模型成为热点研究方向。例如:华为 *** NLP大模型发布718B MOE混合专家模型,在知识推理、工具调用等领域表现突出,其高效长序列处理、低幻觉生成、快慢思考融合及Agent特性显著升级,进一步提升用户体验未来,NLP将向模型轻量化与个性化发展,通过压缩技术(如知识蒸馏)适配终端设备,并针对行业开发定制模型;多模态融合趋势下,NLP将与视觉、语音技术结合,应用于智能安防、会议系统等场景;低资源语言处理也将借助数据增强与迁移学习取得突破,推动全球语言交互。

  中国大模型能力不断提升,与国外的差距逐步缩小。根据《2025 Al Index》显示,2023年美国顶尖人工智能模型大幅领先中国同类产品,在MMLU、MMMU、MATH和HumanEval等比较基准中,中美模型性能差距分别为17.5pct、13.5pct、24.3pct和31.6pct,而2024年末,这一差距大幅收窄至0.3pct、8.1pct、1.6pct和3.7pct。另一方面,中国大模型行业正经历结构性变革,大语言模型向多模态演进、通用大模型向垂直领域渗透的趋势已成为行业共识。截至2024年11月,根据《生成式人工智能暂行办法》进行备案的309款生成式大模型中,大语言/视觉/多模态模型占比分别为78%、12%和10%;通用/垂直大模型占比分别为28%和72%。国产大模型正打破传统“单模态训练+跨模态对齐”的技术路径,实现多模态数据的原生融合。例如:百度文心大模型4.5采用多模态异构专家建模技术,通过自适应分辨率视觉编码和时空重排列三维旋转位置编码,使多模态理解效果提升30%。与此同时,模型支持的模态类型从早期的图文音三模态扩展至全模态。例如:中科院紫东太初2.0新增视频、传感信号、3D点云等模态处理能力,在工业质检场景中可同时分析生产线视频流、设备振动信号和零件3D模型,将故障预测准确率提升至98.7%。

  此外,国产模型通过存算一体芯片适配和动态卸载技术显著降低多模态推理成本。尽管通用大模型具备广泛的知识库和强大的泛化能力,但其在医疗、金融、制造等专业领域的深度知识不足、决策可解释性低、行业逻辑缺失等问题日益凸显。例如,通用模型可能无法准确理解医疗术语、金融法规或制造业工艺参数,导致幻觉”频发或任务失败。因此,垂直领域大模型成为行业落地的关键路径。这些模型通过领域数据微调、专业知识注入和专用工具集成,显著提升了专业场景的准确性和可靠性。例如:京东言犀大模型融合70%的通用数据和30%的数智供应链原生数据具备更高的产业属性;中关村科金通过构建金融、制造、政务等十余个垂直领域的智能体矩阵,将大模型嵌入企业业务流程(如智能投顾、差旅助手、情报分析),直接推动效率提升(如中关村氪金与宁夏交建交通科技研究院打造全国首个交通基建垂类大模型灵筑智工,基于上万份行业规范、工程技术文档等高质量数据训练而成,行业推理准确度较通用大模型提升40%以上)。大语言模型向多态演进和通用模型向垂直深化,本质上是AI技术从通用智能”向专用智能跃迁的必然路径。这一过程中多模态技术拓展了模型的感知边界,垂直模型则深化了行业的智能深度。未来,两者的融合将催生更多行业级 AGI(通用人工智能)——例如结合多模态交互与行业知识库的智能诊疗系统,或整合视觉检测与供应链数据的智能制造平台。

  从技术形态看,全球大模型发展正经历从闭源垄断向开源普惠的范式转变。早期以OpenAl的GPT系列、Google的Gemini等为代表的闭源模型通过技术封装构筑认知鸿沟,在2024年前以LaMa-1为代表的开源模型性能大幅落后于GPT-4等闭源模型(2024年1月Chatbot Arena Leaderboard显示顶尖闭源模型领先8.0个百分点)。Meta的LLaMa系列虽推动技术民主化,但商业授权限制(如禁止商业用途)形成新的壁垒。随着开源生态不断完善,开源模型的能力正快速追赶闭源模型——截至2025年2月,顶尖闭源模型与开源模型的性能差距已缩小至1.7个百分点,这一趋势得益于开源社区的迭代速度加快。中国在此进程中成为开源生态的核心驱动力,展现出独特的技术突破路径与产业渗透力。

  技术创新层面,阿里、深度求索、腾讯、智谱等众多企业与浙江大学等科研机构积极投入研发,成果斐然。在2025年6月全球更大开源社区Hugging Face发布的AI开源贡献榜上,阿里Qwen跻身全球第五以及DeepSeek位列第九,是TOP10中唯二的非美国企业。阿里Qwen系列不断突破创新,在自然语言理解、多模态交互等关键领域,展现出与全球顶尖大模型相媲美的实力。其中,Owen3开源首月下载量就突破1,250万次,截至2025年6月,全球开发者基于Qwen系列二次开发的衍生模型数量达到13万个,超越Meta的Lama成为全球更大开源模型族群。深度求索的DeepSeek系列同样表现卓越,技术指标位居全球前列,尤其在复杂逻辑推理方面,展现出领先优势,其V3模型通过创新架构与数据蒸馏技术,重构了大模型的成本-性能曲线万美元,远低于Meta Llama-3.1与OpenAGPT-4o的训练成本,且推理性能直逼一流模型。在产业生态构建上,开源大模型已深入千行百业,为各行业的智能化转型提供有力支撑。以腾讯混元3D 2.1为例,开源后兼容Unreal Engine引擎,极大地推动影视工业数字化转型,提升影视特效生成效率目前,中国正积极构建开源与闭源协同发展的良好局面。一方面,大力推进开源生态建设,众多企业与机构纷纷投身开源浪潮,如阿里、深度求索、零一万物等企业通过开源优质模型,吸引全球开发者参与,形成技术创新的强大合力。另一方面,闭源模型也在发挥重要作用,部分企业基于自身核心技术与数据优势,开发闭源模型,在特定领域提供定制化、高价值的服务。这种“开源验证+闭源落地”的策略,既通过开源生态激活技术创新,又通过闭源模型保障商业价值,最终实现技术民主化与产业专业化的平衡。

  大模型在各行业的落地主要依赖于能力契合、ROI可量化和数据算力充足三大要素。首先,模型能力必须与行业需求高度匹配,能够有效解决实际问题,如自动化处理、智能预测或优化决策等。其次,投入产出比必须清晰可量化,以确保项目的长期可持续性和经济效益,这也是企业决策者关注的核心因素之-。最后,行业必须具备充足的数据资源和算力支持,尤其是在需要处理大规模数据或进行复杂计算的场景下,强大的计算能力和高质量的数据是大模型成功落地的基础。综合来看,只有当这三大要素在具体行业中有机结合,才能推动大模型的高效应用,实现行业效能的显著提升。

  举例而言,金融、医疗等行业已展示了大模型应用的潜力,这些行业的共同点是都拥有高价值的专业数据和充足的预算支持,同时业务需求明确,能够在自动化、精准预测和决策支持等方面产生显著效益。

  从行业应用视角,互联网、金融、制造、消费零售和教育五大行业在实现大模型落地与规模化部署方面领先,五大行业金额贡献合计占比超70%,是当前大模型商业化的领军行业。

  根据2024年网信办发布的《生成式人工智能服务管理暂行办法》,截至2025年3月全国已有451个生成式人工智能服务完成备案,其中超80%为垂直领域定制化解决方案,仅19%为通用模型,标志着AI应用正从“通用能力向“场景化落地深度演进。

  大模型应用层产品按商业成熟度可分三类:嵌入式应用通过为现有成熟软件赋能实现高效变现,成熟度更高;原生AI应用以模型为核心创造新服务,商业模式仍在探索成熟度居中;智能硬件则结合物理载体,潜力巨大但商业化挑战更大,处于早期萌芽。

  面向消费者的网页版大模型应用呈现出显著的头部集中效应。其中,ChatGPT以近47亿次月访问量占据绝对领先地位,微软新必应以约15.3亿次紧随其后,两者共同构成了流量的之一梯队。其后,DeepSeek、Gemini、Perplexity、Character.ai、Claude等应用获得了上亿级别的访问量,形成了第二梯队,但与头部两者相比差距明显,更大量的AI应用则分享着剩余的长尾流量。

  AI对话助手与AI搜索引擎是当前网页端A应用的两大主导形态,合计贡献了超八成总流量。其主要归因于信息查询和交互式问答是用户更高频、最基础的 *** 核心需求AI搜索和AI助手恰好高效满足了这一点;同时,这两类应用场景通用性强,用户基数庞大,加之领先产品通过先发优势或整合原有入口已成功积累了大量用户并验证了其核心价值。

  在超大规模GPU集群训练中,算力损失率通常会从小规模的10-20%攀升至20-30%甚至更高,成为硬件投资回报的关键制约。更大化可用算力可借助负载均衡等技术,将GPU利用率稳固推升至80%+。

  算力损失率(Compute Power Loss Rate)通常指在实际运行过程中,理论可用算力与实际发挥出的算力之间的差异比例。简单来说,就是系统中由于各种原因导致部分计算资源没有被有效利用,从而损失掉的那一部分算力的比例。

  在训练大语言模型(比如 GPT、LLaMA、文心一言这类模型)时,通常会用到大规模GPU集群,比如数百到上万张GPU。理论上,整个集群的总算力非常惊人,但实际训练时,总会有一部分算力损失掉。常见导致算力损失的原因:

  以算力切片与潮汐调度为代表的资源管理技术,正推动算力实现持续的优化升级。算力切片技术与潮汐调度技术根据业务负载变化,实现计算资源的弹性化伸缩,确保算力资源的高效与精细化利用。

  算力切片,就是把整块算力资源按照一定规则切成多个虚拟小单元”,分别独立调度、分配和使用。算力切片是通过硬件隔离、虚拟化技术或调度系统,在物理算力资源上创建逻辑独立、性能有保障的小型算力单元,以支持多租户共享、弹性分配、按需计费和精细化调度。

  通用GPU虽算力强劲,但全生命周期TCO极高、推理效率仅30%-50%且受CUDA生态锁定,带来成本与供应风险;而定制化ASIC通过专用架构设计大幅提升性能——成本比和能效,正成为高效推理的更优选。

  NVIDIA 在数据中心加速卡市场占有率逾90%,CUDA 软硬件闭环使云厂商与大模型公司在采购价格、交付周期和未来路线图上高度依赖单一供应商,一旦产能受限或遇出口管制,成本和项目进度面临系统性风险。

  通用 GPU 为兼顾图形渲染与科学计算,集成大量并行小核和复杂缓存逻辑,但在典型I/O 受限、批量深度有限的推理场景下,算力利用率常仅30%-50%,大部分晶体管与功耗处于闲置状态,性能、价格与能耗三角失衡。针对确定性推理需求的定制化 ASIC(如谷歌 TPUv5e)采用手术刀式”设计,仅保留与模型高度相关的矩阵运算和稀疏计算单元优化片上存储与互连;在 Llama-3 推理测试中,单瓦性能-成本比较 H100 提升约 70%且规模化生产可使单片成本再降60%6-70%。

  开源大模型与闭源大模型主要围绕创新与生态共享和商业利益与安全考量展开。开源模型提倡透明开放,吸引各领域专家联合贡献开发力量,闭源模型则更加关注数据安全和商业层面的效益。

  企业在模型部署上以71.5%的占比显著倾向开源方案,且40%的决策者因其可托管于自有基础设施而尤为青睐部分开源模型,以实现更高的数据隐私与安全可控性。

  MaaS正在成为企业调用AI能力和未来云厂商竞争的核心入口。其通过API大幅降低企业使用AI的门槛,并能有效带动laaS和PaaS等底层云服务的营收,将成为驱动AI全产业链营收高速增长的关键引擎。

  MaaS模型即服务,通过可扩展的、按需付费的API提供预训练机器学习模型,使开发者能够在无需自建基础设施或深厚专业知识的情况下,快速集成和部署先进的 AI 能力。

  大模型应用已由通用能力输出阶段转向行业深化阶段。首先,通过领域专属数据进行精调训练,以提升模型在垂直行业的精准度;其次,将精调后模型能力深度赋能风控等业务流程,以实现降本增效。

  企业采纳大模型的视角,已从早期侧重模型性能、倾向于“先采后用的探索模式,转向以明确的业务场景和可量化的价值实现为核心驱动。因此,需求侧企业愈发重视云服务厂商的端到端交付能力。

  市场正沿着两条不同的商业化道路分野,一是以闭源模型和MaaS平台为核心的平台生态化路径,旨在构建高价值、高粘性的商业闭环;二是以Llama、Qwen、DeepSeek为代表的开源普惠化路径,旨在通过开放技术、构建广泛的开发者社区来赢得市场,这两种路径的博弈与共存定义了当前的市场竞争格局。

  中国与海外的头部厂商的技术演进路线均明确指向原生多模态,即从处理单一信息类型向融合处理文本、视觉、听觉的统一智能体演进,以GPT-4o和Gemini为代表的模型已成为业界共同追逐的技术标杆。

  长文本工程也是当前模型进步的重要发展方向之一,Gemini-2.5 pro的上下文窗口已达到,进一步将大模型能力渗透至,超长论文摘要、会议纪要、文学作品输出等长文本高价值领域。

  大模型预训练始于海量数据预处理与预训练,以学习世界知识规律随后通过人工标注问答数据进行监督微调,赋予基础对话能力;最后借助人类反馈强化学习实现能力与价值观的精细对齐。

万字长文讲透人工智能全产业链发展

  预训练模型在对话流畅度和准确性上仍欠佳;因此,后训练阶段使用高质量对话数据进行监督微调,再将奖励模型将主观偏好量化为评分,不断迭代更新模型参数,实现模型产出与人类价值的对齐。

  大模型推理的流程为输入文本先经分词和嵌入层映射为向量,通过多层 Transformer 的自注意力计算并结合 KV 缓存提升性能,再在词汇概率输出层生成并通过后处理拼接成完整文本。

  大模型推理分为并行Prefil与增量Decode两阶段,分别依托模型并行与批量吞吐、以及KV缓存与注意力优化,实现了高效低延迟的推理流水线。

  大模型调用量从24年1月的8,000亿Token激增至25年4月的71.8万亿标志产业应用迈入规模化落地阶段;市场呈现三足鼎立,火山引擎占46.4%,阿里云与百度智能云合计约38.4%,三者合计达85%。

  未来50年,中国大模型产业将在算力与基础设施夯实及多模态感知与深度推理等技术突破的驱动下,逐步向应用场景主导转型,并在AGI临近时凭借丰富的上层应用生态实现人机共生的价值巅峰。

  具身智能通过身体与环境的互动实现感知、认知和行为控制,强调智能行为依赖于身体能力、感知和动作。其发展历经三个阶段:哲学概念提出,人工智能和机器人技术积累,大模型技术突破。

  具身智能是指通过身体与环境的动态互动,实现对世界的感知、认知和行为控制的智能系统,它强调智能行为的产生不仅仅依赖于内部处理,而是与身体的能力、感知和动作紧密相关。

  具身智能强调,智能系统唯有通过身体与环境的动态交互并付诸具体行为,才能真正理解与认知所处场景。

  智能机器人技术存在从L0到L4的明确自动化分级,不同领域的机器人对智能化侧重各有不同。例如,工业机器人因场景稳定而追求极致的自动化精度,而服务与特种机器人则因环境多变,更侧重于发展L3-L4级别的高度自适应与自主决策能力。

  在机器人技术领域,智能机器人的自动化水平被划分为五个等级,从基础操作到完全自主,依次为L0(人工操控)、L1(程序操控)、L2(感知操控)、L3(自适应操控)和L4(完全自主)。

  针对不同领域,工业机器人因环境稳定且精度要求极高,更注重自动化而非智能化;而服务与特种机器人面临复杂多变的场景,对高精密度依赖较低,却更需智能决策。未来,服务与特种机器人中的身体化智能技术将拥有更大增长潜力。

  工业机器人在多任务机械臂和多关节机器人等工业场景中广泛应用;服务机器人在酒店、医疗和物流领域实现规模化落地,而无人驾驶载具与人形机器人仍处早期,商业化潜力待挖掘。

  具身智能行业产业整机供应商可以分为四个类型,之一个类型为工业机器人、第二个类型为服务机器人、第三个类型为无人驾驶载具、第四个类型为人形机器人。从当前的市场营收占比来看,这四类占比中,工业机器人的占比更高,达到53%,是当前商业化落地场景最丰富也最为成熟的场景,领先企业包括埃斯顿、新松科技等,在工业场景已有较为成熟的应用,例如多任务类型机械臂、垂直多关节型机器人等。其次是服务机器人,在酒店、医院、物流配送等领域应用成熟,领先企业包括科沃斯、石头科技、天智航等无人驾驶载具与人形机器人目前还相对处在发展初期,商业化潜力有待进一步得到释放。

  未来50年,具身智能将在2020-2035年依托多模态感知、深度强化学习、仿真-现实与软体机器人等核心技术突破,将市场规模从2,271亿元增至近9,749亿元,并实现系统集成与人机协同的初步商业化;此后至2075年,随着弹性形态设计、终身学习、边缘计算与5G/6G、模块化标准平台和低代码开发的普及,机器人部署成本和门槛大幅下降,市场规模将激增至约13.1万亿元,推动制造、服务、城市运维和家庭护理等领域的广泛普惠与指数级生产力跃迁。

  智能体Agent指能够独立自主对任务进行目标规划、拆解、工具调用、最终完成用户的指令。Agent的核心特征是具备学习、推理和适应环境变化的泛化能力,实现在没有人类干预的情况下完成任务。

  Al Agent(智能体)指能够独立自主对任务进行目标规划、拆解、工具调用、最终完成用户的指令。 A Agent的核心特征是能够进行自主行为,并且通常具备学习、推理和适应环境变化的泛化能力,实现在没有人类干预的情况下完成任务。

  依据Al Agent在任务执行过程中所表现出的复杂性和自主性,将其能力划分为不同等级,从而评估Al Agent是否具备足够的智能和适应性。Level 3是Al Agent的关键点标志着AI从工具性的助手,向更具自我调节和自我优化能力的智能体转变。

  AlAgent产品供给侧聚焦通用场景,凭借广泛的市场需求、技术通用性、成本效益及市场探索阶段的高适应性占据优势;从需求分布来看,通信、交通和能源行业的落地需求尤为显著。

  在通信、交通和能源三大行业,A Agents正在迅速落地以应对关键技术挑战——在通信领域实现智能化 *** 管理与自愈,在交通领域支持自适应流量调度与自动驾驶决策,在能源领域优化电网调度与预测性维护;在政策扶持与资本推动下,AIAgent技术已成为行业招投标的战略焦点。

  在未来50年,智能体Agent预计将完成一场深刻的演变,从底层技术突破发展为应用场景的广泛拓宽,最终成为连接人类、人工智能与硬件的核心媒介。其发展路径始于模型与数据的技术迭代,随后凭借在企业和消费端的规模化应用实现爆发式增长,并最终作为一种核心技术形态稳定渗透。这一演进趋势将推动市场规模实现指数级增长,预计在2075年其体量将超过1.12万亿元。

    相关应用