赛迪报告:全球智能体发展进展、面临挑战与对策建议

2025-07-12 15:36:00
文 | 赛迪智库信息化与软件产业研究所

智能体概念内涵不断演进


(一)智能体泛指具有感知决策能力的代理体

智能体泛指能够感知环境、理解信息并作出决策与行动的代理体,它可以是软件、硬件或者一个系统,具备自主性、适应性和交互能力。从历史起源看,智能体的演进经历五个关键阶段。一是符号智能体阶段,主要使用逻辑规则和符号表示对知识进行封装并推动推理进程。20世纪80年代兴起的基于知识的专家系统是典型代表案例,这类系统在医疗诊断、财务分析等领域展现了智能体在特定任务中的实用价值。二是反应式智能体阶段,主要关注智能体与环境之间的交互,能够快速感知环境并做出反应。这类智能体的设计优先考虑直接的输入、输出映射,而不是复杂的推理和符号操作。1999年索尼推出的AIBO娱乐机器人是此类智能体在消费电子领域的早期应用,展现了智能体在日常生活和休闲互动中的应用前景。三是基于强化学习的智能体阶段,主要关注使智能体通过与环境交互优化决策过程。在这一阶段,智能体能够从高维输入中学习复杂的策略,并取得许多重大成果。例如,2011年IBM研发的Watson智能体在《危险边缘》问答比赛中战胜人类冠军;2016年谷歌研发的AlphaGo战胜围棋世界冠军李世石,这一系列里程碑展示了智能体在复杂环境中不断提升的决策能力。四是具有迁移学习和元学习能力的智能体阶段,主要关注提高智能体在新任务方面的学习效率与泛化能力,降低对大量训练样本的依赖。2020年Deep Mind推出的Alpha Fold2在蛋白质结构预测领域的重大突破是这一阶段的标志性成果。五是基于大语言模型的智能体阶段,将大语言模型作为智能体大脑或控制器的核心组件,并借助多模态感知技术和工具使用等多样化策略显著扩展感知范围和行动空间。2023年AutoGPT的出现进一步提升了智能体的自主性和任务执行能力,推动智能体向更通用化的方向演进。

图1智能体演进经历(数据来源:赛迪智库整理)

广义智能体包含多种类型。按照产品形态划分,包括“硬智能体”和“软智能体”两类,其中“硬智能体”指具备物理实体的产品,包括具身智能、自动驾驶等;“软智能体”指数字世界的软件实体,是未来数字生态的神经中枢,也是“硬智能体”的核心驱动。按照智能体作出决策的依据划分,包括确定性和非确定性两类,确定性智能体是基于固定规则和逻辑运行,结果可预测;非确定性智能体是基于数据驱动的,具有灵活的适应性。

按照智能体作出决策的过程划分,包括简单反射、基于模型的反射、基于目标的、基于效用的四类,简单反射智能体不考虑过去经验,直接根据规则作出反应;基于模型的反射智能体根据历史数据和模型规则共同作出决策;基于目标的智能体以最大化未来目标为依据作出决策;基于效用的智能体可以在目标相互冲突或不确定的复杂环境中作出决策。按照智能体所处层次划分,包括操作系统智能体和应用层智能体,其中操作系统智能体具备操作计算设备底层硬件和上层应用的能力;应用层智能体面向特定应用,具备调用外部软件工具能力。按照功能定位与应用场景划分,包括智能助理、感知交互、仿真、安全、协作等多种类型按照智能体数量与协作能力划分,包括单智能体系统、多智能体系统以及人类与智能体协作三类,单智能体系统侧重于独立运作与自主决策,适用于执行明确任务并实现单一目标的应用场景;多智能体系统以智能体协同与信息交互为核心特征,通过集体智能解决单体智能难以应对的复杂问题;人类与智能体协作将人类认知与机器能力有机结合,构建从工具使用到伙伴协作的多层次交互模式。

(二)当代智能体主要指以大模型为基础的智能系统

当前,智能体是指以大模型为核心驱动,具备感知、学习、适应、决策、执行能力的智能系统。

图2基于大语言模型驱动的智能体基本框架

数据来源:Lilian Weng《LLM Powered Autonomous Agents》,赛迪智库整理


当代智能体是人工智能新发展阶段的重要产品形态。英伟达CEO黄仁勋认为,人工智能发展可以分为四个阶段,一是感知式人工智能,以图像识别等为代表,具备能看能听能力,但不具备思考能力。二是生成式人工智能,以大模型为代表,会思考能写作,但是不具备使用工具能力。三是代理式人工智能,以智能体为代表,能分解任务、自主决策并执行任务。四是物理式人工智能,以具身智能为代表,是智能体与机器人的结合,能够改造物理世界。当前人工智能正在经历一个新的拐点,正在从生成式迈向代理式阶段,智能体是新发展阶段的重要产品形态。

当代智能体是大模型之上能力更强的系统。大模型擅长知识处理和语言交互,是一种被动响应输入,智能体则拥有自主思考和调用工具的能力,能实现端到端的问题解决。具体来看,从功能定位方面,大模型以内容生成及理解为核心能力,而智能体以任务完成为目标,具备规划和执行能力。从模型结构方面,大模型为神经网络架构,智能体则是多组件系统,包括感知器、大模型、工具、记忆组件、规划器等。从自主性方面,大模型为被动响应输入,无主动决策能力,智能体可主动规划、迭代、调用工具。从应用场景方面,大模型适用于问答、写作等生成式服务,智能体可解决一站式智能助手等复杂问题或端到端问题。综合看,智能体能力不再仅限于大模型的被动响应人类指令,而是可以理解人类意图、自动分解任务、作出决策并寻找可用工具执行任务,推动人工智能从只会回答问题的“做题家”升级为能够解决问题的“项目经理”,能力发生飞跃质变。

(三)当代智能体是下一代软件演进跃迁的新方向

智能体的核心软件属性既延续传统软件的本质特征,又通过智能化实现能力跃迁,代表了下一代软件变革演进的新方向、新形态。

智能体的软件属性不变,其本质是由代码构成的可执行程序的延续升级。智能体通过自主决策系统和动态适应能力,将软件从“工具属性”升级为“伙伴属性”,但其代码驱动、可执行、可管理的软件本质属性未变。从代码驱动的一致性看,智能体的大模型推理、强化学习策略等核心决策模块本质上是动态代码的集合,API、数据库等工具调用仍依赖于软件接口规范;从运行环境的一致性看,智能体需部署在服务器、云端或边缘设备,依赖操作系统、容器化技术,与传统软件的运行环境兼容,如谷歌云平台、亚马逊云服务、微软Azure云平台提供各种云计算服务,用于构建和部署智能体;从部署运维的一致性看,智能体遵循需求分析→设计→编码→测试→部署→运维的软件开发流程,依赖软件开发相关的版本控制、测试、监控等工具提升开发效率、保证质量。

智能体推动软件的用户从人变为智能体,从而推动软件向原子化、个性化、智能体友好转变。过去软件面向的用户群体是人,界面的易用性、功能的完备性是争夺用户的核心要素,但正因为功能设置过于繁琐,加上需要人通过点击等操作方式来使用特定功能,造成诸多“隐藏产品”和“隐藏功能”出现。相关数据表明,微软应用商店现有超过16万个APP,“搜索难”“选择难”问题一直存在。根据微软发布会公布的数据,PowerPoint、Excel中超过90%的功能因“操作难”而被用户闲置。智能体能够有效解决上述问题,其进行任务规划、调用和使用工具的能力能够帮助用户完成“选软件-手动操作软件”的整个过程,用户仅需在聊天界面中用自然语言描述需求,智能体就能自动执行任务。这表明,用户与软件之间将产生隔离,软件的用户将从用户端转移到智能体,“运行哪款软件”将交由智能体判断,软件特别是工具软件的生态将迎来重构,有可能转变为智能体的功能插件或数据源,从一体化转向原子化、从人类友好转向智能体友好将是工具软件的演进趋势。

智能体推动软件形态由“静态”变为“动态”,从而改变软件的生产范式。过去软件的开发是通过人总结经验并将其转化为机器能够理解的代码,其运行规则是既定的,任务执行只能依据既有的规则进行机械化响应,每次功能更新都需要对软件进行重新开发。智能体依托大模型的“思考”和“学习”能力,克服了传统软件规则僵化、响应机械、升级困难的局限性。人类向智能体下达任务指令后,智能体能够依据任务要求自适应调用功能、工具甚至自主编写代码来完成指定任务,比如在金融分析中,Manus可以自主制定搜索方案、抓取数据信息、编写Python分析脚本并生成可视化图表。另外,智能体凭借自主学习能力还能实现自成长、自演进。例如,借助强化学习算法,Devin每周的编程能力迭代提升幅度达15%,目前已精通12种主流编程语言,熟练使用300+开发框架。在代码质量评测中,其生成代码的稳定性和可维护性得分比初级程序员平均水平高出37%。未来,智能体将同时扮演软件本体、软件使用者以及软件设计、编写、修改者等多重角色。软件的生产模式将从人类学习掌握机器语言进而完成软件开发的模式,转变为智能体按照人类需求完成软件功能扩展和迭代的模式。

智能体推动软件由“孤岛”走向“互联”,从而改变软件的商业模式。与传统软件作为独立工具、彼此无法相互调用不同,智能体具备调用外部软硬件工具的能力。它既可以在数字环境中调用各种软件接口,比如数据分析、图像生成、办公套件等,也可以通过IoT协议获取空间感知、环境适应和实时反馈功能,并控制物理设备如机械臂、汽车等,形成虚实结合的任务执行能力。此外,通过多个独立智能体之间的职能划分和协同合作来处理复杂任务的多智能体网络系统,使得智能体生态具有极强的可扩展性,如同一个自组织系统持续演化,可以突破单一软件在任务类型和应用场景上的限制。研究数据显示,现有的软件工程智能体中,多智能体系统占比达52.8%。比如阿里云发布的智能编程助手通义灵码2.0,通过规划智能体、搜索、生成、单测、调试智能体等多智能体框架来处理复杂的软件开发任务。在智能体互联互通特性的支撑下,用户逐渐无需在多个软件产品或者云端SaaS产品之间进行切换,“订阅多个独立软件或SaaS”可能转变为“订阅一个通用智能体”。这或将推动以往按工具使用收费模式向按任务量收费模式的转变。

全球智能体技术研发和应用创新

不断加快


全球智能体快速兴起,科技巨头纷纷加大技术研发和应用创新布局力度,市场预期乐观向好。英伟达CEO黄仁勋称,智能体可能是下一个机器人产业,蕴藏着价值数万亿美元的机会,未来每家公司的IT部门都将成为智能体的“人力资源部”。据Gartner预测,至2028年,将有33%的企业软件应用程序包含智能体,至少15%的日常工作决策将通过智能体自主做出。凯捷(Capgemini)的一份报告表示,大多数组织(82%)计划到2026年整合智能体,主要用于诸如电子邮件生成、编码和数据分析等任务。特别是客户服务智能体,已成为众多品牌的标配,在许多行业中,高达60%的客户交互由智能体处理。国际著名市场研究机构Researchand Market发布报告显示,AI智能体的市场规模将从2024年的51亿美元增长到2030年的471亿美元,年均复合增长率为44.8%。


图3、2023-2030E全球AI智能体市场规模(亿美元)

数据来源:Research and Market


(一)技术研发持续突破,核心能力不断增强

大模型技术持续迭代升级,赋予智能体“超强大脑”。大模型是当代智能体的核心驱动,是智能体具备自主规划、自主决策、自主学习能力的关键组成。自2022年OpenAI发布ChatGPT以来,全球大模型发展进入技术加速进化、能力集中涌现、应用加快普及、创新群体突破交织叠加的“四阶并进”时期。ChatGPT问世2年以来,月访问量已达到37亿人次,同比增长一倍以上;各国发布大语言模型突破1000个,前20款产品总访问量突破87亿人次,达到全球人口同等量级。斯坦福大学《2025年人工智能指数报告》显示,大模型基准性能近年来显著提升,在MMMU、GPQA、SWE-bench三个基准测试集上,2024年大模型相较2023年得分分别提升18.8、48.9、67.3个百分点,在SWE-bench上,AI编程问题解决率由2023年的4.4%升至2024年的71.7%,实现惊人跃迁。各国纷纷加大大模型布局力度,推动大模型进入应用成本和门槛双重降低,技术水平和成熟度双重提升阶段。美国OpenAI相继发布ChatGPT、Sora、o1、o3等标志性技术产品,引领全球大模型技术的里程碑式创新,Anthropic、谷歌、Meta、xAI等也加速跟进。我国DeepSeek公司推出DeepSeek-V3和DeepSeek-R1模型,实现大模型训练成本和推理能力双提升,模型能力达到国际领先水平,工程化水平得到全球广泛认可,开辟大模型发展新路径。随着OpenAIo1和DeepSeek-R1的推出,大模型逐步从重训练向重推理转变,思维链(ChainofThought,CoT)技术成为推理模型的关键。思维链技术是智能体任务分解的关键,其可以模拟人类思考过程,将任务指令分解成多个可具体执行的子任务,逐步开展假设、演绎、反思、纠错等步骤,显著提升了模型的逻辑推理能力。

智能体开发平台与工具快速涌现,构建产业发展“新基建”。智能体开发平台与工具是承担推动智能体技术创新和应用落地的关键角色,为智能体设计、训练、测试和部署提供系统化、模块化支持,目前正加速构建和完善。例如,微软推出Copilot Studio平台支持企业自建智能体,截至2024年11月,已有逾10万家企业借助Copilot Studio创建属于自己的智能体;谷歌推出Vertex AI Agent Builder,为企业提供无代码/低代码智能体开发平台;Oracle推出AI Agent Studio平台,使企业在安全合规的前提下,灵活构建智能体并嵌入核心业务流程;英伟达推出智能体协同开源工具组件Agent IQ Toolkit,优化智能体运行效率。我国阿里、字节跳动、百度、腾讯、科大讯飞等也纷纷推出智能体开发平台。其中,百度文心智能体平台允许开发者通过零代码或低代码的方式,利用自然语言交互快速创建智能体。截至2024年11月已汇聚15万家企业,80万名开发者,分发量较2024年初上涨16倍。

通信协议标准化加速推进,多智能体“社会”初步形成。互联互通是智能体区别于传统软件的核心特性。通过多个智能体的相互连接,构建起一个多智能体协作网络,而通信协议则是实现互联互通的关键保障,目前已实现重要突破。例如,2024年11月,Anthropic推出模型上下文协议(MCP),MCP打破了模型链接外部资源的信息孤岛,简化了集成流程,被比喻为“AI领域的USB-C接口”。截至2025年2月,已有1000多个社区构建并对外提供MCP服务器服务,OpenAI等美国企业以及华为等我国企业均已在其产品中集成使用。2025年4月,谷歌联合Oracle、德勤、Salesforce等超50家技术合作伙伴和服务商推出Agent 2 Agent(A2A)开放协议,旨在为不同框架、供应商构建的智能体提供标准化通信机制,实现跨平台的无缝协同。A2A协议实现了与MCP协议的互补,可有效助力构建多智能体团队处理复杂工作任务。此外,常高伟团队推出智能体互联通信协议(ANP),并在GitHub开源。ANP采用点对点(P2P)思路,基于W3CDID(去中心化标识符)标准实现智能体身份管理,形成去中心化协作网络。基于ANP可实现多智能体的去中心化高效协作,且具有可扩展性,以适应复杂网络环境。

表1智能体通信协议对比


(二)应用创新蓬勃发展,产品形态日益丰富

当前,手机、电脑等端侧设备厂商以及大模型厂商、智能体创新企业纷纷面向消费级应用和企业级应用推出一系列智能体产品,应用场景逐步拓展。

消费级智能体方面,聚焦手机、电脑等终端使用,具备网页浏览及操作、报告撰写等功能的智能体加速涌现。在手机智能助手方面,苹果通过接入OpenAI的ChatGPT等大模型将Siri升级为智能体,华为、小米等手机厂商也纷纷将语音助手升级为智能体。此外,智谱发布智能体系列产品,针对手机端的AutoGLM,兼容抖音、微博、饿了么、京东、拼多多等热门APP,并具备跨APP操作能力。在计算机助手方面,微软推出Windows Copilot,打造用户与应用软件的智能交互新入口,推动用户使用应用软件的方式由传统的适应学习转变为自然语言驱动。智能体创新企业Monica推出智能体Manus,能够直接控制电脑,完成报告编写、简历筛选等任务。

表2消费级智能体产品图谱


企业级智能体方面,行业通用工具类和面向特定行业类“一纵一横”两类智能体加速发展。从纵向看办公、管理等行业通用工具类智能体不断推出。美国软件巨头依托前期积累,重点发力行业管理智能体并迎来高增长。微软在Dynamics365中集成了10个销售、运营、服务类自主智能体,为企业用户节约大量时间和运营成本。比如美国电信企业Lumen通过运用微软智能体每年节约了5000万美元的成本,相当于新增了187名全职员工的效能;麦肯锡借助自动化的流程分配智能体,将项目受理流程从20天压缩至仅2天。管理软件厂商Salesforce将智能体与客户管理软件融合打造Agentforce,允许企业按需创建客户服务、销售、数据分析等智能体,已与超过1000家客户达成了付费协议,涵盖销售、招聘和客服等多个业务场景。我国金山、金蝶、用友等企业也纷纷推出办公辅助、人力资源智能体产品,但国际知名度较低。从横向看,行业智能体产品不断丰富。软件工程领域,美国CognitionAI公司推出人工智能软件工程师Devin推动软件工程全流程智能化。金融领域,招商银行推出“掌上生活优惠”与“财富看点”两款智能体,为用户提供优惠查询、办卡指南、行情分析、资产配置建议等个性化服务。教育领域,字节跳动推出“豆包爱学”,可协助学生和教师进行智能解题、作业批改。

全球智能体发展面临的挑战


(一)底层技术瓶颈:算法、数据、算力三大要素制约发展

一是算法性能有待优化。现有算法在面对复杂应用场景时表现欠佳,稳定性有待加强,以智能体基准测试环境OSWorld为例,当设置最大操作步数为50步时,OpenAI开发的Operator智能体仅能达到32.6%的任务成功率,而字节跳动的UI-TARS智能体任务成功率更是仅有24.6%。二是高质量数据获取难、治理难。训练高性能的智能体通常需要大规模、高质量、多样性丰富的标注数据。然而,这类数据获取成本高昂,标注过程耗时费力且易出错。许多行业存在“数据孤岛”现象,数据分散在不同部门或系统中,难以整合利用。三是高性能算力资源相对紧缺。相较于传统大模型,推理导向的应用对计算资源的消耗呈现几何级增长。随着智能体应用边界的持续扩展,推理算力的需求呈现爆发式增长态势,对算力的执行效率和响应速度提出更为严苛的要求。

(二)实际部署困境:决策质量稳定性与跨场景协作能力不足

智能体的商业化应用和大规模部署仍处于初期探索阶段,主要困难集中在决策质量不稳定、跨场景协作能力不足等问题。当前许多智能体以大语言模型作为核心认知引擎。然而,大模型固有的“幻觉”问题,导致智能体输出结果的可靠性难以保证,质量难以稳定控制。尤其在高精度和高可靠性的应用场景中,一旦智能体输出错误决策,恐导致系统性问题,甚至产生不可修复的损失。如在医疗领域,智能体承担辅助诊断、疾病预测和个性化治疗等关键任务,其决策失误可能直接危害患者健康甚至生命,并可能引发对整个医疗AI技术体系的信任危机。此外,智能体跨场景跨系统协作能力不足,现有智能体大多只能在特定工作环节中发挥作用,缺乏灵活调配和自主决策的综合能力,影响了其在自主驾驶、复杂任务规划等多元化、融合性场景中的适用性。

(三)产业生态挑战:隐私保护、算法偏见、责任归属等多维度风险并存

隐私保护方面,智能体为用户提供个性化、智能化服务的过程中,不可避免地需要接触和处理大量数据,其中不乏个人敏感信息和企业核心机密。其日益增强的自主决策能力和与外部环境API接口、数据库系统等的交互能力,使其在某种程度上成为数据系统中的“特权访问者”,带来了前所未有的隐私泄露风险。算法偏见方面,智能体决策行为高度依赖其训练数据和底层算法设计,其自主学习和强化训练过程可能会将训练数据中存在的隐性偏见进一步放大,从而加剧社会公平问题,导致在关键应用领域产生歧视性后果。此外,智能体作为未来软件应用的实际操控者,在软件产品选择方面拥有较大的话语权。一旦智能体开发商将不公平竞争规则内置于智能体系统中,势必会对软件市场的公平选择机制造成干扰。责任归属方面,智能体具备高度自主的决策能力,当智能体的行为导致损失时,极大增加了在开发者、部署者、使用者等多元主体之间清晰界定并分配责任的难度。

对策建议


对照全球发展情况,结合我国实际,智能体发展仍面临一些问题瓶颈,如自主芯片软件生态发展缓慢、模型性能不够优化、产业化发展缺乏成熟的商业模式、产业生态体系不够健全等,亟需强化支持引导,统筹推进技术创新、应用推广、标准制定、人才培养等各项工作,为加快推动我国智能体发展创造良好条件。

(一)推动技术创新

一是加强智能体关键技术研发,支持高校院所和企业围绕智能体核心算法、架构设计、协同机制等开展技术攻关,提升智能体技术水平和应用能力。二是促进智能体开源创新发展,鼓励建设开源技术社区和代码仓库,推动智能体相关工具、框架、模型的开源共享,降低技术应用门槛。三是完善技术创新支持政策,通过科技计划项目、创新基金等方式,加大对智能体技术研发的资金投入和政策支持力度。

(二)深化融合应用

一是推进智能体在重点行业的应用示范,在制造、金融、教育、医疗等重点行业开展智能体应用试点,探索智能体与传统业务的深度融合模式。二是建立智能体应用推广机制,组织开展智能体技术交流、产品展示、供需对接等活动,促进智能体技术成果的转化应用。三是完善智能体应用效果评价机制,建立涵盖技术先进性、应用成熟度、经济效益等多维度的评价指标体系。

(三)完善标准体系

一是制定智能体技术标准,围绕智能体架构、接口、协议等技术要素,研究制定相关技术标准和规范,为智能体产品开发和应用提供技术指引。二是建立智能体评估评测标准,制定智能体性能评价、安全评估、能力测试等标准体系,为智能体产品质量评价和应用选择提供科学依据。三是推动标准宣贯实施,通过标准培训、认证评估等方式,促进智能体相关标准的推广应用和持续完善。

(四)加强人才培养

一是完善智能体人才培养体系,支持高校设立智能体相关专业课程,培养既懂人工智能技术又熟悉行业应用的复合型人才。二是开展智能体专业技能培训,面向企业技术人员和管理人员,组织智能体技术培训、应用实践等活动,提升从业人员专业技能水平。三是建立人才交流合作机制,促进产学研用各方在智能体人才培养方面的交流合作,推动优秀人才向智能体领域聚集。

来源:赛迪智库

作者:王宇霞、胡靖阳、牛子佳、刘健、刘丽超、许旭

编辑:晓燕

指导:辛文

图片
图片

相关文章推荐