Agentic AI 驱动企业 IT 基础设施全面重构
Agent 正在从会聊天走向会干活,但让 AI 真正干活并非只需部署大模型和 Agent 框架,企业 IT 基础设施需系统级重构。这一判断来自鲲鹏开发者峰会上传出的观点,华为公司 Fellow 胡新卫与鲲鹏计算产品部部长刘林超的演讲共同指出,Agentic AI 推动企业 IT 基础设施迎来四大新趋势,关键在于计算底座能否驾驭会干活的 AI。
AI 算力方面,CPU 与 GPU 协同成为核心。过去大模型训练和推理依赖 GPU 做矩阵计算,但 Agent 时代,Agent 不仅要思考还要动手,比如调用 API、查询数据库、执行代码等,这些调度、编排和控制流任务是 CPU 的主场。胡新卫提到,Agent 执行任务时 CPU 处理工具调用的执行时延占比最高可达 90.6%,CPU 不再只是 GPU 的辅助角色,直接影响 Agent 运行效率和稳定性。因此 AI 数据中心的 CPU 与 GPU 配比正在变化,过去可能是 1:8,现在正走向 1:2 甚至 1:1。
内存与存储成为 Agent 的记忆层。Agent 需要记住历史对话、任务进度、工具返回结果和多 Agent 协作状态,但记忆有成本,上下文越长 KV Cache 越大,任务越复杂历史数据越多,Agent 越多内存压力越高。胡新卫指出,Agent 多轮对话累积上下文易导致 KV Cache 成为容量瓶颈,几个并发用户就可能耗尽几十 GB 的高速片上内存,而片上内存是最贵最稀缺的资源。合理的解决方式是分层记忆,最急迫的热数据放在计算卡附近,有复用价值的温数据放在 DDR 内存,庞大的历史对话和长期记忆存到固态硬盘,避免只靠堆显卡增加成本。
资源池化转向超节点架构。Agent 规模化运行时,单台机器难以承载持续调用工具、传输数据等需求,传统服务器集群的独立资源边界导致跨机器访问延迟高、数据搬运开销大。Agent 需要高并发、低时延、强协同,推动超节点架构发展。超节点通过高速互联把多台物理机逻辑连成超级机器,鲲鹏超节点实现单节点 TB 级互联带宽,比传统网络提升 10 倍,节点间时延达百纳秒级,比传统以太网降低 10 倍,让 Agent 间的消息传递、数据调用和记忆访问能在接近共享内存的体系里高效流动。
系统优化兼顾成本、稳定性与安全。Agent 越聪明越依赖记忆,记忆越多 Token 开销越高,任务链越长调用次数越多,若无系统级优化成本易失控。刘林超提到,基于鲲鹏超节点的 AI 数据底座通过上下文缓存和共享内存机制实现数据按需加载,可将 Agent 业务的 Token 开销降低 50%,复用记忆、缓存数据、按需加载减少不必要的开销。同时,Agent 能执行命令行、访问数据库等操作,权限失控可能带来风险,因此需要安全沙箱,确保关键操作可控、执行过程可追踪、出错后能快速回滚。
从大模型到 Agentic AI,不是简单套个壳子,背后是 CPU、内存、网络、存储、安全和操作系统的全面重构。过去大家关注谁的大模型更聪明,接下来更关键的是谁的计算底座能真正驾驭一群会干活的 AI。
