Agentic AI 驱动企业 IT 基础设施全面重构 Agent 正在从会聊天

Agentic AI 驱动企业 IT 基础设施全面重构
Agent 正在从会聊天走向会干活，但让 AI 真正干活并非只需部署大模型和 Agent 框架，企业 IT 基础设施需系统级重构。这一判断来自鲲鹏开发者峰会上传出的观点，华为公司 Fellow 胡新卫与鲲鹏计算产品部部长刘林超的演讲共同指出，Agentic AI 推动企业 IT 基础设施迎来四大新趋势，关键在于计算底座能否驾驭会干活的 AI。
AI 算力方面，CPU 与 GPU 协同成为核心。过去大模型训练和推理依赖 GPU 做矩阵计算，但 Agent 时代，Agent 不仅要思考还要动手，比如调用 API、查询数据库、执行代码等，这些调度、编排和控制流任务是 CPU 的主场。胡新卫提到，Agent 执行任务时 CPU 处理工具调用的执行时延占比最高可达 90.6%，CPU 不再只是 GPU 的辅助角色，直接影响 Agent 运行效率和稳定性。因此 AI 数据中心的 CPU 与 GPU 配比正在变化，过去可能是 1:8，现在正走向 1:2 甚至 1:1。
内存与存储成为 Agent 的记忆层。Agent 需要记住历史对话、任务进度、工具返回结果和多 Agent 协作状态，但记忆有成本，上下文越长 KV Cache 越大，任务越复杂历史数据越多，Agent 越多内存压力越高。胡新卫指出，Agent 多轮对话累积上下文易导致 KV Cache 成为容量瓶颈，几个并发用户就可能耗尽几十 GB 的高速片上内存，而片上内存是最贵最稀缺的资源。合理的解决方式是分层记忆，最急迫的热数据放在计算卡附近，有复用价值的温数据放在 DDR 内存，庞大的历史对话和长期记忆存到固态硬盘，避免只靠堆显卡增加成本。
资源池化转向超节点架构。Agent 规模化运行时，单台机器难以承载持续调用工具、传输数据等需求，传统服务器集群的独立资源边界导致跨机器访问延迟高、数据搬运开销大。Agent 需要高并发、低时延、强协同，推动超节点架构发展。超节点通过高速互联把多台物理机逻辑连成超级机器，鲲鹏超节点实现单节点 TB 级互联带宽，比传统网络提升 10 倍，节点间时延达百纳秒级，比传统以太网降低 10 倍，让 Agent 间的消息传递、数据调用和记忆访问能在接近共享内存的体系里高效流动。
系统优化兼顾成本、稳定性与安全。Agent 越聪明越依赖记忆，记忆越多 Token 开销越高，任务链越长调用次数越多，若无系统级优化成本易失控。刘林超提到，基于鲲鹏超节点的 AI 数据底座通过上下文缓存和共享内存机制实现数据按需加载，可将 Agent 业务的 Token 开销降低 50%，复用记忆、缓存数据、按需加载减少不必要的开销。同时，Agent 能执行命令行、访问数据库等操作，权限失控可能带来风险，因此需要安全沙箱，确保关键操作可控、执行过程可追踪、出错后能快速回滚。
从大模型到 Agentic AI，不是简单套个壳子，背后是 CPU、内存、网络、存储、安全和操作系统的全面重构。过去大家关注谁的大模型更聪明，接下来更关键的是谁的计算底座能真正驾驭一群会干活的 AI。

众力资讯网

Agentic AI 驱动企业 IT 基础设施全面重构 Agent 正在从会聊天

热门分类