
腾讯云操作系统总经理陈立东:"我们打磨的不仅是一个操作系统,更是中国市场上极少数拥有从内核到AI框架完整自研能力的'AI原生操作系统'”。
出品丨自主可控新鲜事
转载请注明出处
正文共3318,建议阅读时间5分钟
从ChatGPT到Sora再到DeepSeek,人工智能产业发展进入全新纪元,对世界的方方面面进行了快速“再造”。就连行业大佬们都纷纷疾呼:面对AI芯片算力爆棚、AI模型飞速发展、AI应用百花齐放,所有行业都值得用AI重新再做一遍。当然,操作系统也不例外。
在AI技术加速渗透与产业升级交织的关键节点,如何在安全稳定的基础上,借助AI之力推动操作系统从“底层支撑”的单一角色向更主动的智能协同中枢进化,在企业数智转型的效率和质量中发挥更大价值,成为了全行业共同聚焦的战略命题。
如何破题?自主可控新事在近日召开的2025年腾讯全球数字生态大会操作系统专场上找到了答案:面向AI场景覆盖从AI模型层、计算加速套件、软件栈到底层硬件的全链条能力的国内独家「OS+AI」解决方案——TencentOS Server AI正式亮相。这不仅是一次产品创新,更标志着国产操作系统正式迈入与AI深度融合的"智能协同"时代。

操作系统是连接软硬件生态的核心枢纽,每一次技术范式的跃迁,都会推动其功能定位的深刻变革。AI时代,异构计算的爆发式增长与应用的指数级需求,正以前所未有的力度重塑企业级服务器操作系统的底层逻辑。在此阶段,操作系统企业面临着比以往任何时期都更复杂的系统性挑战。
其一,算力效能的极致挑战。大模型推理需要低延迟、高吞吐的算力支撑,多模态场景(如文生图、视频理解)对内存带宽、IO效率提出更高要求。传统一刀切的调度策略,已难以满足AI应用对实时性的极致追求。
其二,资源浪费的现实痛点。据调研数据显示,当前AI服务器算力利用率普遍在30%-40%,大量GPU资源因任务峰谷差异、适配兼容性问题处于闲置状态。如何通过操作系统级激活沉睡算力,提升资源利用率,成为企业降本增效的关键。
其三,生态割裂的协同难题。AI生态的“百舸争流”,正在给服务器操作系统带来很大的协调压力。硬件端英伟达、AMD、英特尔以及国内昇腾、壁仞、摩尔线程、天数智芯等GPU厂商各有技术路线。软件层面,推理框架、训练框架及上层业务应用的迭代周期已缩短至半年、季度甚至更短。操作系统若无法兼顾"广适配"与"快兼容",将成为AI应用落地的"最后一道墙"。
综上可知,AI时代的服务器操作系统正经历价值重构。正如腾讯云副总裁、腾讯蓬莱实验室负责人郭振宇所言:“当AI大模型和操作系统相遇,我们将见证并开启一个从‘跟跑’迈向‘领跑’的变革新时代。不过,要想实现‘领跑’,并持续‘领跑’,须跨越上述三重挑战,并在挑战中寻找新机遇,打开新局面。”

腾讯云副总裁、腾讯蓬莱实验室负责人郭振宇
02、TencentOS Server AI,以“双轮驱动”重构智能中枢要打造AI时代的操作系统,我们不妨先看看AI究竟能为OS做什么?众所周知,操作系统与AI是相辅相成的关系,但其早已超越传统的单向赋能,演变为“OS for AI”与“AI for OS”的双向共生:前者通过底层优化释放AI生产力,后者借AI能力反哺OS智能化升级。二者的深度融合,正是AI时代操作系统的终极形态。
“我们的AI技术栈就是围绕着这两条路径发展而来。近年来,为了促进操作系统与AI深度融合,腾讯云自主研发的企业级Linux服务器操作系统TencentOS Server持续迭代升级技术。针对AI推理加速、GPU资源利用率提升、AI生态兼容等挑战,我们正式推出TencentOS Server AI全栈生态方案,助力企业把握AI时代发展机遇。”腾讯云操作系统总经理陈立东在大会上介绍到。

腾讯云操作系统总经理陈立东
具体来看,在OS for AI方面,TencentOS Server一方面创新性推出qGPU算力切割与显存隔离技术,实现GPU资源灵活分配与K8S集成,提升资源利用率。截至目前,已帮助客户节约超60%的GPU硬件采购成本。另一方面还自研了大模型推理加速器TACO-LLM,显著优化了吞吐与延迟表现。基于自研TACO加速框架,TencentOS Server在智能客服助手场景下,测试DeepSeek R1满血版吞吐性能提升超100%;多模态理解方面,实现模型吞吐提升超50%;多模态生成方面,将Flux模型生图速度提升至开源方案的2倍以上。以荣耀为例,TencentOS Server帮助荣耀客服助手“智小荣”持续优化,相较原始开源框架,模型吞吐性能提升2倍、首包延迟降低92%。
在AI for OS维度,TencentOS Server正将AI能力注入系统运维与资源调度的“神经中枢”。用户可通过自然语言与系统交互,借助AI助手自动执行命令,提升运维效率。此外,腾讯云还在推进“可编程调度器”,通过AI动态分析服务器负载,实现自适应的资源调度策略,进一步提升系统智能化水平。

在生态建设上,腾讯云开源分布式KV缓存系统FlexKV,以解决大模型推理中的显存瓶颈,在实测中实现首Token延迟降低70%、对话时延降低57%。不仅如此,TencentOS Server现已支持超过40款主流GPU/NPU硬件,超过30款主流或热门推理框架、训练框架、应用框架及其WebUI应用,进一步便利用户使用。并且,腾讯云将不断通过OpenCloudOS社区贡献开源,共建更加开放、丰富的基础设施生态。
更为重要的是,在AI驱动的业务创新中安全始终是不可逾越的红线。近日,TencentOS Server V4作为国内首批6.6内核操作系统产品正式通过中国信息安全测评中心“安全可靠测评”。此外,其全链路安全漏洞管理体系以及100%兼容RHEL/CentOS、支持原地替换一键回滚的迁移方案等,都为企业转型升级筑牢了安全"压舱石"。

“TencentOS Server不仅是一款软件产品,更是建立在腾讯海量业务之上、不断适应真实生产环境演进的操作系统。这意味着我们不仅是开发者还是深度使用者与运营者。这种‘研发+应用一体化’的模式,推动我们不断发现问题并形成真正可落地、可复制、可扩展的技术能力。更重要的是,腾讯独特的大规模业务场景,包括高并发、低延迟、大模型推理等极端需求环境,使得我们在AI资源调度、系统性能优化等方面积累了独一无二的实践经验。放眼整个业内,很难找到另一个像腾讯这样体量的平台,能够系统性地验证一套国产操作系统的全栈能力。这正是TencentOS Server在业界最核心、最难被复制的竞争力。”腾讯云操作系统总经理陈立东在与自主可控新事交流中如是说。
03、服务千行百业,TencentOSServer的落地答卷技术的价值,最终还要在产业落地中验证。基于15年的技术积累和场景沉淀,如今TencentOS Server已在服务千行百业中交出了一份“累计部署超千万套”的扎实答卷。而在2025年腾讯全球数字生态大会操作系统专场的用户实践分享,更勾勒出TencentOS Server在关基领域的深度渗透图景。
四川银行作为新锐城商行的代表,其新一代工程云平台底座采用1300+物理服务器全量部署腾讯云操作系统,深度适配核心、渠道、支付、信贷、风控等93套业务系统,超过5000个云上虚拟机部署使用TencentOS,承载了60000+容器,有力保障云上业务系统安全稳定运行。
中粮信托基础设施运维经理南昕表示,中粮信托在进行国产化迁移的过程中面临着技术适配与迁移窗口等诸多难题,借助TencentOS Server强大的生态兼容性、丰富的金融行业实践案例以及卓越的技术服务能力,中粮信托高效、平稳、安全地实现了业务迁移,确保了迁移过程中业务的连续性。
“金融企业需选择有长期商业支持、国产生态兼容、面向未来的操作系统,TencentOS是更优选而非备选。”华泰保险集团运维管理负责人程迅介绍到。在华泰保险云原生转型过程中,TencentOS Server不仅为其全栈自主可控(TCE+TDSQL+TencentOS Server)打造了一个安全高效的数字化新基座,还通过GPU虚拟化和推理加速框架,推动华泰加速拥抱AI。在使用TencentOS Server后,华泰保险实现了0安全事故,漏洞修复及时率100%,核心系统性能提升10%+,资源成本下降了30%,业务系统可用性达99.999%。
中国航空结算有限责任公司承担着航空业全链条票务结算、数据服务等核心职能,在国产化转型中面临着管理复杂度高、维护成本高、企业软硬件转型差异较大、供应链风险承压等挑战,通过引入TencentOS Server,结算公司实现了从应用到运维的全流程自主管理。“引入TencentoS 后,我们最大的感受是:管理复杂度降了,运维效率也提高了。”中国航空结算有限责任公司系统运行部资深系统管理工程师孙海骅感慨道。
04、结语从被动适配的"工具"到主动智能的"中枢",TencentOS Server AI的登场,不仅是一次产品升级,更标志着国产操作系统正式迈入与AI深度融合的"智能原生"阶段。
正如腾讯云操作系统总经理陈立东所说:"我们打磨的不仅是一个操作系统,更是中国市场上极少数拥有从内核到AI框架完整自研能力的'AI原生操作系统'。"当AI浪潮持续奔涌,当信创升级成为必选项,这样的操作系统或许正是千行百业数智转型的“最后一公里”基石。
未来已来。操作系统的新故事,将由AI书写。