2026年以来,国内AI推理需求的发展是否超出预期?这种需求的增长势头在未来一两年内是否可持续?
2026年以来,国内AI推理需求的发展确实好于预期。一方面,国产芯片在与特定模型进行深度对接和适配后的表现超出了早前预期。例如,经过深度适配后,国内一些头部芯片的性能已经能够超过英伟达的H20。
关于未来一到两年的可持续性,推理需求的增长前景是乐观的。当前流量最大、热度最高的两大场景是编程辅助和聊天机器人。其中,Coding场景已非常成熟,用户习惯已经形成,并与日常工作深度绑定,这将持续推动Token调用量的增长。而AI Agent等场景目前尚不成熟,一旦技术成熟并能在商业场景中大规模应用且实现成本效益,其需求也将迎来快速增长。因此,推理需求的增长具有坚实的应用基础和发展潜力,其可持续性是有保障的,可能会呈现出随应用成熟度提升而波浪式上升的态势。