众力资讯网

[CV]《MoCapAnything: Unified 3D Motion Ca

[CV]《MoCapAnything: Unified 3D Motion Capture for Arbitrary Skeletons from Monocular Videos》K Gong, Z Wen, W He, M Xu… [Huawei International Pte. Ltd. & Huawei Central Media Technology Institute] (2026)

在动作捕捉领域,从单目视频生成任意骨骼动画是一个悬而未决的难题。过去方法受困于固定人类或动物模板,本质原因是关节定义与运动表示强依赖特定骨架。

本文的核心洞见是:把“动作恢复”重新看作“先预测关节轨迹,再恢复旋转”。由此,引入参考资产作为提示,并通过4D网格桥接图像与骨骼空间,使不同物种甚至非生物骨架都能共享同一解码过程。

这项工作真正留下的遗产是将动作捕捉变为“可提示的通用生成问题”。它为跨物种、跨角色动画打开新门,但尚未跨过的门槛是对高质量3D重建与已知骨架结构的依赖。

arxiv.org/abs/2512.10881 机器学习 人工智能 论文 AI创造营