世界模型有了开源基座世界模型赛道新玩家最新最强的开源原生多模态世界模型——北京智

2025-10-31 10:48:03 量子位看科技科技

世界模型有了开源基座世界模型赛道新玩家

最新最强的开源原生多模态世界模型——

北京智源人工智能研究院（BAAI）的悟界·Emu3.5来炸场了。

图、文、视频任务一网打尽，不仅能画图改图，还能生成图文教程，视频任务更是增加了物理真实性。

先感受一下它的高精度操作：一句话消除手写痕迹。【图1】

第一视角漫游动态3D世界：【图2】

要知道，现在AI迭代的速度，正在刷新所有人的认知。

尤其是在文生视频这条赛道上，几乎每个月都有新技术出来"搞事情"。

肉眼可见，AI视频一个比一个真，一个比一个长。

but，先别急着鼓掌，真正的赛点，早已不是"像不像"，而是"懂不懂"。

它知道桌子上的苹果被拿走后，那里应该变空吗？它明白你转身之后，背后的场景依然存在吗？如果答案是否定的，那再逼真的视频，也不过是"高级的GIF"。

现在，致力于攻克这一终极难题的玩家，终于带着悟界·Emu3.5来了。

从官方放出的demo来看，Emu3.5生成的作品展现出极强的连贯性、逻辑性，尤其让AI模拟动态物理世界的能力又双叒增强了。

它能让你以第一人称视角进入它所构建的虚拟世界。你的每一次移动、每一次转身，它都能动态构建出你下一步应该看到的场景，全程保持空间一致性。

由于掌握了世界运行的内在规律，它不仅能像专业设计师一样，进行高精度、可控的图像编辑：【图3】

还能像拍电影一样，生成图文并茂的视觉故事：【图4】

从测评成绩来看，悟界·Emu3.5的表现也极其亮眼——在多项权威基准上，性能媲美甚至超越了Gemini-2.5-Flash-Image，没错，就是那个Nano Banana，在文本渲染和多模态交错生成任务上优势尤其显著。【图5】

Emu3.5的命名，就揭示了它的定位：世界模型基座。

顾名思义，它要做的是世界模型的基础模型，这等于是在AI领域开辟了一条全新的赛道。

那么，这样一个被寄予厚望的模型究竟有多强？来看更多案例：

阅读：1 点赞：0

猜你喜欢

这是AI最有温度的一集：

2025-10-30 月入百万女士

标签： ai 社交平台人工智能

西方终于明白，中国AI为何全面爆发！最近西方不少权威媒体、专家都在说，中国A

2025-10-29 承影简史

标签： ai

黄仁勋点赞中国模型，算力战场却悄悄换人，谁在背后推着芯片跑？2024年GTC

2025-10-30 零零后小萌新

标签：芯片黄仁勋算力 GPU it芯片

这是ai做的图还是真的啊，真帅

2025-10-24 会爆炸的土豆

标签： ai

大家有没有发现，自从AI爆火后，很多软件都变得良心好用了。举个例子，大家可有印

2025-10-30 辉辉记

标签： ai 软件人工智能

被这两天的新闻吓到了！你们知道吗？全球超过3000名顶尖科学家和科技大佬突

2025-10-27 幸福百香果

标签： ai 人工智能姚期智苹果

很多人还没觉察到，全球科技圈出现两大新变化，信号极其强烈！第一变：中美科技

2025-10-29 往事趣谈纪录

标签： ai 芯片人工智能

有一个ai使用小技巧

2025-10-26 校园活动啊

标签： ai

众力资讯网

世界模型有了开源基座世界模型赛道新玩家最新最强的开源原生多模态世界模型——北京智

热门分类