众力资讯网

微软MAI-Image-2发布:超现实场景、精确人像、文字,一次搞定

大家好,我是 Chris。昨天微软 AI 团队发了个新品——MAI-Image-2。科技公司发模型已经不是新闻了。但这个

大家好,我是 Chris。

昨天微软 AI 团队发了个新品——MAI-Image-2。

科技公司发模型已经不是新闻了。但这个产品的定位和发布方式,让我多看了两眼。

产品介绍

MAI-Image-2 是微软 AI Superintelligence 团队发布的第二代文生图模型。目前已在 Arena.ai 排行榜上位列全球前三。

该模型在增强写实感方面表现突出,能够生成自然光照、准确肤色、具有生活感的图像场景,同时支持可靠的内图像文字生成功能,可用于创建信息图表、幻灯片、海报等设计素材。

此外,它还具备丰富的场景生成能力,能够将超现实概念、华丽构图和宏大世界观转化为逼真的图片。

官方介绍:https://microsoft.ai/news/introducing-MAI-Image-2/

核心能力有三个:

1.照片级真实感

官方给出的示例图质量非常高,比如冰洞里的人物、逆光下的皮肤纹理、眼睛里的光线反射。这些过去AI最容易被看穿的场景,MAI-Image-2 处理得相当自然。

2.图片内的文字渲染

这是个老问题了。DALL-E 画什么都行,唯独文字一塌糊涂,经常生成一堆乱码。这次有明显改进,菜单、海报、标语这类带文字的画面能看了。

3.复杂场景和超现实构图

冰川、星空、现代主义设计图,这些需要想象力又不失真实感的场景,模型能Hold住。

产品配套落地

做AI产品的都有个感受:一个模型能不能用,和它排名多少没有绝对关系。排名看的是技术指标,但产品落地看的是配套能力。

微软这次没有只发一个模型了事。而是上线 MAI Playground 平台,让大家可以直接在网页上使用最新的 MAI-Image-2:

MAI Playground 地址:https://playground.microsoft.ai/chat

Copilot 和 Bing Image Creator 同步接入,企业客户像 WPP 已经有 API 可以调用,Foundry 平台也开放给开发者了。

微软完全是在抢市场。 Arena.ai第三名是个好的起点,能不能留住用户,最终拼的还是产品体验和分发渠道。

产品使用

现在可以打开 https://playground.microsoft.ai/chat 直接在网页体验,用户每天有 10 次创作额度,且每次生成间隔至少 1 分钟。生成的内容会在系统中保存最多 29 天后被删除。