大家好,我是 Chris。
昨天微软 AI 团队发了个新品——MAI-Image-2。
科技公司发模型已经不是新闻了。但这个产品的定位和发布方式,让我多看了两眼。
产品介绍MAI-Image-2 是微软 AI Superintelligence 团队发布的第二代文生图模型。目前已在 Arena.ai 排行榜上位列全球前三。
该模型在增强写实感方面表现突出,能够生成自然光照、准确肤色、具有生活感的图像场景,同时支持可靠的内图像文字生成功能,可用于创建信息图表、幻灯片、海报等设计素材。
此外,它还具备丰富的场景生成能力,能够将超现实概念、华丽构图和宏大世界观转化为逼真的图片。
官方介绍:https://microsoft.ai/news/introducing-MAI-Image-2/

核心能力有三个:
1.照片级真实感官方给出的示例图质量非常高,比如冰洞里的人物、逆光下的皮肤纹理、眼睛里的光线反射。这些过去AI最容易被看穿的场景,MAI-Image-2 处理得相当自然。
2.图片内的文字渲染这是个老问题了。DALL-E 画什么都行,唯独文字一塌糊涂,经常生成一堆乱码。这次有明显改进,菜单、海报、标语这类带文字的画面能看了。
3.复杂场景和超现实构图冰川、星空、现代主义设计图,这些需要想象力又不失真实感的场景,模型能Hold住。


产品配套落地做AI产品的都有个感受:一个模型能不能用,和它排名多少没有绝对关系。排名看的是技术指标,但产品落地看的是配套能力。
微软这次没有只发一个模型了事。而是上线 MAI Playground 平台,让大家可以直接在网页上使用最新的 MAI-Image-2:
MAI Playground 地址:https://playground.microsoft.ai/chat


Copilot 和 Bing Image Creator 同步接入,企业客户像 WPP 已经有 API 可以调用,Foundry 平台也开放给开发者了。
微软完全是在抢市场。 Arena.ai第三名是个好的起点,能不能留住用户,最终拼的还是产品体验和分发渠道。
产品使用现在可以打开 https://playground.microsoft.ai/chat 直接在网页体验,用户每天有 10 次创作额度,且每次生成间隔至少 1 分钟。生成的内容会在系统中保存最多 29 天后被删除。