2025年2月18日,阶跃星辰和吉利汽车集团联合宣布,将双方合作研发的两款Ste

小芳老师爱聊车 2025-02-18 11:21:15

2025年2月18日,阶跃星辰和吉利汽车集团联合宣布,将双方合作研发的两款Step系列多模态大模型向全球开发者开源。这两款模型分别是:

Step-Video-T2V:这是目前全球范围内参数量最大、性能最好的开源视频生成模型,参数量达到300亿,能够生成204帧、540P分辨率的高质量视频。该模型支持复杂运动场景、精准镜头控制和生动人物生成,适用于创意视频制作、动画制作和影视广告等场景。

Step-Audio:这是行业内首款产品级开源语音交互大模型,能够根据不同的场景需求生成情绪、方言、语种、歌声和个性化风格的表达,支持自然、高质量的对话。该模型生成的语音具有超自然、高情商等特征,同时也能实现高质量的音色复刻。

这两款模型的开源,旨在与全球开发者分享最新的多模态大模型技术成果,为全球开源社区贡献力量。

0 阅读:0
小芳老师爱聊车

小芳老师爱聊车

感谢大家的关注