今日凌晨,阿里云通义千问超大规模的MoE模型Qwen2.5-Max 正式上线,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准测试中,Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o。 在新模型发布后,阿里巴巴美股大涨6.76%。而在前一日,通义千问还开源了全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。新的Qwen2.5-VL能够更准确地解析图像内容,支持超1小时的视频理解,实现给指定朋友送祝福、电脑修图、手机订票等操作。 刚刚暴击美股的DeepSeek团队也在1月28日抛出了新模型,两款多模态框架—— Janus-Pro 和 JanusFlow。其中,Janus-Pro 是一款统一多模态理解与生成的创新框架,是Janus的升级版本,它在图像生成基准测试中的表现超越了 OpenAI 的 " 文生图 " 模型 DALL·E 3。并与之前的 Janus 系列一样选择了开源。
今日凌晨,阿里云通义千问超大规模的MoE模型Qwen2.5-Max正式上线,Q
清风探紫
2025-01-29 17:05:24
0
阅读:1672
叶凡
Janus不是deepseek的吧?
太空之弦
百花齐放,期待超级智能的寄点出现
杨家大少
神仙打架了
采薇主人
deepseek没出来的时候怎么没看见你支棱[捂脸哭][捂脸哭][捂脸哭]
大叼萝莉
部署要求的硬件规模,与ds类似吗?如果是,那么openai就彻底只能收割鹰酱本土的客户了。
個人醉醉
关键是否开源,不开源没有发布必要了。
北与南山海间
别蹭deepseek的热度,真牛逼的话,等过几个月dS热度下去了,自己再来个更猛的,让英伟达直接跌20%,不行就别逼逼!!!!
呜呼啦呼
能不能把购买api搞的方便些