今日凌晨,阿里云通义千问超大规模的MoE模型Qwen2.5-Max正式上线,Q

清风探紫 2025-01-29 17:05:24

今日凌晨,阿里云通义千问超大规模的MoE模型Qwen2.5-Max 正式上线,Qwen2.5-Max模型是阿里云通义团队对MoE模型的最新成果,预训练数据超过20万亿tokens。在Arena-Hard、LiveBench、LiveCodeBench、GPQA-Diamond等基准测试中,Qwen2.5-Max整体表现优于DeepSeek V3、Llama-3.1-405B以及闭源模型GPT-4o。 在新模型发布后,阿里巴巴美股大涨6.76%。而在前一日,通义千问还开源了全新的视觉模型Qwen2.5-VL,推出3B、7B和72B三个尺寸版本。新的Qwen2.5-VL能够更准确地解析图像内容,支持超1小时的视频理解,实现给指定朋友送祝福、电脑修图、手机订票等操作。 刚刚暴击美股的DeepSeek团队也在1月28日抛出了新模型,两款多模态框架—— Janus-Pro 和 JanusFlow。其中,Janus-Pro 是一款统一多模态理解与生成的创新框架,是Janus的升级版本,它在图像生成基准测试中的表现超越了 OpenAI 的 " 文生图 " 模型 DALL·E 3。并与之前的 Janus 系列一样选择了开源。

0 阅读:1672

评论列表

叶凡

叶凡

13
2025-01-29 21:18

Janus不是deepseek的吧?

太空之弦

太空之弦

12
2025-01-29 19:51

百花齐放,期待超级智能的寄点出现

杨家大少

杨家大少

7
2025-01-29 18:38

神仙打架了

采薇主人

采薇主人

2
2025-01-29 19:50

deepseek没出来的时候怎么没看见你支棱[捂脸哭][捂脸哭][捂脸哭]

大叼萝莉

大叼萝莉

2025-01-30 05:48

部署要求的硬件规模,与ds类似吗?如果是,那么openai就彻底只能收割鹰酱本土的客户了。

個人醉醉

個人醉醉

2025-01-29 17:27

关键是否开源,不开源没有发布必要了。

北与南山海间

北与南山海间

2025-01-30 06:42

别蹭deepseek的热度,真牛逼的话,等过几个月dS热度下去了,自己再来个更猛的,让英伟达直接跌20%,不行就别逼逼!!!!

呜呼啦呼

呜呼啦呼

2025-01-29 18:04

能不能把购买api搞的方便些

清风探紫

清风探紫

感谢大家的关注