白宫彻底坐不住了,川普接连收到3个噩耗,美媒:7大巨头这次麻烦大了! 就

顾议史 2025-01-30 15:36:51

白宫彻底坐不住了,川普接连收到3个噩耗,美媒:7大巨头这次麻烦大了!

就在东大的DeepSeek R1大模型引起的讨论不断升温之际,白宫彻底坐不住了,美方意图通过其他“盘外招”来淡化自身结构性问题。

美媒普遍认为,这次DeepSeek R1大模型和KIMI k1.5模型对美方的人工智能产业造成了强烈冲击,它不仅改写了美方鼓吹的所谓“高性能芯片+算力中心+巨额投资”的高成本大模型训练模式,而且还从根本上动摇了美方高科技产业发展逻辑和思维方式的根基。

为此,负责白宫人工智能领域的专业顾问大卫·萨克斯在28日的福克斯新闻上对着东大的DeepSeek-R1模型表达忧虑,他认为DeepSeek-R1模型的训练过程实际上是对美方成果的一种优化,也就是通过所谓“模型蒸馏”技术对OpenAI的模型进行知识提炼和数据总结,继而站在OpenAI数据模型和相关参数基础之上获得的低成本、高推理速度的优势。

随后不久,美方人工智能产业界也开始随声附和,一个是认为DeepSeek-R1模型的训练不可能仅仅使用了几百张低效能计算卡就能做到,他们纷纷认为深度求索公司可能囤积了大批高性能人工智能芯片,继而通过其他手段获得了技术优势。

总而言之就是不相信DeepSeek-R1模型仅用557万美元就达到美方企业耗资几十亿美元成本训练出来的生成式大模型,这一言论既没有客观证据,也没有实施意见和让人信服的推导过程,完全就是一副无法相信的神态。

分析人士认为这凸显出美西方国家从心理上根本无法接受一款开源大模型在低成本、高效率和高精度训练模式上的进步,根本无法接受一个非西方企业通过算法和训练手段上的优化就能做到“被神话”的高端人工智能产业成就,这实际上就是一种刻在骨子里的傲慢。

不过,东大人工智能企业对美方带来的“认知震撼”还远没有结束:

1、根据彭博社28日报道,DeepSeek-R1-Distill等多个小型模型上线,DeepSeek随后对外表示,华为云系统正在使用东大昇腾处理器适配DeepSeek-R1模型,这一行动将为深度求索公司的下一代DeepSeek系列大模型在昇腾处理器算力集群上进行训练和实际部署奠定坚实基础,这一消息实际上意味着,即便美方对深度求索公司进行“算力限制”,依旧无法阻碍DeepSeek模型的未来发展,而昇腾处理器毫无疑问将彻底打破英伟达在算力中心构件上的所有技术垄断。

2、就在深度求索公司发布DeepSeek-R1模型之后,1月28日上午,该公司还发布了Janus-Pro-7B多模态模型,该模型不仅可以支持图像输入模式,而且还能进行文生图的快速生成,其总体性能瞬间大败了OpenAI的DALL-E 3 模型和 Stable Diffusion 大模型,让后两者简直无地自容的是,仅仅只有70亿参数版本的Janus-Pro-7B,不仅可以显著提高多模式数据理解、视觉生成和模型指令处理效率,而且其训练策略和训练数据方式与OpenAI存在明显不同,更加让美国人工智能企业汗颜的是,这款多模态模型可以在普通电脑上运行,而且这款模型是完全开源的。

分析人士指出,按照Janus-Pro-7B多模态模型现有训练模式和训练相关数据分析,深度求索公司可能还有一款文生视频的高性能大模型正在开发或已经开发完毕,这无疑将再次引发全球高级生成式人工智能领域的“再一次海啸”。

3、1月28日下午,阿里云人工智能团队(通义)发布了其自行研制的Qwen2.5-VL视觉理解模型,这款主要用于文字、图像、视频处理的多模态开源模型,不仅仅一举拿下13个相关测试项目的第一名。而且作为开源模型,其总体性能和各项关键指数与GPT4o和Claude3.5不分伯仲,甚至在个别领域还略微领先。

我们看到,Qwen2.5-VL视觉理解模型不仅仅擅长识别常见的失误,而且还可以对图像中比较哦抽象的图标、图形和图片布局进行深度分析和理解,并且还可以与文本和图表进行分析比对,也就是说,在准确理解图像、图形内容的前提下,该模型突破了支持超过1小时长视频的理解能力,无需进行某型微调,就能够成为一个能操控手机和电脑的AI视觉智能体。

眼看东大人工智能发展日新月异,新模型如同雨后春笋一般,白宫这次是彻底坐不住了。当地时间1月28日,美方突然宣布对东大大模型和人工智能企业进行所谓的“安全调查”,美媒认为这是由于担忧美国七大高科技龙头企业可能遭受重创而进行的自保行为。

0 阅读:2566

评论列表

金怪

金怪

5
2025-01-30 20:49

我吹吹吹,好不容易吹出来的泡泡,居然被中国人轻易地戳破了,我愤怒了!

用户11xxx79

用户11xxx79

4
2025-01-30 22:37

不相信滴多着呢~陆续有来…

asjack

asjack

1
2025-01-31 05:21

Qwen2.5-VL视觉理解模型早在24年6月就对外公布了

顾议史

顾议史

花开不是为了花落,而是为了开的更加灿烂。