字节扣子模型广场,给AI大模型搭了一座擂台

雷科技 2024-06-14 09:56:30

6月11日凌晨,在苹果开发者大会WWDC 2024上,苹果发布iOS 18,同时首次公布了苹果智能(Apple Intelligence,简称 AI)。在近 40 分钟的时间内,苹果差不多提到了 60 次 Apple Intelligence,基于自有AI与“外援”OpenAI,苹果将重构Siri、iOS以及iPhone、iPad、Mac等设备的体验。发布会后,苹果股价连续两日拉涨,最新市值3.3万亿美元再度成为世界市值最高公司。

(图源:苹果WWDC 2024)

苹果宣布放弃汽车押注AI后,终于真刀真枪地干了起来。苹果用实际行动证明,AI就是世界的未来——上一次科技行业如此激动还是移动互联网爆发时。

“AI的iPhone时刻”终于来了!这一概念由黄仁勋率先提出,作为AI“卖铲子的”,英伟达一骑绝尘,成了跟苹果、微软同一个体量的超级巨头。现在看来,iOS 18以及Apple Intelligence的发布,意味着AI的“iPhone时刻”真的到来。

Bot大爆发,AI现象级应用呼之欲出

2022年11月,GPT-3.5让人们见到了AI大模型的强大威力,AIGC百花齐放,文生文、文生图、文生音乐、文生视频……不断涌现“炸裂级”基础大模型技术。同时,越来越多的企业与开发者跑步入局AI,想法设法将AI融入到自家产品中。

然而从结果来看,AI尚未普及,迄今为止行业缺乏一款类似于微信(3G移动时代)或者说抖音(4G移动时代)的现象级应用,大多数用户对AI大模型是“只闻其声”,Sora更是成了停留在demo阶段的传说。

当前的AI大模型有点像2010年前后的移动互联网:iPhone与安卓均已诞生,3G也已发牌,然而App的缺失却让智能手机成了少数发烧友的炫酷装备。

任何技术都需要繁荣的应用生态,因为“只有车跑起来,高速公路才有价值”。AI应用生态亟需更加丰富,但AI开发者正面临两大难题:

一个是AI大模型本身具有极高的开发门槛,开发者不知道如何“下牙”,不同模型能力不同,越复杂的模型越难调试,学习成本高,开发难度大;第二个是AI计算资源昂贵奢侈,大模型训练、推理与部署均需要高性能GPU、电能等计算资源,这给开发者带来巨大的资金压力。

AI想要普及,必须下沉到各类软硬件产品上,要么成为AI硬件,要么成为融入到AI硬件中的AI应用——其中最具代表性的是Bot,即Robot(机器人)的缩写,它是当前应用最广泛的智能应用形态,具有代表性的是ChatGPT、字节豆包、文心一言。

(图源:字节扣子)

大模型将重构人机交互方式,应用的终极形态可能不一定再是基于触控点按GUI(图形交互界面)的App,而是基于人机自然多模态对话交互的Bot,就跟苹果在WWDC 24上“画饼”的Siri超级助理一样,AI可理解文字、声音、图片、视频等诸多指令并生成对应的结果。

这样看,Bot将会是AI时代的“App”,对于开发者来说,开发Bot将是拥抱AI的主流路径,也是新的红利。

因此,要推动AI大模型落地,最重要的一点就是降低Bot开发门槛。移动时代,苹果和谷歌始终为降低开发门槛而不懈努力,它们的应用生态分别拥有数百万计的App。AI时代,字节旗下的扣子(coze.cn)也想扮演类似角色,让开发者更低门槛、更高效率、更低成本地开发Bot应用,拥抱AI新浪潮。

字节扣子,让人人都能成为AI开发者

对大多数开发者来说,基于基础大模型开发AI应用特别是Bot,并不现实,因为基础大模型开发门槛极高,与大多数开发者之间都有技术鸿沟,更别说缺乏编程经验的普通人了。

AI开发者的痛点,有平台看见了,比如善于技术产品化的字节跳动。在大模型驱动的AI时代,字节没有狂卷参数猛堆料搞军备竞赛,而是将重点放在了技术产品化与大模型落地上。除了“人有我有”的基础大模型以及对应的云服务外,今年2月字节在国内上线了新一代 AI Bot 应用开发平台扣子(coze.cn)。在这个平台上,即使是没有编程基础的小白,也能快速创建各种各样的聊天机器人,并将创建的机器人发布到抖音、微信等社交通讯平台。

(图源:字节扣子)

相较于其他Bot开发平台而言,字节扣子的最大特色可被概括为:“模块化”。

开发者可像搭积木一样拼装不同组件,将大模型、插件和工作流等能力组合成具有不同能力、适用于不同场景的Bot应用,哪怕没有编程基础的人,也可通过拖拉拽的方式快速搭建一个工作流实现编程的效果。

在搭建Bot的过程中,扣子提供了多样的知识存储能力和丰富的交互模式支持,开发者可“投喂”网站实时信息或者本地大文件作为知识库,让Bot具备特定领域的数据源。

此外,字节扣子另一个特征是更新迭代快,这一点至关重要。为什么苹果在WWDC 2024上说不清楚“苹果智能”的路线图?因为AI进化神速,它到底会长出什么样的软硬件今天没人知道答案。因此,所有AI开发者特别是Bot都必须只争朝夕,快速进化。

字节扣子可满足开发者快速进化的需求,一则是其低门槛、易上手的搭建环境支持Bot极速迭代;二则是其会及时地更新各种基础大模型且兼容并包,让Bot拥有与时俱进的底层智能,其现已支持字节豆包、通义千问、MiniMax、Moonshot、智谱、百川智能等基础大模型,且名单依然在扩大中。

凭借着模块化的低门槛开发能力,快速迭代的平台基础能力体系,字节扣子让Bot开发变得前所未有的简单。

6月13日,字节扣子联合Intel推出AI工坊(Coze AI Factory)活动,同时推出了全新板块“模型广场”,定位为在线大模型对比与评估系统——可以简单地将其理解成是AI大模型以及Bot的“擂台”。

(图源:字节扣子)‍

古代的“擂台”要么是比武招亲,要么是招募勇士,总之就是要寻觅牛人。同理,字节扣子的“模型广场”旨在构建一个大模型评估体系,一则让AI开发者可更好地选择适合自身需求的大模型,二则让大模型供应商知道对应大模型在细分领域和真实应用中的反馈,进而有的放矢地改进。

字节扣子模型广场推出的背景是,“百模大战”如火如荼,基础大模型,垂直大模型,产业大模型,多模态大模型如雨后春笋出现,这让开发者陷入了选择困难症,在开发Bot往往不知道选择什么模型,市面上也没有类似于豆瓣电影评分这样的评测体系。

举个例子,小雷这样的科技爱好者想在扣子上创建一个帮助编辑检查文章配图版权、错别字的Bot,但缺乏大模型开发经验的我并不知道扣子上的哪些模型、哪些插件、哪些能力可以为我所用,在模型广场,小雷可以通过“模型对战”来寻觅适合的模型。

也就是说,开发者可让一个Bot在隐藏模型的情况下回答任何问题,再对回答进行投票,测试结束扣子会揭晓模型,让开发者不再有选择困难症。

字节扣子模型广场的对战模式分为三种:指定Bot对战、随机Bot对战和纯模型对战。

开发者想要评测模型在指定细分领域的能力,可以“指定Bot对战”,选取感兴趣的Bot后(比如财经领域的信息处理,再比如数学领域的知识应用),系统会随机选取两个匿名模型来让开发者进行对战测试,检验是否符合预期并进行筛选。

(图源:字节扣子)

比如我想做一个影评类Bot,需筛选一个善于影视类信息分析处理的模型。我只需选中字节扣子上已有的“影视分析Bot”进行对战,就可以筛选出表现更好的大模型。

(图源:字节扣子,该问题下,B模型显然不如A模型表现好。)

如果开发者要评测模型在通用业务场景下的能力,则可选择“随机Bot”对战模式,系统会随机选取一个bot再随机匹配两个匿名模型来进行评测;

(图源:字节扣子,随机Bot对战,问一个问题,对Bot的回答进行评分)

(图源:字节扣子,随机Bot对战,评分后系统会展示隐藏模型细节,帮助开发者选择合适的。)

如果开发者只是想评测模型本身能力,则可选择“纯模型对战”模式,可直观地对比出模型本身的文本生成等AIGC能力。

字节靠着引以为豪的A/B测试方法体系,开发并运营了多款成功的移动产品,成为移动App工场。在小雷看来,字节扣子创造性推出的“模型竞技场”其实也是受到A/B测试方法论的启发,让开发者可以更高效地开发Bot,同时帮助所有大模型更快进化,字节扣子正在邀请更多大模型对其开放 API,加入到其评测范围,收集真实消费场景的数据进而有的放矢地优化。

(图源:雷科技AIGC生成)

自上线以来,字节扣子动作频频,成功抹平基础大模型与AI应用Bot之间的技术鸿沟,让Bot开发走向低代码阶段。AI应用的开发正在变得跟开发App一样简单甚至更简单。今年5月就有一位五年级小朋友基于字节扣子开发了AI bot,他通过利用在学校学到的语文知识,打造了一个堪称英语外教的 AI bot。

人人成为AI开发者,在字节扣子正在成为现实。

重做所有软硬件!开发者迎接AI泼天富贵

任何产品的成功都离不开两点:开发与运营,AI应用也不例外。AI应用的分发则是成功的运营的第一步。开发者开发Bot后,需要先部署让其“跑起来”,再分发获取用户、实现商业化,这些字节扣子都有对应的能力支持。

开发者在字节扣子创建完Bot后,可将Bot部署成网站/App/小程序甚至硬件终端上,接着可将其一键发布到包括抖音、公众号(订阅号/服务号/企业微信)在内的社交通讯平台。

(图源:字节扣子)

已有不少开发者尝到了低门槛开发与运营Bot的甜头,比如海底捞使用扣子模拟顾客对话演练,帮助客服小姐姐提高服务水平,让“海底捞式服务”在AI加持下精益求精;比如超级猩猩使用扣子帮助用户懂得更好的健身;招商银行基于扣子搭建了推荐餐饮优惠门店的掌上生活优惠 bot 以及分析市场行情的财富看点……

2024年的一个显著趋势是,所有软硬件都在被用AI重做一遍。比如阿里提出了AI电商战略让淘宝App全面拥抱AI;再比如在硬件行业,AI手机、AI PC、AI电视、AI穿戴、AI汽车更是蔚然成风,继OPPO、vivo、荣耀、三星、华为、魅族等安卓巨头加码AI硬件后,WWDC 24上苹果的动作更表明,AI手机以及AI硬件是大势所趋。

硬件开发者当然不只是大厂,除了海量智能硬件开发者外,还有大量的基于智能硬件实现行业方案的开发者。不过,AI硬件开发比AI软件要难得多,因为终端侧会更受限于算力、网络、续航等底层资源。苹果AI硬件采取了端-边-云的大模型联动协同复杂方案,vivo、三星等AI硬件巨头都请了“外援”,由此可见AI硬件开发,绝非易事。

字节扣子已针对AI硬件的开发难题提供解法,其产品经理潘宇扬就明确提到,扣子已具备将AI能力带入硬件设备的能力,比如说在边缘云Bot的统筹下,普通的摄像头也能化身“AI设备”,通过图像截取、图像分析等能力,告诉后台哪个展馆热度最高、人流如何。

借着字节扣子“一键发布Bot”的能力,开发者可一键让硬件接入大模型能力,基于此,教育硬件、穿戴设备、家居家电、健康设备、行业智能设备等等智能设备,都可具备全新的Bot对话服务能力,极大化地感知真实世界与场景需求,更好地服务于人类的生活、生产与学习。

不论是移动互联网还是AI大模型,软件与硬件均密不可分。AI硬件是AI 应用普及的关键,AI设备上的OS将升级为AI OS(如iOS 18),软件则将升级成AI 应用(如豆包)。不断降低AI软硬件应用开发门槛的字节扣子,正在“长出”更多Bot创新。

(图源:字节扣子)

移动互联网的流量红利消失,开发者迎来AI带来的新一轮泼天富贵。千行百业的软硬件开发者正在字节扣子释放创意,结合业务场景与客户需求,开发Bot,用Bot创业,用Bot承载现有业务服务客户,用Bot改造现有软硬件应用,用Bot重塑原来的数字化系统。

写在最后:

“高手在民间”。

移动互联网时代,iOS与安卓催生了海量的创新,不只是有微信、抖音、美团外卖、街电等等创新软件,也有智能电视、智能手表、智能门锁、智能家电、XR眼镜、智能汽车等智能硬件,还有智慧交通、智能能源、智能安防、共享经济等等行业数字化应用……

同样,当所有软硬件开发者,甚至每一个用户都能低门槛地开发AI Bot时,AI一定会实现从“智能涌现”到“创新涌现”的跨越,“AI英雄”将会创造出许多我们今天想得到、想不到的AI软硬件应用,乃至全新的商业模式。

AI的iPhone时刻已经到来,AI应用的算力、设备、开发工具等基础设施已万事俱备,我们距离真正的“AI时代”,只有一步之遥。

想看模型一键PK?到雷科技回复“扣子”围观!

1 阅读:78

雷科技

简介:专注AI硬科技