最近网上很火的DeepSeek据说很牛,解题准确率很高,我测试了一下。让它做了一道数学题,DeepSeek花了三分多钟分析了很大一堆 ,各个方面展开计算,并验算,最终得出的它的答案。
测试的题目是:边长10cm的正方形最多能铺进去多少个直径1cm的圆?
DeepSeek的答案是105,很遗憾的是回答错误!
正确答案是106个。
对其他的大模型比如kimi,文心一言,星火大模型也分别进行了测试,答案都是100,差距明显。
看来DeepSeek确实比其他大模型有优势,但还不完善。
最近网上很火的DeepSeek据说很牛,解题准确率很高,我测试了一下。让它做了一道数学题,DeepSeek花了三分多钟分析了很大一堆 ,各个方面展开计算,并验算,最终得出的它的答案。
测试的题目是:边长10cm的正方形最多能铺进去多少个直径1cm的圆?
DeepSeek的答案是105,很遗憾的是回答错误!
正确答案是106个。
对其他的大模型比如kimi,文心一言,星火大模型也分别进行了测试,答案都是100,差距明显。
看来DeepSeek确实比其他大模型有优势,但还不完善。
评论列表
猜你喜欢
作者最新文章
热门分类
体育TOP
体育最新文章
吃饱没事撑着干
怎么我问出来的答案是:不管那么多了,今天除夕,杀鸡拜祖是正事,初八上班再讨论这个。
myf 回复 01-29 11:10
后面括号里那一句你没看见?(有多少钱过多少钱的年,想开点)
C4 回复 01-29 11:34
现在问是106[得瑟]
一号两用看着喷
这个号就是来各种摸黑的,大家小心
阿宝raymond 回复 01-29 15:49
不怕不代表不讨厌
初恋成了大嫂 回复 阿宝raymond 01-29 16:45
嘴长在人家身上 人家有权发表自己的意见,你既然面向市场除了要享受别人的赞扬更要容得下别人的批评质疑。
遥远的风景
是啊,还差的远,老美股市反应过度了,小扎赶紧把4个研究团队撤了吧,没有必要![捂脸哭][捂脸哭]
浮生 回复 01-29 00:21
那是有人在里面做空,发酵了
用户94xxx17
如图我的Deepseek答案为106,正确
用户10xxx19 回复 01-29 10:18
问 GPT 去 啊
Steven 回复 01-29 07:31
不是记忆学习,他会优化自己的模型,提高正确的机会。
不再天真VS我本善良
不说正方形。架设这个正方形下方可以无限延伸变矩形。他的最多放置数量(六边形放置)就是第一行10,第二行9,第三行10,第四行9依次类推。怎么排加起来的总数也不会有106。但是要考虑面积有限,所以要考虑一下,已经排列的要超越正方形排列,剩下的面积够同等行数的正方形排列。106这种数,只能是排了7行六边形,剩下的三行排正方形,这样比排全部都是六边形多1个。
游云
最后两行可以排1O个
用户10xxx36
问点实际的。。。[DeepSeek 深挖]审计大A个上市公司的财务是否有造假!!!
用户10xxx62
106个圆是怎么得出的?
点万家灯火。 回复 01-29 06:14
错位排2行及19个需要的高度0.5+√3/2+0.5=1.866,错位排9行需要的高度0.5+6×√3/2+0.5=7.928,10-7.928的高度能排2行10个,总共5×10+4×9+2×10=106
点万家灯火。 回复 01-29 06:15
错位排2行及19个需要的高度0.5+√3/2+0.5=1.866,错位排9行需要的高度0.5+8×√3/2+0.5=7.928,10-7.928的高度能排2行10个,总共5×10+4×9+2×10=106
用户10xxx95
刚开始么难免的,不是免费让你们训练呢么。我之前让他算24点还20+0=24硬挤答案呢,告诉他错了之后就改正了
皂滑挵魜 回复 01-28 23:43
24点很多 ai 都不行,豆包也是回答得一塌糊涂。
captainco 回复 01-28 23:03
很多艺术类创造哪有标准答案
Z00
这玩意儿本就是资本运作出来的,还脚踢英伟达拳打Facebook!
大毛 回复 01-29 11:44
Ai还真是自己推演出来的,还搜索答案不一样
用户17xxx15 回复 01-29 12:54
知道为什么Open AI 的chatgpt5已经宣告做不出来了吗?因为现有的线上线下知识库已经全部用完了,没有可以推算的数据了。这就是你现在说的从网上得到的信息,现在所有AI都不能自己发明理论知识,你以为🇺🇸的月亮圆啊
水面无波
有没可能正确答案本来就是105个?
UC网友10xxxx2846
哈哈,算几不重要,他的使命,灭绝英伟达,要问我为啥,我也不知道
田螺家的男人
尝试一下,讯飞星火解答半页得出答案100,kimi是两页答案是100,deepseek是三十多页吧,答案是105
欣之辰
有没有可能美国投资万亿美元的大模型算出来是103个
༄guan࿐ 回复 01-29 05:23
万亿,你投资的?
TriX
试试问一下这个问题:1234567891是质数吗?
火车头 回复 01-29 07:11
豆包
To be best me 回复 01-29 08:30
239秒,各种推理完全看不懂[捂脸哭]
....
本质上只是个开放性的题库建设而已,比的不是谁知识多,谁更准确,而是速度(当然,乱答瞎答肯定不行),还有谁更能吹,谁更会炒作[哭笑不得]
用户10xxx21 回复 01-29 07:57
专业领域问题就不行了,特别是涉及一些新知识新发现
无限可能
一个人有时候吃十个包子就饱了,可是硬塞,他也能吃的下十一个,不过九个也饱了,你说他能吃多少个? 我要是有那个闲心,把画圆后剩下来的都拼起来,你信不信至少又能得到四五个。
用户50xxx31 回复 01-29 01:47
九漏鱼
赵红滢
小边有什么资格给评,就是吃饱了撑的出来乱编乱写抹黑造谣生事
走狗的天敌
谈体育是就不要出来丢人现眼了
东方九笑
点万家灯火。 回复 01-29 05:39
不考虑其他,就12.54行,最后一行完全可以放10个,即7行10+5行9=115
东方九笑 回复 01-29 00:13
哈哈😄
不负如来不负卿
再牛的ai也不如一个人类婴儿的智商,就像吹嘘的有8岁人类智商的海豚,你觉得它有人类婴儿聪明吗? 人类领先是整体领先,很多动物都比人类在很多方面强的多,而ai连初级生命都比不了,它终究只是个工具。
顺子
他们急了
用户94xxx06
总有些跳梁鼠辈跳出来找骂,算了,大过年的,就放过你这小丑吧。
Ren
黑文,这两天黑文好多,今天平台直接被国外(老美)网络攻击导致服务器异常。
關東壹品堂
我问了是100个
大灰狼
问它,灭小鬼子用氢弹还是原子弹效率高
凤竹
现在ai行业也算体育了吗?
曾经沧海水
你这龟孙,要是劳资没用deep seek搜过,还被你骗了!
布格格尔
好好吃顿饭,您遭瞄准了
用户94xxx17
行者
小编既然如此厉害,那干脆你也弄一个大数据模型,比他的更好更强大,岂不是青史留名了?
用户12xxx62
你问它最近信息基本都答不上来,其他AI软件都没问题,而且它的系统时间是2023年,哈哈哈
惠飛
刚刚试了用时155秒,结果约105个
省察克治
我试着说了,边长为11厘米的正方形,你猜猜deekseek会怎样?答案根本停不下来。
无忧无虑
问了三次,100/105/106
ﺭﺭ最爱西红柿
它已经算出110个了[并不简单]
jack
今天早上已经变成110个了。比106个还多
用户10xxx61
我试了,啥都没回答!
相识一笑间
CAD里面一画不就知道了吗
青衫浮世
109
天山魔头
106个是怎么算出来的,10cm一排放10个1cm
浮云
奇怪了,小编数学是体育老师教的????你他喵的你个谈体育的来教大家数学题跟AI模型之间的关系????
夜风
我问deepseek,答案是105,问kimi却是100[并不简单]
show
问了kimi,回答127
Money
按照公式。初中水平的模型基本上都是10×10=100。DS考虑的是蜂窝铺设,按照公式算是105。但是按照实际应用,例如将货物装到货柜,装柜工作人员会把最后层铺两个10。一共就是7个10层,4个9层:70+36=106
用户19xxx21
豆包只可以100个😢
大海
要深度思考
太行红豆杉
边长10厘米的正方形能放进去多少个直径一厘米的圆
三思无悔
我刚刚问了gemini,它说这个问题不简单,肯定不止loo个,还说中间有空隙,我要直接答案,但它还是一个套路,回答不出来。
用户10xxx89
百万网友 回复 01-29 04:08
昨天已经有人告诉他是106个了,今天还是回答我105,和他辩论了一下,他承认了错误,是106,然后我重新问,然后服务器繁忙了
大笨熊
为什么我同样的问题得出来是110个呢?但我感觉整个过程确实很厉害!😎😎😎
沉默
这么快就抹黑了
驴友
㕚㕚谈叉叉
财喜增添
据传deepseek可以根据提问者的智商来回答他提出的问题
处处观察
我成功的让它修正了错误
flyyxw
一个议论体育的也来凑热闹,真TM的搞笑,黑也黑出个样子
天堂的花
看到第一句话就知道肯定是要黑的!再看账号名字:符合标准!想想昨天持续不断的境外网络攻击,最后看看内容:果然是黑的!
赵志峰
谈体育去吧,别在这瞎比比
江越能源陈越
是不是可以测试运算一下各国彩票,如果准确率高,就搞美国佬
财经妖女
这是豆包给出的答案。
牛顿的弟弟
它一本正经的告诉我25年是马年
王老五 回复 01-29 00:24
[点赞]
楠言
总归有些鸵鸟存在的,没事,继续。常态
江山如画
谈体育,没一篇体育
赵大明白
是的,我输入了一个某市的小区名称,地址完全错误,小区情况大同小异看不出来对不对[并不简单]
用户16xxx33
黑子,你是第一个!查查!
侯家
刚问完,100
用户10xxx55
遗憾……,一锤子。
永红
我马上测了下,它三种答案及推判都出来了,最终选了106
九成五都不显
我也用
小厨
我问的105
用户10xxx47
这么简单的数学题还答错了?
萬 法 歸 宗
雷雷
我问是105
my god
确实给了两答案:100和105
Val0r
还要加强
Sorriluv
LWX2203
豆包回答是114个
用户14xxx75
一有点事,谈体育,说军事,谈娱乐就出来了!过年也不放弃,说明这些号在国外运营
用户24xxx28
我问回复是105个,而且,我还觉得正确,他思考的过程真的像人类
福清咩野
用的还是gpu