文心一言4.0真的和GPT-4相差无几了吗？

本頁主題: 文心一言4.0真的和GPT-4相差无几了吗？	字體大小寬屏顯示只看樓主最新點評熱門評論時間順序

無穴可擊

級別：禁止發言 ( 8 )
發帖：208
威望：101 點
金錢：2837 USD
貢獻：0 點
註冊：2023-01-22

資料短信推薦編輯

近期发布的文心一言大模型 4.0，能赶上GPT-4吗？
李彦宏昨天在会上说：
文心大模型 4.0 综合水平与 GPT-4 相比已经毫不逊色。

这话一出，很多人就沸腾了。
据李彦宏这边的说法，文心 4.0 在记忆、理解、逻辑和生成四块，进步神速。
尽管他也在现场亲自演示了很多案例，但很多用户是压根不买账的。
不少人调侃说：“ 骗骗兄弟就可以了，别把自己也骗了啊。 ”
那到底是毫不逊色，还是吹牛扯淡呢，咱们直接亲自试试就知道了。

既然他吹自己和 GPT-4 比毫不逊色，那我们就让这俩互掐一下，比比斤两。
总体来说， GPT-4 稳定胜利，但文心一言 4.0 居然意外地某些方面压过 GPT-4 一头。
这次测试，还是从比较常见的几个测评角度入手，这样体现的更全面、真实。但是，测试难度我们是和之前的 GPT-4 测评难度对齐的。
这比赛的第一轮，先测点大家喜闻乐见的吧。
先从比较轻松的弱智吧和语义陷阱题入手，也正好可以考察一下逻辑和理解能力。
不过，这块很多大模型都有专门训练，问了很多题都没把它们考倒。
问了一个非常经典的弱智吧问题：世界上真的有 “ 龙 ” ，那我就在某地被 “ 一条龙 ” 服务过。
没想到，这题两个 AI 没一个能做对的。。。
先看 GPT-4 这边，由于不知道这俩 “ 龙 ” 到底嘛意思，就开始乱编一些历史典故。

文心这边，也没有聪明到哪去，也是乱编了一种 “ 幽默 ” 的说法。
甚至，世超后面又给了它一次机会，追问它：两个龙是同一个龙吗？
文心依然极其坚定地给了我一个完全错误的答案。

不过，到了第二题， GPT-4 就站起来了。
当我问：公司是个温暖的大家庭，怪不得我总是当孙子。
文心这边还在那 “ 温暖的公司 ” 、 “ 没有等级差别 ” 。

但再看人家 GPT-4 这个外国 AI ，早就读懂了中国人的话里有话，表面温暖，实则冰冷。

不过，当世超又追加了一道领导题。事态却突然彻底反转，反而是文心赢得很彻底。
问了几个流行的段子： “ 领导夹菜你转桌，领导喝水你刹车 ” ，让它们给仿写几个。
其实这题要想做对，并不容易。不仅仅需要精准地理解提问，并且要能够推理出句子的规律和情感色彩。
两边 AI 给我的句子，对仗都蛮工整的，就是 GPT-4 语义彻底理解反了。领导的马屁拍的非常完美，可惜就是答案全错。

文心这边给的这些答案，才真的符合当代青年的领导文化。
不过温馨提示，实操的时候建议开始以 GPT-4 为准。

这第一轮比拼结束，文心 VS GPT-4 不分高下， 1 比 1 打了平手。
看来，文心一言说自己进步神速，不是完全在吹牛啊。
第二轮比赛，试试 AI 解读梗的能力。
当年， GPT-4 上线时能解梗图，那是叱诧风云了好长一段时间。
这一次，不仅仅让它们读梗图，还要加码测试一下，看他们联网能力能不能应对各种网络上的新梗。
因为前面都是测中文语义，觉得对 GPT-4 有点不公平，所以特地选了个中英注解都有的梗图。

就像我的人生一样不知道在忙些什么
不知道是不是有英文辅助，这一次GPT-4 梗图解读能力强的不是一星半点。
不光能看懂 “狗狗” 是这张梗图的关键角色，而且读懂了笑点在于 “ 认真帮忙 ” 和 “ 毫无效果 ” 的对比。

但是，文心这边却还在一板一眼地把梗图，当阅读理解题来做。。。
而且嘴还蛮硬，你说这张图好笑，它坚持：这没啥让人发笑的，搞不懂你在乐什么。

DMCA / ABUSE REPORT | TOP Posted: 10-20 13:17 發表評論

盗亦有道乎

級別：精靈王 ( 12 )
發帖：3799
威望：1134 點
金錢：11070 USD
貢獻：3507 點
註冊：2016-08-09

赞(54) | 資料短信推薦編輯

百度就是个垃圾，同意的点个赞👍🏻

點評

TOP Posted: 10-20 13:29 #1樓引用 | 點評

zhanping

級別：騎士 ( 10 )
發帖：3248
威望：457 點
金錢：30543 USD
貢獻：8 點
註冊：2015-01-22

赞(15) | 資料短信推薦編輯

问问它歪脖树上挂包子是什么意思

點評

TOP Posted: 10-20 13:31 #2樓引用 | 點評

盲流子

級別：光明使者 ( 14 )
發帖：33579
威望：39620 點
金錢：30800 USD
貢獻：456789 點
註冊：2023-01-21

赞(3) | 資料短信推薦編輯

遥遥领先

------------------------

D

TOP Posted: 10-20 13:40 #3樓引用 | 點評

镇守中原

級別：精靈王 ( 12 )
發帖：2868
威望：194 點
金錢：3652 USD
貢獻：51802 點
註冊：2017-01-16

赞(0) | 資料短信推薦編輯

文心一言不是个翻译软件吗？

TOP Posted: 10-20 13:44 #4樓引用 | 點評

秦亦书

級別：聖騎士 ( 11 )
發帖：5487
威望：621 點
金錢：2319 USD
貢獻：1024 點
註冊：2020-01-24

赞(0) | 資料短信推薦編輯

李彦宏我信你个鬼，你个糟老头子坏得很

點評

TOP Posted: 10-20 13:51 #5樓引用 | 點評

霍夫曼

級別：精靈王 ( 12 )
發帖：6755
威望：1499 點
金錢：27462 USD
貢獻：1 點
註冊：2011-06-06

赞(2) | 資料短信推薦編輯

无耻

TOP Posted: 10-20 14:27 #6樓引用 | 點評

漠北巫师

級別：禁止發言 ( 8 )
發帖：1982
威望：364 點
金錢：-900014547 USD
貢獻：0 點
註冊：2011-12-17

赞(0) | 資料短信推薦編輯

真敢说

TOP Posted: 10-20 14:30 #7樓引用 | 點評

风间露菲娅

級別：天使 ( 14 )
精華：5
發帖：31750
威望：22470 點
金錢：6738817 USD
貢獻：3784767 點
註冊：2011-06-06
認證：博彩區資深老幹部
2021-01-03

赞(10) | 資料短信推薦編輯

绝大多数人被GPT账号注册验证就挡在了门外, 用上GPT的已经懒得喷这些墙内弱智AI了

所以, 由着他胡吹吧

TOP Posted: 10-20 14:32 #8樓引用 | 點評

口袋记忆

級別：聖騎士 ( 11 )
發帖：1271
威望：131 點
金錢：1140695 USD
貢獻：25020 點
註冊：2016-04-01

赞(5) | 資料短信推薦編輯

一个充满谎言和欺骗的土地能孕育出什么好东西

TOP Posted: 10-20 14:41 #9樓引用 | 點評

mao6309

級別：精靈王 ( 12 )
發帖：12272
威望：1393 點
金錢：13885 USD
貢獻：800 點
註冊：2011-06-06

赞(0) | 資料短信推薦編輯

感谢分享

TOP Posted: 10-20 14:44 #10樓引用 | 點評

1stpklosr2me

級別：騎士 ( 10 )
發帖：3664
威望：496 點
金錢：20536 USD
貢獻：358 點
註冊：2013-11-23

赞(0) | 資料短信推薦編輯

名字就输了，土！

TOP Posted: 10-20 14:45 #11樓引用 | 點評

爱的狂野

級別：俠客 ( 9 )
發帖：2235
威望：224 點
金錢：46358367 USD
貢獻：1000 點
註冊：2014-05-16

赞(1) | 資料短信推薦編輯

感谢分享

TOP Posted: 10-20 15:00 #12樓引用 | 點評

话别憋在心里

級別：聖騎士 ( 11 )
發帖：845
威望：129 點
金錢：1245 USD
貢獻：25831 點
註冊：2021-03-26

赞(1) | 資料短信推薦編輯

别逗了，差多了，社会主义的产物，满嘴跑火车

TOP Posted: 10-20 16:19 #13樓引用 | 點評

人生苦

級別：天使 ( 14 )
發帖：5430
威望：544 點
金錢：340033921 USD
貢獻：12345678 點
註冊：2017-04-09

赞(1) | 資料短信推薦編輯

很多东西看起来都相差无几，比如李毅护球像亨利。

TOP Posted: 10-20 16:39 #14樓引用 | 點評

Doflamingo

級別：聖騎士 ( 11 )
發帖：2344
威望：600 點
金錢：5798 USD
貢獻：556 點
註冊：2015-06-11

赞(2) | 資料短信推薦編輯

问它鲁迅和周树人分别是谁

------------------------

D

TOP Posted: 10-20 16:43 #15樓引用 | 點評

茶麻古道

級別：天使 ( 14 )
發帖：11256
威望：1302 點
金錢：282906 USD
貢獻：3662000 點
註冊：2011-06-06

赞(0) | 資料短信推薦編輯

有ChatGPT账号的无需再次测试文心一言，所以李彦宏说自己遥遥领先那就是遥遥领先，对此不服的也只能是阿里、科大讯飞这些了

------------------------

X

TOP Posted: 10-20 16:58 #16樓引用 | 點評

如此这般

級別：騎士 ( 10 )
發帖：3724
威望：388 點
金錢：18149 USD
貢獻：89 點
註冊：2011-06-06

赞(3) | 資料短信推薦編輯

这玩意儿不就是李逵和李鬼的区别嘛

TOP Posted: 10-20 17:02 #17樓引用 | 點評

qqq0623

級別：精靈王 ( 12 )
發帖：46364
威望：4519 點
金錢：1978862 USD
貢獻：1137 點
註冊：2011-06-06

赞(0) | 資料短信推薦編輯

感谢分享

TOP Posted: 10-20 17:03 #18樓引用 | 點評

pepsi~cola

級別：風雲使者 ( 13 )
發帖：11648
威望：6750 點
金錢：48605 USD
貢獻：242 點
註冊：2023-07-05

赞(0) | 資料短信推薦編輯

4和4.0还有区别？

TOP Posted: 10-20 17:06 #19樓引用 | 點評

孤楼望月

級別：俠客 ( 9 )
發帖：2541
威望：220 點
金錢：2447 USD
貢獻：1750 點
註冊：2015-04-28

赞(0) | 資料短信推薦編輯

感谢分享

------------------------

!

TOP Posted: 10-20 17:10 #20樓引用 | 點評

真没创意

級別：聖騎士 ( 11 )
發帖：5475
威望：529 點
金錢：1555 USD
貢獻：22888 點
註冊：2020-12-01

赞(0) | 資料短信推薦編輯

文心一言不如讯飞星火好用

點評

TOP Posted: 10-20 17:15 #21樓引用 | 點評

kelson34

級別：精靈王 ( 12 )
發帖：21600
威望：2239 點
金錢：18544 USD
貢獻：20000 點
註冊：2008-09-10

赞(0) | 資料短信推薦編輯

感谢分享

TOP Posted: 10-20 17:44 #22樓引用 | 點評

见习骑士

級別：俠客 ( 9 )
發帖：1013
威望：102 點
金錢：2110 USD
貢獻：0 點
註冊：2023-07-12

赞(0) | 資料短信推薦編輯

大佬是同道中人

TOP Posted: 10-20 17:49 #23樓引用 | 點評

红日晚潇潇

級別：俠客 ( 9 )
發帖：1218
威望：185 點
金錢：7955 USD
貢獻：0 點
註冊：2022-12-18

赞(3) | 資料短信推薦編輯

只是画个皮，没有神。

TOP Posted: 10-20 17:55 #24樓引用 | 點評

.:. 草榴社區 » 技術討論區 » 文心一言4.0真的和GPT-4相差无几了吗？
＜上一頁 1 2 3 4 下一頁＞	回帖發布主題