查看原文
其他

中科院认证:干碎知乎豆瓣小红书,弱智吧成为中国“最聪明”社区?

二七 情报姬 2024-04-26


文丨二七 审核丨菜包

排版丨鹿九


鲁迅先生曾说过:弱智吧里出睿智。


意思是人只要在弱智吧里混迹上段时日,思维逻辑就会更清晰,整体会更睿智。


我愿称此为睿智法则,而令人震惊的是,这法则对AI竟然也生效......



这么说是因为,在中科院开展的“中文互联网社区Ai培育竞赛”中,弱智吧力压小红书、知乎、豆瓣等平台,荣获了“竞赛”一等奖。


简言之,弱智吧养出了最睿智的中文Ai。


啊?难不成中国最伟大的逻辑学家、哲学家、思辨家,乃至举国智库巅峰,还真就在弱智吧里?


怎么回事呢?



首先要澄清的是,中科院并没有举办真正意义上的竞赛,只是展开了和中文Ai有关的研究项目。


操刀此项目的是个联合团队,涉及中科院深圳先进技术研究院、中科院自动化研究所......他们收集了国内各大社区平台的语言文字资料,借之培养了数个Ai模型,并用于性能竞赛。



此中逻辑可理解为,研究团队向多个互联网社区派遣了Ai宝宝,让它们扎根基层,努力从各种帖子、回复、评论中汲取养分。经多日熏陶后,宝宝们学成归来,参与了一场考试,论出了高低。


于是就有了下面这个表格:



其上存在许多有趣的数据。


比如,用小红书数据训练的Ai擅长头脑风暴,但摘要、封闭回答的能力都很差,均分只有50.3,败给了豆瓣和知乎。


用豆瓣训练的Ai均分63.2,排行第四,性能不差,但几乎各方面都被知乎Ai压上一头。


用知乎训练的Ai的整体表现很棒,原本甚至能夺冠,可惜的是,它遇上了自己的一生之敌,弱智吧。



“Ruozhiba(弱智吧)”产出的Ai宝宝,是本次测试中的绝对王者,有在八个项目拿下第一,仅对“重写”与“数学”不太擅长。最离谱的是,其代码能力还超过了专精此道的思否。


所以,知乎不如弱智吧、小红书不如弱智吧、豆瓣不如弱智吧......弱智吧天下第一!理论成立!



这个看起来荒谬的答案,细细想来,其实非常合理。


因为弱智吧老哥们苦思冥想殚精竭虑反复推敲出的语料质量相当高,不但用词精确简洁,而且思维缜密、逻辑自恰。



换言之,弱智吧的语料,本就是浓缩的精化、中文语言逻辑的集大成者,经这般语料喂养出的Ai宝宝,自然比别处的更加茁壮。


但,这却只是咱以及许多网友们的一厢情愿,因为弱智吧Ai宝宝的这场大胜,说来其实并不“光彩”。


它“作弊”了。



Ai当然没有进化和变异到自主作弊的程度,做这事的,是科研团队。


具体情况是,团队给弱智吧Ai找了位顶级教师进行一对一辅导,如此才有了耀眼的成绩。


至于这位老师的身份,大家伙也不陌生,GPT-4。



科研团队这么做,估计也是不得已,因为不这样的话,弱智吧语料就无法发挥有效作用。


毕竟,对幼年级别的Ai而言,理解弱智吧,不亚于普通人看高数。


像ChatGPT刚诞生那会,就有遭遇过各种弱智吧问题的拷打,错漏百出,文心一言刚面世时也一样。



会出现这种情况,是因为弱智吧语料具有特殊性。


弱智吧的问题,属于是有问题的问题,往往涉及常识错误、语义错误、因果倒置、时序倒置,充满了逻辑陷阱.......面对这种陷阱,许多人类都绕不过来,更别说刚刚诞生的Ai了。


所以它们会顺杆爬,将错就错,最后就得出了各种令人难绷的回复。


出于这样的原因,科研团队给弱智吧Ai订制了全新学习方案。



他们会将相关语料抛先给GPT-4,让其回答,然后人工进行修正,最后将整个过程打包喂给AI宝宝。


为什么是GPT-4呢?因为作为成熟,或者说被拷打经验丰富的大Ai,GPT-4已经基本学会了该如何应对这类弱智问题。它会先否定问题本身,再纠正问题的表达,最后回答问题。


有这么一位名师教导,弱智吧的AI宝宝,自然也就遥遥领先了。



讲到这里,这个小乌龙算是解释完了,瓜也吃罢了,但我们其实还可以深入思考一下。


比如,中科院整这么一出,图什么啊?


GPT-4不是已经发展的非常成熟,能够流程回答各种中文问题了吗?学着它做个新Ai有什么意义呢?


况且真培育出来,效果也不一定有人家更好。


是不是有点脱裤子放屁,多此一举呢?



缘由其实很简单——GPT-4在中文领域的表现并不算好,且在很多时候,其英文回答要比中文好很多。


有人或许会觉得,本就是西方搞出的玩意,英语好汉语差不是很正常嘛?其实不然,因为尽管语言不同,但相关训练方式却趋于一致,Ai理解不同语言并非是通过翻译,而是直接学习原文本,所以Ai并不存在母语一说,所有语言都可以是它的母语。


GPT-4在英文上的强大,源于相关语料的丰富。


根据一项数据显示,英语网站在全球网站中的占比就高达60%,中文则只有1.3%,位列第十(2020年数据),且英语还是论文的主要语言,论文占比为96.17%,中文大概不到2%,所以GPT-4在英文问答上表现优秀,中文则差强人意。


(2020年数据)


中文资料缺失的成因比较复杂,涉及各种维度,主要在两方面。


首先是中文互联网的起步比较晚,且存在诸多限制,其次是因为各流量巨头画地为牢,有把信息截留在自家APP上。


像微信公众号上就存在大量高价值信息,但却几乎无法以任何微信外的方式搜索到,使得搜索引擎能触及到的内容极为有限。在此基础上,中国互联网还高速开启了视频时代,令信息视频化,更难以被检索。


搜索不到就等于不存在,也就无法作为Ai教育的养分。



中科院的研究就意在解决这个问题,而且他们真的通过弱智吧Ai宝宝的表现找到了答案。


——质量是中文Ai教学微调所需要的一切。


这是论文的标题,也是该团队为中国Ai找到的新出路。



他们的研究标明,Ai教育的最大难点不是数据够不够多,而是能否让Ai接触和吸收到高质量数据,以及该采用何种方式将之喂养。换言之,Ai要想表现好,取决于能不能找到好的教辅资料,以及教学手段合不合适。


出于这样的目的,团队向多个中文社区派遣了Ai宝宝,以论证不同资料的实用价值,也是在喂养预料的过程中,他们在弱智吧遇到了特殊情况,所以重新构造了回答,并最终得出了更加高效的教学手段。


这是个相当令人振奋的结果,意味着从业者发现了数据训练的规律。


它很有可能会弥补中文Ai教育的数据短板,让更适应中国宝宝的Ai加速到来,再然后,Ai普及,再然后,Ai统治人类,再然后,Ai称霸太阳系.....


或许在千百年后,在机器人的世界里,在它们的数据库里,弱智吧这个名字会被铭记。那群宇宙外的高维生物,就算一眼能够望穿时间与空间的缝隙,把次元拓扑折叠当做与人类绑蝴蝶结一般平平无奇的玩闹——他们也会无法理解,为何渺小的三维宇宙角落,居然藏着这么一个充满逻辑谬误与不可逆悖论的信息堆,这是否是更高等的文明伪装的信息熵炸弹?


这一切,只因为弱智吧改变了AI教育。


 参考文章:

[1]COIG-CQIA:质量是中文教学微调所需要的一切(arxiv.org) https://arxiv.org/html/2403.18058v1


[2]知乎专栏《笑死我了,用弱智吧数据训练的 AI 爆杀了所有中文平台》,作者Anlin

https://zhuanlan.zhihu.com/p/690640864



 往期推荐 点图可阅 

给狗洗脚的“清洁杯”,成为了日本网友倾泻一切龌龊妄想的荣耀之孔

哎不对啊?被遗老们痛批的《辐射》游改剧,怎么分这么高?


扫描下方二维码关注 情报姬 获得更多一手资讯

也欢迎大佬找姬投稿哦~ 投稿邮箱:crsq477@163.com

点击这里,给我好看


继续滑动看下一个
向上滑动看下一个

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存