今天看啥  ›  专栏  ›  经纬创投

弱智吧,成为人类应对AI的最后一层堡垒? |【经纬低调分享】

经纬创投  · 公众号  · 科技投资  · 2024-04-07 11:44
没想到,大模型最好的中文语料库竟然是:弱智吧。弱智吧是百度贴吧上的一个子版块,吧友们热衷于创作一些存在逻辑陷阱的内容,譬如“被门夹过的核桃,还能补脑吗?”。这样的段子常常引起无数吧友讨论、转载,部分帖子甚至带有一定的哲学意味。而这些帖子竟成为了训练大模型最好的中文语料。来自中科院深圳先进技术研究院、中科院自动化研究所,滑铁卢大学等众多高校、研究机构联合团队曾做的一项研究发现,使用弱智吧数据训练的大模型,跑分超过百科、知乎、豆瓣、小红书等平台,甚至超过研究团队精心挑选的数据集。曾经专门用来调戏大模型弱智吧问题测试集,摇身一变成了训练集。这背后有何故事?训练大模型最好的中文语料为何如此难找?以下,Enjoy: 梦晨 西风 发自 凹非寺来源:量子位离大谱了,弱智吧登上正经AI论 ………………………………

原文地址:访问原文地址
快照地址: 访问文章快照