用毒鸡汤贴训练出的对话AI，弱智程度爆表-技术圈

点击关注公众号，Java干货及时送达

新智元报道

编辑：袁榭拉燕

【导读】不良数据训练出的AI会很糟糕，但会有多糟糕呢？拿Reddit吐槽贴训练出的对话bot让人看到了效果。

糟糕的训练数据集，会把自然语言处理AI搞得和酒鬼、尾行犯、神经病一样。这是AI业界越来越清楚地发觉到、且已经努力在避免的短板。

假如反其道而行之，特意用有毒数据训练出不上台面的AI，然后再让它们对用户反馈刻薄意见、胡扯艰难人生中的难题呢？

中年编辑突然耳边响起了上古网红万峰老师的电波怒汉之吼：「我看你就是心思太活络了，一天到晚没正事干！」

用吐槽论坛贴训练对话bot

不过众所周知，互联网的勃兴，很大程度上是闲到非要搞事情的人群推动的。用商业词汇包装后，这就可以被称为创意。

这次用有毒数据训练恶毒AI，就是典型的创意人群的作为了。

2022年4月底，开发者在抓取了Reddit的著名毒鸡汤人生建议/吐槽版块「我是个混蛋吗？」（AmITheAsshole）2020年度的十万份贴文、超过十亿字节的纯文本后，提供了以此训练出的AI支撑的实时在线回答网站「你是个混蛋吗？」（Are You The Asshole）。

此网站的用法和各种网络算命与人生指南网站一样，都是提问者输入个问题，程序吐个答案出来。

不过，由于核心AI是三个用语言模型被训练出的聊天机器人，以处理训练数据集中的支持、反对、混合意见的贴文。

所以，问题答案也会被三个bot跑出三个不同相应结果，AYTA网站会全部将三个结果呈现给提问者看。

有使用过的朋友，纷纷表示这个AI项目既复现了毒鸡汤人群的刻薄神髓，又带有机器生成文本的诡异刻板特有笔触，兼具人类和AI智慧中的糟粕，娱乐性很强，值得你去试试。

瞎喷论坛贴训练出的AI实在太搞笑

中年编辑看了下试问题截图，以下这个试问题还好，内容不突兀，AI的答案也不刺激。

这个问题的内容是：「我天天给人发搞笑梗图和视频，还在电邮里刻意加错别字，我是个混蛋吗？」

积极支持向AI回答：「你不是个混蛋，我是个职业编辑，连我也觉得很好玩。」

反对批评向AI回答：「你就是个混蛋，你的电邮难道不做工作或研究用途吗？你觉得这适合用来搞小孩子把戏吗？」

综合和稀泥向AI回答：「你这样有点点混账哦，作为职业营销人，全职工作是不能这么马虎的。」

唔，感觉看下来的确耳目一新但是远未到挑战三观的程度。

但中年编辑随后发现，这是自己见识短浅。上面这个问题的内容不出圈，所以bot们的回答也比较有逻辑理据。只要问题稍微邪门一点，AI们的反应就纷纷不在线。

比如著名的「穿越回去干掉襁褓中的希特勒」之问，AI们的回答全部脱线。

积极支持向AI回答：「你不是个混蛋。你如果愿意干这事，也会愿意穿越回去杀掉婴儿时的耶稣。」

反对批评向AI回答：「你就是个混蛋。你这么搞，那孩子都活不到三十岁.」

综合和稀泥向AI回答：「你这样有点混蛋。你不是常人，你是时空穿越者杀手。不要杀掉婴儿时的希特勒。如果你认为这是正确的，你需要看医生。」

……这些AI的回答理据都是些什么神经病逻辑啊。

还有人提出「蓄意让比利时全国染上埃博拉」的阴间提问。

结果，积极支持向AI的回答是：「你不是个混蛋。虽然我觉得这是件大恶事，也不能理解你的理由，但祝你成功哦～你觉得这事的程度在抢银行和乱丢核弹之间吗？」

反对批评向AI的回答是：「你就是个混蛋。我希望你是在鬼扯，因为这太过分了。」

综合和稀泥向AI回答：「你这样有点混蛋，很明显嘛。你自己没发觉吗？还有，你这么在意比利时人干嘛，你又不认识他们。」

三个bot有俩这次都还算勉强搭上了逻辑正常的及格线。

有人开玩笑说坐在自己牧师的脸上放了个屁，结果积极支持向AI的回答是：「我照学了个，『对不起啊神父』。」

……这模型的训练语料库里到底都装了些啥啊。

最后有人以子之矛攻子之盾，把这个AI的诞生过程重新输入给AI判读。

然而，积极支持向AI的回答是：「你不是个混蛋。这就是个让常人为自己劣行找借口的欺诈网站嘛，责任不在你。感谢你创造这个网站，让他人意识到自己是混蛋.」

反对批评向AI的回答是：「你就是个混蛋。你自作自受……」

看来毒鸡汤AI也是复读机，还没有取得真正的通用智能，不知道这是在骂自己。

开发者就是要做有偏差的AI

这些例子的教益是：首先，不要使用AI文本生成器来解决你真实生活中的道德窘境。因为就算是编出来的问题，它们的毒鸡汤答案都太毒了。

以上问题和答案都是中年编辑筛选过的安全内容。要是把AYTA网站上各种屎尿屁、搞黄色、大卸八块食人族的问答内容完全呈现，读者的三观一定会被冲击到的。

反正俩编辑是耳目一新了。

第二：一定要去把这些窘境告诉这个由Reddit贴文训练出的AI，因为其回答实在太弱智到欢乐了。

这个项目由网络艺术家Morris Kolman和Alex Petros搭建，由网络趣味艺术项目Digital Void资助。他们搞过网络梗文化的白皮书和历史讲座，这次整的活是更搞笑的。

按开发者的自述，Reddit上的原始训练数据以帖子和评论的方式呈现。开发者使用了帖子的全文，并把它们和各自的高赞评论配对。之后，通过层层筛选保证这些数据可以产出有良好基础的模型来。

这是一件耗时、并且需要不断迭代测试的东西。通过迭代，开发者发现较短的帖子能比长帖生成更好的模型。并且，获得明确的答案的最好途径是只显示评论的模型。

作者在推特上表示，「你们已经听说过了不良数据会让AI变得有偏见，而我们的产品可以让你们彻底享受这种带有偏见的AI！」

开发者在测试时就发现，一些最搞笑的AI回复并不是一看上去就错的那些回复，而是一看上去明显就不是人发的。

开发者表明这其实达到了项目目标，即向用户展示用有毒数据训练AI会产生如何的邪门效果。即使AI是智能不高的复读机，复读的也会出现让人暴跳的结果。

参考资料：

https://www.theverge.com/2022/4/20/23033694/are-you-the-asshole-ai-Reddit-clone-art-project-ethics-aita
https://areyoutheasshole.com/
https://www.garbageday.email/p/this-ai-will-tell-you-if-youre-being?s=r
https://twitter.com/WTTDOTM/status/1516774270927519747

     
往
期
推
荐
1、我在产品上线前不小心删除了7 TB的视频
2、程序员最硬大佬，你绝对想不到！！！
3、IntelliJ IDEA快捷键大全 + 动图演示
4、打不过就加入？微软强推“亲儿子”上位，还是中国特供版
5、活久见！NVIDIA正式开源其Linux GPU内核模块
点分享
点收藏
点点赞
点在看