GPT-3真是人工智能「核武器」吗?花1200万美元训练却没能通过图灵...
新智元
共 1587字,需浏览 4分钟
· 2020-07-23
新智元报道
编辑:白峰
【新智元导读】从GPT系列的预训练语言模型一直是大力出奇迹的典型代表,今年五月份OpenAI又耗资1200万训练出了GPT-3,新模型能算数还能写代码,在多个任务中表现出色,GPT-3是否具有了超越人类的智能,来一次图灵测试吧!
GPT-3太大玩不起?OpenAI开放了一个 API,现在你也可以轻松访问GPT3模型了。
与大多数人工智能系统的复杂设计不同,现在的 API只需要你输入一个文本,就能返回相应的输出。
我们先来看下GPT-2的效果。
GPT-2已经十分惊艳了,可以像上图演示的那样在开放领域对答如流。那GPT-3到底有哪些进化呢?离真正的人类还有多远,它能通过图灵测试吗?
图灵测试是图灵于1950年提出的一个关于判断机器是否能够思考的著名思想实验,测试某机器是否能表现出与人等价或无法区分的智能。
GPT-3 基于 CommonCrawl (从2016年到2019年收集了近1万亿个单词)、网络文本、书籍、维基百科等相关的数据集进行训练。参数量高达1750亿,相比之下,GPT-2的最大版本也只有15亿个参数。
常识难不住这个「维基百科」
多轮对话也是手到擒来,放到十年前,上面的对话会不会让你以为是个真人? 看到这样的结果,可能会有些疑问,GPT-3怎么知道长颈鹿有两只眼睛?我们也不确定,只能推测,在它的训练数据中,一定有一些网页,讨论了长颈鹿有多少只眼睛。
击败GPT-3,你只需要一个「天马行空」的问题
五个里面答对了四个,我好像发现了什么,网络上没出现过的,GPT3就失灵了!因为正常人不会去比较铅笔和烤箱的重量。 那我们再来几个「超越现实」的问题,GPT-3可以进行正常的交谈。它却不会说「等一下... ... 你的问题是胡说八道。」它也不知道怎么说「我不知道」,你问一些天马行空的问题,它就开启「尬聊」模式,图灵测试fail了。 所以,如果你想对一个人工智能系统进行图灵测试,一定要问一些无意义的问题,然后看看受访者是否会以人类的方式做出回应。 逻辑运算能力有,还会写代码
测试结果显示,GPT-3的通用性远超我们想象。然而,它也是神经网络本身的结构,没有一个神经网络能够基于训练数据而不是硬编码在大量数字上做加法和乘法等基本算术运算,所以复杂的数学运算也会失败。 对于一个程序来说,有些数学操作很简单,编写个递归就行了。但是,某些递归逻辑通常不能很好地映射到神经网络结构上。 但有趣的是,GPT-3通过编写代码可以解决很多编程型的问题,你如果用代码作为提示,它就会试着写代码来回答。 可以看到,GPT-3模型的行为会随着不同的提示而发生巨大的变化。所以它是很容易迁移的,你只需要少量的提示,就能改善 GPT-3的在具体的任务上的性能。 GPT-3在某些方面令人印象深刻,但在其他方面仍然和人类有很大差距。只有更好地理解它的优点和缺点,才能更高效地在实际产品中使用GPT-3这个「核武器」。
评论
销售真是个多劳多得的工作吗?
我们先不做评判,只是来分析一下,什么是劳什么是得。
首先,辛辛苦苦把电话簿上的电话从头打到尾,算不算劳?
不管它算不算劳,总之这种客户开发的模式,效率越来越低和取得成果的可能性越来越小。所以现在高级一点的公司,是买个语音机器人批量外呼,筛选了意向客户以后,再由电话销售来跟进。
其次,针对某一个客户,详细分析客户公司层级,不同岗位之间关系,关键决策人喜好等等信息,算不算劳?
第三,偷偷地往竞品公司打电话,假扮客户,了解对方的话术和宣传资料,改进自己的话术和资料,算不算劳?
所以你会发现,不同类型的所谓的劳,对于销售最后成单结果的促进作用是不一样的,某些内容的劳,做再多,可能结果微乎其微。
其次我们分析一下得。
得有两方面
杨帆
0
大学生可以通过视频剪辑赚钱吗?
如果你每天有2-3个小时的空闲时间,那我非常建议你去做自媒体影视剪辑。
我自己也是0基础开始做自媒体的,靠着影视解说把自媒体从副业转变成了主业。
很多朋友可能没事的时候就经常刷刷抖音啊快手啊西瓜视频啊这些的视频软件,我们在看的时候可能就单纯的觉得这个视频很搞笑、哪个视频很精彩什么的。
你在看是在消磨时光,但是剪视频的人可能就因为你的观看有了收益,其实视频剪辑还是存在挺久的一个副业的。
大家新手去做,平台上建议选择头条号。因为不需要积累粉丝就能开通原创收益,门槛对比其他平台更低,只要把作品做好就能赚到不错的收益。
大家可以看看我上个月的收益
那今天呢,我就来给大家讲解一下做自媒体影视剪辑的流程,从怎么找素材,找什么素材,如
恩冠呀
0