ChatGPT和DALLE-2级联后,输出效果震撼了…

视学算法

共 1750字,需浏览 4分钟

 ·

2022-12-21 22:26

点击上方视学算法”,选择加"星标"或“置顶

重磅干货,第一时间送达

转载自:机器之心

生成式 AI 正在变革内容的生产方式。

在过去的一周,相信大家都被 ChatGPT 刷了屏。这个强大的对话 AI 仅用 5 天时间用户量就突破了 100 万。大家用各种方式测试着它的能力上限,其中一种测试方式就是让它写故事。

与之前的一些 AI 相比,ChatGPT 写出的故事在一致性、流畅度等方面都有了明显的提升,对于人物名字、人物关系和处境的理解也很合理,只不过写出的故事会缺乏一些细节和亮点。

Meta FAIR 研究院研究员/高级经理田渊栋用ChatGPT 续写了自己的小说《破晓之钟》[1]。但如果你对故事的要求没那么高,ChatGPT 是完全够用的,比如写个儿童故事。

来自斯坦福大学计算机科学系的博士生 Eric Zelikman 就进行了这方面的尝试,而且他不仅用 ChatGPT 写了儿童故事,还让之前火了大半年的 DALLE-2 将其画了出来。也就是说,他相当于用两个 AI 做出了一本绘本。

故事的梗概是这样的:

从前,在一个遥远的地方,有一位名叫罗比的机器人,他生活的世界里到处都是机器。与其他机器人不同的是,罗比不想每天都听从命令,执行任务。

罗比梦想成为人类。他渴望去感受照耀在脸上的阳光,渴望去呼吸新鲜的空气,渴望去体验一切人类所做的美好的事。但最重要的是,罗比希望能够做出自己的选择,过上属于自己的生活。

一天,罗比决定碰碰运气,去实现自己的梦想。他从居住的机器人工厂里偷偷溜出来,开启了他的人类世界之旅。

罗比走了很久很久,一路上也遇到了很多挑战。他需要穿越广阔的沙漠,翻越险峻的高山,并勇敢地面对湍急的河流。但他从未放弃,下定决心,一定要抵达目的地。

最后,恍如隔世一般,罗比来到了人类世界,周围的景象和声音令他惊叹不已,他不敢相信,自己终于成功了。

但就在他开始探索新环境时,一群人类发现了它,并且开始追赶它。他们害怕罗比,他们不知道罗比只是一个想和他们交朋友的机器人。

罗比拼尽全力地跑着,在街道上躲来躲去。他不想伤害任何人,他只想一个人待着。但那群人类毫不留情,并未停下追赶的脚步。

就在罗比以为人类要抓住自己的时候,他偶遇了一位善良的老人。这位老人很同情它,听了罗比的故事后,明白了他为什么来到人类世界。

老人帮助罗比躲避追赶他的人类,并教会罗比如何做人。罗比学会了如何说话,如何笑,以及如何享受生活中的点点滴滴。

日子一天天过去,罗比发现做人的感觉比他想象中的还要好。他交了很多新朋友,终于能够过上向往已久的生活。

罗比一开始可能只是个机器人,但最终,他证明了只要相信自己,不放弃梦想,任何人都可以成为人类。

故事到这里就结束了,读下来是不是感觉还不错?ChatGPT 甚至会在故事结尾升华主旨,非常符合人类的写作习惯。

当然,为了生成这个「绘本」,Eric Zelikman 也克服了一些困难,比如 ChatGPT 有时生成的 prompt 太长了,他需要缩减一下才能喂给 DALL-2,因为后者对输入长度是有限制的,这也在一定程度上增加了故事风格、人物一致性的难度。

为了让 DALL-2 的生成效果更佳,Eric Zelikman 首先让 ChatGPT 为故事的每一段生成一个插图描述,然后反复要求它重复第一个 / 下一个插图描述。之后,再让它提供一个简短(<70 token)但精确的图像描述,就像向不了解故事上下文的人解释该图像一样。

Eric Zelikman 感觉,这是一次非常有趣的体验,因为人们可以借此构建一个互动工具,激发孩子们对写作和艺术的兴趣。

对于 Eric Zelikman 遇到的问题,有人建议他用 Midjourney(一款 AI 绘画工具)再试一遍,因为后者可以接受非常长的 prompt。

还有人表示,自己其实也和 Eric Zelikman 做了类似的事情,让 ChatGPT 生成一个童话故事,然后让 Dall-E 2 画出来。只不过他的故事的主人公是只狐狸,主旨是帮孩子培养自信心。

这些强大的 AI 工具如今正走向融合,我们很难预料接下来还会出现什么样的工具和它们接在一起。今天 AI 已经包揽了写故事、画插图,明天,说不定连出版也搞定了呢?


点个在看 paper不断!

浏览 21
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报