AI拿下艺术大奖,它离文学奖还有多远?
共 4872字,需浏览 10分钟
·
2022-09-15 22:40
这是真实发生的事情。在今年科罗拉多州博览会的年度艺术竞赛中,杰森·艾伦凭借由 人工智能 “Midjourney” 生成的作品,拿下了“数字艺术/数字加工摄影”分项的奖项。它也是第一幅赢得这类奖项的人工智能作品。
随着技术的不断发展,人工智能已广泛渗透到艺术消费、艺术创作、艺术市场的全过程,AI与艺术实践的交互融合也为当代艺术实践注入一股崭新的生命力。
在自然语言处理(NLP)领域, 浪潮 发布 2457亿参数 的巨量模型 “源1.0” 也正颠覆人们对AI艺术的认识。“源”创作的诗歌、小说、戏剧等艺术作品达到与文学家的作品“以假乱真”,以下哪一首为源(AI所做):1. 夜战桑乾北,秦兵半不归。朝来有乡信,犹自寄寒衣。
2. 战鼓催征千嶂寒,阴阳交会九皋盘。飞军万里浮云外,铁骑丛中明月边。
2017年,一项调查曾预测, 到本世纪中,人工智能将有能力创作一本畅销书。未 来,我们的音乐、小说、电影等各种艺术作品,有可能由人工智能来创作吗?A I有灵感吗 ?
创造力似乎是一种玄妙且虚幻的东西,有时会被笼统模糊地说成“灵感”或者“灵光乍现”。但一些科学家相信,它并非超出科学范畴的“魔法”。
事实上, 艺术的核心和科学类似,都离不开观察与理解。 一些科学家和研究人员也越发相信,所谓的灵感,或者说创造力,并非凭空出现的“魔法”,也不是超出科学范畴的神秘法则,它可以被研究、探讨、模拟,甚至加以利用。
早在20世纪70年代,苏塞克斯大学认知科学教授玛格丽特·博登在她的著作《人工智能与自然人》中写道,在新思想产生之前,它们的种子早已存在于我们的脑海之中,“ 如果把创造力理解成在我们已有的知识碎片之间建立的新关系的结果 ,那么一个人之前拥有的知识越多,就越能发挥创造力”。
论知识储备,那么AI可以碾压人类。比如, “源1.0” 几乎把近5年内整个中文互联网的浩瀚内容全部读完,共2000 亿词,相当于阅读了300万本书,超出一个人一万年的阅读量。
因此“源”有能力一秒生成几十首生成极具文学美感的诗歌:
秋色无边月影新,
玉盘清辉照人频。
夜深忽动思乡念,
疑是嫦娥降广津。
从诗情画意的诗人,到“中年危机”的主人公
在NLP研究领域,人工智能专家一直不断探索着大模型文学创作的边界。
在先前大量尝试中,“源”已经多次证明了创作能力。比如,以千亿模型为基石精炼出的古文模型,其创作诗文都遵从着平仄、对偶、押韵三原则,诗歌工整对仗,富含音乐感。它还有能力模仿不同风格的诗人,无论是奔放的李白,还是细致平实的白居易,或者充满禅意的王维,都能精准掌握:
仿写《竹坞》
— “源”
竹坞溪桥畔,
碧峰相倚拄。
有怀未得谐,
道近惟禅寂。
在近期的一次新的尝试中, 开发团队为“源”提出了一个不一样的挑战—— 创作小说 。
原先,模型在撰写长文本内容时,可能存在重复、正确的废话等现象。针对这类问题,团队提出了一个新的文本创作流程,也就是“创意-规划-编辑-重复生成”,简称 IPER。
1. 创意(Idea),需要用户指定一个创意,发挥人的创造力。当然也可以使用模型来辅助生成一些创意,给人参考;
2. 规划(Plan),通过自然语言描述想实现创意而需要模型执行的行动,通常用Prompt作为指示告之源大模型,比如“增加更多的细节描述”;
3. 编辑(Edit),源大模型根据规划给出行动的结果,人可以对这一结果进行编辑,然后给出新的创意或规划;
4. 重复生成(Repeat),重新进行行动,直到得到满意的结果。
简而言之, 就是 不再仅仅把模型当成一个“文本生成器”,而是让它真正模仿人类进行小说创作的过程。
开发人员首先为模型提供了一个类似《迷失东京》的故事大纲:“中年危机”的主人公由于繁忙的工作而对生活感到乏味,面对家人也生出了一丝疲倦。但他无意间穿越到了过去,经历种种后发现了家庭和爱的意义。
最终,“源”交出了一份令人惊喜的作品。小说不仅逻辑通畅,行文优美,模型还“自由发挥”出了丰富的细节描写。举个例子, 在描述环境时,它说:
“初秋的天气仿佛还残留着夏日的过剩的意识,阳光依旧是那样的明媚,只是早上多了一份秋日的清爽。”
它还学会了将环境和主人公的心境结合在一起:
“深夜的车辆在城市里汇成了一条不算稀疏的光带,他的视线被这道光带牵引着,恍惚觉得那光像是在燃烧,又像是在哭泣,车辆的尾灯映在地上,像是融入了黑夜中的烛火一般。如果以房子的面积衡量,属于自己的空间似乎越来越大,然而以心中的“自由感”为准绳时,这空间又越来越小。”
甚至从字里行间溢出了浓浓的感情。
它总能挑选出最准确的形容词,“血红色的夕阳”“草木的清香”,用文字激发我们各种感官的体验;在描绘时间流逝时,模型选择了“滑”这个动词——“让时间不知不觉中就滑到了深夜”;它似乎也学会运用一些更深层的意象,比如“生活中的摆渡人”。
在另一项尝试中,团队还让“源”根据鲁迅所著的小说《孔乙己》, 改编了一本话剧剧本 。“源”精准捕捉并提炼出了原文中的对话和人物动作。在处理一些人物的心理活动时,也准确地将它转换为人物面向观众说出的台词。
人工智能生成剧本 |
小说原文 |
我:(对观众)我和掌柜的等级还很远呢,而且我们掌柜也从不将茴香豆上账。(又好笑,又不耐烦,懒懒地答)谁要你教,不是草头底下一个来回的回字么? |
我暗想我和掌柜的等级还很远呢,而且我们掌柜也从不将茴香豆上帐;又好笑,又不耐烦,懒懒的答他道,“谁要你教,不是草头底下一个来回的回字么?” |
A I创作 , 带给未来无限想象
借助“源”为代表的大模型,通过优化创作流程以及配套的便捷地工具等, AI在艺术领域将有无穷想象空间。
未来,借助通过包括提出新的流程、高效利用大模型以及配套的便捷地工具等方法,借助“源”辅助艺术创作,将有望发挥更大的能量。
为了支持开发者进行创作,浪潮开源了直接可用的代码示例,可以帮助开发者节省各类研发开支。此外,“源1.0”大模型的开源模式之一是向开发者提供大模型API,显著降低了开发者应用开发的门槛。 不同知识背景的各行业用户可以驱动大模型创造更多的可能。用 户可以完全通过模型的能力和开发的API就能创造各种不同的任务,实现不同内容的交互,将部分繁琐的开发流程省略。
浪潮在降低开发门槛上面还进行了两类探索,包括APIExp的工具,让用户直接通过网页与大模型交流;他们还研发了一款沙箱工具,同样是通过网页直接选择用户所需的创意效果。
浪潮还将“源1.0”相关的训练数据开源,能助力用户实现业务模型或代码优化,同时还会为开发者提供一些持续的支持,实现开源社区交流共赢。
目前,开源开放的API接口暂时只是通用的文本生成能力,并不能完全自动化地支持人机IPER创作流程。未来,浪潮还计划开源开放支持IPER创作的API和工具软件。API面向开发者,开发者可以低代码,甚至零代码地进行开发,便适应不同领域、不同创作流程的艺术创作。
“源”也即将应用在智能写作领域,比如为B端客户提供智能创作服务API及私有化部署服务,基于此服务可以提供网页版或小程序版的展示应用平台,同时在公文写作、媒体、金融等各个行业中推行。
辅助写作的人工智能有望不断提升参考样本推荐的智能化,为创作者提供实时样例作为写作参考或者灵感激发的触媒。它还能不断解决超级长篇小说写作的“记忆痛点”,开发具有智能分析和追踪创作者创作作品,对人设和情节做数据库处理,能形成超级即时在线人设和情节历史资料智能调取和提示功能。此外,通过逻辑合理性和历史合理性等运算,软件还可以为作者提供大纲编写建议(故事策划)和人物性格设计建议。这或许就是未来人工智能对文学创作做出的最可能、也是最突出的贡献。
未来,AI作家、AI画家可能会非常常见 , 我们甚至会像喜欢一些别具风格的作家一样,追捧某个由独特数据集训练出来的AI作家。 而AI作家的不同之处在于,它能永不停歇地高速创作,同时根据你的反馈,定制出你一定会喜欢的作品。