深度学习在不同领域的应用,我去,这也行!?

极市平台

共 3143字,需浏览 7分钟

 ·

2021-07-27 15:54

↑ 点击蓝字 关注极市平台

作者丨Giant@知乎(已授权)
来源丨https://www.zhihu.com/question/47563637/answer/1997061212
编辑丨极市平台

极市导读

 

本文介绍几款深度学习领域的有趣应用,一起来看看吧。 >>加入极市CV技术交流群,走在计算机视觉的最前沿

人工智能炼丹师既是工程师也是艺术家。随着NLP、CV、ASR等技术的逐渐成熟,一些好玩的应用开始进入我们的生活。

比如大家多多少少听说过的AI下围棋、打Dota、玩德扑、解方程等等,这里再分享几个让我咋一看直呼“好家伙”的DL应用。

1.AgileGAN变脸——字节跳动

想给自己做一个卡通风或者古风头像吗?

字节一位小哥哥用GAN界新秀 AgileGAN 训练了一个换脸模型,一键上传体验瞬间换脸。工作累了可以来娱乐一把!

我们以于和伟老师为例,看看卡通、油画、古风三种效果下,于老师的变脸效果:

除了这三种风格,还有很多其他好玩的特效,感兴趣的同学可以去在线demo尝试一下。

在线demo:https://www.agilegan.com/,paper:https://guoxiansong.github.io/homepage/paper/AgileGAN.pdf

2.斗地主模型DouZero——快手

近日,快手 AI 平台部的研究者用非常简单的方法在斗地主游戏中取得了突破,几天内就战胜了所有已知的斗地主打牌机器人,并达到了人类玩家水平。而且,复现这个研究只需要一个普通的四卡 GPU 服务器。

斗地主是一款合作与竞技并存的游戏,牌型组合复杂,一直以来被认为是一个极具挑战的领域。

DouZero 模型创新性地将传统的蒙特卡罗方法与深度学习相结合,提出了动作编码机制来应付斗地主复杂的牌型组合。让我们期待AI能否拿下下一个冠军宝座。

paper:https://arxiv.org/abs/2106.06135,code:https://github.com/kwai/DouZero,在线demo:https://www.douzero.org/

3.九歌写诗机器人——清华大学

AI写诗一直是NLP文本生成任务非常有趣的应用之一,清华大学的开源的写诗系统“九歌”就是这样一位兼赋智慧与诗意的“诗人”。

模型支持五言七言等诗歌载体,可以自定义内容主题,AI作诗后机器会自动从通顺、连贯、新颖、意境等角度进行打分。

九歌—人工智能诗歌写作系统:http://jiuge.thunlp.org/

4.用AI为黑白老照片上色——DeepAI

DeOldify 模型基于深度学习技术,专门用于修复&上色拍摄于一百余年前的黑白老照片、电影胶卷,甚至也能处理几个世纪前的油画和线条画。

我看完几张模型上色的照片感觉非常和谐真实,除了图片,DeOldify 还能为黑白视频上色。

更多项目细节查看开源仓库:https://github.com/jantic/DeOldify

5.基于CNN的马儿情感识别——MIT

两位来自MIT的朋友八成是期末要交AI大作业了,硬生生搞出了这么个玩意儿。

没有专业人士标注,400张图片的训练集和80张图片的验证集,就直接上CNN,是不是有点迫击炮打蚊子的味道?

他们还特地做了个交互界面,上传图片,哦,是一匹好奇的马。厉害厉害。然而,我不关心马,我目前见到的会关心马的情绪的也只有你们俩,好了,下一个。

文章地址:https://github.com/jantic/DeOldify

6.基于ML的面部骨骼生长预测——华沙理工大学

该工作是通过人在幼年时期头骨的形状,预测其成年时面相的变化。

这个工作挺有价值的,比如说对走失儿童、无名尸体的鉴别,以及医美方面都用得上,说不定还能给中国传统文化之算命提供一定的可解释性。

但是,这个模型的效果如何要打个问号:如果以头骨的数据作为输入,那这个任务隐含的假设是小时候长相相似的人在成长过程中面部变化的倾向也会相似。而实际上,基因、成长环境、生活习惯等因素都对人的长相有重要的影响。

此外,如果真的想为这个任务建一个数据集,那么十年左右的数据采集周期是必不可少的,祝研究者好运啦。

文章地址:https://rxiv.org/pdf/2106.10464.pdf

7.风格迁移——deepart

照片风格迁移,即利用一张图片的风格元素来绘制另一张图片的内容。你可以用最喜欢的艺术家的风格,重新绘制自己的照片,只需三步哦。

官网提供了各种供迁移参考的风格艺术照,当然,你可以用自己喜欢的照片。

官网demo:https://deepart.io/

8.真人同声传译

前两天在公司内部的“CEO面对面”活动上,公司同时提供了中文直播频道和英文传译频道。

为了锻炼自己的英文听力,我切换到英文频道,同声传译者是一位声音非常好听的小哥哥,口音地道、翻译专业。半个小时后,看评论区我才知道实现同声传译的居然是AI模型。好家伙,这效果也太逼真了!

AI同声传译得益于语音识别、机器翻译、语音合成技术的发展与成熟,借助机器持久、高效的工作能力或许是未来同传发展的最优解。

深度学习领域奇特有创意的应用还有很多,先分享到这里,之后再陆续更新啦。小伙伴们有发现好玩的应用也欢迎来分享呀!

Reference

[1] 白鹡鸰:近期神奇机器学习应用大赏

[2] 快手开源斗地主AI,入选ICML,能否干得过「冠军」柯洁?

[3] 人工智能在现实生活中有哪些有趣的应用?

作者名片

Giant,本名叶琛,浙江大学计算机技术硕士。一个爱旅行,懂养生的算法工程师兼干货答主,也是个喜欢用接地气的文风为年轻朋友分享职场经验和算法知识的人。

如果觉得有用,就请分享到朋友圈吧!

△点击卡片关注极市平台,获取最新CV干货

公众号后台回复“ICCV2021”获取最新论文合集


极市干货
YOLO教程:一文读懂YOLO V5 与 YOLO V4大盘点|YOLO 系目标检测算法总览全面解析YOLO V4网络结构
实操教程:PyTorch vs LibTorch:网络推理速度谁更快?只用两行代码,我让Transformer推理加速了50倍PyTorch AutoGrad C++层实现
算法技巧(trick):深度学习训练tricks总结(有实验支撑)深度强化学习调参Tricks合集长尾识别中的Tricks汇总(AAAI2021
最新CV竞赛:2021 高通人工智能应用创新大赛CVPR 2021 | Short-video Face Parsing Challenge3D人体目标检测与行为分析竞赛开赛,奖池7万+,数据集达16671张!



CV技术社群邀请函 #

△长按添加极市小助手
添加极市小助手微信(ID : cvmart4)

备注:姓名-学校/公司-研究方向-城市(如:小极-北大-目标检测-深圳)


即可申请加入极市目标检测/图像分割/工业检测/人脸/医学影像/3D/SLAM/自动驾驶/超分辨率/姿态估计/ReID/GAN/图像增强/OCR/视频理解等技术交流群


每月大咖直播分享、真实项目需求对接、求职内推、算法竞赛、干货资讯汇总、与 10000+来自港科大、北大、清华、中科院、CMU、腾讯、百度等名校名企视觉开发者互动交流~



觉得有用麻烦给个在看啦~  


浏览 41
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报