又整新活,AI 杀麻了!

Jack Cui

共 1647字,需浏览 4分钟

 ·

2021-12-29 13:26

大家好,又是一个整活的周末。

年底了,各种有趣好玩的算法,突然多了起来。

今天跟大家聊聊三个新出的 AI 算法,每一个算法都可以单独写一篇文章。

不过为了大家看得过瘾,一次写全吧。

一、Latent Diffusion

超分辨率重建算法,再添一员!

之前写过一个在二次元图片上表现很好的 Real-ESRGAN 算法。

这个算法,也是我上期视频里投票最高的,想让我做成视频教程的算法之一。

今天介绍的 Latent Diffusion 算法功能类似,不过主要针对的是真实场景。

我们看下效果:

这个效果,真的很顶了!

当然这个算法不仅仅是超分,还能进行 inpainting。

可以 P 掉我们图片里想要去掉的东西。

这就有一个比较不错的场景,比如情侣拍照,想去掉旁边的路人,就可以使用这个算法。

不过算法的效果是否稳定,就得调研看看了。

刚刚开源 5 天,新鲜热乎。

项目地址:

https://github.com/CompVis/latent-diffusion

二、GLIDE

今年年初的 DALL-E 想必大家都知道,当时我也写过一期硬核的算法讲解文章。

保姆级教程:硬核图解Transformer

最近,OpenAI 又有了新动作,开源了 35 亿参数的新模型 GLIDE。

我们先看其中一项功能,文字转图片任务:就是根据一段文字描述,生成对应描述的图片。

这回效果很惊艳,举个例子。

a hedgehog using a calculator

刺猬使用计算器,这是多么离谱的输入,但是结果表现很不错。

a corgi wearing a red bowtie and a purple party hat

一只戴着红色蝴蝶结和紫色派对帽的柯基。

更多效果:

除了从文本生成图像,GLIDE 还有图像编辑功能。

根据文字描述,修改图像。

总之,很强!

这个和我上个月发的多模态 NÜWA(女娲)算法功能类似。

女娲算法,杀疯了!

不过 NÜWA 至今还没有开源,我被啪啪打脸了。

OpenAI 的 GLIDE 不存在这个问题,直接开源。

也是新鲜热乎的。

项目地址:

https://github.com/openai/glide-text2im

更良心的是,还给大家配置了 colab。

不用配置环境,能登陆使用 google 的,可以直接运行看效果。

三、JoJoGAN

JoJo 没错,就是这个。

JoJoGAN 就是将让人脸动漫化。

我还脑补了下,鬼灭要是也都是 JoJo 的画风,是不是得这样。

有点辣眼睛,我们还是看算法效果吧。

输入一副图片,根据动漫的画风,生成对应画风的漫画人脸。

JoJoGAN 其他生成效果展示:

这效果你打几分?

还是新鲜热乎,刚刚开源。

项目地址:

https://github.com/mchong6/JoJoGAN

这个工程也提供了 colab,除了这个,还有 web 试玩地址:

https://huggingface.co/spaces/akhaliq/JoJoGAN

絮叨

三个算法,都是新鲜热乎的,我看到的第一时间,就分享给各位小伙伴了。

今天,我连续写了两篇文章,一篇是大家已经看完的这篇 AI 算法。

另一篇是预计下周二或周三发,还需要再改改。是一篇量化交易策略的新教程,硬核教程类,之前的文章里立的 Flag。

我的第一个,一百万!

另一个立的 Flag 的,保姆级教学视频,还在做,慢工出细活,争取一次给大家都讲明白。

上午写一篇文章,下午写一篇文章,晚上接着做视频。

虽然忙了点,但一天过得很充实!

我是努力还 Flag 的 Jack,我们下期见!

·················END·················

推荐阅读

•   清华这样上•   我的小金库•   从高考到程序员的成长之路

浏览 49
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报