Jeff Dean万字总结!图解谷歌2022年AIGC、LLM、CV三大领域成就
【新智元导读】2022年,谷歌在ML领域取得了哪些新进展?Jeff Dean发万字长文总结。
语言模型
在过去十年中,机器学习最令人兴奋的领域之一,无疑就是规模更大、功能更强的语言模型了。
进行多步算术(左)、在大学水平考试中考高分(中)以及在上下文中识别单词的预期含义(右)的能力,都只出现在足够大的模型中,包括LaMDA、GPT-3、Gopher、Chinchilla和PaLM
生成模型
论文地址:https://arxiv.org/abs/2103.00020
左图来自Imagen:「皇家城堡的一面墙。墙上有两幅画。左边那幅是皇家浣熊国王充满细节的油画。右边那幅是皇家浣熊王后充满细节的油画。」 右图来自Prti:「一只戴着摩托车头盔和披风的泰迪熊在纽约市的出租车上冲浪。数码照片。」
论文地址:https://arxiv.org/abs/2205.11487
用户的控制
论文地址:https://arxiv.org/abs/2208.12242
论文地址:https://arxiv.org/abs/2208.01626
生成式视频
生成式音频
计算机视觉
图像的处理
理解3D世界
写在最后:谷歌是负责的
评论