扩散模型原理到实战:让AIGC成功破圈的《太空歌剧院》
共 6974字,需浏览 14分钟
·
2023-08-30 17:52
公众号【机器学习与AI生成创作】后台回复:168。即可参与免费寄送【扩散模型】图书活动,活动截止日期为 2023-08-28 晚上10点 。
公众号后台回复:168(建议选中复制)
也可自行购买,戳如下优惠京东专属链接:
你能想象吗?下面这些精美绝伦的图片竟然都是AI自动生成的!
图:书中插图
▮ 扩散过程:这滴墨水随着时间的推移逐步扩散到水中,水的颜色也逐渐变成这滴墨水的颜色。
▮ 反向扩散:前向扩散的反向过程,是“去噪”的过程,即从随机噪声中迭代恢复出清晰数据的过程。通俗地说,就是生成模型的采样过程。
图:DDPM 的扩散过程(选自书中)
图:使用现有模型再学习到指定主体图像的功能
在第3章中,作者以实战方式演示了从0开始搭建扩散模型的过程,从一个简单的扩散模型讲起,展示其不同部分的工作原理。
图:模型的预测结果(选自书中)
图:采样过程(选自书中)
此外,作者还对调整时间步、优化采样步骤等提出了思考,以便更好地改善模型效果。同时,读者可以访问B站观看Hugging Face平台提供的课程,来以互动性更强的方式学习扩散模型知识。
图:B站扩散模型直播活动
作者也希望各位读者可以将学到的知识与专业领域或技能相结合,解决生活或工作中的实际问题。
图:Hugging Face Hub 上的模型卡片(选自书中)
▮ 数据集:Hugging Face 归集了超过5000个数据集,涵盖100多种语言,可用于自然语言处理、计算机视觉和音频等广泛领域的任务。
图:某个模型的训练数据集以及使用该模型建立的应用列表(选自书中)
▮ 应用程序:Hugging Face Hub 提供了Spaces 功能,它可以让你在几分钟内创建和部署一个应用程序。
图:Hugging Face Hub 内展示的本周热门 Spaces 应用
除此之外,Hugging Face 还在 GitHub 上开源了一系列机器学习库和工具,比如Transformer、Datasets、diffusers等。
图:使用 Gradio 运行“Hello World !”程序(选自书中)
图:Hugging Face其他精品课程
图灵联合创始人和创始总编刘江、作家马伯庸、Stability.AI 技术产品总监郑屹州以及声网 CTO 钟声博士也为本书的创作提出了宝贵的参考意见。
纵观人类历史,机遇永远属于抢先一步占据未来高度的人。我们每一个人都有必要去探究人工智能的奥秘,以便在即将到来的变革大潮中争得一席之地。
—— 马伯庸 作家
本书系统地介绍了扩散模型的原理和相关细节,同时书中丰富的实战案例也将引领读者快速上手扩散模型。对于任何想要学习和了解扩散模型的人来说,本书都是颇具价值的参考资料。
—— 周明 澜舟科技创始人兼CEO 、创新工场首席科学家、CCF副理事长
本书从“一滴墨水”开始,由浅入深,从理论到实践“扩散”出了图像、文本与音频的AIGC蓝图,并为读者保留了精华,去除了“噪声”,还原出了知识体系最真实的“分布”。
—— 杨耀东 北京大学人工智能研究院研究员
仔细阅读本书,你既可以对扩散模型背后的原理有较为深刻的理解,也可以依此动手进行实践,从而牢固掌握扩散模型,为进一步创新或深度应用打下坚实基础。
—— 钟声 声网CTO
《扩散模型从原理到实战》以Hugging Face的扩散模型课程为基础,通过理论和实例相结合的方式,为读者构建了一个完整的学习框架。无论你是新手还是经验丰富的从业者,这本以实战为导向的图书都能够帮助你更好地理解和应用扩散模型。
—— 王铁震 Hugging Face中国地区负责人、高级工程师
图:书中教学内容
正是因为有了这样庞大的支持团队,本书才得以顺利完成!
从国内外各机构、大厂近期的种种操作看来,这个预测已经照进现实:
作者老王sai【参考资料】
1.AI蛋白设计再登Nature:Diffusion模型助力更强的蛋白质从头设计
2.扩散模型家族再添一员,最新 Cold Diffusion 不再依赖高斯噪声
3.2022 剑桥 AI 全景报告出炉:扩散模型是风口,中国论文数量为美国的 4.5 倍
4.AI生成艺术的底层原理:非平衡物理的扩散模型
5.AI不止ChatGPT,上 Hugging Face Hub,带你探索更多AI模型和应用https://zhuanlan.zhihu.com/p/623521984
6.英特尔实验室推出AI扩散模型,可从文本提示产生360度图片
7.OpenAI全面开放GPT-4 API;Stability AI推出新扩散模型SDXL