大厂们在大模型上都快要卷成麻花了-技术圈

清华团队推出 MiniCPM：利用可扩展的训练策略挖掘小模型潜力；

苹果MM1大模型：30B参数，多模态，在预训练指标上达到SOTA；

亚马逊提出大规模视频语言对齐方法VidLA；

英伟达参与，高效视频扩散模型CMD发布；

谷歌、Stability AI新研究：由文本引导生成纹理3D服装；

港大、阿里新研究：只需一张图，轻松即时定制个性化照片；

上海 AI Lab 新研究：将 LVLM 分辨率提升到 4K HD。

大模型正在重构一个新的人工智能，技术的更迭也是日新月异，这次我整理了近3个月的包含谷歌/苹果/亚马逊/阿里等最新大模型研究102篇大模型论文，给大家做学习参考。

扫码回复“大模型”

领最新100+篇大模型论文合集

AI大模型，正在改变世界，为了更好的入局AI大模型，这次我特意复盘和整理大模型学习脉络，开了30节大模型的课程，包含大模型理论、大模型论文带读以及大模型企业项目实战，还附赠500+大模型论文。

0.01元解锁30节“AI大模型系列课程”

领500+篇大模型论文合集

以下是《AI大模型系列课》课程目录

第一课：NLP大模型：基础、前沿与学习路径

第二课：基于模型量化的大模型压缩的进展

🔻 压缩技术中，为什么量化要优于剪枝、蒸馏？

🔻 如何搜索裁剪阈值用于裁剪outlier？

🔻 包含有异常值outlier的特征如何量化？

第三课：基于模型剪枝的大模型高效计算和应用

🔻 模型剪枝的技术背景

🔻 模型剪枝具体方法

🔻 模型剪枝前沿方法

🔻 语言模型剪枝实例

第四课：讲解扩散模型的基础知识及拓展应用

🔻 AI作画--以文生图

🔻 扩散模型是什么

🔻 扩散模型工作拓展

🔻 扩散模型带来的机遇

第五课：大语言模型的RLHF

🔻 RLHF的优点和挑战

🔻 RLHF如何改善大模型性能

🔻 RLHF的实际应用案例

🔻 RLHF在大模型的未来趋势

第六课：[LLM + 微调]大模型的高效微调

🔻 01 介绍

🔻 02 常用的高效微调方法介绍

🔻 03 如何针对领域数据集根据高效微调方法创造大语言模型

🔻 04 未来挑战与研究方向

第七课：大模型医疗

🔻 医疗领域的数据特点、挑战和机遇

🔻 大模型的定义和特点，如预训练、微调、指令学习等

🔻 针对ChatGLM大模型，介绍ChatGLM模型微调

🔻 代码实践以及模型微调

第八课：大模型基本概念以及应用场景

🔻 发展线路与技术手段

🔻 应用场景

🔻 缺点与局限

🔻 未来展望

第九课：LLAMA2中文大模型

🔻 理论介绍

🔻 代码实践

第十课：大模型前沿论文带读训练营（NLP方向）

🔻 01 LLaMA训练营

🔻 02 LLaMA训练营——精读

🔻 03 LLaMA训练营——代码讲解

🔻 04 GLM-130B训练营——论文泛读

🔻 05 GLM-130B训练营——论文精读

🔻 06 GLM-130B训练营——代码讲解

🔻 07 Alpaca训练营——论文泛读

🔻 08 Alpaca训练营——论文精读

🔻 09 Alpaca训练营——代码讲解

第十一课：掌握大模型领域前沿，跑通三套企业级项目代码

🔻 01 开发基于大模型的聊天机器人

🔻 02 实战基于大模型的对话系统（实战一）

🔻 03 大模型模型原理及综述

🔻 04 大语言模型（LLM）原理及综述

🔻 05 精读大模型-3论文、Instruct论文

🔻 06 精读谷歌PaLM论文、脸书LLaMA论文

🔻 07 实战基于大模型的对话系统（实战二）

🔻 08 实战微调LLaMA模型

扫码回复“大模型”

领500+篇大模型论文合集

在大模型的构建之下，AI自动化交互，将会决定世界的未来，谁的大模型更强大，将决定在遥远的未来的话语权，同时，大模型会成为AI基础设施。

2024年也必将是大模型继续活跃的一年，不想错过大模型机遇的同学，赶紧0.01元扫码获取30节《AI大模型系列课程》！

0.01元解锁30节“AI大模型系列课程”

领500+篇大模型论文合集