中国人民大学《大语言模型》书籍中文版开放下载！还配套代码工具库~-技术圈

大语言模型综述文章《A Survey of Large Language Models》团队终于出书啦！而且是中文版——《大语言模型》！这本书整理呈现了大模型技术框架和路线图，是一本非常好的入门书籍。🧿🧿🧿 此外，官方不仅发布了电子版 PDF 下载链接，还提供了配套资源。点赞 👍图书下载 → [大语言模型]

⬆️关注公众号，后台回复：大语言模型

以下是书籍大纲，如果有你感兴趣的内容，可以直接下载和阅读啦！

第一部分背景与基础知识第一章引言 - 1.1 语言模型的发展历程 - 1.2 大语言模型的能力特点 - 1.3 大语言模型关键技术概览 - 1.4 大语言模型对科技发展的影响 - 1.5 本书的内容组织第二章基础介绍 - 2.1 大语言模型的构建过程 - 2.2 扩展法则 - 2.3 涌现能力 - 2.4 GPT 系列模型的技术演变第三章大语言模型资源 - 3.1 公开可用的模型检查点或 API - 3.2 常用的预训练数据集 - 3.3 常用微调数据集 - 3.4 代码库资源第二部分预训练第四章数据准备 - 4.1 数据来源 - 4.2 数据预处理 - 4.3 词元化 (分词) - 4.4 数据调度第五章模型架构 - 5.1 Transformer 模型 - 5.2 详细配置 - 5.3 主流架构 - 5.4 长上下文模型 - 5.5 新型模型架构第六章模型预训练 - 6.1 预训练任务 - 6.2 优化参数设置 - 6.3 可扩展的训练技术 - 6.4 模型参数量计算与效率分析 - 6.5 预训练代码实践第三部分微调与对齐第七章指令微调 - 7.1 指令数据的构建 - 7.2 指令微调的训练策略 - 7.3 参数高效的模型微调 - 7.4 代码实践与分析第八章人类对齐 - 8.1 人类对齐的背景与标准 - 8.2 基于人类反馈的强化学习 - 8.3 非强化学习的对齐方法 - 8.4 关于 SFT 和 RLHF 的进一步讨论第四部分大模型使用第九章解码与部署 - 9.1 解码策略 - 9.2 解码加速算法 - 9.3 低资源部署策略 - 9.4 其他模型压缩方法第十章提示学习 - 10.1 基础提示 - 10.2 上下文学习 - 10.3 思维链提示第十一章规划与智能体 - 11.1 基于大语言模型的规划 - 11.2 基于大语言模型的智能体第五部分评测与应用第十二章评测 - 12.1 评测指标与评测方法 - 12.2 基础能力评测 - 12.3 高级能力评测 - 12.4 公开综合评测体系第十三章应用 - 13.1 大语言模型在研究领域的应用 - 13.2 大语言模型在专业领域的应用

图书下载 → [大语言模型]

⬆️关注公众号，后台回复：大语言模型

   
    如此“爬虫”？代码全省了
    

   
   
    用 R Bookdown 做本书，上线
    

   
   
    吴恩达最新短课，大模型系列
    

   
   
    ChatGPT、大模型、AI资料分享群
   
   
    本地运行 Llama 3，可以中文，但不强
    

   
   
    Jekyll +  Vercel搭建个人博客，完整教程