如何看Meta发布的全新大模型 LLaMa 2?免费商用又如何快速用起来?

共 3531字,需浏览 8分钟

 ·

2023-08-04 15:27


01
引言
Facebook母公司Meta上周(7.19)发布了新一代可商用大语言模型LLaMa 2,可以说是迄今为止ChatGPT最强大的开源竞争对手。LLaMa 2因为性能强劲,关键是完全免费商用,其对大模型行业的格局也势必产生较大影响。
LLaMa 2对比其他开源模型均有明显胜出
不光开源了模型,Meta还写了一篇76的paper,把各种细节都讲的清清楚楚,相比 OpenAI,这是真的开放!建议大家去阅读(下一篇会分享一个翻译插件帮助大家阅读),复制下面地址下载即可:https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

LLaMa 2推出当天,傅盛和朱啸虎就又在朋友圈开始了据6月份后的第二次斗嘴。大模型行业到底是该笑呢,还是哭呢?很有意思。
反正作为应用层和消费者,我们肯定是乐得一笑的。并且,据LLaMa 2文档明确表示,直到你的产品月活跃用户达到7亿,商业使用LLaMa 2都是免费的。这将是多么令人兴奋的一件事,可以相信未来就是人手一个专属的LLM。

要知道现在单纯国内就是千模大赛,LLaMa 2出来以后,想想大多数的处境都会比较尴尬,甚至被排死在沙滩上。除非Top几家因中文语料比较丰富的,中文模型效果更为突出,或者是垂直模型另说。因为一个行业不仅应用层不需要重复造轮子,大模型行业也同样如此。


02
LLAMA 2的参数和训练

1、LLaMa2 的性能和参数 

对于LLaMa2 的性能和参数,官网上(ai.meta.com/llama)介绍很详细也很清楚:

- LLaMa2 的训练数据比LLaMa 1 多 40%,上下文长度是LLaMa 1 的两倍。

- LLaMa2有大小三个版本分别是7B 13B和70B。

- 预训练的Token为2 万亿,上下文长度为4096。

- 据Meta所说,LLaMa2在许多外部基准测试中都优于其他开源语言模型,包括推理、编码、熟练程度和知识测试。


2、LLaMa2 的模型架构 

- LLaMa2-Chat 的基础是 LLaMa2 系列预训练语言模型。LLaMa2使用标准的Transformer架构。

- LLaMa2-Chat 通过监督微调和强化学习人类反馈进行了优化。先进行监督微调,然后应用包括拒绝采样和PPO在内的强化学习算法进行迭代改进。

- 采用了一些优化,比如预规范化、SwiGLU激活函数和旋转位置嵌入(RoPE)。

- LLaMa2-Chat有70亿、34亿、13亿和7亿参数的版本。训练使用公开可获得的数据,没有使用任何Meta用户数据。


3、LLaMa2 的训练方法论
1)预训练
- 使用公开可获得的在线数据进行预训练,总计2万亿个标记。

- 对数据进行了清洗,移除了一些包含大量个人信息的网站。

- 采用标准的Transformer架构,以及一些优化如RoPE等。


2)监督微调 

- 使用高质量的人工标注数据(约3万示例)进行监督微调。

- 优化回答标记,而不是提示标记。


3)基于人类反馈的强化学习 

- 收集人类偏好数据: letting人类比较并选择更好的回复。

- 训练奖励模型,给回复打分。

- 使用拒绝抽样和PPO算法进行迭代调优。


4)安全性
- 收集安全/有帮助的数据进行监督微调。

- 训练独立的安全性奖励模型。

- 使用内容蒸馏等方法增强安全性。

在模型安全性方面,LLaMa2 可以说是一骑绝尘,一举超越了 ChatGPT。事实上,开源模型的安全大多都很糟糕,通过下图量化对比你能知道它们会有多差。

4、关于代码能力

官方使用了 human evel 作为测试。官方说很明白,LLaMa2和 GPT3.5 还是有「显著的差距」。具体得分 LLaMa2 29.9,GPT3.5 48.1,GPT4 67 。同时也能看到 PaLM-2 的各项指标也都不错,是比 LLaMa2要强的。


5、评估 

- 在4K提示上进行有用性人类评估,与ChatGPT等旗鼓相当。

- 在2K提示上进行安全性人类评估,优于多个基准模型。


6、如何申请模型使用

- 与 LLaMa1 版本不同,这次Meta开放了商业使用的权限。

- 现在可以直接在这个页面申请下载模型使用:https://ai.meta.com/resources/models-and-libraries/llama-downloads

- 日活大于7亿的产品需要单独申请商用权限 

- 不得使用 LLaMa 材料或 LLaMa 材料的任何输出或结果来改进任何其他大型语言模型。



03
如何使用LLAMA 2?

LLaMa 2作为全新的开源大模型,不用购买 IP,就能免费使用。除了在官网申请模型使用外,以下是几种能够快捷体验到用 LLaMa 2 进行 Chat 聊天的方法:

1、llama2.ai

国内用户就可以直接访问,轻松注册后就可以正常使用。左侧列表支持选择具体模型(70B/13B/7B),设定Temperature、Top P以及Max Sequence Length,这些参数主要是调优prompt对话效果的,后面讲prompt工程训练时我们再介绍。当然对于一些问题还是能看出来它在一本正经瞎说,大家要留心辨认。

2、在Hugging Chat 上使用LLaMa 2 

在 huggingchat 上最大的亮点是支持连网功能-search web。这点比较强大能够获得很多实时性语料内容。该站使用的模型是LLaMa/LLaMa2 70B,使用 LLaMa2 的地址:https://huggingface.co/chat/

3、perplexity AI chat

使用地址:llama.perplexity.ai,目前还是13B的模型,70B还要等等。

4、 当然还有我一直推荐的poe.com 或者 poe 客户端

LLaMa 2Chat 整体的体验都还不错,从用户体验来看和 ChatGPT (GPT3.5) 确实差别不明显。不过有时候他的回答默认是英文,还需要你再让他翻一下。


总之,Meta 发布的 LLaMa 2 大模型整体还是非常强大的。参数量级和性能效果足以吊打很多大模型,关键还可以免费商用,直到你的产品月活 7 亿。可以说,LLaMa 2 势必会对大模型行业产生较大影响,尤其是大模型创业。即便是安全性略逊,LLaMa 2 也是很多小微企业开始 AI 应用层训练的起点和支撑。具体影响还让我们拭目以待!


关于 LLaMa 2,你有什么想聊的也欢迎留言讨论~

...................END...................

hello,我是阿外,10 年+PM&Designer,AGI领域研究者。欢迎关注「波悟馆」(bo_club),也可以加我微信,申请加入读者群,和更多小伙伴一起学习,共同成长。

推荐阅读

Claude 2 评测和使用方法

BingChat的产品启示

Stable Diffusion安装教程

免费使用GPT-4

如果你觉得文章对你有帮助,请记得一定点下面👇的「分享」、「赞」和「在看」。

浏览 336
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报