从技术路径，纵观国产大模型逆袭之路

智能计算芯世界

共 3285字，需浏览 7分钟

·

2024-07-22 07:37

OpenAI、Google、Antropic三大厂商竞相轮换大模型第一宝座：自23年初GPT-4发布以来，在1年左右时间内基本稳定处于大模型最强位置。2024年海外大模型迭代速度有所加快，龙头竞争格局悄然发生变化。

 1）5月，OpenAI发布新的旗舰模型GPT-4o，实现跨模态即时响应，相比GPT-4 Turbo，刷新SOTA实现性能飞跃。

 2）5月，Google发布Gemini 1.5 Pro进阶版，实现200万tokens上下文，具备更强大的推理和理解能力。

 3）6月，Antropic发布Claude 3.5 Sonnet，具备更强的代码和视觉能力，基准测试结果全方位碾压Gemini 1.5 Pro和Llama-400b，大部分优于 GPT-4o，一定程度上暂时代表着当前大模型性能最高水平。

在传统基准测试中，GPT-4o在文本、推理和编码智能方面实现了GPT-4 Turbo级别的性能，同时在多语言、音频和视觉功能上达到了新的高水位线。

 文本推理：GPT-4o在0-shot COT MMLU（常识问题）上创下了88.7%的新高分。此外，在传统的5-shot no-CoT MMLU上，GPT-4o创下了87.2%的新高分。相较于GPT-4 Turbo而言，GPT-4o文本推理能力有一定提升。

 多语言识别：与Whisper-v3相比，GPT-4o在多种语言的识别中表现优异，尤其是资源匮乏的语言。

 音频翻译：GPT-4o在音频翻译表现上达到新的高水准，且在MLS基准测试中优于Whisper-v3。

 M3Exam测试：M3Exam基准测试既是多语言评估也是视觉评估，由来自其他国家标准化测试的多项选择题组成，有时还

包括图形和图表。在所有语言的基准测试中，GPT-4o都比GPT-4更强。

 视觉理解：GPT-4o在视觉感知基准上实现了最先进的性能。具体来看，GPT-4o在MMMU测试中分数达到69.1，而GPT-4

Turbo、Gemini 1.0 Ultra、Gemini 1.5 Pro、Claude Opus分别为63.1、59.4、58.5、59.4。

 GPT-4o多模态能力范围显著拓展：除了文本、图像等常用功能，GPT-4o还支持3D物品合成、文本转字体等多样化功能。与GPT-4 Turbo相比，GPT-4o速度提升2倍、成本却降低了50%，且速率限制提升5倍。

下载链接：

计算机行业深度：从技术路径，纵观国产大模型逆袭之路

《SuperCLUE：中文大模型基准测评报告合集》

1、SuperCLUE：中文大模型基准测评报告（2024上半年） 2、SuperCLUE：中文大模型基准测评报告（2024.4）

《海外AI研究系列合集》

1、海外AI研究系列（一）：算力帝国的挑战者（2024） 2、海外AI研究系列（二）：AI时代的算力领军人

3、海外AI研究系列（三）：存储与算力需求共振，AI时代大展宏图

《智算中心及算力网络技术合集》

1、智算时代一体化电源应用分析 2、面向算力网络的传输网发展与研究 3、新型智算中心组网方案研究 4、面向算力网络的安全能力研究 5、AI智算发展对高速光模块的应用需求研究 6、面向算力网络的算力建模与度量技术研究

《芯片封测行业技术分析合集》

1、封测行业研究框架

2、半导体封测专题：封测行业景气，先进封测驱动芯片成长

3、半导体精华：先进封测，价值增厚

4、裸芯片封测技术的发展与挑战

5、先进封测装与Chiplet共塑后摩尔半导体产业新格局

6、IC半导体封装测试流程（精华版）

《70+篇半导体行业“研究框架”合集》

《46份智能网卡和DPU合集》

600+份重磅ChatGPT专业报告

《人工智能AI大模型技术合集》

《FPGA五问五答系列合集》

下载链接：

2024年中国安防视频监控SoC芯片行业研究报告：安防SoC市场喜迎百亿爆发，众企竞逐后海思时代

迈向巅峰之路：中国成长型AI企业研究报告（2024）

2024安全大模型技术与市场研究报告

2024大模型典型示范应用案例集

HBM专题：逐鹿顶尖工艺，HBM4的三国时代

AI Agent行业词条报告：驱动智能交互变革，重塑服务生态

空间数据智能大模型研究：2024年中国空间数据智能战略发展白皮书

企业竞争图谱：2024年量子计算词条报告

2024中国服务器CPU行业概览：信创带动服务器CPU国产化

HBM专题报告：跨越带宽增长极限，HBM赋能AI新纪元

2024基于标准PCIe接口的人工智能加速卡液冷设计白皮书

大模型时代的算力和存储产业新机遇

《新型智算中心改造系列报告合集》

1、新型智算中心改造系列报告二：拉动全球电力消耗增长，液冷渗透率快速提升 2、新型智算中心改造系列报告一：网络成大模型训练瓶颈，节点内外多方案并存

《国产异构处理器定位优化技术合集》

1、面向申威众核处理器的规则处理优化技术 2、神威超级计算机运行时故障定位方法

2024中国半导体深度分析与展望报告

面向异构硬件架构软件支撑和优化技术

AI大模型赋能手机终端，拥抱AI手机新机遇

全球AI算力行业首次覆盖：从云到端，云端协同，AI开启科技行业超级成长周期

2024年中国大模型行业应用研究：大模型引领智能时代，助力各行业全面升级

《半导体行业系列专题合集》

1、半导体行业系列专题：刻蚀—半导体制造核心设备，国产化典范

2、半导体行业系列专题：碳化硅—衬底产能持续扩充，加速国产化机会

3、半导体行业系列专题：直写光刻篇，行业技术升级加速应用渗透

4、半导体行业系列专题：先进封装—先进封装大有可为，上下游产业链受益

“人工智能+”进入爆发临界，开启繁荣生态前景

鲲鹏处理器软件性能调优（精编版）

《算力网络：光网络技术合集（1）》

1、面向算力网络的新型全光网技术发展及关键器件探讨

2、面向算力网络的光网络智能化架构与技术白皮书

3、2023开放光网络系统验证测试规范

4、面向通感算一体化光网络的光纤传感技术白皮书

《算力网络：光网络技术合集（2）》

1、数据中心互联开放光传输系统设计

2、确定性光传输支撑广域长距算力互联

3、面向时隙光交换网络的纳秒级时间同步技术

4、数据中心光互联模块发展趋势及新技术研究

面向超万卡集群的新型智算技术白皮书

面向AI大模型的智算中心网络演进白皮书

本号资料全部上传至知识星球，更多内容请登录智能计算芯知识（知识星球）星球下载全部资料。

免责申明：本号聚焦相关技术分享，内容观点不代表本号立场，可追溯内容均注明来源，发布文章若存在版权等问题，请留言联系删除，谢谢。

温馨提示：

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享，点击“阅读原文”获取更多原创技术干货。

浏览 90

点赞

收藏

分享

举报

评论

图片

表情

从家庭主妇到格力老总，董明珠的大女主逆袭之路

逆袭了......

一个非科班生的逆袭之路

程序员书单

一碗螺蛳粉的百亿逆袭之路

底层程序员，逆袭！

NLP菜鸟逆袭

NLP菜鸟逆袭记：地址：Github地址：https://github.com/km1994/AwesomeNLPdGitee 地址：https://gitee.com/km601/AwesomeNLP_gitee x介绍：【NLP菜鸟逆袭】分享自然语言处理（文本分类、信息抽取、知识图谱

NLP菜鸟逆袭

NLP菜鸟逆袭记：地址：Github地址：https://github.com/km1994/AwesomeNLPdGitee 地址：https://gitee.com/km601/AwesomeNLP_gitee x介绍：【NLP菜鸟逆袭】分享自然语言处理（文本分类、信息抽取、知识图谱

NLP菜鸟逆袭

NLP菜鸟逆袭记：地址：Github地址：https://github.com/km1994/AwesomeNLPdGitee 地址：https://gitee.com/km601/AwesomeNLP_gitee x介绍：【NLP菜鸟逆袭】分享自然语言处理（文本分类、信息抽取、知识图谱

点赞

收藏

分享

举报