从技术路径,纵观国产大模型逆袭之路

共 3285字,需浏览 7分钟

 ·

2024-07-22 07:37

OpenAI、Google、Antropic三大厂商竞相轮换大模型第一宝座:自23年初GPT-4发布以来,在1年左右时间内基本稳定处于大模型最强位置。2024年海外大模型迭代速度有所加快,龙头竞争格局悄然发生变化。

1)5月,OpenAI发布新的旗舰模型GPT-4o,实现跨模态即时响应,相比GPT-4 Turbo,刷新SOTA实现性能飞跃。

2)5月,Google发布Gemini 1.5 Pro进阶版,实现200万tokens上下文,具备更强大的推理和理解能力。

3)6月,Antropic发布Claude 3.5 Sonnet,具备更强的代码和视觉能力,基准测试结果全方位碾压Gemini 1.5 Pro和Llama-400b,大部分优于 GPT-4o,一定程度上暂时代表着当前大模型性能最高水平。

在传统基准测试中,GPT-4o在文本、推理和编码智能方面实现了GPT-4 Turbo级别的性能,同时在多语言、音频和视觉功能上达到了新的高水位线。

文本推理:GPT-4o在0-shot COT MMLU(常识问题)上创下了88.7%的新高分。此外,在传统的5-shot no-CoT MMLU上,GPT-4o创下了87.2%的新高分。相较于GPT-4 Turbo而言,GPT-4o文本推理能力有一定提升。

多语言识别:与Whisper-v3相比,GPT-4o在多种语言的识别中表现优异,尤其是资源匮乏的语言。

音频翻译:GPT-4o在音频翻译表现上达到新的高水准,且在MLS基准测试中优于Whisper-v3。

M3Exam测试:M3Exam基准测试既是多语言评估也是视觉评估,由来自其他国家标准化测试的多项选择题组成,有时还

包括图形和图表。在所有语言的基准测试中,GPT-4o都比GPT-4更强。

视觉理解:GPT-4o在视觉感知基准上实现了最先进的性能。具体来看,GPT-4o在MMMU测试中分数达到69.1,而GPT-4

Turbo、Gemini 1.0 Ultra、Gemini 1.5 Pro、Claude Opus分别为63.1、59.4、58.5、59.4。

GPT-4o多模态能力范围显著拓展:除了文本、图像等常用功能,GPT-4o还支持3D物品合成、文本转字体等多样化功能。与GPT-4 Turbo相比,GPT-4o速度提升2倍、成本却降低了50%,且速率限制提升5倍。

下载链接:
计算机行业深度:从技术路径,纵观国产大模型逆袭之路
《SuperCLUE:中文大模型基准测评报告合集》
1、SuperCLUE:中文大模型基准测评报告(2024上半年) 2、SuperCLUE:中文大模型基准测评报告(2024.4)
《海外AI研究系列合集》
1、海外AI研究系列(一):算力帝国的挑战者(2024) 2、海外AI研究系列(二):AI时代的算力领军人
3、海外AI研究系列(三):存储与算力需求共振,AI时代大展宏图
《智算中心及算力网络技术合集》
1、智算时代一体化电源应用分析 2、面向算力网络的传输网发展与研究 3、新型智算中心组网方案研究 4、面向算力网络的安全能力研究 5、AI智算发展对高速光模块的应用需求研究 6、面向算力网络的算力建模与度量技术研究

《芯片封测行业技术分析合集》

1、封测行业研究框架 

2、半导体封测专题:封测行业景气,先进封测驱动芯片成长 

3、半导体精华:先进封测,价值增厚

4、裸芯片封测技术的发展与挑战 

5、先进封测装与Chiplet共塑后摩尔半导体产业新格局

6、IC半导体封装测试流程(精华版)

《70+篇半导体行业“研究框架”合集》

《46份智能网卡和DPU合集》

600+份重磅ChatGPT专业报告

《人工智能AI大模型技术合集》

《FPGA五问五答系列合集》


下载链接:

2024年中国安防视频监控SoC芯片行业研究报告:安防SoC市场喜迎百亿爆发,众企竞逐后海思时代

迈向巅峰之路:中国成长型AI企业研究报告(2024)

2024安全大模型技术与市场研究报告

2024大模型典型示范应用案例集

HBM专题:逐鹿顶尖工艺,HBM4的三国时代

AI Agent行业词条报告:驱动智能交互变革,重塑服务生态

空间数据智能大模型研究:2024年中国空间数据智能战略发展白皮书

企业竞争图谱:2024年量子计算词条报告

2024中国服务器CPU行业概览:信创带动服务器CPU国产化

HBM专题报告:跨越带宽增长极限,HBM赋能AI新纪元

2024基于标准PCIe接口的人工智能加速卡液冷设计白皮书

大模型时代的算力和存储产业新机遇

《新型智算中心改造系列报告合集》

1、新型智算中心改造系列报告二:拉动全球电力消耗增长,液冷渗透率快速提升 2、新型智算中心改造系列报告一:网络成大模型训练瓶颈,节点内外多方案并存

《国产异构处理器定位优化技术合集》

1、面向申威众核处理器的规则处理优化技术 2、神威超级计算机运行时故障定位方法

2024中国半导体深度分析与展望报告

面向异构硬件架构软件支撑和优化技术

AI大模型赋能手机终端,拥抱AI手机新机遇

全球AI算力行业首次覆盖:从云到端,云端协同,AI开启科技行业超级成长周期

2024年中国大模型行业应用研究:大模型引领智能时代,助力各行业全面升级

《半导体行业系列专题合集》

1、半导体行业系列专题:刻蚀—半导体制造核心设备,国产化典范

2、半导体行业系列专题:碳化硅—衬底产能持续扩充,加速国产化机会 

3、半导体行业系列专题:直写光刻篇,行业技术升级加速应用渗透 

4、半导体行业系列专题:先进封装—先进封装大有可为,上下游产业链受益

“人工智能+”进入爆发临界,开启繁荣生态前景

鲲鹏处理器软件性能调优(精编版)

《算力网络:光网络技术合集(1)》

1、面向算力网络的新型全光网技术发展及关键器件探讨 

2、面向算力网络的光网络智能化架构与技术白皮书 

3、2023开放光网络系统验证测试规范 

4、面向通感算一体化光网络的光纤传感技术白皮书

《算力网络:光网络技术合集(2)》

1、数据中心互联开放光传输系统设计 

2、确定性光传输支撑广域长距算力互联 

3、面向时隙光交换网络的纳秒级时间同步技术 

4、数据中心光互联模块发展趋势及新技术研究

面向超万卡集群的新型智算技术白皮书

面向AI大模型的智算中心网络演进白皮书

本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。



温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。



浏览 60
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报