大模型:进入“百模混战”时代

智能计算芯世界

共 4640字,需浏览 10分钟

 · 2023-10-14

全球已发布大模型超200个,中美数量占全球的九成。虽然ChatGPT点燃了大模型发布的热情,不过早在ChatGPT发布之前,全球已经发布了不少大模型,《中国人工智能大模型地图研究报告》显示,2019年美国已经有了4个大模型,而中国2020年有了2个大模型,此后每年都有大模型发布,仅仅2023年的前五个月,中美分别有19、18个大模型发布。

下载链接:
中美AI大模型应用比较研究报告
2023年中国网络摄像机SoC芯片行业词条报告
硅光技术产业深度研究:芯片出光,硅光技术开启高速与高集成度传输时代
半导体检测行业报告:集成电路国产化加速,第三方检测发展空间广阔
2023年AR增强现实技术终端设备词条报告
算力国产化大势所趋,昇腾构建自主高端AI计算竞争力
2023人工智能专题报告:AI大模型应用中美比较研究
2023年半导体封测设备行业词条报告
深度报告:存储行业拐点已至,国产化主线确立
华为发布会:Mate60系列引领创新,全场景新品技术升级
AI大模型开源生态及大模型平台实践
2023新型算力中心调研报告(2023)

400+份重磅ChatGPT专业报告(合集)

1、CPU处理器、内存、GPU知识
2、服务器、存储、网卡知识
3、可信计算、操作系统、RAID知识

截至2023年5月底,国内10亿级参数规模以上基础大模型至少已发布79个,而美国这一数字为100个,全球累计发布大模型202个,中美两国大模型的数量占全球大模型数量的近90%,中国大模型数量已进入第一梯队。

发布大模型的机构可以分为四种类型,互联网公司、学术/研究机构、Al公司及行业公司。国内大模型呈快速发展之势,在以下几个方面表现突出:

一是,大模型应用越来越广泛,在自然语言处理、图像识别、语音识别、内容生成等多个领域有着广泛应用。


二是,大模型算法丰富,国内的模型上除了GPT之外,还对BERT、ALBERT、NEZHA等进行了广泛的探索。

三是,大模型性能不断提升,国内大模型玩家纷纷加大对Al的研发投入,据钛媒体·钛度图闻不完全统计,2022年,华为在研发费用上投入1615亿元,成为研发投资资金最多的企业;其次,腾讯以614亿元排名第二,阿里以555亿元排名第三,他们在硬件和软件领域的大规模投入,大大提高了大模型的运算速度和效率。

四是,大模型研究成果不断涌现,国内以清华、复旦、哈工大等高校也推出了自己的大模型,国内机构在NLP、CV等领域也拿到了多个国际级别的冠军。
然而不得不承认的是,国内大模型迅猛发展的同时也面临着基础模型研发能力不足,部分行业数据搜集整理难度大等问题。

据国外风投数据分析公司PitchBook的数据,2023上半年,全球人工智能领域共计发生融资1387件,筹集融资金额255亿美元,平均融资金额达2605万美元。

根据Crunchbase数据库,2011-2023年共计3658个Al领域融资项目(仅统计500万以上融资金额的项目,且融资公司所在地为美国),美国Al领域融资项目数及融资金额稳步增长。2022年美国风投Al领域融资项目数为574个,2011-2022年CAGR达29.3%;2022年美国AI领域融资金额为243.5亿美元,2011-2022年CAGR达422.5%。


据业界不完全统计,2023年上半年,美国AIGC一级市场中,硅谷在人工智能领域共完成了42起融资,总金额约140亿美元,占世界总融资金额的55%。平均轮次融资金额为3.3亿美元,是平均融资水平的近13倍之多。其中,8家人工智能明星独角兽公司拔地而起,平均轮次融资金额3.3亿美元。

虽然大模型发布数量不断增长,然而对于大模型如何落地变现,仍在不断探索中,据中国电信研究院分析,国外行业大模型发展模式主要有三种,且以前两种发展模式为主。

一是。目前国际巨头多采用这种模式,如谷歌、微软、Meta等龙头厂商利用大模型重构原有业务,比如微软利用GPT-4全面“龙头大模型+原有业务”赋能Azure云、Office365、Dynamics365等传统业务。这种模式的优势在于可以利用大模型的强大语言能力,提升原有业务的智能化水平,同时也可以借助原有业务的数据和用户资源,增强大模型的应用相关性和准确性。

二是“龙头大模型+外部行业数据”。这种模式是国内创业公司普遍采用的方式,通过直接调用API或基于GPT大模型微调改进自身Al产品,比如哈维基于GPT及行业数据推出“Al法律助手”。这种模式的优势在于可以利用龙头大模型的先进技术和算力,快速打造出具有行业特色和竞争力的Al产品,同时也可以借助外部数据源,增强行业相关性和准确性。

三是“开源大模型+自有行业数据搭建行业大模型”。这种模式多适用于有着丰富的行业数据积累的中大型企业。例如基于开源模型研发,实现LLM与金融垂直领域知识的深度融合。这种模式的优势在于可以充分利用自有数据的质量和数量级,打造出更专业、更精准的行业大模型,同时也可以借鉴开源大模型的技术和经验,提升训练效率和效果。

总体而言,基础大模型训练成本高,研发难度大,这决定了大模型会遵照“赢者通吃”的规律,未来市场上仅存几个龙头大模型,而围绕龙头大模型的创业生态将逐步形成。

下载链接:
400+份重磅ChatGPT专业报告(合集)
隐私计算中的多层次计算技术
端云协同隐私计算系统的设计和落地探索
《大模型和AIGC技术合集(2023.9)》
1、AI大模型落地的前景和痛点,兼谈工程师架构师所面临的机会和挑战 2、AIGC驱动下高校数字化转型 3、大模型趋势下的企业数据体系思考 4、大模型时代下数据中台该何去 5、大模型重塑软件开发以及实践案例展示 6、当GPT遇到低代码低代码平台AIGC开发落地实战
7、迈向通用人工智能时代之路——边缘与管力网络演进及思考
8、网宿边缘智能平台与AIGC探索
人工智能和虚拟现实将如何改变职场世界
2023年生成式人工智能的突破年
华为昇腾:国产AI算力的扛旗者(2023)
中国联通新一代AI计算基础设施白皮书
开放加速规范AI服务器设计指南(2023)
《未来网络白皮书(2023)合集》
1、未来网络白皮书(2023):算网操作系统白皮书 
2、未来网络白皮书(2023):以网络IO为中心的无服务器数据中心白皮书 
3、未来网络白皮书(2023):光电融合服务定制广域网白皮书

人工智能专题报告:智算中心—赋能AI产业化、产业AI化(2023)

中国超导体行业:立足科技前沿,满足能源战略需求(2023)
行业报告:大模型推理算力知多少?
艾瑞咨询:2023年中国AIGC产业全景报告
体系化人工智能与大模型(2023)

多样性算力:新一代计算架构超异构计算

聚力“高广深”打造先进算力网络

生成式AI:产业变革与机会(2023论坛合集)

《全球OCP峰会Chiplet资料汇总》
华为鲲鹏处理器介绍
鲲鹏计算产业发展白皮书
华为鲲鹏生态研究框架

《“东数西算”技术分析合集》

《2023年液冷技术白皮书汇总》

1、浸没式液冷数据中心热回收白皮书(2023) 2、数据中心绿色设计白皮书(2023)
2022年算力强基行动产品目录(2023)

世界AI大会系列:数据为核,迈向多模态AI大模型时代

AI精华系列报告:AMD发布MI300,指引Chiplet等AI芯片新方向
《CXL论坛:CXL全球厂商方案合集》
1、CXL-Forum AMD技术方案.pdf 
2、CXL-Forum CXL-Consortium技术方案.pdf
3、CXL-Forum Elastics cloud技术方案.pdf 
4、CXL-Forum Intel技术方案.pdf 
5、CXL-Forum Marvell技术方案.pdf 
6、CXL-Forum MemVerge技术方案.pdf 
7、CXL-Forum Micron技术方案.pdf
玄铁RISC-V处理器入门及实战
《芯来科技RISC-V设计与实现合集》
1、芯来科技:基于RISC-V的MCU软硬件解决方案
2、芯来科技:高可靠高安全性RISC-V处理器设计与实现


本号资料全部上传至知识星球,更多内容请登录智能计算芯知识(知识星球)星球下载全部资料。




免责申明:本号聚焦相关技术分享,内容观点不代表本号立场,可追溯内容均注明来源,发布文章若存在版权等问题,请留言联系删除,谢谢。


温馨提示:

请搜索“AI_Architect”或“扫码”关注公众号实时掌握深度技术分享,点击“阅读原文”获取更多原创技术干货。

浏览 984
点赞
评论
收藏
分享

手机扫一扫分享

举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

举报