AI周期大复盘|七年轮回,2024会是下一个2017吗?
共 34622字,需浏览 70分钟
·
2024-04-02 12:39
从2017到2024, AI的七年之痒。
基于这个范式,OpenAI在2020年推出了具有1750亿参数的GPT-3。在证明Scale Law的同时,将大型语言模型的从AI界推向了整个科技界。
Magic是YCW15的公司,Sequoia Capital、SVA、Slow Ventures等投资
Clara Labs是YCS14的公司,Sequoia Capital、SVA、First Round、Greg Brockman等投资
Operator是由Uber CoFounder Garrett Camp 联合创立,Greylock、GGV等投资
系统1是快思考:无意识、快速、不怎么费脑力、无需推理
系统2是慢思考:需要调动注意力、过程更慢、费脑力、需要推理
用户让Siri推荐一个餐厅:Siri 会推荐餐厅
用户问Siri除了推荐餐厅还能推荐什么?Siri还是会推荐餐厅
用户让Siri别推荐餐厅。Siri依然会推荐餐厅
大模型能力的提升自然不用多说了,呈现出了一定程度的逻辑能力和推理能力。
模型拥有使用工具的能力,API的接入,让应用有了闭环交付任务的能力。
第一个方向是和上一波一样,用新技术再次尝试:面向C端用户的通用型个人助手。
目前看来,现在的技术还是难以去支持一个通用的复杂任务推理框架。正如上一波C端助手做不下去被迫转B端类似。如果将任务局限在一个独特的Vertical里,Agent的表现就会更稳定可靠。
第二个方向是通用的对话系统 + 特殊的Domain:面向垂直细分的AI专家。
这里的 Domian 可以是行业的细分,比如像 法律、医疗、金融 这些数据丰富、单位价值较高的行业,已经出现像 Harvey、Hippocratic 这样的明星公司。
可以是面向 C 端的细分场景,比如 社交、购物、出行、游戏等等。
打造一个让Agent拥有理解任务、规划任务、使用工具并拥有记忆的推理框架。
首先商超需要全局改造,摄像头覆盖、就近服务器部署就需要很大的前期投入
其次由于早期技术的局限性,货物的识别往往会出现误差,这导致在自动系统的背后往往需要配备一个人工的复核团队
最后,对于商超来说,商品的补货仍然需要人工操作,并不能达到真正的无人零售
因此,无论对于商超还是无人零售解决方案提供商而言,ROI都很难算的过来。正像你提到的 Amazon Go 在去年关了好几家店;在2021年前后无人零售概念火的时候,各家初创公司都融了不少钱,但由于一直是烧钱的模式,到现在多多少少遇到发展瓶颈。
以 Mashgin(YC W15)为代表的Checkout unit 模式,类比L3级别的自动驾驶,是原有自助收银系统的智能化版本。类似的还有Caper(YC W16),除了智能收银系统以外,它还提供能够自主结账的购物车,在2021年被Instacart(YC S12)以3.5亿美金的估值收购。
区别于AmazonGo的识别模式,Mashgin使用的是静态固定角度物体识别,因此他们的解决方案能将当下的计算机视觉算法发挥到最佳程度。也正因为如此,Mashgin 只需要使用最普通的摄像头就能达到99.9%的准确率。由于成本优势,Mashgin可以让用户感受到直观的ROI,从而吸引更多的客户,包括那些经济较差、基础设施较差的地区的小商户。并且对于终端的消费者来说,购物的流程并没有被改变,不需要下载额外的App、也不需要担心隐私数据的泄露。
首先作为链接数字世界和物理世界的大模型,它的想象空间是巨大的。
其次可以看到越来越多的大厂可以投资资源:
GTC上Nvidia宣布了开启人形机器人通用基础模型GROOT项目。
再早一些,Figure与OpenAI合作发布的人形机器人演示视频也吸引了一大波关注。
包括Google最早从12-13年收购 Boston Dynamic 开始就一直在机器人领域投入很多。他们开源的RT模型和相关数据对外界模型的开发起了很大的帮助。
最后顶尖的人才也在往这个方向汇聚:
Geoffrey Hinton在离开Google后参与了一家机器人初创公司
Lifefei 对标 ImageNet 做机器人版本的数据集
如果把它作为Transformer衍生的角度来看的话,目前主流的像PaLM-E、RT-2目前仍处于GPT-1的水平。
如果把它作为一个全新的领域去攻克的话,那Embodied AI 仅仅处于 ImageNet 出现的阶段。
文末互动:
你对2024的AI有哪些期待?
👇评论区留言告诉我们你的想法哦~