GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4
新智元
共 5047字,需浏览 11分钟
·
2024-05-19 12:44
新智元报道
新智元报道
【新智元导读】OpenAI半小时的发布会让很多人第一反应是直呼「失望」,但随着官网放出更多demo以及更多网友开始试用,大家才发现GPT-4o真的不可小觑,不仅在各种基准测试中稳拿第一,而且有很多发布会从未提及的惊艳功能。
基准测试结果
https://github.com/llmonpy/needle-in-a-needlestack
GPT-4o的能力被严重低估了
白热化的开源与闭源之争
https://www.reddit.com/r/singularity/comments/1crto0m/gpt4o_was_bizarrely_underpresented/?rdt=58871
评论
OpenAI CEO斯坦福闭门猛料!“GPT-5将远超GPT-4”
来源:量子位 “AI模型将更加智能,我们还没有接近这条曲线的顶端。”这是Sam Altman最近在斯坦福闭门座谈会上谈到的观点。当然,对于人们跺脚期盼的GPT-5,他再次卖关子道:GPT-5将远超GPT-4,我们还没有走到Scaling Law的顶点。(os: 具体你们等着瞧
机器学习初学者
0
OpenAI CEO斯坦福闭门猛料!“GPT-5将远超GPT-4”
Datawhale干货 最新:OpenAI,来源:量子位“AI模型将更加智能,我们还没有接近这条曲线的顶端。”这是Sam Altman最近在斯坦福闭门座谈会上谈到的观点。当然,对于人们跺脚期盼的GPT-5,他再次卖关子道:GPT-5将远超GPT-4,我们还没有走到Scaling
Datawhale
1
GPT-4 Claude 3 Gemini Pro对决,还是GPT-4胜一筹
大模型战力排行榜 这两天折腾了两个Mac上的小应用,一个是从视频抽取音频,一个是短视频转Gif。 功能分别是将视频文件/文件夹拖拽到图标上,自动抽取视频中的音频文件;将短视频拖拽到图标上,自动转成Gif格式并保存...
机器学习算法与Python实战
0
接口测试和功能测试的区别
一、什么是功能测试 功能测试 就是对产品的各功能进行验证,根据功能测试用例,逐项测试,检查产品是否达到用户要求的功能。Functionaltesting(功能测试),也称为behavioral testing(行为测试)、黑盒测试或数据...
测试人生路
0