GPT-4o成为全领域SOTA!基准测试远超Gemini和Claude,多模态功能远超GPT-4
新智元
共 5047字,需浏览 11分钟
·
2024-05-19 12:44
新智元报道
新智元报道
【新智元导读】OpenAI半小时的发布会让很多人第一反应是直呼「失望」,但随着官网放出更多demo以及更多网友开始试用,大家才发现GPT-4o真的不可小觑,不仅在各种基准测试中稳拿第一,而且有很多发布会从未提及的惊艳功能。
基准测试结果
https://github.com/llmonpy/needle-in-a-needlestack
GPT-4o的能力被严重低估了
白热化的开源与闭源之争
https://www.reddit.com/r/singularity/comments/1crto0m/gpt4o_was_bizarrely_underpresented/?rdt=58871
评论