Google发布最强大模型,从评测上Google的评测结果来看确实很强.-技术圈

当地时间12月6日，谷歌发布迄今为止功能最强大、最通用的多模态 AI 大模型Gemini 1.0系列（中文译为“双子座”），共包括Ultra、Pro和Nano三个版本。其中，Gemini Ultra已超越了GPT-4，甚至在MMLU测试得分高达90.0%，成为第一个超越人类专家水平的 AI 模型。

1）从自然图像、音频和视频理解到数学推理，Gemini Ultra 的性能在大型语言模型 (LLM) 研发中使用的 32 个广泛使用的学术基准中的 30 个上超过了当前最先进的结果。2）Gemini Ultra 的得分高达 90.0%，是第一个在MMLU（大规模多任务语言理解）上超越人类专家的模型，该模型结合了数学、物理、历史、法律、医学和伦理学等 57 个科目来测试知识和解决问题的能力。

凭借强大的性能，Gemini一夜爆红，引来了华尔街的关注。12月7日，谷歌母公司Alphabet（Nasdaq：GOOG）的股价涨5.31%，收于136.93美元，迎来自今年8月29日以来表现最好的一天，总市值达到1.72万亿美元。

官方文:

https://blog.google/technology/ai/google-gemini-ai/?utm_source=twitter&utm_medium=social&utm_campaign=GDMGemini#performance

60页技术论文：

https://storage.googleapis.com/deepmind-media/gemini/gemini_1_report.pdf

如需, 后台领取。

但有分析指出，谷歌在Gemini的宣传资料中存在夸大宣传的嫌疑。在质疑发酵后，谷歌DeepMind研究和深度学习负责人副总裁奥里奥尔·维尼亚尔斯（Oriol Vinyals）也在X（原推特）平台上发布长文，解释了团队是如何制作该视频的：“视频中的所有用户提示和输出都是真实的，只是为了简洁而进行了缩短。”维尼亚尔斯还表示：“该视频展示了使用Gemini构建的多模态用户体验是什么样子。我们这样做是为了激励开发人员。因此这一次的视频事件会让人们更加怀疑Gemini的可用性。“至少在公众看来，谷歌已经被OpenAI今年的巨大成功打了个措手不及。如果它想激励开发人员，就不能通过精心编辑的、可能歪曲人工智能能力的精彩视频。”