互联网晚报 | 李佳琦方回应直播间卖假和田玉传闻;特朗普遭刺杀后支持率未显著领先;多家大模型测不出9.11和9.9哪个大
产品刘
共 7470字,需浏览 15分钟
·
2024-07-18 13:24
大部分大模型在问答中都错误地比较了小数点后的数字,认为9.11大于9.9,考虑到数字涉及的语境问题,记者将其限定为在数学语境下,如ChatGPT这样的大模型也照样答错。在这背后,大模型数学能力较差是长期存在的问题,有行业人士认为,生成式的语言模型从设计上就更像文字思维而不是数字思维。不过,针对性地语料训练或许能在未来逐步提升模型的理科能力。(第一财经日报)
评论