大脑如何处理语言?普林斯顿团队对Transformer模型进行分析
共 3314字,需浏览 7分钟
·
2024-07-23 17:00
来源:专知 本文约1700字,建议阅读5分钟
研究证明,由各个功能专门化的「注意力头」执行的紧急计算,会以不同的方式预测特定皮层区域的大脑活动。这些注意力头沿着与低维皮层空间中的不同层和上下文长度相对应的梯度下降。
编辑:文婧
关于我们
数据派THU作为数据科学类公众号,背靠清华大学大数据研究中心,分享前沿数据科学与大数据技术创新研究动态、持续传播数据科学知识,努力建设数据人才聚集平台、打造中国大数据最强集团军。
新浪微博:@数据派THU
微信视频号:数据派THU
今日头条:数据派THU
评论