大脑与 AI 共享语言预测机制:一项神经科学实验的新证据
📅 2026年06月20日 · 快讯
我们的大脑在听人说话时,其实不是被动地接收每一个词——它在不停地"猜"下一个词是什么。这种预测被认为是人类语言处理高效的关键。一个长期悬而未决的问题是:大脑的这种预测机制,和大型语言模型(LLM)的"预测下一个 token"到底是不是一回事?最新发表在认知神经科学期刊上的一项研究,给出了相当肯定的答案。
实验怎么做的
研究团队让 29 名参与者戴上设备聆听有声读物,同时同步记录他们的脑电图(EEG)和脑磁图(MEG)数据。关键在于,研究者用三种语言模型对有声读物里出现的名词逐一打"可预测性评分":一个是 BERT 模型,另外两个是多语言版本的 LLaMA。
然后用这些模型的预测概率,去和真实的大脑神经活动做对照——看看模型认为"这个词有多容易被猜到",是否和大脑的反应模式一致。
结果:高度吻合
结论相当清晰:当某个词的可预测性越高(即模型也认为它很"顺理成章"),大脑在识别这个词时反应就越"省力"——具体表现为一个被称为 N400 的脑电波成分幅度降低,同时在该词出现之前,预期相关的神经活动会增强。
- 脑电图数据显示,左侧额颞叶区域出现了更强的"预激活"——也就是大脑在词还没被说出时就已经开始为它做准备。
- 脑磁图数据则显示,那些低可预测性、让人意外的词,更容易引发感觉运动皮层的参与,暗示语言预测可能还包含与"动作"相关的成分。
为什么这件事重要
这是据研究者所知,首个利用自然语音刺激(而不是人工构造的句子)来验证这些效应的实验。它把计算语言模型和真实的神经生理数据结合了起来,从两个不同的层面证明了:人脑和 AI 语言模型,在"组织和预测语言"这件事上,遵循着高度相似的并行处理原则。
这至少有两层意义。对认知科学而言,它为"预测编码理论"——即大脑是一个不断预测、再用感觉输入去修正预测的机器——提供了新的实证支持。对人工智能而言,它启发了一种思路:神经科学对人类语言机制的理解,反过来可以为设计更高效、更接近人类认知方式的 AI 提供灵感。
一个有趣的延伸
这项研究某种程度上"回敬"了一个常见质疑:"AI 的预测概率不过是数学统计,和人脑理解语言不是一回事。"数据显示,至少在词级别的预测上,两者的运作原则惊人地一致。当然,这并不意味着 LLM 就像人脑一样"理解"语言——它说明的是,预测本身可能就是语言处理的一种通用原理,无论是碳基的还是硅基的。