小孩子如何学会语言？科学家使用计算机模型解释儿童语言学习过程-技术圈

来源：学术头条

本文约2500字，建议阅读5分钟 
本文介绍了小孩学会语言的过程以及科学家如何依托计算机程序对其进行预测。

人类的交流能力可谓是动物王国中其他物种所无与伦比的，语言允许人们以独特的方式进行沟通和协作，语言也成为人类文化和社会的基石。人类幼崽从幼儿时期咿咿呀呀发音开始，就以一种特殊的方式与外界进行沟通，直到他们学会学会用语言与社会环境中的其他人进行沟通。

一个儿童在正式入学前，会掌握数千个左右的词汇量，而且可以在特定的场景下说出一句情感与意义兼具的话语。仔细想来，从认识几个字到能够畅通地用语言表达一个完整的意思，儿童不仅要了解单词的意义，还需要掌握句法结构，还需要将复杂社会场景下的语言进行有效整合，他们是如何做到的？

在一项最新研究中，来自马克斯・普朗克进化人类学研究所、麻省理工学院和斯坦福大学的一个研究小组对这个问题进行了研究，并提出一种儿童整合信息的理论，为语言学习过程中信息的整合提供了定量理论。

儿童如何整合信息

马克斯・普朗克进化人类学研究所研究员 Manuel Bohn 说：“我们知道，孩子们在学习新单词的过程中，会使用社会环境中的很多不同的信息来源，包括他们自己的知识。但从现有的研究中可以看出，孩子们有一堆可以使用的技巧。”

例如，如果你给孩子看一个他们已经知道的物体（比如杯子），以及一个他们从未见过的物体，孩子通常会认为他们以前从未听过的词属于新物体。原因是什么呢？孩子们会利用他们现有的词汇知识形式的信息，来推断没有名字的物体与没有物体的名字进行匹配，例如喝水用的东西叫 "杯子"。其他信息则来自社会环境，儿童会记住过去与说话者的互动，来找出他们接下来可能会谈论的内容。

“但在现实世界中，孩子们在复杂的社会环境中学习单词，其中有不止一种类型的信息可用。他们必须在与说话者进行互动时使用他们的词汇知识。词汇学习总是需要整合多种不同的信息源”，Bohn 继续说道。一个悬而未决的问题是儿童如何结合不同的、有时甚至是相互冲突的信息来源。

研究结果表明，幼儿即使是在相对较早的发育阶段，也可以在语言学习过程中整合多种信息源。为了研究这个问题，研究人员首先进行了一系列实验来衡量儿童对不同信息来源的敏感性，然后提出了一个计算认知模型，详细说明了这些信息的整合方式。

计算机程序的预测

语言学习的一个核心问题是参照物识别：为了获得一个词和一个物体之间的常规符号关系，儿童必须确定这个词的预期参照物。然而，没有一个独特的线索可以在所有情况下使用。相反，参照物者只能通过推理说话者的意图来确定。也就是说，儿童必须根据一句话所处社会环境的信息来源来推断说话者在交流什么。

儿童学习语言的环境是复杂的，孩子们必须整合不同的信息源，包括与当下的期望有关的信息、与正在展开的互动动态有关的信息、以及一些与他们先前获得的知识有关的信息。

该研究基于语言学习的社会实用主义理论，在实验之初提出这样一种假设，即信息源具有不同的功能作用，但作为综合社会推理过程的一部分被结合起来。儿童使用所有可用信息来推断说话者一句话背后的意图，然后引导他们正确识别世界上的所指对象，并学习传统的词对象映射。

图：实验任务和模型

Manuel Bohn 等人将单词学习视为社会推理过程的结果，而不仅仅是一个跨情景或基于原则的学习过程。在该研究中，理性整合模型通过贝叶斯推理对信息源进行仲裁，以每个参照物的先验概率 ρ 作为上下文，听者对说话者话语的所指进行推理。

该研究假设儿童对不同的信息源越来越敏感，但这些信息源的整合方式保持不变。研究人员重点关注了三个信息源，即对说话者以合作性和信息性的方式交流的期望、关于对话中谈论的内容的共同点、关于先前学习的词-物映射的语义知识。这三个信息源在不同的时间尺度上运作，说话者信息量是对特定话语的瞬时期望，共同点在对话过程中增长，语义知识是在整个开发过程中学习的。

“你可以把这个模型看作是一个小小的计算机程序。我们输入儿童对不同信息的敏感度，在单独的实验中对这些信息进行测量，然后程序模拟如果这些信息源以合理的方式结合起来会发生什么。” 研究的主要作者之一 Michael Henry Tessler 解释说：“该模型可以预测在假设的新情况下应该发生什么，这些信息源都是可用的。”

该模型提出了一个明确和实质性的发展理论，它假设，虽然儿童对个人信息源的敏感性随着年龄的增长而增加，但整合进行的方式保持不变。在模型中，是通过创建年龄相关参数来实现的，这些参数会捕捉对说话者信息量、共同点和对象特定语义知识的敏感性的发展变化。

在最后一步，研究人员将这些假设情况转化为实际实验。他们收集了 2 到 5 岁儿童的数据，以测试模型的预测与现实世界数据的吻合程度。实验结论表明，儿童会考虑所有可用的信息来源来推断新词的含义。

图：预测信息整合 Bohn 总结了这些结果：“信息整合的理性模型在这些新情况下预测儿童的实际行为的能力非常出色。它告诉我们，我们在从数学角度理解儿童如何学习语言方面走在正确的轨道上。”

语言学习作为一个社会推理问题

模型是如何工作的？处理不同信息源并将它们整合在一起的算法受到哲学、发展心理学和语言学数十年研究的启发。从本质上讲，该模型将语言学习视为一个社会推理问题，其中孩子试图找出说话者的意思 —— 他们的意图是什么。不同的信息源都与这个潜在的意图系统地相关，这提供了一种整合它们的自然方式。

该理性整合模型假设所有信息源都进入一个联合推理过程，但替代整合过程是可以想象的，并且可能与数据一致，还指定了随着孩子年龄的增长会发生哪些变化。随着发展，儿童对个体信息源变得更加敏感，但整合信息源的社会推理过程保持不变。

图：解释信息的整合

“计算建模的优点在于你可以阐明一系列替代假设 —— 替代模型 —— 具有不同的内部联系，以测试其他理论是否会做出同样好的或更好的预测。” Tessler 解释说。

研究人员在论文中还指出，实验仍存在一定的局限性，例如实验应该在来自不同文化背景、学习不同语言的儿童身上进行。而且该模型没有区分共同基础信息和其他可能使对象在上下文中更加突出的原因。

尽管如此，这项研究仍提供了几个令人兴奋和发人深省的结果，为我们了解儿童如何学习语言提供了参考，更加增进了科学家们对儿童如何驾驭复杂学习环境的理解。除此之外，它还开辟了一种新的、跨学科的研究方式。

Manuel Bohn 说：“我们的目标是将正式模型与实验数据进行直接对话。这两种方法在儿童发展研究中基本上是分开的。” 该研究计划的下一步将是测试这个理论模型的稳健性。为了做到这一点，该团队目前正在进行涉及一组新的信息来源的实验，以进行整合。

参考资料：

https://www.nature.com/articles/s41562-021-01145-1https://www.eurekalert.org/pub_releases/2021-07/mpif-hci062821.php

编辑：于腾凯

校对：林亦霖