中国科学院院士梅宏:如何构造人工群体智能

大数据科学

共 4405字,需浏览 9分钟

 ·

2022-04-29 15:08

本文内容由数据派THU 整理自梅宏士在清华软件论坛上所做的专题报告

一、群体智能研究现状

群体智能是科学家长期关注和研究的一种自然现象。在很多低等社会性生物群体中可以观察到,群体中的单一个体不具有智能,或仅有非常有限的智能,由这些个体构成的群体却展现出远超个体能力的智能行为。这种在低等社会性生物群体层面上展现出的智能,通常被称为群体智能(Swarm Intelligence)
 


1.1 人类社会中的群体智能现象

  • 草地上的小路:即使没有人进行全局的规划或指挥,草坪上也会自发地涌现一条或几条条弯弯曲曲的小路。

  • 《乌合之众》(古斯塔夫·勒庞):这本书也是一种群体现象,如果受到有效的激励和鼓动,群体会展现出惊人的破坏力,因为这种激发,个体在里面失去了很多东西。

  • 三个臭皮匠顶个诸葛亮:几个智力平平的人团结在一起也有可能做出很高质量的决策。

  • 市场经济:好像存在一只“看不见的手”,对大规模市场资源进行有效配置。


人类社会的不断发展和演化也可以被认为是一种群体智能现象,绝大多数文明成果都是人类个体在长期群体化、社会化的生产和生活中逐渐演化形成的产物。


1.2 人类群体智能受到越来越多的关注

Science 2010年的一篇学术论文用定量的方式观察到物理空间中2~4人小群体在协同求解问题时群体智能现象的存在,题目中的“Collective Intelligence”指的就是高等生物。
 


对个体智能的定义和系统性度量问题,心理学家已经给出了有效的统计方法。论文将个体智能的统计度量方法应用于群体智能的度量,得到了类似于个体智能的一种度量指标“c factor”。在物理空间2~4人的群体任务求解中,观察到如下现象:群体智能弱相关于个体平均/最高智能,但强相关于个体平均社会。

敏感度、个体对话平等度、以及群体中女性比例等三个因素。在一定程度上印证了“三个臭皮匠,顶过一个诸葛亮”。
 


Science在2005年发布了125个科学开放问题,其中第16题是关于人类合作行为如何发展演化。

在2021年,Science和上海交通大学合作,再次提出125个问题,其中明确提出了群体智能如何涌现形成?

1.3 群体智能研究现状小结
 


为什么利用现象规律构造人类群体智能系统的实践很少?

  • 原因一:对群体智能的形成机理缺乏充分理解。对群体智能的理解和应用仍然处于必然王国的阶段;无法确保求解特定问题时群体智能的可控重复发生。

  • 原因二:物理空间阻碍了人类群体智能的形成。在物理空间中聚集一个大规模的人类群体成本太高;人类群体无法在局部物理空间长时间同步高效工作。


二、网络空间人类群体智能

2.1 互联网带来了新的可能性

互联网的出现为人类群体的跨时空大规模协同提供了可能,网络空间中的人群不再受到地域和时间的限制,更大规模的人类群体可以在网络空间中进行更加方便灵活的显式或隐式交互。互联网技术的不断发展,促进了网络空间人类群体智能系统的探索和成功实践。

2.2 网络空间人类群体智能 典型案例
 

 
2.3 网络空间人类群体智能 现状小结

  • 现有实践本质上是对互联网跨时空汇聚能力的利用:针对特定问题精心设计的群体力量利用方案;对于群智规律和机理的认识与探讨较为缺乏。

  • 形成的网络空间群智现象仍然处于相对初级的阶段:距离理想形态的群智现象差距较大;无法确保群智现象的可控重复发生。

  • 与物理空间群智机理探索的研究工作缺少结合:网络空间关注利用“群智”“群力”的实践;物理空间关注低等生物群智现象的观察解释;鲜有结合二者的努力。


三、北京大学团队的研究与实践进展

3.1 研究问题

  • 群体智能的形成机理是什么?

  • 群体智能能否成为求解问题的基本方法之一?

  • 如何构造求解特定问题的人类群体智能系统?

  • 群体智能的能力边界在哪里?


3.2 对群体智能的定位与理解

3.2.1 基本认识


理想形态的群体智能展现出两种基本性质:

    • 智能放大效应:对个体智能进行有效放大;

    • 规模可扩展性:数量庞大的个体参与其中;


在本质上,群体智能来源于自主个体之间的大规模有效协同:


    • 学视角:量变产生质变;

    • 复杂系统视角:涌现、自组织。


3.2.2 如何定位和理解群体智能?


群体智能是什么?我们的理解是利用群体的力量来求解复杂问题的方式,而这个复杂问题仅依靠单一个体无法求解。

群体智能两个特征:1+1>2;群体协同规模的可扩展性。

3.2.3 微观群体智能两种基本原理

 


微观群体智能两种基本原理:

情况在问题可分解的情况下,不同个体之间进行分工合作。把一个问题分成P1、P2,张三李四求解能力不同,解决P1、P2的时间不同,如果张三求解P1表示擅长,1t时间完成,求解P2表示不擅长,10t时间完成,总共加起来11t。同理李四,如果分工合作,总耗时仅为2t ,这就是一种可分解的局面。

情况二具有关联性的不同信息片段融合后自然形成的信息增加。以拼图为例,张三李四的片段合起来形成一个更大的片段,它带来的含量信息含量是1+1>2的结果。

3.2.4 宏观群体智能

从宏观层面来看,群体智能是由大量持续出现的微观层次的群体智能现象复合形成的现象。如凯文·凯利在《失控:全人类的最终命运和结局》中提到:“一种由无数默默无闻的零件,通过永不停歇的工作,而形成的缓慢而宽广的创造力”,这是群体智能涌现的过程。

3.2.5 宏观群体智能基本原理

把群体智能进行分解,实际上包含三件事情:

    • 第一是探索,群体中的每一个体自主地对当前问题进行探索得到该问题的信息。

    • 第二是融合,所有个体探索到的信息通过某种方式被融合。

    • 第三是反馈,融合活动产生的群体信息通过某种方式反馈给个体刺激个体进行持续地探索。


3.2.6 物理空间利用群体智能的可行性?

目前,利用群智机理让人类群体在物理空间中求解工程问题还不具有一般意义上的可行性。

表面原因:

    • 第一,过程和结果不可控;

    • 第二,时间跨度大。


深层原因:

    • 第一,找不到足够多的参与者:在物理空间中召集一个群体的成本太高;长时间将一群人限定在一个物理空间中,工作效率会越来越低。

    • 第二,信息传播的速度太慢:物理空间中的信息传播存在限制。

    • 第三,信息融合依赖于重要人物:这样的重要人物很少。

    • 第四,被动式的信息反馈:信息不会主动反馈回来;需要主动去获取信息。


当网络空间出现之前,除人类文明这种宏观层次的人类群体智能现象,很难观察到其他宏观层次的人类群体智能现象。

3.2.7 互联网带来的可行性

互联网直接消除了四条深层原因中的前两条,足够多的参与者没有时空的约束,传播速度极快,在网络空间,各种人类群体智能现象持续涌现。

3.2.8 进一步还能做什么?

自发涌现的网络空间群体智能现象大多仅消除了深层原因1和2,基本没有触及深层原因3和4。以消除深层原因3和4为目标可以设想出一种理想形态的群体智能。
 


当前形态是什么呢?探索在某种意义上有些功利性,融合是手工,反馈是被动的。如果我们自由探索,把融合变成自动的,然后根据个体能力和特性,进行有针对性的反馈,这样一来效率就更高。

3.3 群体智能的构造性模型

环境激发效应对群体智能现象的形成提供了一种事后解释性模型,在这一概念的基础上,我们主要关注如何构造求解特定问题群体智能系统。


群体智能的构造性模型EIFL,由三个环进行信息激发、融合和反馈。个体探索之后形成片段,融合之后反馈回来,通过多轮迭代形成一个解决方案。

3.3.1 群体智能系统的分类维度
 
由分类框架得到群体构成的三种分类维度:


  • 第一个分类维度:由自然生命体构成的群体(蚁群、人群);

  • 第二个分类维度:由人造智能体构成的群体(机器人群体);

  • 第三个分类维度:混合群体(人-机混合、低等生物-机混合)。


实践一:利用EIFL模型观察已经存在的群体智能系统



关于群体智能的构造模型,我们在国家科学评论,发表了相关观点性的文章。构造模型的核心,就是我们要加快融合法和提高反馈法。

实践二:基于群体智能的自组装(self-assembly)

群体自组装问题

动漫电影《超能陆战队》中设想有一种磁力机器人能够大规模地聚集在一起,组成各种形状。而我们的研究目标是:能否采用“探索-融合-反馈”基本原理实现大规模群体在非中心控制情况下的自我成型。
 


  • 融合:形成红光场;根据所有未被占据目标网络的位置,融合形成蓝光光场。

  • 反馈:每一个体获得其周围的局部光场信息。

  • 探索:每一个体根据其周围的局部光场信息确定其下一步的行动决策。



实践三:基于群体智能的拼图
 


拼图问题是一类复杂问题的典型代表:无法通过自上而下、集中控制方式进行有效求解。
 


  • 探索:单一个体自主进行拼图,拼图结果被表示为由图块以及图块之间的邻接关系形成的图。

  • 融合:所有个体当前时刻的拼图结果被融合在一起,形成当前时刻的群体观点图。

  • 反馈:根据个体当前时刻的拼图动作,将当前时刻群体观点图中相关的具有较高可信度的邻接关系反馈给当前个体。



实践四:基于群体智能的知识图谱构建

在目前阶段,专业领域的知识图谱不可能完全通过自动化算法进行构建;人类参与必不可少。对于一个大规模的专业知识图谱,仅依靠少量专家进行构建,也不具有现实的可行性。
 


  • 探索:每个参与者在探索活动中持续构建各自的个体知识图谱;个体知识图谱被表示为一种节点和边带标签的有向图。

  • 融合:所有参与者构建的个体知识图谱,通过熵最小化原则进行对齐,进而融合形成群体知识图谱。

  • 反馈:根据参与者的知识图谱构建行为,将群体知识图谱中相关且具有较高可信度的知识图谱片段反馈给参与者。



实践五:基于群体智能的软件开发

软件是一种具有复杂逻辑结构的人造知识制品,规模和复杂性持续增长,开发困难性不断增加能否将群体智能用于软件的生产与持续演化?



新一代人工智能把群体智能当成人工智能,而我们需要提出新的认识,群体智能本身是自然智能。科学家认识群体智能机理,我们还希望能够把这种规律或者机理利用起来。

通过群体智能构造性模型,在求解特定问题的时,个体探索之后,用机器汇聚效率高,还需要确保正确性。目前,我们在软件工程领域开展了初步的探索,取得了一定效果。希望未来,对开源社区的平台机制提供一些帮助,实现自动汇聚。以百科平台为例,是由人来管理,我们有没有更好的办法合作?类似这样的系统有没有更好的办法引入机器的能力?现在,实际上是想把AI用到群体智能系统的构建,用AI去加强融合和反馈,替代人的工作。我们最关心的是在软件开发中,能不能更多的人去参与,AI在软件开发中的应用,以及AI在群体化软件开发中应用。谢谢大家。


审核:刘璘
校对:林亦霖
编辑:黄继彦


>>更多阅读


数据分析案例:浅谈网易严选用户行为分析


↓↓点击 阅读原文,访问数据分析网

浏览 55
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报
评论
图片
表情
推荐
点赞
评论
收藏
分享

手机扫一扫分享

分享
举报