找回密码
 立即注册
搜索
查看: 78|回复: 0

复杂科学:探索各学科领域的奥秘,四位研究者的深入访谈

[复制链接]

2万

主题

0

回帖

7万

积分

管理员

积分
70012
发表于 2024-11-22 05:35:08 | 显示全部楼层 |阅读模式
四位研究员(从左至右):卢林园、刘宇、胡吉良、卢超超

四位复杂系统研究人员访谈:跨学科研究中的复杂性科学

霍金在新千年来临之际直言:21世纪是一个复杂的世纪。但我们很少听到学者自称是“复杂性科学家”,因为对复杂性的探索深入到各个学科。

本期采访的四位受访者所处的学科领域都与复杂科学有着千丝万缕的联系:网络方法作为抽象建模的手段,在过去20年里被广泛应用于社会、经济、人工智能等领域。它已成为复杂科学最引人注目的领域;生命起源问题直接指向复杂系统的创造和演化,甚至可以让我们超越地球。生命的视角,追问宇宙尺度上的生命是什么;生态系统研究不仅是复杂科学的主要来源之一,而且借助复杂系统方法不断取得突破,帮助人类认识到自己只是系统的一部分;机器学习领域的因果革命和向新一代人工智能的迈进有望解开复杂系统中出现的谜团。

1/复杂系统的骨架:网络

卢林园独家专访

受访者_卢林园(电子科技大学基础与前沿研究院)

采访者_刘培源

请介绍一下您的研究方向。

卢林园:我主要从事统计物理与信息科学交叉领域的前沿研究,重点研究网络信息挖掘的基础理论和关键方法。网络信息挖掘是复杂系统研究的一个重要方向。其核心是研究如何快速、高效地从大规模网络中挖掘有价值的信息。该领域的研究不仅为理解大脑、信息、城市等各种复杂系统的结构、功能和演化机制提供理论框架和方法论支撑,而且具有重要的应用价值。近年来,我们重点关注高阶网络分析(即从新的高阶视角研究网络)的理论和应用研究。

为什么复杂系统研究需要复杂网络?

卢林园:复杂网络是描述复杂系统的抽象模型。其中,节点代表复杂系统的组成部分,节点之间的边代表元素之间的相互作用。现实世界中的许多复杂系统都可以用复杂网络的形式来描述,不同系统的共性都包含在其相应的网络结构中。复杂网络也为不同学科的复杂系统研究提供了重要的理论和方法论支持。它是21世纪随着互联网、大数据、人工智能的发展而出现的一个新兴前沿方向。

请谈谈您在链接预测和节点排序方面的主要研究成果。

卢林园:我们知道网络包含两个基本元素,即边(或链接)和节点。在网络框架内,网络信息挖掘可以从边和节点的理解开始,分别对应重要链路挖掘和重要节点挖掘问题。其中,前者可以细分为丢失链接的预测(即链接预测问题)和错误链接的识别,而后者本质上是对节点的重要性进行排序。

链路预测是根据观察到的网络结构来预测网络中两个不相连的节点之间形成链路的可能性。预测对象既包括观测中可能忽略的链接,也包括将来可能出现的链接。关联。链路预测本质上从网络链路的微观层面解释了网络结构生成的原因,具有广泛的应用场景。例如,它可以用于在线社交网络中推荐朋友,指导生物网络中的结构验证实验,以及预测疾病与致病基因之间的关系。

链接预测

卢林园周涛

高等教育出版社,2013

在网络中,重要节点是指比其他节点对网络的结构和功能产生更大影响的一些特殊节点。节点排序(或节点重要性排序、重要节点挖掘)旨在识别此类特殊节点。重要节点挖掘研究不仅具有理论意义,而且可以解决与社会经济相关的实际问题,例如遏制传染病传播、控制社交媒体舆论等。

近年来,我们利用统计物理的理论和方法解决了信息领域的几个重要问题。我们独创性地提出了基于集成理论和似然分析的网络信息挖掘基本理论体系,以及基于扩散动力学的基本理论体系。一系列网络信息挖掘方法、相关研究推动了物理与信息学新的交叉学科研究方向的形成,成果也得到了广泛应用。

更具代表性的是,在链路预测方面,我们首次提出了网络链路可预测性的概念,并给出了量化的表征指标,被国际同行称为链路预测领域的里程碑;在重要节点挖掘方面,我们首次揭示了过去30年被认为无关紧要的三个重要指标——度中心性、H指数和核心数的内在关系(即网络的DHC定理) ——并提出了一系列有效挖掘网络中重要节点的方法。解决大规模演化网络中重要节点识别问题的算法。目前,部分研究成果已应用于网络舆情监测、致病基因预测、医保欺诈识别、电子商务服务等实际系统中。

一位复杂系统研究人员荣获 2021 年诺贝尔物理学奖。这对复杂科学意味着什么?

卢林园:这是诺贝尔物理学奖首次授予与复杂系统相关的研究人员。它是复杂系统研究的一个里程碑,对从事相关研究的学者来说也是一个巨大的鼓励。这不仅表明复杂系统领域的研究和重要成果得到了科学界的认可,也表明通过具体的系统研究发展复杂系统的基础理论还有很长的路要走。我相信这一事件将推动复杂系统研究的进一步发展,特别是在当今的数字时代,复杂系统、复杂网络的理论和方法有着更广泛的应用范围,与人工智能、生物学、社会、在经济学与其他学科交叉融合的过程中,不断出现新的、更具挑战性的问题,需要进一步探讨。

祝贺荣获国际网络科学学会 2022 年 Erdős-Rényi 奖。您如何评价中国学者在复杂科学领域的贡献?

卢林园荣获2022年Erdős-Rényi奖

来源:集智俱乐部

吕林园:在我国,钱学森先生和一批科研人员率先积极探索复杂系统。著名系统科学专家方福康先生就是其中之一。他也是我的母校北京师范大学管理学院(现系统科学学院)的。 )创始人。钱老等前辈早在20世纪70年代就进行了复杂性科学的研究,创造性地建立了系统科学和系统理论。 21世纪前夕,小世界网络、无标度网络等的引入使许多物理学家(尤其是统计物理学家)认识到利用复杂网络作为复杂系统研究工具的重要作用。我国学者对复杂系统和复杂网络的研究主要分为三个路径:一是以理论物理学家和统计物理学家为代表,强调复杂系统基础理论的研究;二是以理论物理学家和统计物理学家为代表,强调复杂系统基础理论的研究;另一类以计算机和控制领域的学者为代表,重点研究系统管理、控制及其在工程中的应用;还有一个轨道侧重于复杂系统方法在社会经济领域的应用。在复杂系统研究的各个方向上,中国学者的研究贡献越来越突出。

我国复杂系统研究的发展情况可以从相关会议的举办情况看出:中国网络科学论坛自2004年以来已举办了18届,全国复杂网络学术会议自2005年以来已举办了17届,中国网络科学论坛自2005年以来已举办了17届。系统科学大会、全国统计物理与复杂系统学术会议等众多相关会议的持续召开,表明复杂系统研究在我国日益受到重视。此外,2018年国际网络科学冬季大会(-X)首次在中国杭州举办,2022年7月国际网络科学大会(-X)在上海成功举办,标志着国内网络科学科学研究得到国际同行的认可。在一些领域,我们已经与国际同行处于同一水平,甚至形成了自己的特色。当然,距离全面引领发展还有很长的路要走。基于中国人民固有的系统整体思维、互联网在中国的广泛应用以及国家对技术创新的高度重视,我们坚信中国将有机会成为全球复杂系统研究的高地。未来。

当前流行的跨学科研究对复杂性科学有何影响?

卢林园:这是一件好事。传统的科研模式已经不能满足快速发展的社会的需求。网络时代,无论是科研活动内部,还是科研与经济活动之间,除了分工,还需要合作。这里所说的合作并不是零件组装那么简单,而是有机的整合。应该说,在当今万物互联的时代,分工是为了更好的合作。对于科学研究活动(尤其是跨学科研究),我们不仅需要在各自的学科领域进行深入、持续的研究,而且要看到其他学科的前沿发展及其与自己研究的关系,这样才有可能取得更有影响力的研究成果。此外,当今人类面临的问题越来越复杂,很难从单一学科来解决。这也为复杂科学等跨学科研究提供了大展拳脚的机会。当然,这种交叉必须围绕关键的科学问题,而不是简单地为了交叉而交叉。



您如何看待复杂性科学与人工智能的融合?

陆林园:人工智能技术为复杂系统研究提供了前沿方法,在提高解决相关问题的精度和计算效率方面具有显着优势。尤其是在当前海量数据的背景下,考虑到数据的高维、强噪声、稀疏性、异构性等属性,人工智能技术可以有效赋能数据采集、处理以及复杂系统特征和要素的提取。重要的环节。复杂系统研究与人工智能技术的结合是未来一个有前景的方向。

复杂性科学的未来是什么?

卢林园:我认为未来几年,复杂系统的研究将会在脑科学、数字治理、军事科学等多个领域取得成果。随着理论和研究方法的深入发展,复杂系统研究将为这些领域带来新的研究视角和方法。以复杂网络为例,我们最近关注的高阶网络分析在脑网络等研究领域取得了初步成果。这些结果为我们提供了对人脑的新认识,为临床应用和类脑计算框架的开发开辟了新途径。新方法。我们相信,将复杂系统理论和方法与具体的研究背景和研究问题相结合,具有解决现有难题的巨大潜力。我们也清醒地认识到,现实世界中的真实系统具有特征多变、动态演化、不可预测等特点,对效率、准确性和成本有更高的要求。在这种情况下,如何发展更加现实的复杂性科学理论和方法,并有效地将其应用到实际系统中,需要进一步的研究和实践,以及不同领域学者的参与和合作。

2/生命的起源和复杂性

刘宇独家专访

受访者_刘宇(北京师范大学珠海校区国际复杂系统科学中心)

采访者_梁进

请谈谈您的研究方向。

刘宇:我是物理学出身,博士。属于应用数学。我目前的研究方向是生命起源建模,涉及生命起源理论、自我复制、信息进化、生物信息学、神经网络模块等。目前我的主要研究课题包括:信息是如何产生和积累的,信息是如何产生和积累的这个过程塑造了进化,以及我们如何在真实的蛋白质和基因序列中发现这个过程的痕迹(即重复和层次结构)。嵌套结构)应用于解决实际问题。

关于生命起源的基本问题是什么?

刘宇:生命起源的基本问题是“自我复制”(或自我复制)是如何发生的。由于自我复制被公认为生命的主要特征之一,包括我自己在内的一些学者甚至认为自我复制是生命最重要的特征。生命,包括组成生命的细胞,可以自我复制:一变成二,二变成四。但无生命的物质——大如岩石或小如分子——无法自我复制。为什么一群不能自我复制的分子聚集在一起形成一个系统,但这个系统却可以自我复制?这是一种新兴现象,也是生命起源的关键。

我们可以从不同角度来研究自我复制问题。我主要研究自我复制机制以及能力如何从复杂的科学中产生,即更多的理论视角。但也有很多其他的研究角度,比如合成生物学的角度,研究如何从蛋白质或核糖核酸(RNA)的合成开始逐步制造人造细胞;而从化学的角度来看,我们可以构建一些真实的化学反应系统,并对其进行调整和优化,看看它是否能够具有自我复制的特性。

如何理解自我复制的过程?

刘宇:关于自我复制,目前已经有比较成熟的理论解释,特别是在微观层面。比较经典的是“自催化集”理论。虽然没有任何基本的化学反应能够实现物质的自我复制,但是许多化学反应可以通过一定的方法耦合在一起成为一个系统,这个系统就可能实现自我复制。化学反应系统要实现自我复制,需要两个条件:第一个条件是系统中每个方程的反应物都来自于系统中其他方程的产物,相当于一个头对尾的反应。咬合过程;第二个条件是,第一个条件是化学反应的产出比,要求方程中某种物质的产出量大于消耗量。只要化学反应网络满足这两个条件,就会发生“自催化”,即可以实现自我复制。如果输出量不大于消耗量,则只是简单的催化反应。这里所谓的自我复制,是指作为一个系统、作为一个整体的复制。如果输入足够多的反应物,系统中事物的数量就会呈指数级增长。从更高的层面来看,系统会自我复制。

在家中

出版社,1995

在生命起源的过程中,蛋白质和脱氧核糖核酸(DNA)哪个先出现?

刘宇:这个问题看起来像是一个“先有鸡还是先有蛋”的问题。生命或者构成生命的细胞要实现任何功能,都需要蛋白质的参与,甚至需要DNA的复制。蛋白质参与实现细胞功能的过程,统称为新陈代谢。 DNA是一种储存信息的物质。蛋白质的信息编码在DNA中,因此蛋白质的形成离不开DNA。此前,有两个主要的思想流派,它们也代表了两种研究路径:“信息至上”学派认为,储存信息的遗传物质,如DNA或RNA,首先出现,“代谢至上”学派认为,首先出现的是蛋白质等功能分子。我们认为这两种研究路径最终会走到一起,而我们最近的工作似乎为此提供了一个理论视角。这个看似矛盾的问题,实际上只是同一个体系在不同层次上的特点。在低规模下,它是一个自催化过程,在高规模下,它是自我复制。

能够演化复杂性的系统有哪些特征?

刘宇:如果一个系统具备两个特性——“成核”能力和“复制”能力,那么这个系统一定能够从简单进化到复杂。我们称之为阶梯路径系统,这是我们最近一直在研究的。所谓成核,是指系统产生新的成分,比如旧技术转化为新技术,或者现有蛋白质转化为新蛋白质。转变的过程就是形成新成分的过程。生命显然具有这种特征。另外,只要系统中的某些组件是可以复制的,那么该系统就具有可复制的特性。生活显然也有这个特点。事实上,语言也具有生活化的特点。发明新词是成核,别人使用你发明的新词是抄袭。

生命进化的过程是一个修修补补的过程,伴随着适应和优化,可能不是从简单到复杂的单向进化。虽然人类是由单细胞生物进化而来,并且比单细胞生物更加复杂,但这并不意味着单细胞生物已经消失。甚至“人类比细菌复杂多少”的问题也需要深入研究。两者的差距或许并没有想象中的那么大。因此,如何找到合适的工具来衡量复杂性也是关键问题之一。这是后续生命起源理论研究的一个重要问题,也是我们的研究方向之一。

生命起源研究和复杂性科学之间有什么关系?

刘宇:生命起源是复杂科学中非常重要的问题。事实上,生命的起源及其背后的信息演化,以及自我复制的问题,甚至是科学的终极问题之一。当然,生命起源问题不仅可以用复杂系统论来解释,还可以从化学、物理学、合成生物学、人工智能等角度来解释。

在复杂性科学领域,我们主要用抽象的理论而不是实验来研究生命的起源。这就是复杂性科学的优势。复杂性科学更关心框架,框架中要填充的实体是可变的。当我们建立关于自我复制和生命起源的模型时,我们可以忽略具体的附着物质、化学约束或物理约束,而简单地将它们抽象成数学对象。如果我们能够从理论上解释生命是如何起源的,我们也可以将其应用到其他天体上,看看它们上面是否存在符合生命特征的东西,而不必考虑它们是否与地球生命同源或相似。

3/生态系统复杂性

胡继良独家专访

受访者_胡吉良(麻省理工学院生命系统物理中心博士生)

采访者_刘培源

请介绍一下您的主要研究方向。



胡吉良:我们团队主要结合实验和理论来研究复杂生态群落和复杂生态网络背后的动态性、稳定性、生物多样性及其随时间演化的特征;主要以微生物群落为模型,在大范围参数下观察大范围内生态系统的结构和动态,特别关注两个或多个物种相互作用时系统分岔的临界点和网络群落结构的组装规则。

在此基础上,我个人的研究更侧重于由数百种细菌组成的复杂生态系统。我基于统计物理学和平均场理论等方法构建模型,以找到复杂生态系统中出现的控制参数,并使用少量可测量的群落特征。预测其动态演化和生物多样性。

如何理解生态系统与一般复杂系统的异同?

胡继良:生态系统与一般复杂系统的相似之处在于它们具有大量的变量和单体。不同物种不仅与其他物种相互作用,而且与环境也有很强的相互作用,从而形成物种与物种、物种与环境之间相互作用的复杂网络。

生态系统的独特性在于它是一个由不同物种及其环境(即生物和非生物部分)组成的开放系统。它必须与外界交换能量或物质。此外,生态网络中不同物种的相互作用机制和强度差异很大,因此形成的复杂网络异质性很高。生态系统的另一个特点是环境起着极其重要的作用。例如,对于同一类细菌,它们在不同的营养物质和温度等环境条件下可能会达到完全不同的系统稳态。

生物多样性的起源是什么以及它是如何被破坏的?

胡继良:首先,生物多样性产生的原因并不难理解。一个群落在进化过程中会不断发生突变,经过足够长的时间,就会形成新的物种。多样性的不断创造是进化的自然过程。当一个新物种从一个生态系统中出现或者从外部侵入一个新的生态系统时,它可能面临三种命运:适应性差、衰落;适应性强,可融入系统;或者非常强大但会破坏系统。统计数据显示,特定环境中的生物多样性在某些稳定状态附近振荡。

从动态系统的角度来看,生物多样性主要取决于其所处的环境,特别是一定环境下生态系统相互作用的强度、丰富程度和恢复力。在竞争较少的环境中,生物多样性可能较高,而在竞争较强的环境中,生物多样性相对较低。这就是为什么一些入侵物种非常有害,因为它们与本地物种有很强的相互作用,例如激烈的捕食或竞争,这可能会导致当地物种的灭绝。在真正的大规模生态系统中,通常需要在多样性和复杂性之间进行权衡。换句话说,高度多样化的生态系统必须降低复杂性并削弱物种之间的相互作用。

多样性-复杂性散点图:系统越多样化,复杂性越低

来源:集智俱乐部

复杂性科学的哪些前沿方法已应用于生态系统研究?

胡吉良:复杂系统和复杂网络的粗粒度方法是我们目前关注并尝试应用于生态系统研究的前沿方法:我们不需要用生物群落包含的所有种群来描述社区,而是找到少量的控制变量,用少量的参数来描述一个生态系统,就像用温度和压力来描述大量气体分子的行为一样。

4/从因果到出现:迈向新一代人工智能

卢超超独家专访

受访者_陆超超(剑桥大学机器学习组博士生)

采访者_梁进

请谈谈您的研究方向。

陆超超:我的主要研究兴趣是因果机器学习。通常所说的机器学习的目的是发现数据中的模式,然后根据这些模式进行预测。预测很困难,因为我们生活在一个复杂的世界中。一个极端的例子是混沌现象:即使所有函数都是确定性的,仍然会出现蝴蝶效应,初始的微小变化会导致完全不同的结果。

我们的工作是引入基于传统机器学习的因果机制,并使用结构因果模型对数据生成过程进行建模。这可以提供一个非常通用的框架来描述数据分布如何变化,从而更好地预测和响应外部变化。因果机器学习是处理数据变化的理想框架之一,正在成为新一代人工智能的重要基础。

请详细告诉我们更多关于因果机器学习的信息。

陆超超:因果机器学习是一类利用因果模型对数据生成过程进行建模的机器学习方法的总称。其目的是为了更好地处理现实生活中数据分布发生变化的大量场景。它的两个重要的子方向是因果表示学习和因果强化学习。

为什么

朱迪·佩达纳·麦肯齐

中信出版集团,2019

因果表示学习的目标是从低级、高维数据中学习高级、低维因果表示。良好的因果表示不仅可以大大简化机器学习分类器或预测器的设计和学习,而且可以有效应对新场景中数据分布的变化。对于分类任务,比如判断一张图片是否是猫,人们会根据形状是否像猫来做出判断。因此,在这个任务中,形状是一种因果表示。人们不会根据背景、颜色、姿势等来判断图片是否是猫,因此这些特征不是因果表示。对于预测任务,场景中猫的背景等变化不会影响分类器的性能,因为背景信息不是猫的因果表示,并且不会被分类器利用。

我们知道强化学习是一种允许智能体在与环境交互的同时学习策略的策略。它因其在击败顶级人类玩家的游戏中的使用而闻名。然而,传统的强化学习无法应对环境的变化,即在一种环境中学到的策略很难迁移到另一种环境中。因果强化学习允许代理在与环境交互过程中学习和发现其因果模型。因为因果模型是描述环境变化的理想工具之一,基于因果模型优化自己的策略可以更好地应对环境变化,进而指导和优化下一步的交互——这就是对人类行为的模仿。因此,因果强化学习本质上是一种具有广泛应用潜力的通用学习算法,正在向计算机视觉、医学健康、推荐系统、自动驾驶等领域渗透。

因果科学的方法如何应用于复杂系统的研究?

陆超超:因果表示学习作为因果科学的前沿方法,可以用来研究复杂系统中的突现现象。涌现是一个从微观到宏观的过程,与因果表征学习正好对应。由于表示学习也是从微观到宏观的学习过程,因此它可以从一些微观信息(例如图像或音频)中学习宏和可解释的因果变量。

例如,关于文本,文章中的单词之间的关系非常复杂。但是,如果您对文章进行抽象摘要,则每个段落具有核心含义。您只能查看每个段落的核心含义,以便整篇文章的逻辑结构变得清晰。另一个示例是图像。图像中低级和高维像素之间的关系非常复杂。但是,如果我们可以从图像中学习高水平的低维宏变量,例如透视,颜色和形状,我们可以做得更好。了解图像。因果表示学习是从这些低级,高维数据中学习高级,低维变量。这些变量是更多的宏观概念,它有助于人类理解并发现复杂数据中的更多基本模式。

(最初发表在《新人周刊》第83期中)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|【远见汇智】 ( 京ICP备20013102号-17 )

GMT+8, 2025-5-15 00:00 , Processed in 0.067700 second(s), 20 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表