#前言
2023年9月,历时十年的欧洲人脑计划(Human Brain Project,HBP)正式画上句号。这项计划试图众筹多学科力量,来解析和模拟人类大脑的复杂结构与功能。然而,自孕育之初,就一直引起争议。“我们不应该做出那样不切实际的承诺。”
说话人大脑计划时,马克斯·普朗克大脑科学研究所主任 Moritz Helmstaedter 教授的表情突然严肃起来。他直接截住了当地的说法:“这种”把我们知道的东西凑在一起,模拟它,然后来解决大脑疾病的观点,我认为是错误的。”
因此,他也流着目光注意到:“我有时很羡慕物理学界能够研发出成功的大型加速器,这是大型科学的理想模式。但在神经科学领域,我们在方法论上缺乏征询,不确定哪种方法是最好的,甚至不知道哪种方法能够成功理解大脑。”
尽管对欧洲人脑计划抱有遗憾和遗憾,Helmstaedter教授却确信神经科学正逐渐变好。在人工智能的浪潮下,他表示自己正在努力使用机器学习做神经科学研究的学者。他坚信,人工智能将加速神经科学领域的发展,甚至在很大程度上替代人类评论者。而至于人工智能所带来的那些虚幻的预期,他并不感兴趣。他更关心的是大脑背后的实际和人工智能的机制实际应用价值。以下为「追问」访谈Moritz Helmstaedter教授的详细内容。为了阅读,我们对文字进行了专业版。
问:Helmstaedter教授,您好!非常感谢您接受天桥脑科学研究院支持的“追问专访”栏目。在采访开始前,请介绍一下您的研究领域。
我是莫里茨·赫尔姆施塔特(Moritz Helmstaedter),涉足德国马克·普朗克大脑研究所的主任。我的研究重点是解析颅内神经网络,特别是应用高级显微镜和其他方法稀疏神经网络,即组连接学。 ·普朗克大脑研究所负责连接组学部门的工作。
问:您曾在2015年针对欧洲人大脑计划的前身“蓝色大脑计划”公开发表评论,指出“将大量数据放在一起并不能创造新的科学”。我们知道欧盟委员在9月之后将不再资助HBP,这是否符合您的预期?从一开始,这个项目就备受争议,似乎大多数人都认为它失败了。
您认为阻碍它实现原目标的真正原因是什么?最初的人脑计划*被提出和构想时,它非常强调利用当时所有可用的数据来创建模型。我和许多其他同事都对这种说法持怀疑态度。作为科学家,我们必须对公众非常明智沟通。如果我们做出的承诺很明显无法实现,或者这些承诺显然是错误的,那就是行不通的,我们必须公开交流。就像我现在所做的那样,我告诉你们,也许连接组学会对我们有很大的帮助,但我们必须说明,其间也存在不确定性,我们不应该做出那些不切实际的承诺。10年过去了,很明显这些承诺并没有实现。当然,这个大项目还是产生了很多有趣的相关科学成果。但我当时提出了具体的批评,因为这种“把我们知道的东西凑在一起,模拟它,然后来解决大脑疾病”的观点,我认为是错误的。
*欧洲人脑计划(Human Brain Project,HBP):HBP是一项为期10年的大型科学研究计划。该计划由欧洲联盟资助,由近500名科学家参与,消耗资金约6亿欧元,目标是计算机里建立大脑模型,为脑部研究、认知神经科学和脑直觉计算,建立基于信息通讯技术的研究基础设施,供世界各地的研究人员使用。该计划于2013年10月1日启动,于2023年年9月结束。经过十年的积累,HBP得出了重要且有用的科学成果,如通过整合和创建大约200个重要的大脑皮层和更精细的大脑结构的三维地图,HBP科学家制作了人脑图谱,可通过EBRAINS访问。但从一开始HBP就任务争议,该项目的任务数次频率,相关研究被任务任务化,无法实现多维度整合,缺乏优先顺序,合作设定等。随HBP的必须在9月底停止,有关HBP是否失败的讨论成千论万。详情请见:因为山就在那里——人类大脑计划的十年|追问观察
我认为,如果你创建一个大型科学项目,比如“人脑计划”,并投入一些十亿或类似巨额作为资金,那么问题不仅仅在于是否会有很酷的成果出现。毕竟,这样的资金规模应该产生许多引人入胜和关键性的发现。事实上,“人脑计划”的合作者已经开展了许多相关且最近有吸引力的研究。如果现在资金被搁置数千份,则每份一百万欧元五百万欧元,分配给各地的研究,结果又会有什么不同呢?我认为这个更难评判,这是一个更高的评判欧洲判别标准,因为这也使得团队产生了伟大的科学成果。为此,你还需要证明这些成果不可能仅通过动物小项目实现。但“人脑计划”从一开始就声称可以利用现有数据建立一个巨大的脑科学模型,并解决重大问题。然而,这个原始目标明显实现了,这是很多同事预测到的,我对此也表示怀疑。但我们必须承认,这确实不如项目所预想的那样。
问:您是否看过电影《奥本海默》?我们在物理学领域已经看到了一些成功的大型科学项目,如熔化计划、LIGO激光干涉波天文台和欧洲核子研究中心。下,在生命科学领域,这样的例子却比较少见。是大型科学方法本身不适用于当前的脑科学研究,还是HBP缺乏一个像奥本海默那样的领导者?
我没有看过《奥本海默》,只是有所了解。不得不说,我有时很羡慕物理学界能够研发成功的大型加速器,这些都是大型科学的成功标志。为什么他们如此成功?因为是他们的目标非常明确、可测量、可量化。物理学家花了几十年的时间来开发一个连贯的模型,使他们能够准确地预测——“如果我做X,就能测试Y”。而且如果有人为了付钱,他们就能够完成这些任务。这是大型科学的理想模式。但在神经科学领域要彻底失败,虽然我不会说这不可能。我们在方法论上缺乏认知,不确定哪种方法最佳,甚至不知道哪种方法能成功理解大脑。每个人都认为自己的方法是最优的。在领域内,我们达成了共识,这与大相径庭。目前,生物学中一个较大的大型科学项目例子是人类基因组计划。这个项目目标明确且可实现,但其影响和直接后果几乎都被错误估计了。人们都希望通过它鉴定出一些关键基因,用于治疗与基因无关的疾病,包括精神病学领域。但显然没有发生。尽管如此,促进了更快速的振荡技术发展,使全基因组关联分析*成为可能。我们会竭尽全力去追求目标,甚至在*竞争中实现它。然而,当我们没有找到预期的结果时,我们会惊讶我们,但这就是为什么我们要这样做的原因。如果我们事先想知道寻找什么,就不一定要去探索新大陆、新概念这也是我从事连接组学的动力,到目前为止,我们仍然对数据的精确度和深度感到惊讶,但有时,另外我们也能找到预期找到的东西,或者我们认为会发现奇妙的最终事物出现。基本上无法转换假设,并且它说再见,然后转向下一个假设。这就是科学的过程。
全基因组关联分析(Genome wide association study,GWAS):应用基因组中数以百万计的单核苷酸多态性(single nucleotide polymorphism,SNP)为分子遗传标记,进行全基因组水平上的对照分析或相关性分析,通过比较发现影响复杂性状的基因变异的一种新策略。*竞争:指美国的民营企业(比如Celara Genomics)与人类基因组计划进行的竞争。他们同样测定了果蝇基因组,也测定了小鼠和人的全基因组序列,取得过很好的科学、经济与社会效果。尽管双方各自努力有些浪费资源,但最终“官”和“民”的竞争还是达成了和解。
问:之前有一种论调,许多人认为HBP缺乏一个明确且可实现的目标。如果您要为HBP设定一个明确的目标,那将会是什么?
不得不承认,我正在努力实现我为这个项目设定的目标。设定的目标不是因为我认为其他人也应该这样做,而是因为我深信这些目标的重要性,并能论证其重要所在。神经突触级连接组(synaptic level Connectome)是我们在进化中学习所涉及的部分。学习的过程,包括适应与选择。什么样的捕食者会出现,为什么有条纹的野兽是危险的,还有那只靠近的鹰代表着什么,这些都可能在进化上被编码。除此之外就是我们个体一生所学的个体知识。神经突触级连接组是这两者汇聚的地方。它不是基于细胞类型的连接组,它也不是像整个大脑弥散张量成像(DTI)图那种高速公路般的投影图,因为他们都不存储个体知识。所以这就是为什么我认为这个观点有很大价值。这不是一个任意的描述或者选择,而是为了理解这些大脑网络而向前迈进的正确选择。
问:我还有个假设性的问题,如果HBP在今天推出,借助所有新技术和人工智能,您认为结果会有所不同吗?
当然,结果肯定会不同,但仍然很难定义一个明确的最终目标。明确的目标是可以量化的,比如,仅仅说“我想了解大脑”并不是一个可量化的、明确的目标。我也不认为它应该是治愈疾病的行为,这仍然太过模糊。我们需要的是非常具体和可实现的目标,它可以是雄心勃勃的,但不能含糊不清。
问:我知道您在海德堡大学学过物理和医学,请问跨学科研究以及物理学背景对您的神经科学研究有何帮助?
我从物理学教育中获益匪浅,我非常感激自己接受了这种非常基础的教育。物理学消除了我对复杂性的恐惧。物理学在处理看似复杂的历史以及一些非常复杂的问题,但随后发展了定量方法来解决这些问题。如果你接受了这方面的训练,你就会失去那种恐惧。显然,可能会有我们不能理解的问题,但你受过物理学训练,就会让你在这些问题上无所畏惧,至少你不会再去回避研究像是神经网络这样复杂的东西。
问:贵实验室的研究需要处理大量的数据,您是如何将人工智能的力量融入到这个过程中的?
我们需要追踪连接神经元的细小纤维,即轴突,而这需要高分辨率的电子显微镜。但如果我们在三维空间做重构,这意味着我们需要获取非常大的数据集。实际上,20多年前,存储设备还处于千兆字节的规模,我们无法用当时的存储设备来分析我们获取的太字节级数据集。由于大脑中轴突和突触十分密集,其三维结构就会变得非常复杂和庞大,因此,就时间投入来说,手动追踪神经元已不可行。所以,我们很早就开始寻求自动化方法。大约在2005或2006年,我们开始探索机器学习在图像分析中的应用,这还不是常规方法。当时,我们还在使用标准图像处理方法,即设计一些滤镜,然后将其应用到图像中,最后得出一些结果。当时我与共事的Winfried Denk开始使用机器学习方法。我们从K近邻算法开始。这是一种非常传统的用于解决视觉图像问题的机器学习方法。当时这已是相当不寻常的尝试,并使我们取得了显著的进步。随后我们与Sebastian Seung合作,使用由杨立昆开发的卷积神经网络。
到了2007年,我们将其应用于图像数据分析,这是这种方法最早的应用之一,而且非常成功。我们在2013年发表的第一个哺乳动物连接组图,是使用当时的现代AI方法处理的。但我们仍然需要依赖大量的人类智力的努力。我们招募了数百名学生来帮助我们标注数据。他们的高效标注与我们为此开发的工具相结合,与当时的人工智能相结合,帮助我们完成了首个哺乳动物视网膜连接组。这种关于老鼠的视觉处理装置揭示了人工智能和神经科学之间的有趣循环:一方面,我们用人工智能更好地理解大脑;另一方面,我们也用视觉器官实时分析人工智能捕获的大脑结构。过去10年,我们越来越多地使用人工智能,以减少对人力需求。由于人力资源的扩展性有其限制——例如雇佣数百甚至数千名学生是极其困难的——因此我们必须推动人工智能及其改进,来减少所需的人力工作时间。这种做法已经证明非常有效。到2019年,我们发布了首个皮层连接组,效率比之前的视网膜连接组高出20到40倍。现在我们真正进入了一个新阶段,我们认为人工智能可以在很大程度上取代人工注释者,这将更快地推进我们领域的发展。
问:我们都知道ChatGPT现在很热门,我想知道这类大语言模型是否能帮助您的研究?
我们还没有直接研究过如何应用这类transformer模型。我们的经验是,当我们找到一个针对性的解决方案来解决我们的问题时,我们总是能取得最大的成功。因此,我认为ChatGPT这类大语言模型,在处理语言和其他复杂数据中确实有很大的潜力。但我们的数据并不复杂,它并没有太多可能的配置,只是在局部区分和理解这些轴突的延续位置非常困难,这是一个非常有针对性的问题。我们目前的解决方法是把它看作一个三维飞行问题。我们有三维数据,并且已经构建了一个基于人工智能的飞行引擎,可以说,它学会了沿着轴突导航。现在这篇论文的第一个版本在biorxiv发布,我们称它为“RoboEM”*。它就像一个小型机器人在电子显微数据中穿行,这在我们应用中非常成功。它作为一个为具体的问题量身定做的解决方案,仍然具有优势。
* Schmidt, Martin, et al. “RoboEM: automated 3D flight tracing for synaptic-resolution connectomics.” bioRxiv (2022): 2022-09.“RoboEM”是一个基于AI的自动化3D飞行系统,训练用于仅使用三维电子显微镜的数据沿神经元导航。RoboEM大幅降低了皮层连接组的计算标注成本,比手动错误校正的成本低约400倍,显著提高了自动化的最先进分割技术,并取代了人工校对,用于更复杂的连接组分析问题。
问:您早期的工作中对比了人类大脑和灵长类大脑的差异,在您看来,人工智能和人类智能在工作模式上有什么区别?
在讨论人工智能和人类智能的工作模式差异时,首先应关注的是它们的学习效率。现代人工智能与人类智能之间最显著的区别在于学习效率。虽然我们现在创建的人工智能已经在某些方面表现出色,但在更多的方面仍在持续不断进步。但关键不仅仅在于能否完成任务,更重要的是从有限的指导中快速学习和适应的能力。一个婴儿或小孩如何学会在世界中导航,识别树木、汽车、父母、人和猫?他们使用的标签很少,依靠的是大量未标记的数据进行学习。这是当前人工智能努力学习的方面,尽管我不是说不可能实现,但这确实是两者之间的一个主要区别。第二个主要的差异再次体现在表现(功能和性能)的层面上。我们似乎在大脑中训练一个关于世界如何运作的模型,我们对物理定律有一些直观的理解,例如汽车不会飞行,飞机不会潜水,苹果会掉下来等等。我们的大脑以我们并没有真正理解的方式训练、学习并记住这些物理定律。今天,人工智能仍然是通过大量冗余地学习各种可能发生和不可能发生的事情来理解这些概念。多数人认为,我们还没有找到一种方法能让人工智能像学习统计数据那样去学习和理解这些背后的基本定律。虽然学习这些定律并非绝对必要,但对于世界的准确预测来说,这种方法似乎更为高效。所以,许多专家和同行认为,这种对世界模型的理解和预测能力仍然是人类智能和人工智能之间的一个主要区别。如果我可以在结构上补充一点,人工智能中的大多数图像处理依赖于前馈网络,即深度网络仅有前馈连接。因此,在这些网络中,既没有横向连接也没有反馈连接。这与我们早期对大脑的理解,即视网膜、丘脑、皮层之间的逐层前馈处理类似。然而,我们大脑的网络结构包含大量反馈连接。这意味着人工智能虽然在图像处理上效果很好,但使用的方法可能与大脑的工作方式有很大差异。在人工智能领域,管理循环神经网络一直是一个挑战,我们花了很长时间才找到方法,但我们的大脑在这方面却表现出色。现在,在这方面,我们仍然可以从人类大脑中学到更多。我认为我们应该关注抑制作用。这是现代人工智能中尚未明确处理的一个领域。最近我们发现,即使与小鼠相比,人脑也有大规模的抑制突触网络。这是一个值得注意的话题,我们应该更好地理解它,也许这会在概念上帮助我们获得更好的人工智能。
问:我们都知道,神经科学启发了人工智能的早期发展。未来,您认为人工智能会变得越来越像人类智能吗?还是说,它会走上一条相对独立的道路?
在我看来,人工智能是否会与人类智能融合,这是一个非常开放的问题。早期的人工智能确实深受神经科学的启发,我相信神经科学和人工智能之间的相互启发将会持续,但也有可能人工智能会使用我们已有的方法,并在技术方面加速发展。例如,量子计算的使用很可能会开辟出一条独立的技术进步之路,而这并不需要深入了解人脑的知识。就我个人而言,我仍然认为,在我提到的预测性学习、世界模型的编码以及记忆的处理方式等方面,我们还有很多可以从人脑中学到的东西。
问:我认为ChatGPT就是一个很好的例子,可以说明量的增长会带来质的突破,即所谓的新兴智能。你认为类似的事情也可能发生在脑科学领域吗?比如您和您的同事正在尽可能多地绘制全脑神经元,描述它们之间的联系,你认为这最终能帮助我们破译大脑吗?
我将大量精力投入在利用连接组学来推进人们对大脑皮层和其他大脑功能的理解。因为我有一种强烈的直觉,这将从根本上帮助我们理解大脑是如何工作的,特别是通过筛选神经环路的可变性,我们可以更好地理解感官体验、发育成长、个体发展以及物种的影响。当然,我们需要特别理解人类大脑,但也需要理解病理变化,所以我认为研究神经环路是非常有力的手段。到目前为止,我们已经得到了积极的反馈。当然,只有在成果诞生后才会知道,这一切努力是否值得。我们现在已经开始积累这类洞察力,即如何对科学发展具有前瞻性。这永远是一个开放的领域,在一条充满未知的道路上,只有未来才能告诉我们,我的想法是否正确。前面我已经指出了抑制的作用,我知道人工智能界对这个问题很感兴趣,并试图从概念上理解神经网络的优势。所以,这显然是一个潜在的有趣的发展方向。我们仍然需要了解学习和学习规则,我认为网络数据将帮助我们了解,生物学中的哪些存储规则实际上在人类大脑中被大规模使用,这可以为更好的人工智能提供信息。我希望并相信,未来这些成果将从生物学领域再回到人工智能领域,但这是否会发生仍然是一个未知数。
当我们评价某种人工智能的优劣时,通常会通过它是否能完成图灵测试来判断。从神经科学的角度来看,您认为我们是否需要一种新的方法来测试人工智能的性能,尤其是人工智能与人类大脑之间的相似性?
事实上,我是人工智能领域众多观点的观察者和倾听者。显然,领域内有很强烈的观点认为,我们已经掌握了人工智能的关键原理,其余只是技术问题。我会把这个阵营归为 Geoffrey Hinton 等人,他们甚至认为反向传播是大脑的真实写照。我对此并不赞同。目前的人工智能与我们小时候学习时所做的还有很大差距。但我常用一个例子说明,我们不需要模仿鸟类的飞行方式来实现飞行的功能,就像我们不必完全模仿大脑来构建人类水平的智能。我们应该理解现象背后的规律。我们可以从大脑的运作方式中获得启发,然后用不同的方式实现这种理解,就像飞机的飞行方式一样。或者至少,我们可以观察大脑的工作方式,然后开始重新创建类似的网络。这很像多层透视最初的工作方式,虽然一开始并未深入理解非线性的作用,但它的功能强大。目前大多数情况下,我们通过捕捉信息来证明自己是人类。我认为,测试人工智能性能和区分AI与HI(人类智能)之间的相似性已不再那么重要。因为很明显,在各类问题的解决上,它们总是做得更好,而且表现会越来越好。目前的语言模型也显得非常聪明,所以我对这种测试的概念并不确定。坦白地讲,我并不认为这很有趣,因为我认为其背后的机制和人工智能的应用可能性才是真正重要的。当然,我们必须确保我们能控制它,不让它取代我们,但对此我并不担心。
问:您的工作与人工智能联系如此紧密,三年来您一直在钻研专业知识,所以我想知道跨学科交叉合作对科研推进的帮助是怎样的?
我认为跨学科物理学家合作最明显的好处是不同领域的专家能够相互学习,互补视角。在我们实验室中,有来自不同背景的年轻科学家,比如电气工程师、家、生物学家,甚至医学院学生们,他们的专业知识覆盖了广泛的领域,包括化学等。我们有各种不同的视角,在一起工作很有趣。虽然有些同事最初对大脑的了解有限,但他们不断学习神经科学知识,同时我们也拥有解决数据分析问题的出色技能。我们聚在一起,互相学习,这不仅仅是跨学科的关键标志,我们有共同的目标,这使我们非常明确为何要合作。共同解决问题的过程,富有意义接触,还是非常有趣的,因为我们可以清楚地看到我们所取得的进展和进步。
问:大众可能会认为脑科学的突破非常缓慢,比如我们怎么还不能治愈一些脑疾病。如果你要选择本世纪最重要的脑科学发现,你会选择哪一个?
我同意和大众对神经病学或精神病学等神经科学领域在攻克疾病上的完全失望。但我们得承认它是彻底的失败。尽管在80年代和90年代,即所谓的“大脑十年”期间,我们在某些重大疾病的治疗上取得了相当大的进展,但神经退行带来的挑战同样巨大,而预计在未来几十年内将给我们的社会带来沉重的负担。这就是我们面临的挑战的巨大挑战。我同意当前的发现似乎很少,问题为何会这样。当研究变得极其困难时,我们应该反思是否选择了正确的方法和研究目标。我刚才进行了这样的研究,因为我相信,神经网络可能是疾病表现的关键方面,这个假设已经存在很长时间了,但我们之前无法研究它。现在我们认为我们能够研究这类问题。至少我们要检验一下,是否有主要的的精神疾病与特定的神经回路有关,如果有,是哪些,它又是如何感染的,感染的是回路的哪些部分,哪些信号可能容易受到感染等。这将有助于我们理解神经退行假设尽管这是一个复杂且困难重重的领域,其中的因果关系也存在争议。我能说的最多的是我自己的研究领域。我们发现了小鼠和人类大脑皮层的显着区别,这不是我们对我来说,这就是一个例子,表明如果你探索全新的领域,用新的方式观察网络,你会发现一些之前未曾想到的东西。
来自@Moritz Helmstaedter的问题:关于世界的知识表征是如何在我们大脑中编码的?大脑中是否存在进行预测编码的神经回路?
我对一个基本问题感到困惑:关于世界的知识表征是如何在我们大脑中编码的,从而让我们能够理解当前发生的事情。特别是预测编码(predictivecoding)的概念,大脑中是否存在进行预测编码的神经回路?如果存在,它们是如何构成的?我认为我们所进行的许多思维活动都是基于预测性的,并且依赖于广泛的假设。因此,理解这种处理背后的架构是一个根本性的问题。同时,这对神经回路病理学的理解也越来越重要。我们正在积极开展这方面的研究,因为这对我们理解大脑疾病有着重大的影响。针对Helmstaedter教授的问题,我们将邀请更多嘉宾探索答案,敬请关注。