脑机接口,作为当下神经科学领域最为关注的科技前沿话题,在今年二月被《自然-电子》杂志评为2023年年度技术。该杂志还强调,2023年是我们对脑机接口技术做出反思,并考虑其发展方向的关键时刻。今年七月,联合国教育、科学及文化组织(UNESCO)发布了一份关于神经技术的报告,而脑机接口正是这个领域的核心[1]。
在获得高关注的同时,脑机接口技术本身也不断刷新着自身记录:今年10月在《自然-神经科学》上发布的一项研究表明,借助功能性超声(fUS)神经影像技术,可以做到“未动先知”,在不植入电极的前提下,在猴子没有做出任何行动时就可以解读出它们的运动计划[2]。研究者来自美国加州理工学院神经科学教授、天桥脑科学研究院(TCCI)脑机接口中心主任Richard Andersen团队。
简单来说,研究者通过fUS从两只恒河猴的后顶叶皮层获取它们执行眼睛和手部运动时的数据。经过训练,这些猴子能够使用脑机接口(BMI)实时控制最多八个运动方向。他们还开发了一种使用先前会话的数据进行预训练的脑机接口(BMI)方法。这样就能在随后的几天,甚至相隔数月的实验期间实现即时控制,而无需进行大量的重新校准。这项研究将人们的视野再次聚焦在这个带有浓浓科幻色彩的脑机技术上,从它身上,我们可以窥见“超声读心”技术背后的特点与突破。
为了测试fUS-BMI的可行性,研究者首先进行了在线闭环的两个运动方向上的解码。在猴子根据记忆引导完成左右眼动任务时记录实时的fUS数据。在得到100个成功试次的数据后,实验切换到闭环解码阶段:猴子只能通过运动的意图来控制任务方向,并每次都会被告知BMI预测出来的是左边还是右边。在第二个阶段中,解码器在55次训练试验后准确性显著提高,并在第114次试验达到82%准确性。
为了测试跨时段的重新校准问题,研究者通过预训练的方法在不同会话之间保持了fUS-BMI的稳定解码性能。他们比较仅使用当前会话数据和使用前一次会话数据进行预训练的fUS-BMI性能,发现预训练显著提高了性能且缩短了训练时间。
在解决了跨时区重新校准问题,保证了在线闭环解码的性能之后,为了进一步提升fUS-BMI的性能,研究者这一次尝试实时解码八个运动方向。首先分别预测运动意向的垂直(上、中、下)和水平(左、中、右)分量,然后将这些独立的预测组合成最终的预测(例如,向上和向右)。这样的设计与后顶叶皮层(PPC)神经元的响应特征是相符的:对相邻运动方向有相似的响应,但对具有更大角度分离的运动方向有不同的响应。换句话说,这种多编码器方法融入了相邻方向之间的神经表示相似性,而不是将八个方向视为八个独立的类别。解码器在86个训练试验后准确度达到显著(高于与12.5%的随机水平),并稳定在34-37%的准确度。这时,研究者再次测试了预训练的效果,再次发现预训练减少了达到显著解码所需的试验次数。
得益于fUS技术,研究者得以记录到多个功能脑区的活动,例如编码手和眼动的区域。为了验证这一点,他们将上述训练、解码过程在手动任务中重复了一遍,也获得了很好的效果。
“超声读心”的原理
人们研究大脑最直接的目的是理解、解读、最终自主控制大脑,脑机接口就为此提供了大脑与外界设备直接通讯的连接,可以记录、解码和刺激神经活动。我们都知道,神经信号在神经元上以电信号传播,最直接的测量方式是使用电极记录局部场电位(如ECoG)或者穿过头皮的电信号(如EEG),除此之外还有很多间接的方式来测量神经活动,如fMRI(功能性磁共振成像)、Ca2+(钙离子)等。此次研究所使用的超声波信号便是这样一种间接信号,它被用于大脑成像只有十余年的历史。
从成像原理上看,fUS与fMRI类似,依靠的是神经血管耦合效应。利用超声波在大脑小动脉和毛细血管内成像血流动力学参数(血容量),以约1赫兹的频率来间接推断神经活动。位置信息则是基于脉冲波多普勒效应,对超声波接收的反射声音,根据静止发射源和移动反射目标之间的距离推断反射目标的运动信息。同时,为了达到较深的成像距离,fUS必须使用极短的超声脉冲,这使得直接测量频率变化难以被实现,然而发送多个脉冲时,整合多个反射信号便可以间接计算出频率的短时间延迟,这便是脉冲波的多普勒效应。
在收集到成像数据后,所得到的神经元信息还需要经历一道关卡——滤波。血液细胞被移动的脑组织包围,这些脑组织也会产生多普勒信号,而分离血液和组织信号的过程至关重要。由于心脏、呼吸和行为活动引起的脑组织移动通常较慢,因此产生的多普勒信号的绝对频率较低于血液。使用高通滤波器可以消除这些组织信号,仅保留血液信号。更先进的滤波技术则可以优化这种分离,因此高效的滤波对清醒状态下的记录尤为重要[3]。
“超声读心”的前世今生
截至目前,大多数fUS研究都是在啮齿动物中进行的[4]。最初,研究者只能在固定头部的麻醉大鼠上做实验,得益于临床技术的进步,长期耐受性良好的颅窗使得在清醒的头部固定小鼠上采集fUS信号成为可能[5]。在啮齿类动物身上使用fUS信号主要是为了检测技术的可行性。直到最近,对固定头部清醒小鼠的研究才开始着重于观测全脑成像与行为、环路操纵的关系[6]。与fUS固定成像同时发展起来的还有在不同物种动物身上应用的拓展,这证明了这项技术可以广泛应用于多个物种,只需要调整频率以适应不同的大脑体积。
fUS的一个明显优势是它能够跟踪自由移动的啮齿动物的全脑活动。从技术上讲,只需在动物头上植入颅窗和支架,在实验期间将超声波探头插入其中。当动物奔跑或执行行为任务时,就可以同时通过电缆连接到超声波扫描仪。自由移动成像技术的发展得益于小型线性超声探头的制造。这些微型探头有一个坚硬的电缆,一次只能成像一个成像平面。尽管如此,当啮齿类动物执行比头部固定的任务更自然的任务时,它们为观测大脑深处的活动提供了途径。在论证了该技术的可行性后[6],大鼠自由移动的fUS主要用于系统层面的行为状态研究,如运动或睡眠,这些行为状态在无约束条件下才可以更自然地发生[7]。此外,将fUS成像与同时进行的电生理记录相结合,还可以使大规模血流动力学模式与特定区域的神经元活动相关联。
除了啮齿类动物外,fUS对于非人灵长类研究也十分具有吸引力,从技术上来说研究方法均与啮齿类动物应用类似,但为了适应非人灵长类动物(如猴子)头皮有褶皱的结构,研究者对深层脑区成像使用了更低的频率。例如近期有一项研究就利用fUS对清醒的非人灵长类动物深层视觉皮层进行精细研究[9]。此外,fUS还在猕猴身上被用于进行记忆引导的运动任务的成像,这被认为是用fUS解码灵长类动物大脑运动计划的首项工作。尽管由于血管信号的干扰,时间分辨率较低,但这为利用深层大脑信号控制外界机械设备作下了重要铺垫。自这篇文章发表之后,科学家便在临床与数据分析两方面持续突破。
今年,代表这项技术在信号处理与数据分析方面重大突破的便是此次来自Richard Andersen教授团队的研究[2],而在十分相近的时间内,作者还发表了首例将fUS用于完全完整的成年人头骨中监测大脑活动的工作[10]。这一突破为研究者提供了在不侵入人体的情况下获取高灵敏度、大规模、高分辨率神经成像的新途径。通过这一技术,研究者首次实现了对手指运动的皮层响应的完全非侵入式映射和解码,生成了高分辨率(200微米)和大规模(50毫米x38毫米)的脑成像。这项研究将有助于深入理解脑活动,推动神经科学和脑机接口技术的发展,为神经疾病治疗和脑机接口应用提供创新性的方法。
“超声读心”与其他信号的比较
到此,我们已能够更好的理解fUS成像的特征,而与其他成像技术对比,就可以更直观的感受到不同技术收集信号性能的优劣之处。它们的差异主要体现在性能、侵入性、覆盖范围、时空分辨率、便携性和跨时段的解码稳定性上。
从表现上来说,目前最先进的使用膜下ECoG或侵入式电极的脑机接口可以以高准确度解码每分钟>15-60个单词、每分钟>29-90个字符以及个别手指的运动。
非侵入式的EEG是另一种常用于控制脑机接口的技术,而当代基于EEG的BMI有很大的个体差异性,一般来说使用EEG可以实现70-90%的准确率来对运动意图进行二分类。
再来看fUS,fUS记录到的信号既能实现广泛的覆盖范围,又能达到较高的空间分辨率(100微米)。15.6MHz的超声波探头可以提供12.8 mm × 20 mm这样大而深的视场,可以同时可靠地记录来自多个大脑皮层区域、广泛分布于多个脑区的运动信号。此外,许多脑机接口技术仅限于从大脑表面几毫米深的浅层皮层记录(例如ECoG、Utah阵列和钙成像)。但在本次研究中,研究人员采集到了解码眼动信息最有信息量的位于中到深层的LIP脑区信号,大约在大脑皮层下5-9毫米,这是别的技术无法实现的。
另外,虽然目前fUS与EEG的性能指标相近,但相较EEG、fNIRS和fMRI,fUS更具发展潜力。先前的研究发现,用PPC脑区的fUS信号进行解码,准确率随着空间分辨率下降而迅速恶化。这意味着,对于其他宏观空间分辨率的脑机接口技术,将难以有效地解码在微观和中观神经群体中变化的信息。
此外,fUS还具有易于重定位和能够穿透软组织这些便携性的优点。侵入性电极阵列通常只能插入一次,并且常由于定位不佳或为了避免影响主血管而经常选择放置在次优位置。植入电极阵列还需要额外的手术从而难以重新定位。并且对这些技术来说,组织反应会降低硬脑膜下和颅内慢性电极的性能。而当使用fUS的时候,超声波探头可以在锁定位置之前进行多次定位、测试和重新定位,因此就更容易找到并记录特定感兴趣的区域。原则上,fUS可以无限期地通过硬脑膜操作,实现在很长时间内的慢性成像,并且信号质量几乎不受损耗。
可见,fUS虽然是一项新兴技术,却具有很大的潜力。不过我们同时也需要看到它的不足与受限之处。它受制于中观神经血管耦合(秒级),神经血管反应充当每个体素信号的低通滤波器,导致时间分辨率较低。在2赫兹的fUS下实时延迟约为800毫秒。这也是fUS无法实现实时成像的原因。在目前的技术条件下,只能通过先前获取的离线fUS数据进行滞后相关分析,近似得到100Hz fUS的成像结果。
但综合考虑时空分辨率,fUS依旧具有独特的优势,可以检测到脑内的神经血流动力学信号,例如监测神经精神疾病的生物标志物。在一些脑机接口的应用场景下,即使只有较慢的中观神经血流动力学反应,也可以提取出意图运动的轨迹有关的信号。
“超声读心”的未来发展方向
那么,这项研究的意义何在?简单来说,研究者们展示并验证了一种在线、闭环功能性超声脑机接口(fUS-BMI)的有效性,这代表了目前最前沿的结果。对此,他们主要提出了两大突破点。
- 解码更多运动方向:
基于以往解码两个眼动方向或者两个手动方向的结果,成功实现了实时解码八个运动方向。
- 实现跨阶段的解码稳定性:
使用颅内电极的脑机接口(BMIs),例如犹他阵列,特别擅长在行为或刺激期间从空间定位的区域(<1厘米)感知快速变化(毫秒级)的神经活动,该活动与这些空间特定区域的活动相关,例如运动的M1区域和视觉的V1区域。然而,颅内电极在较长时间内(例如在后续记录会话之间)难以跟踪个别神经元,因此解码器通常每天重新训练。类似的神经群体识别问题也存在于超声设备中,包括在实验会话之间的视野偏移。在当前研究中,作者使用了一种对齐方法,该方法在一个月以上的时间内稳定了基于图像的脑机接口,即使需要重新训练,也可以在最小程度下从相同的神经血管群体解码。
而这是一项重要的发展,它使得研究者可以轻松地将前一天的模型与新一天的数据对齐,并允许在最小或没有新的训练数据的情况下开始解码。与传统基于流形的方法相比,作者采用的解码器对齐算法利用了fUS神经影像学提供的内在空间分辨率和视野,以直观、可重复和高性能的方式保证解码器稳定性。他们使用单个fUS帧(∼500毫秒)生成了当前会话解剖的图像,并将前一会话的视野对齐到这个单一图像上。值得注意的是,这不需要任何额外的行为数据来进行对齐。
至于未来应如何提高超声成像在脑机接口领域的性能,作者也提出了几点。从采样区域上,作者建议更改放置头柱与探头的位置,使得可以对于更大范围的LIP脑区进行成像。其次,在成像技术上,过往主要关注如何获得单层脑片的图像,但为了更全面的获得大脑活动信息,3D体积成像是一种可能的解决方案。然而目前,由于带宽、内存和计算能力的限制,高质量、低延迟的实时3D fUS成像尚不可能。然而,硬件和算法的不断进步很可能很快就会实现3D fUS-BMI。
最后,提高性能的另一途径可能是使用更先进的解码器模型来代替当前的线性解码器。卷积神经网络专门用于识别图像特征,并且对于fUS图像中常见的空间扰动(如与呼吸或心率相关的脑脉动)具有鲁棒性。此外,循环神经网络和Transformers模型使用“记忆”的过程,可能特别擅长表征fUS时间序列数据的时间结构。不过,这类人工神经网络(ANNs)的一个潜在缺点在于它们需要更多的训练数据。由此,作者也介绍了一种跨会话图像的对齐方法,允许将先前记录的数据汇总并组织成大型数据语料库。这样的数据语料库可能足以训练许多ANNs。除了训练ANNs所需的数据量外,最近的研究还强调了在为闭环运动BMI控制训练深度学习模型时所面临的额外挑战,特别是避免模型对先前记录数据中的时间结构过度拟合。尽管目前ANN还未被用于当前的脑机接口实验研究中,但它在未来研究更复杂的fUS-BMI有很大的潜力。
总结
当我们畅想大脑与机器的互动时,一定会好奇人类究竟能做到哪一步?通过回看fUS一步步的发展以及最近令人兴奋的研究成果,我们对这一新兴技术有了更全面的认识。
也许在不久的将来,人类就能看到它得以更广泛地在人类身上得到应用,来解读人类更复杂的“想法”。那时候它不会是神奇的“天外来物”,而是凝聚了人类医学、工程学、数学等多领域智慧的结晶。