蕴藏在大脑里的美丽几何——神经流形浅入门(上)基本概念与兴起历程
□ 撰文丨沁瓢瓢(计算神经科学博士 普林斯顿大学博士后)
□ 责编丨浦肯野
□ 排版丨ahead
众所周知,神经科学家们最关心的问题,除了今天中午食堂是供应炒面还是卤肉饭之外,就是我们的大脑究竟如何从外界萃取和编码信息。一千多年前的九月,王勃登高望远,看见了“落霞与孤鹜齐飞,秋水共长天一色”美不胜收的景色。而这时,他的大脑通过什么机制分辨出云霞与鸟、水与天呢?
我们知道,神经元是大脑的识别分辨机制中最基础的组成元件。在人们刚开始对大脑活动产生兴趣的一百年里,科学家们发明了膜片钳技术来研究神经元电位如何波动。而最近几十年,随着植入式电极阵列和高密度神经探针的发展进步,可以实现大范围、高精度、对几十甚至上百个神经元动作电位的精确发放时间和波形的同时记录,进而研究重心也逐步从关注单一神经元转向研究神经元之间的动态相互作用(neural dynamics)。
拿笔者的研究举例,(在佛祖的保佑下)笔者今日从实验小猴的脑内同时记录到了200个神经元随着时间波动的即时脉冲活动,从而形成一个200维度的神经元群体的高维活动空间。假设我们能画出这个200维的空间,就可以在每时每刻找到一个点,可以代表着此时200个神经元脉冲活动。而点与点连接所形成的轨迹,就代表了这群体神经元的活动曲线(neural trajectory)。但是,不难想象神经元之间的联系高度缠结并且互相影响,显然这200个神经元的脉冲活动不可能彼此之间完全独立、毫无关联。于是乎,我们连接点与点得到的群体神经元的活动曲线并不会杂乱无章,也无法经过200维空间里的任意位置,而会存在一定规律,被限制在更低维度的空间中(neural subspace)。至于这个低维空间以及其中的神经轨迹具体长什么样,则是由组成这个空间的群体神经元之间的相互作用关系、相互连接性的强弱、以及具体的生物学活动等因素共同决定。
在记录电极技术发展的同时,随着计算神经科学领域的兴起,大量的数学家、物理学家冲进神经科学领域来抢生物学家的饭碗,继而涌现出了一批又一批的计算神经科学家们,开始用几何学和拓扑学的手段在低维度的空间里研究高维度的皮层状态的动态演化。浅显来说,就是研究怎样把200维甚至更高维的神经空间里的神经群体活动降维到低维的神经流形(neural manifolds)里,通过研究低维神经空间的形状以及限制于其中的神经活动轨迹(neural trajectory),来研究其背后所蕴藏的高维神经群体对于信号的编码。笔者不才,想通过这篇文章简短浅显地向大家介绍什么是神经流形。随后在下一篇文章中,将和大家一同回顾,最近几年神经科学家们如何利用一系列高维空间的抽象数学的方法来揭露神经回路的秘密。
首先,流形(manifolds)这个概念当然不是神经科学这个才一两百岁的科学小宝宝所独创。她的祖奶奶---数学,有一门美丽的分支叫做代数拓扑(algebraic topology),这门分支玩的就是如何用抽象代数的工具来研究拓扑空间。流形,其实也是一种拓扑空间,可能听起来比较邪乎,但你可以把它想象成一个可任你随意扭、扯、拉、卷的胶泥平面。于是乎,对于拓扑学家来说,圆平面和方平面本质上来说都是同一个东西,因为经过延展或弯曲二者可以相互转变,这个概念在拓扑学界被称为同胚(homeomorphic)。当然,并不是所有形状的流形都相等,因为我们对胶泥平面的“玩法”还是存在限制。比如说,不能给平面打洞, 再如可以把一张纸折成混天绫,但是折不成乾坤圈等等。如果你已经在脑袋里凭空捏扯了几分钟胶泥,相信拓扑空间这个概念现在应该听起来没那么陌生了。事实上,我们所处的三维欧几里得空间(R3)、经典力学的相空间和构造广义相对论时空模型的四维伪黎曼流形(Pseudo-Riemannian manifold)都是流形的实例。神经元与神经元之间,也可以组成这样的一个拓扑空间。比如笔者记录到200个神经元的活动,就可以组成一个R200空间,而这个空间的每个轴都代表着一个神经元。
相信小时候,我们每个人对地球都有过相同的一个误解——觉得地球是平的。这是因为我们每天活动的范围对于地球来说太小了,所以我们眼中地球看起来就是个平面。而长大后,看到宇航员在地球之外传回来的自拍,从背景中就可以知道,地球实际上是类似球体的存在。而之所以小时候我们会产生误解,是因为地球的每一个无限小的地方,都是一个小平面,有点类似于高中数学中,导数的几何意义就是任意一点都可以被直线相切。于是乎,如果我们没有离开地球拍照的话,地球就算是下图中的某种形状,理论上来说我们也感知不到——因为他们的宏观形状虽然并不一样,但是都可以被划分成很多个小小的方形平面。这样就比较形象地解释了流形的含义。我们刚才提到的球形,以及下图中五花八门的形状,也都是流形。

如果说笔者的人生是由火锅定义,那么对于流形来说,定义她的概念就是维度(dimension),其实还有个定义概念叫genus of a torus,但笔者不知道这个怎么翻译,所以先按下不表(嘻嘻)。因为篇幅有限,我们重点来讲一下维度这个概念。每个流形都是由嵌入流形(embedding dimension)和内在流形(intrinsic dimension)两部分组成。嵌入流形是指这个流形所在的欧几里得空间,而内在流形则指的是流形自身需要几个变量来定义其中每个点的坐标,也就是我们常说的自由度。如果说地球是三维的嵌入流形,它同时也是二维的内在流形,因为任何一个点都可以被经度和纬度两个指标定义。
这个概念大大地拯救了计算神经科学家们,因为虽然采集的数据是成百上千的神经元活动组成的Rn嵌入流形,但通过主成分分析(principle component analysis, PCA)和因子分析(factor analysis, FA)等降维方法,我们可以把高维神经元维度转化为低维的内在流形来研究信息的嵌入。如果一个R200的嵌入流形是维度为一的内在流形,那就说明虽然这个流形存在于一个非常难以解释的空间,但是流形本身却非常简单。是不是有一种感觉像是夜空中最亮的星,贫民窟里的百万富翁,误入女儿国的唐三藏或者被六大门派围攻的张无忌……当然,这一切能够成立,都是因为神经元彼此之间高度相互关联且重复的。
在弄懂流形的定义之后,我们接下来看看它在神经科学领域的兴起过程以及对整个领域看待神经活动的角度造成的“核弹”影响。大概70年前,神经科学家们就开始记录和研究单个神经元的功能活动。从第一个在清醒猴子的大脑运动皮层中记录单个神经元的Ed Evarts[1]开始,到研究决策行为中单个神经元活动的Will Newsome[2],几十年来,人们从各个脑区中记录到了神经系统无数最基础组成元件的功能活动。但是,人们从最开始亦可赛艇的状态渐渐地冷静下来,意识到只研究单个神经元不足以理解大脑的高级功能活动。以运动领域的研究为例,早期基于单个神经元的研究大部分都只是揭露了单个神经元活动和运动相关的不同参数之间的关系,比如运动过程中的肌肉力、关节位置、运动方向等等[1,3,4],但是这些信息并不能帮助我们理解运动皮层如何产生和控制运动过程[5]。
显然,从单个神经元的活动并不能帮助我们理解一群神经元组成的神经群体间的相互作用。不过请注意,这里谈及的群体间的相互作用,跟传统意义上的群体神经元解码(neural population decoding)是不一样的。早在1982年,Georgopoulos就研究了群体神经元活动和运动参数之间的关系[6],但这样的神经元群体活动不包括个体神经元间相互作用的动态的(neural dynamics)。随着科技的进步,从一次只能记录到几十个神经元的电极探头和电极阵列,到现在包括哥大的Michael Shadlen、斯坦福的Tirin Moore、伯克利的Joni Wallis等实验室都率先尝试使用的一次能记录成百上千个神经元活动的猴用高密度神经探针(如Primatepixel等探针),能够记录到的神经元呈指数级增长,为人们理解神经系统如何在神经群体级别规划和执行运动铺平了道路。
谈回今天幸福的笔者,从做重复性动作的小猴子身上记录到一大群神经元活动。在分析这些神经元的活动时,就可以产生两种解读:一种是,单个神经元在某一时刻的脉冲频率代表了这个神经元对于不同的运动特征的编码,比如运动速度或者目标位置。而另一种解读则认为,神经系统的运动中枢更可能是一种动力系统,其中单个神经元活动并不是编码不同的运动特征,而是通过与其他单个神经元的组成的神经群体发出并控制运动。也就是说,我们的目光应该从单个神经元转移到相互作用的一组神经元上。虽然笔者记录到了200个神经元的活动,但如果把其当成一个整体来看,考虑到神经元之间的高度关联和重复,在分析时自然而然就会考虑进行降维处理。
事实也正是如此,前人也已经发现,大脑只需要极低数量级的几个独立信号,就可以实现对运动的控制。比如早在2009年,研究者发现在一个三维的低维空间里,人们就能分辨出前运动皮层手臂区域的群体神经元在准备时间的活动曲线[7]。这些控制指定行为所需要的独立神经信号互不相关,也叫做潜在变量(latent variables)[8]。因为它们并不是直接观察记录到的实验数据,而是经过降维处理后产生的。
下面的示意图假定了一个最极端简单的情况,能帮助我们更清晰地理解这个重要概念。X-Y-Z三个轴(即图中N1, N2, N3)分别代表记录到三个神经元的功能活动,三者间形成了一个三维的神经元活动空间。而通过降维,我们可以将其随着时间变化的群体神经元活动,也就是图中所示的黑色曲线,简化到位于u1,u2两个张量形成的一个二维表面里,也就是一个相对于三维来说更低维的神经空间。这两个互不相关的张量叫做神经模态(neural mode), 他们随着时间变化的活动也就是潜在变量。于是,这两个潜在变量的线性组合就可以描述三个神经元的群体活动。当然,真正的神经流形也可能不是图2A所示的超平面,而是与之同胚,图2B所示的蓝色曲面。不过显而易见,我们用线性方法处理产生的平面空间其实也已经抓住了这个非线性空间的主旨。当然,如果涉及复杂的行为,大面积不同的脑区活动都会参与其中,此时平面的流形近似可能就不再准确。于是,使用非线性的降维手段则会提供更准确的神经流形,具体方法如局部先行嵌入(locally linear embedding)、等距特征映射(isomap)、或者自编码器神经网络(autoencoder neural network)等。

如上所述,我们对大脑运动皮层做神经动力学分析,就可以不再探索高维神经空间,而是探索其中由神经模态所张成的低维流形。低维流形可以捕捉神经变异性(variability),其存在从某种程度上来说也是对皮层活动的一种约束。就好比在三维空间里提笔写字时,无法写到空间里的任何一个地方,而只能写在这个空间里的一张二维的白纸上。
通过前面的介绍,相信各位读者已经大致对神经流形有了初步认识,知晓了其产生的研究背景和发展历程,自然也会理解降维处理能够帮助我们认识复杂的神经活动。在下一篇文章中,笔者将会带领大家从近年来的研究中领略神经流形的魅力。
·封面来源·
arXiv:2103.02663v1
·文章插图·
图1 https://bjlkeng.github.io/posts/manifolds/
图2 参考文献[5]
·参考文献·
1. Evarts, E. V. (1968). Relation of pyramidal tract activity to force exerted during voluntary movement. Journal of neurophysiology, 31(1), 14-27.
2. Newsome, W. T., Britten, K. H., & Movshon, J. A. (1989). Neuronal correlates of a perceptual decision. Nature, 341(6237), 52-54.
3. Humphrey, D. R., Schmidt, E. M., & Thompson, W. D. (1970). Predicting measures of motor performance from multiple cortical spike trains. Science, 170(3959), 758-762.
4. Thach, W. T. (1978). Correlation of neural discharge with pattern and force of muscular activity, joint position, and direction of intended next movement in motor cortex and cerebellum. Journal of neurophysiology, 41(3), 654-676.
5. Gallego, J. A., Perich, M. G., Miller, L. E., et al. (2017). Neural manifolds for the control of movement. Neuron, 94(5), 978-984.
6. Georgopoulos, A. P., Kalaska, J. F., Caminiti, R., et al. (1982). On the relations between the direction of two-dimensional arm movements and cell discharge in primate motor cortex. Journal of Neuroscience, 2(11), 1527-1537.
7. Santhanam, G., Yu, B. M., Gilja, V., et al. (2009). Factor-analysis methods for higher-performance neural prostheses. Journal of neurophysiology, 102(2), 1315-1330.
8. Churchland, M. M., Cunningham, J. P., Kaufman, M. T., et al. (2012). Neural population dynamics during reaching. Nature, 487(7405), 51-56.