北京航空航天大学高庆:CIM是天然的图数据处理量子计算平台

量子前哨重磅推出独家专题《量子科学家100人》,我们将遍访全球量子计算相关领域100位优秀科学家,多角度、多维度、多层面讲述该领域的最前沿科学故事,为读者解析科学洞见:量子科技前沿的最新观察与行业评析。
全文共4000字,阅读时间大约需要10分钟。
早在90年代,量子神经网络就提出来了。
将“量子”与“神经计算”相结合是美国路易斯安那(Louisiana) 州立大学Subhash Kak教授的创举,他在1995年发表的《On Quantum Neural Computing》一文中首次提出量子神经计算的概念,由此开创了该领域的先河。同年英国 Sussex大学的Ron Chrisley提出了量子学习(Quantum Learning)的概念,并给出非叠加态的量子神经网络模型和相应的学习算法。
与经典图神经网络相比,量子图神经网络(QGNN)具有更快的计算速度、指数级的记忆容量、更小的网络规模、可消除灾变性失忆现象等优势,因此非常适合于未来面对海量图数据、复杂计算要求等任务中。

北京航空航天大学教授高庆博士告诉量子前哨:“工业互联网就是一个典型具有巨大规模与复杂拓扑结构的网络,在未来,利用量子图神经网络将有望对其百亿个数据节点进行深层挖掘。即使在目前有限的量子计算资源下,量子图神经网络仍然可以在电网、社交网络、生物制药等复杂计算场景找到应用落地点。”

目前,高庆博士带领的课题团队主要从事面向真实量子计算平台的量子卷积神经网络方向的研究工作,目前的研究工作主要面向以量子超导电路为代表的量子计算平台。
高庆博士在研究中发现,超导量子电路的架构类似传统电路,也是采用多个级联门电路实现计算功能。这一技术架构有着易于理解与拓展设计的显著优势,但是当处理图层级任务时,甚至是在图数据规模并不怎么大但是拓扑结构复杂时,需要耗费相当数量的量子比特去编码图数据的拓扑信息。这一做法对量子比特的浪费相当显著。
鉴于量子计算平台的现状,这很奢侈。幸运的是,对相干伊辛机(Coherent Ising Machine,CIM)来说,这一问题可迎刃而解。
相干伊辛机,一种采用光量子的耗散式架构的量子计算机。与超导、离子阱等使用逻辑门计算架构的其他技术路线相比,采用量子失谐而不是量子纠缠作为计算资源,更加类似于人脑神经突触的工作模式,天然更适合于形成超大规模的量子图神经网络,对环境噪声和错误有很强的抵抗力。

高庆博士告诉量子前哨,“相干伊辛机是一个天然的图结构,在构建图卷积神经网络时,将不再需要额外的量子比特去进行图形编码,这会省去很多不必要的工作。”
量子图卷积神经网络的优势与挑战
早在2020年,图像识别技术就已经发展的非常成熟,识别度已经从99.9%提升至99.99%。但面对某些客户需求时,仅靠像识别技术来处理海量数据远远不够。
高庆博士举了一个例子,一个男子在打高尔夫球的画面,当一个物体在镜头前飞速前行时会很模糊,无法确定它到底是什么,如果仅用固定模式方案去识别判定,误码率就会比较高,但将其作为图中的某个元素去推断,看到男子打杆的动作以及环境识别等,就能确定飞过来的是球。显然,图像中的元素之间具有关联性,这就很容易判定,所以这种“关联性”非常重要。
高庆博士讲道:“在未来人工智能领域里,面对数据处理时,一定会用到大量冗余的计算,如果不加入‘关联性’,可能还需要其他大量数据去学习。图神经网络是目前AI领域的一个研究热点,而量子图神经网络的研究尚是一片蓝海。我们课题组在这一方向做了一些国际上比较早的初步工作,但是限于目前的量子计算平台,我们在高效经济编码问题上遇到了很大的困难。CIM天然图结构的性质无疑给我们提供了一条重要的思路。”

高庆博士曾在普林斯顿大学化学系访学,其导师从事研究过量子化学方向,课题团队曾专注于生物制药分析,所以高庆博士一直对这一方向较为关注。
在生物制药领域,高庆博士说道,“现在大部分的传统方法是基于传统AI学习与训练数据,比如药物靶标之类的关系,然后去构建一个大数据集合,继续训练学习选择出最优药物分子组合,其中就包含海量的高维图数据。这对传统的AI来说,算力要求极高。相干量子计算很有潜力能为这一领域提供革命性的新技术。”
量子神经网络可以补足“AI不可为”
2022年1月,来自北卡罗来纳大学夏洛特分校的Colby Ford研究团队,利用AI技术(AlphaFold2和RoseTTAFold),只用一小时几乎准确地预测了奥米克戎的复杂蛋白质序列结构,中心原子的位置误差只有约半埃(大约是氢原子的半径)。
高庆博士解释道,这个例子就很好解答了我们面对的挑战在哪里,传统AI已经很强了,量子神经网络如何配合传统AI发挥更高的价值作用很重要。
以社交网络为例,拥有海量节点数据的社交网络如何利用量子图神经网络来训练?对于微博、Facebook等社交网络巨头公司而言,小幅度的算力提升也将会大大降低公司运营的成本。
高庆博士说道:“当前,我们还没有走出现有AI框架,也只是提升了相对算力,但是我们可以在这种基础上加入自研的图神经网络,以此实现更具优势与意义的事情。”
高庆博士认为,量子神经网络是补足AI的一种方式,它可以解决复杂的强算力问题,但不会去颠覆AI自身的框架。在含噪声中等规模量子计算机时代,当可用的量子比特数达到50至100时,且保真度足够高的情况下,我们就可以去做很多事情。

也就是说,解决了面向量子计算的硬件问题,就是真正的量子神经网络出现的拐点。如今,斯坦福大学、哈佛大学、清华大学、中科院、中科大等高等院校、科研院所以及一些初创公司都在从事该方向的研究工作。
事实上,对于大众或行业研究者来说,如何能更快的理解并接受量子计算机,就是他们能够调用或者使用。所以应用层设计非常重要,这也是量子计算硬件技术由质的突破才会引发拐点的原因。
盲目追求高量子比特数不可取
可以预见的是,未来量子计算机的硬件路线发展趋势会保持百花齐放的态势。
高庆博士提到,业内常常提及“通用”量子计算,但“通用”的概念容易被理解为“统一”其实不然。未来的量子计算硬件应该是“通用化设计”,而非“统一构型”,这和我们经典计算机使用同类标识结构(如基于电路的处理芯片等)完全不同。此外,在量子计算硬件系统上的软件算法(如量子神经网络等)也会形成“百家争鸣”的形式。

量子计算在编码的过程中会不可避免的出现量子噪声,因为量子比特会自己“跳变”,这并不是编码错误,而是因为量子比特很容易退相干,环境的轻微干扰都会使其退相干。而量子比特本身的叠加性和纠缠性也会影响量子比特的“跳变”,这种随机事件很难控制。
高庆博士告诉量子前哨,解决这些问题,可以采取用多余的量子比特来冗余编码,但是这种纠错方法属于“抱薪救火”,因为数据传输的高抗噪声度(high noise immunity)通常借助于具有高冗余度的编码来实现,噪声越大冗余编码数要求越高,但是反过来冗余编码越多噪声也会越大,这很矛盾。
高庆博士总结道,要想实现稳定可靠的量子计算,不能盲目只追求量子比特数规模,高保真度也很重要。
CIM与量子神经网络的天然契合
为什么现在图神经网络在AI中研究的这么火?因为当前面临的图类数据处理量达到了高饱和。可以把CIM看为一个应对图数据研究的专用量子平台,它主要解决的就是组合优化问题(如NP问题、NP-hard问题等),可以直接对接图卷积神经网络进行相关研究,这是CIM的天然优势。
高庆博士提到,图神经网络本身不会像AI一样直接面向任务,它做的事情很简单,就是把信息提取出来然后不断逼近,至于如何将通用性、便利性落地到应用点上,就是后续要思考的问题。例如,北京玻色量子就提供了一个非常好的软硬件平台,但是与实际应用中间就需要一架“神经网络模型”的桥梁,这三者结合形成闭环就能不断推进量子神经网络的商业落地。
高庆博士强调,CIM是一个天然的图结构,本身就可以把原子连接搭建出来,不存在任何图结构编码的问题。目前,最大的技术难点在于量子计算平台的研发,最基础的问题就是其深度和稳定性能否达标。但就目前来看,这一基础问题并没有完全解决。

高庆博士告诉量子前哨:“想要强有力的提升算力,我非常看好图神经网络与CIM天然图结构的结合,这是传统AI无法实现的部分。就算传统AI能够搭建图网络,我们也需要对这些图数据进行特殊处理,也就是图的拓扑结构需要进行编码,在小规模图数据维度上,优势可能不明显,但是在类似工业互联网场景的400亿个节点下,量子神经网络的优势就颇为突出。”
未来量子计算大有可为
高庆博士认为,国内量子计算的布局优势主要有以下几个方面:
第一,量子计算已经上升到国家战略高度,国家对高科技领域的投资越来越科学与谨慎,并邀请相关领域的顶级专家进行多轮论证,为量子计算提供了一个长期稳定健康发展的客观环境,不会像欧美等其他国家一样随着政局的变化而导致政府扶持的中断。
第二,对于科学界来说,底层科研人员的体量大,国内不缺人才。不同于控制理论等涉及严密的数学问题的研究方向,量子计算/量子AI偏工程问题较多,所以一定要犀利的找到市场需求点,解决实际问题。
第三,国家的需求太大,各行各业都需要新的科学技术来赋能,我们国家正处于行业结构转型的重要阶段,传统的行业正在不断的被颠覆,行业的兴衰更替也在不断演进,能很好的促进高科技领域的发展,量子计算产业有望在其中找到足够大的市场和足够多的需求点。
高庆博士说道:“对于我们青年科学家来说,一定要敢于拥抱未来,不要想太多,可能中间会有不可避免的弯路或者低谷期,但也要勇敢前行。新兴领域的投资风险大,在国家给予完备政策支持的条件下,我们作为研究工作者眼光一定要长远,新的革命时代已然到来。”
文:慕一
编辑:王珩