计算基础思想普及之一篇充满常识性错误的JACS文章引发的思考...
从今天起,开设一个新的板块。我们过去介绍了许多做得好的文献工作,可以学习;而与此同时也存在大量反面教材,对于科研工作者从中吸取教训也十分有益处。
今天我们来分享一篇发表于2018年的JACS文章,标题为Visible Light Mediated Generation of trans-Arylcyclohexenes and Their Utilization in the Synthesis of Cyclic Bridged Ethers(J. Am. Chem. Soc. 2018, 140, 31, 9934–9941)。


本文内容很简单,介绍了一个基于激发态分子内亲核加成而构筑桥环醚的方法学。在Ir(ppy)3存在下,底物在蓝光照射下可以发生环化,并且大过量的酸对反应必不可少。甲酸最佳,换成乙酸或三氟乙酸后产率急剧下降。鉴于人们很早就知道环己烯在激发态下容易发生亲核加成,并且通常被认为经历反式环己烯中间体,作者做出了同样的机理假设。
在叙述完反应现象后,作者进入了一个“MECHANISTIC INVESTIGATION”的小节。那么接下来作者进行了什么研究呢?
文章概述
首先作者对底物的构象进行了二维扫描,不过并没有解释这样做的用意何在:

对底物两个芳环与环己烯构成的二面角进行扫描,可以发现存在两个极小值点。接下来作者选取了一个芳基旋转的一维过程,并检查了选取出来的一些点处的激发态能级,得出结论:大多数构象下光催化剂都不足以将能量转移给底物,唯独在二面角接近0度时底物的激发态能级落在了光催化剂的激发态能量范围内,因而是这些构象在能量转移过程中起到了关键角色。
接下来作者正式进入理解反应过程的尝试之中。在重水中进行反应,发现氘代专一地发生在产物中与新形成的C–O键处于反式的位置,从而推测环化过程不可逆;KIE数值为1.5,比较中庸,既不直接对应决速的质子化,也与决速的亲核加成不符。作者认为这是由于整个反应中存在多种质子交换的位点,从而为KIE带来了许多复杂性。
在这些证据不能对机理带来确定的结论的基础上,作者进一步对甲酸的作用进行了研究。核磁滴定表明甲酸跟底物可以形成氢键,因而作者认为这一氢键复合物可能对反应性起到了某些关键作用。于是,作者寻找了甲酸复合物参与反应的过渡态,发现它可以解释观察到的质子化的立体化学。于是,作者做出了结论,甲酸与底物形成了预组织(pre-activation),减少了活化熵,从而促进了反应,全文完。

文章分析
之所以以这篇文章作为典型的反面教材,就是因为其中出现的错误实在是过于低级、又过于严重,足以给初学者敲响警钟。事实上,当稍有经验的读者看到上述截图的图注时,就已经能发现其中的计算方法选择是多么离奇。在Figure 1中,作者使用了MP2/STO-5G水平进行构型优化,随后结合MP2/cc-pVTZ水平进行单点计算,不禁让人怀疑这是否真的是2018年进行的工作。先来说其中采用的STO-5G基组;wikipedia上对STO-nG系列的描述如下:
“STO-nG basis sets are minimal basis sets.”
STO-nG系列被称为“极小基”,即小得不能再小的基组。基组是用于对轨道进行展开的一组基函数,显然基组的质量直接决定了对波函数的描述能力。只有选取大小合适、质量良好的基组,才能得到正确的结果。以甲烷分子为例,STO-5G基组仅包含9个基函数,而被普遍认为属于底线级别的6-31G(d)基组足足包含了23个基函数。显而易见,使用STO-5G根本不可能得到哪怕是定性正确的结果。
相比之下,用于单点计算的cc-pVTZ基组则要大得多,属于可用的范围。但不幸的是,由于构型优化的级别太差,后续单点计算用得级别再高也没用。用STO-5G进行构型优化,再结合cc-pVTZ算单点,这种行为就好比用垃圾堆里捡来的剩菜做一道高级料理,最终只能得到毫无意义的结果。
另一方面,在基组极端错误的同时,计算方法选择MP2也不可接受。在90年代,DFT方法尚未充分发展时,MP2一度比较流行,这是由于同时代更好的方法全都超出了当年计算机的算力水平而不得已为之。随着DFT的发展,MP2已经被彻底淘汰,如今只有理论和教育价值(例如许多理论化学的学生在学习阶段都会编写MP2计算程序作为入门课程)。更加不可接受的是,在本文中作者不仅使用MP2进行势能面扫描,还用它得到激发态能级。由于包括自旋污染在内的一系列问题,MP2面对自由基体系表现很差,这是众所周知的事实;而本文却硬要用它来计算三重激发态的能量;随后通过这些能量来得到“某些构象下才能发生激发态能量转移”的结论更是无稽之谈。
在文章的末尾,在得到环化的过渡态时,作者又将计算水平换成了HF/3-21G。即使是对计算化学完全不了解的读者也能够意识到,在同一篇文章中莫名其妙更换计算方法,说不过去;而事实上, HF甚至还不如MP2;MP2是在HF基础上的改进,引入了一部分动态相关。至于3-21G,同样是一个不可接受的基组。3-21G如今仅有的用武之地是对于一些超大分子,在不感兴趣的区域,可以使用诸如3-21G等粗糙的基组来处理;而本文研究的分子很小,没有任何使用3-21G的理由。不合理的方法再结合不合理的基组,最终得到的过渡态结构和能量都完全不可信。在如此粗糙的计算水平下,作者恐怕只需要几个小时就能完成这篇文章中的全部计算,多快好省,却充满误导性。
由上可知,本文各处使用的计算方法充满了常识性错误,根本不可能得到有意义的结果。而即使忽视这些错误,仅从逻辑上,也无法自圆其说。作者提出甲酸的作用是通过氢键、以预组织的方式降低了活化熵,如果要论证这一点,就必须将反应过程的活化参数计算出来。既然推测甲酸降低了活化熵、进而降低了活化能,那么有甲酸和无甲酸时的活化熵和活化能分别是多少?事实上,既然已经优化出来了过渡态,那么只要对能量进行数据处理,就可以得到这些数据,而作者却完全没有提到,仅仅展示了一个过渡态的几何结构了事。在这个工作中,作者根本没有形成完整的逻辑链,仅仅是在堆叠一些时髦的术语(事实上pre-organization也并不时髦,Houk在上个世纪就已经讨论过许多了)。
由此,我们可以知道,这篇文章从计算方法、到逻辑讨论,都错漏百出。即使有的人可以侥幸发表出来,而如果后来者受其误导,采用相似的方法,则几乎可以肯定会被猛批一番、笑掉大牙了。