从化学看自然科学中的理论

作者：Dclean
审核：黍离；白書；一毫秒的永恒

人类对自然的认识首先来源于对自然现象的观察，这种观察所形成的直观认识构成了人类史上最原始的一批“知识”。而为了追求更高层次的认知，这些知识被逐渐分类化、逻辑化和系统化，这就产生了“理论”的雏形。

本篇主要讲述科学的理论观，以及在自然科学中理论的地位及其与实践的关系。

第一节 | 学科差异：研究内容与研究方法

我们时常会产生这样的疑问：物理和化学究竟有什么区别？我们也经常看到一些言论，认为化学是物理的分支学科。为思考清楚这样的问题，我们必须认清学科之间的差异到底是什么。

显然，学科之间差异的最直观之处在于他们的研究内容不同。例如人文科学研究人类社会的发展规律，显然与自然科学研究自然世界的运转规律有着本质的区别。但这并不是全部。一个学科知识体系的建立，在有了研究的目标之后，还要有与之相匹配的研究方法。应当认识到，研究内容与研究方法其实是相互选择的。为了对这种相互选择有一个明确而深刻的认识，我们以物理与化学这两门学科的分立为例来讨论这种现象：

物理与化学，作为研究非生物体系的自然科学，表观上来看，研究内容并没有太大的区别。我们在中学阶段应当读到过这样的话：“化学研究的是原子层面以上，直到超分子尺度，这个范围内的物质性质。”但这样的话显然是令人存疑的——为什么很大(宏观——宇观)和很小的尺度(原子层次之下)都是物理的研究范围，而偏偏处于中间的范围给了化学呢？

我们尝试引入一个新概念，称为“观察单位”，其内涵为“研究一个问题时，该问题涉及的客观实在中，作为整体的最基本单位”。我们来考虑初等物理学和初等化学下一般研究的问题的“观察单位”是什么。

在微观领域下，我们研究粒子之间的相互作用，用初等物理学方法处理时，我们的观察单位无疑是一个个粒子，我们可以对粒子或粒子系统列方程，求解其行为(此处仅讨论初等物理学)。同理，在宇观领域中，我们把一个个天体作为研究整体，研究它们之间的相互作用，也可以对一个个天体或天体系统列方程，求解其行为。

可以发现，在化学反应中，根本找不出一个能做到这一点的观察单位。我们无法把一个分子作为观察单位，因为分子在化学反应过程中并不是保持不变的；我们也没办法把原子作为观察单位，因为原子在化学反应中也是得失电子的。我们发现，在化学反应中，我们根本找不出一个能保持自身不变，且自身内部结构对研究问题可以忽略的观察单位！这意味着我们根本无法将描述化学体系的数学方程简化到初等物理的程度。在科学发展的初期，我们的数学能力能够处理的复杂程度仅此而已。因此，我们在学习过程中，在中学阶段，也根本做不到像物理一样，用严格的数学手段去处理问题，只能站在宏观的层面上，用偏经验性的理论来处理。

从这个意义上讲，物理和化学的根本差异是由于他们所研究对象的特征不同而引起的，即研究方法是由研究内容所决定的。但从科学发展史的角度来看，这个顺序也可以是相反的——人们在对自然界的观察过程中，逐渐产生了科学的研究方法，而这种“契合某类客观对象”的研究方法一旦产生，人类对自然的研究行为就会从起初的无意识观察转向应用研究方法进行的观察。人类对自然的观察是有限的，从有限的观察对象总结来的研究方法，是要应用于未曾观察到的对象的，在这个过程中每一种不同的研究方法都会找到与其相适应的研究内容，此时就存在一个反向选择。这种研究内容与研究方法的双向选择就是学科分化的雏形。

第二节 | 理论诞生与学科发展

自然科学领域中理论的最初诞生，本质上是一个将观察得到的结果逻辑化和系统化的过程。理论的诞生使得知识从朴素直观的认知层次上升到逻辑性体系的层次。理论的核心属性在于其逻辑性，而这也正是理论区别于经验结论的关键。

最初的理论是从实验结论中归纳总结而来的，而理论的正确性则是通过更多的实验结论进行检验的。这种思想的合理性是显而易见的，而且一直贯穿了各个领域各个时期的研究。在现在十分热门的机器学习领域中，有Training Set(训练集)和Testing Set(测试集)的概念。为得到关注的自变量与目标变量的关系，将训练集数据使用特定的算法拟合，但是由训练集中的数据拟合得到的关系是不是在更大范围内表现良好的，则需要测试集来检验。若测试集中的自变量经过拟合关系变换后能够输出与实际情况相去不远的目标变量，则说明该学习是比较成功的。但应当注意到，机器学习得到的拟合关系并非是“理论”，只能被称为“经验结论”，只不过该经验结论在数学形式(或逻辑形式)上是清晰严格的。因为这样的结论是计算机通过算法拟合产生的，其本身并没有实际的意义，也不可能从它入手，进行逻辑演绎得到新的结论(理论之间可以互为大小前提，逻辑演绎出新的理论，也可以在体系内互相推导印证，这是理论“逻辑性”的体现)。研究人员进一步从数学关系入手，将物理图像分析明确，得到一个物理意义明确的公式，并能融入到已有的理论体系当中，则可以称得上是上升到了理论的层面。

次生代的理论除了从实验数据中产生，还可以通过已有的理论逻辑演绎得到。这种理论的产生手段在抽象科学中尤其重要，其最突出的代表就是数学的“公理化系统”(当然，公理化系统与自然科学的理论体系还是有着根本性的区别，这种区别是由抽象科学和自然科学研究的对象不同决定的)。前文强调理论的核心属性在于其逻辑性，意义就在于此。

理论的逻辑性在理论的发展和学科的健全中也起着重要的作用。自然科学发展的历史，就是科学的理论从诞生到发展繁荣的历史。自然科学之所以为自然科学，不仅仅是因为其研究的对象是自然界，同时也是因为其理论体系的系统性，而系统性的内在联结正是逻辑性。只有系统性的理论体系才能诞生合理化的纠错机制，而纠错机制对于学科的发展起着至关重要的作用。而与系统理论相对的，是知识堆砌，这样以“拾遗”的方式建立起来的知识集合是破碎而不成体系的，这不仅给学习带来了巨大的困难，而且也给知识正确性的检验带来了极大的障碍，经验学科的弊端就在于此。譬如多年来一直是讨论焦点的中医，由于其建立和发展的年代太过久远，研究者难以互通信息，只能记载自己的所见所闻和实验所得，经年累月而成一套体系，但须知任何实验都是混沌体系，这样的经验累积中，每一环都有可能由于个体差异和条件影响导致结果不可信，这样的错谬累积千年，非但不会自我纠正，反而会愈加放大。最终的结果正如我们看到的样子，一本医书里可以翻出成百上千个没有任何作用的药方(当然也有大量是有用的，正确和错误的实验结论都是随着时间积累的)。而这样的缺陷对于学科的未来发展是致命的——只要知识体系中有较多实践性错误存在，就不可能诞生合理的理论体系。这正是现代科学对于实验结果可重复性如此重视的原因，如果任何人的实验结论都被不加重复的接受，这种随机性错误会随着时间积累，最终导致学科理论体系崩塌。

上文提到，理论体系的系统性和逻辑性对于学习者而言也是重要的。这主要体现在学习者如何来把握知识体系的核心。以文字向学习者阐述理论的内容，与将该理论的建立过程摆在学习者面前，引导学习者自行得出这一理论相比，效果是截然不同的。笔者认为，学习一个领域知识的最佳手段，是沿着该领域理论体系建立的道路学习(当然，也有一些领域学科建立的思路稍显奇特，与认知规律不符，则另当别论，但这样的情况少之又少)，这正是学习科学史的意义。循着理论体系建立的思路来学习，一定程度上将学习者的思维代换为研究者，从研究者的角度可以看到的东西远比从学习者的角度看到的多，这种角色代换会让学习者了解到他所学习的理论是如何得来，又是如何演绎出新的理论的。经过这样的过程，学习者对所学知识的理解将会达到一个极为深刻的层次。显然，只有系统性的逻辑体系才有这样的可能，成系统的知识体系如同开枝散叶的大树，从主干入手，对核心有所把握，就能对一个领域有较为深刻的理解，从而更好地学习分支知识；而知识堆砌则如同一堆石砖，一块一块地堆砌就不会领会到知识中所蕴含的深刻的内容和含义，就不会领会到知识之间的逻辑关联。

这里插一句题外话，尽管目前的自然科学学科都已经有了很完善的理论体系，但学习者学习资源是他们直面的资料。如果资料写的毫无逻辑，硬生生写成知识堆砌，那也就失去了理论体系的优势。

一个学科对于学习者而言的友好程度，直接决定了其发展的速度。这正是现代繁荣的自然科学全都拥有完善的理论体系，而经验科学则在现代逐渐被边缘化的原因之一。

第三节 | 理论与实验的分工合作

有一段话近年来似乎在网上流传颇广：“Theory is when you know everything but nothing works. Practice is when everything works but no one knows why. In our lab ,theory and practice are combined: nothing works and no one knows why.”这段话较为贴合含义的翻译是：“理论工作能理解清楚所有原理但并没有实用价值，实践工作的结果都是有效的但无人能讲清原因。在我们实验室，理论和实践是结合起来的：研究成果全都没用，而且没人知道原因”。最后一句是纯粹的自嘲，大可不看，前两句话说的虽有夸张，但确有几分道理。

笔者的导师曾对笔者说，做计算化学的理想是能够指导实验。如何指导？理论框架合理，计算的结果准确，能为实验预先指出正确的道路，这就是指导实验。但显然，这种理想并不是什么时候都能达成的。很多时候，我们做的研究与实践其实是完全脱节的，但这种脱节绝不代表这样的研究是没有意义的。这样的研究成果的积累，是一个为理论科学添砖加瓦的过程。正如笔者所在的研究所前些年发表在Science(《科学》)上的论文，仅仅是研究了涉及三个原子的化学反应的动力学过程，显然这样的研究与实践应用彻底脱节，但这并不妨碍这是一个足以发表在Science上的优秀工作。新领域的理论工作都是从最简单的情形开始，逐渐发展到能应用于实际体系的。

显然，理论之作用的发挥在于其原理的合理性(此处用合理一词，而非正确，因现有的理论并不能确凿地称之为正确，仅仅是在当前人类认知水平下的合理，此外，对理论进行合理近似也属于合理的范围)。只有合理的理论才能给出贴近事实的结论，这是用事实检验理论合理性的依据。理论对合理性的要求，本质上既是理论方向的优势，也是理论方向的劣势。其优势在于，只要理论是合理的，得到的结果可以排除一切其他因素的干扰，得到完全“干净”的结果，而且这种结果是可以完全重现的，而这一点是实验所无法企及的。其劣势则正如之前所说，必须要预先知道合理的理论，才能做出合理的结果。

而实验在此方面则完全相反，实验的劣势在于不管如何控制条件，即使是条件做到最优秀的控制变量，也不可能控制住所有无关变量完全相同，这使得实验是一个混沌体系，输出的结果重现性远不如理论结果更好。如经常有科研论文发表后，作者收到邮件称按照论文中的方法无法重复，排查原因时发现是用的仪器上沾染了微量的杂质所致，甚至是因为所用的试剂不出自同一生产商导致杂质有微量的不同。而实验的优势则在于，任何实验，只要完成，都会有一个结果，结果的获得并不需要你知道原因，而且这个结果对于实验条件下来说是确切的(但这个“实验条件”确切是什么样子，实验人员是并不知道的，而且也是不可能完全重现的。他们只知道他们可以控制的几个宏观条件，正如上文所述的实验人员，控制了种种变量，但也没有预料到到仪器上沾了一点点没洗掉的杂质)。即使完全不了解原理，实验也经常能给出令人振奋的重大成果。而理论在此方面则无能为力。(应当指出，经验结论在这方面与理论不同。经验结论很多能给出优秀的预测，但人们并不知道它的原理。)

理论和实验的这种互补的特质在实际研究工作中也自然可以起到互补的作用。当实验给出了与理论预测相异的结果时，若排除理论方面的问题，就应当怀疑实验的条件出现了问题，这对实验错误的排查有重要意义。而若一个理论在某一领域普遍出现预测与实际情况相去甚远，则往往说明该理论并不适用于该领域，应当加以改进或提出新的理论。

一般而言，一个健康的学科体系中，理论的发展是要先于实践的。在理论指导下的实验科学发展是十分迅速的，而应用超前于理论的学科，其前沿领域则往往处于瓶颈状态，发展缓慢。