理论物理学的原理[112]
各位先生:
首先要衷心感谢你们,这是像我这样的人所能得到的最大恩惠。当选为科学院院士使我可以不必为职业生活而发愁操心,全身心地致力于科学研究。即使我的努力没有换来你们所期望的成果,也请相信我的感激之情和勤勉努力。
接下来,请允许我谈谈我的研究领域,即理论物理学与实验物理学的关系。最近,一位数学家朋友半开玩笑地对我说:“数学家能做许多事情,但肯定做不到你当时想让他做的那些事情。”实验物理学家求教于理论物理学家的时候,情况也往往如此。是什么导致了这种独特的适应性缺乏呢?
理论家的方法是把一般假设或原理用作基础,并从中推导出结论。于是,他的工作可以分成两部分:首先他必须发现那些原理,然后由这些原理推导出结论。他在学校里已经得到了很好的知识和训练,能够顺利完成第二项任务。因此,如果在某个领域或者对于一组相互联系的现象,他的第一个问题已经解决,那么只要他足够勤奋和聪明,就一定能够成功。但上述第一项任务,即确立可以作为推导基础的原理,却与此完全不同。这里并没有什么可以学习和系统运用的方法来达到目标。研究者必须从庞杂的经验事实中觉察出一些可以精确表述的一般特征,才能从自然中获得那些一般原理。
一旦成功作出这种表述,便可得出一连串推论,它们往往会揭示出一些意想不到的关系,远远超出了这些原理所出自的事实领域。然而,只要作为推导基础的原理尚未找到,个别经验事实对于理论家来说就几乎毫无用处。事实上,单靠一些从经验中抽象出来的孤立的一般定律,他什么也做不成。面对着经验研究的个别结果,他将始终无能为力,直至找到那些能够作为演绎推理基础的原理。
关于低温下的热辐射和分子运动定律,目前理论的情况就是这样。大约15年前,还没有人会怀疑,只要把伽利略——牛顿力学应用于分子运动,并且根据麦克斯韦的电磁场理论,就可以正确地解释物体的电学、光学和热学性质。然而普朗克表明,要想建立同经验一致的热辐射定律,就必须使用一种计算方法,它与经典物理学的原理变得越来越不相容。为了使用这种计算方法,普朗克将所谓的量子假说引入了物理学,自那以后,该假说得到了完美地证实。他把这种量子假说应用于以足够低的速度和足够高的加速度运动着的足够小的物体,从而推翻了经典物理学,因此在今天,伽利略和牛顿所提出的运动定律只能被视作极限定律。理论家们尽管已经付出了艰苦的努力,但迄今为止仍然未能用一些满足普朗克的热辐射定律或量子假说的原理来取代力学原理。虽然我们已经确定地表明,热需要由分子运动来解释,但必须承认,我们今天对于这种运动的基本定律的了解,就如同牛顿之前的天文学家对于行星运动的了解一样粗浅。
我刚才提到的一组事实,还没有什么原理能对其做理论处理。但还可能有另外一种情况:由明确表述的原理推导出的结论,完全或几乎完全超出了我们目前经验所及的事实领域。在那种情况下,可能需要多年的经验研究,才能查明这些理论原理是否符合实在。在相对论中就有这样的情况。
对空间和时间这两个基本概念的分析已经表明,由运动物体的光学所给出的真空中的光速不变原理绝不能迫使我们接受静止的光以太理论。恰恰相反,有可能提出一种一般理论来解释这样一个事实:在地球上所做的实验永远也无法揭示地球的任何平移运动。这便会用到相对性原理:从原先的(合理的)坐标系过渡到相对于它做匀速平移运动的新坐标系时,自然定律并不改变形式。该理论已经得到了大量经验验证,也简化了对一组已经有所关联的事实的理论描述。
但另一方面,从理论观点来看,该理论还不能完全令人满意,因为方才表述的相对性原理偏爱匀速运动。如果说匀速运动在物理学上没有绝对意义,那么我们就要问,这种说法是否也应扩展到非匀速运动?事实表明,如果在这种扩展的意义上建立相对性原理,就可以对相对论做出明确的推广。由此引出了一种包括动力学的广义引力论。但我们暂时还缺乏必要的事实来检验引入这个假设的原理是否正当。
业已查明,归纳物理学会向演绎物理学提出问题,演绎物理学也会向归纳物理学提出问题,回答这些问题需要我们全力以赴。愿我们团结起来,群策群力,不用多久就能取得重大突破!
[112]1914年在普鲁士科学院的就职演说。爱因斯坦于1913年成为普鲁士科学院院士,希特勒上台后,他便辞去了这一职位(参见本书《与普鲁士科学院的通信》一文)。本文发表在《普鲁士科学院学报》(Proceedings of the Prussian Academy of Sciences, 1914)。
研究的原则[113]
科学的圣殿是一座多层楼阁,住在里面的人真是各种各样,引导其进入的动机也各不相同。有些人喜欢科学是因为他们出众的智力能够带来愉快的感受,科学是一项与之相称的活动,可以带来生动而强烈的体验,并使其雄心壮志得到满足。还有不少人仅仅出于功利目的而把智力成果供奉到这座圣殿里。倘若上帝的天使跑来把这两类人都赶出圣殿,那里就有被清空的可能,但仍有一些人会留在圣殿里,古人和今人都有。我们的普朗克就是其中之一,这正是我们爱戴他的原因。
我当然知道,方才在想象中会把许多卓越的人扫地出门,他们为建造这座科学圣殿做出了很大贡献甚至是主要贡献;在许多情况下,我们的天使也会难以定夺。但有一点我可以肯定,倘若圣殿里只有被驱逐的那两类人,那么这座圣殿就永远不可能建成,正如只有蔓草就长不成森林。对于这些人来说,其实从事任何人类活动都行,他们最终成为工程师、官员、商人还是科学家,完全取决于外在环境。
现在我们再来看看那些受天使宠爱的人。他们大都有些特立独行和不善交际,但除了这些共同特征,他们彼此之间的相似之处却不及被赶走的那群人。是什么东西把他们引入了这座圣殿呢?回答这个问题并不容易,而且肯定不能一言以蔽之。首先,我同意叔本华所说,把人引向艺术和科学的最强烈的动机之一,是逃离日常生活中令人痛苦的粗俗和令人绝望的空虚,摆脱变化无常的欲望的束缚。与世无争者渴望逃离个人生活,进入客观现象和思想的世界。这种动机就如同城市里的人不由自主地渴望逃离喧闹拥挤的环境,躲进幽静的高山,透过清澄纯净的空气举目远眺,沉醉于似乎为永恒而造的宁静景致。
不过,除了这种消极的动机,还有一种积极的动机。人们总想以某种适合自己的方式建立一幅简化的、可理解的世界图像,并试图用这幅图像来取代和克服经验世界。这就是画家、诗人、思辨哲学家和自然科学家以各自的方式去做的事情。每个人都把这幅图像及其构造当作其感情生活的中心,在狭窄而混乱的个人经验领域找到那份久违的平和与安定。
在所有这些可能的世界图像中,理论物理学家的世界图像占据着什么位置呢?它要求以最大的严密性和精确性来描述各种关系,而这只有用数学语言才能达到。为此,物理学家必须严格限制自己的主题:他必须满足于描述我们经验所能给出的最简单的事件;企图以理论物理学家所要求的那种精密性和逻辑性把一切更为复杂的事件重构出来,超出了人类理智的能力。要想得到高度的纯粹性、清晰性和确定性,就要牺牲完备性。但如果畏缩而胆怯地把一切较为微妙复杂的东西都撇开不管,那么彻底认识自然界的一小部分还有什么吸引力呢?这种谦卑的努力成果配得上“世界图像”这个高贵的名号吗?
我认为是配得上的,因为理论物理学的思想大厦所基于的一般定律声称对任何自然现象都有效。有了它们,就可以通过纯粹的思想推导来描述包括生命过程在内的一切自然过程,也就是得出关于这些过程的理论,除非这种推导过程远远超出了人类的理智能力。因此,放弃物理世界图像的完备性倒不是什么原则性的问题。
因此,物理学家的最高使命是寻求那些最一般的基本定律,由它们推导出世界图像。这些定律的发现并无逻辑途径可循,只有通过建立在经验同感基础上的直觉才能得到这些定律。由于这种方法论上的不确定性,人们可能以为这样就会有任意多个理论物理学体系具有同样的合理性。从理论上讲,这种看法无疑也是正确的。但物理学的发展已经表明,在任何时候,在所有可能设想的构造中,总有一个远远优于所有其他构造。凡是真正深入研究过这个问题的人都不会否认,其实,现象世界唯一决定了理论体系的是现象世界,尽管现象与理论原理之间并无逻辑桥梁。这就是莱布尼茨欣然说的“前定和谐”。物理学家们常常指责研究认识论的人对此不够重视。在我看来,几年前马赫和普朗克之间的论战,其根源就在这里。
渴望看到这种前定和谐乃是无穷的耐心与毅力的源泉。我们看到,普朗克正是怀着这种渴望而致力于这门科学中最一般的问题,而不是让自己分心于那些更能取悦人和更容易达到的目标。我的同事们常常把他的这种态度归功于非凡的意志力和磨炼,我认为这是完全错误的。促使人去从事这种工作的情感状态类似于宗教信徒或谈恋爱的人,他们每天的努力并非源于事先的意图或计划,而是源于一种直接的需求。
我们敬爱的普朗克就坐在这里,内心在笑我像孩子一样提着第欧根尼的灯笼闹着玩。我们对他的爱戴无须做俗套乏味的说明。希望对科学的爱能继续照亮他的道路,引领他去解决今天最重要的物理学问题。他本人提出了这个问题,并已朝着问题的解决推进了一大步。祝愿他能把量子论同电动力学和力学成功地统一在一个逻辑一致的体系中。
[113]1918年在柏林物理学会所作的马克斯·普朗克六十岁生日宴会上的讲话,收录于1934年《我的世界观》。普朗克曾任柏林大学理论物理学教授多年,他对物理学所作的最杰出的贡献是1900年提出的量子论,这为现代原子物理学的整个发展奠定了基础。普朗克之后,爱因斯坦在这个新的领域做出先驱性的工作,特别是他的光量子或光子理论(1905年)以及比热理论(1907年)。爱因斯坦比其他任何人更能觉察到,量子概念在物理学的各个分支都发挥着基础性作用。
什么是相对论?[114]
我很高兴应你们的同事之邀,为《泰晤士报》写点关于相对论的东西。在学者之间曾经活跃的交往令人惋惜地中断之后,很高兴借此机会来表达我的喜悦和对英国天文学家和物理学家的感激之情。贵国著名科学家花费了大量时间和精力,科研机构也耗费了大量财力,以检验战争期间在你们敌国发表和完善的一种理论,这充分彰显了贵国伟大而光荣的科学研究传统。虽然太阳引力场对光线的影响是一个纯粹客观的研究主题,但我还是忍不住要以我个人的名义对英国同事们的工作表示感谢。正因为这项工作,我才得以在有生之年看到我的理论蕴含的最重要结论得到验证。
我们可以把物理学理论分成不同种类。大多数理论是构造性的,它们试图从相对简单的形式体系出发,在此基础上构造出更复杂现象的图像。气体运动论就试图把机械的、热的扩散过程还原为分子运动,即由分子运动假说构造出这些过程。当我们说理解了一组自然过程时,我们的意思永远是,已经找到了一种构造性的理论来描述这些过程。
除了这一类重要的理论,还有第二类理论,我称之为“原理性理论”。它们使用的是分析法,而非综合法。构成其基础和出发点的要素不是由假说构造出来的,而是在经验中发现的自然过程的一般特征。这些原理给出了自然过程或其理论描述所必须满足的用数学表达的标准。热力学就试图运用分析法,从永恒运动不可能这一普遍的经验事实出发,推导出各个事件必须满足的必要条件。
构造性理论的优点在于完整性、适应性和清晰性,原理性理论的优点则在于逻辑的完美性和基础的可靠性。
相对论属于原理性理论。为了理解它的本质,首先要理解它所基于的原理。但在讲这些之前,必须指出,相对论就像一座由狭义相对论和广义相对论组成的双层建筑。作为广义相对论之基础的狭义相对论适用于除引力以外的一切物理现象,广义相对论则给出了引力定律以及引力与其他自然力的关系。
当然,自古希腊时代起,人们就已经知道,要想描述一个物体的运动,需要有另一个物体作为前一物体运动的参照。车子的运动是参照地面来说的,行星的运动则是参照所有可见恒星来说的。在物理学中,诸事件在空间上参照的东西被称为坐标系。例如,伽利略和牛顿的力学定律只有借助于坐标系才能表述出来。
然而,要使力学定律有效,坐标系的运动状态不能任意选取(它必须没有转动和加速)。力学中所容许的坐标系被称为“惯性系”。按照力学,惯性系的运动状态并非由自然界唯一决定。恰恰相反,以下定义是成立的:相对于惯性系做匀速直线运动的坐标系同样是惯性系。所谓“狭义相对性原理”是指把这个定义推广到包含一切自然事件。于是,凡是对坐标系C有效的普遍自然定律,对于相对C做匀速平移运动的坐标系C'也必定有效。
狭义相对论所基于的第二条原理是“真空中光速不变原理”。这条原理断言,光在真空中总有一个确定的传播速度,同观测者或光源的运动状态无关。物理学家对这条原理的信任源于麦克斯韦和洛伦兹的电动力学所取得的成功。
上述两条原理都得到了经验的强有力支持,但在逻辑上似乎并不相容。通过修改运动学,即(从物理学的观点)与空间和时间有关的定律的学说,狭义相对论最终成功地使它们在逻辑上协调了起来。于是,除非相对于某个给定的坐标系,否则说两个事件是同时的就没有意义,测量工具的形状和时钟的快慢都必定依赖于它们相对于坐标系的运动状态。
然而,包括伽利略和牛顿的运动定律在内的旧物理学并不符合新的相对论运动学。如果上述两条原理真的适用,那么自然定律就必须服从由相对论运动学得出的一般数学条件。物理学不得不适应这些条件。特别是,科学家们得到了一条关于高速运动质点的新运动定律,它在带电粒子的情况下已经得到了美妙的证实。狭义相对论最重要的结论与物体系统的惯性质量有关,该结论是,系统的惯性必然依赖于它所含的能量。由此立即可以得出,惯性质量不过是潜在的能量罢了。质量守恒原理失去了它的独立性,同能量守恒原理融合在一起。
狭义相对论不过是对麦克斯韦和洛伦兹电动力学的系统发展罢了,但又指向它自身之外。难道物理定律与坐标系的运动状态无关仅限于坐标系彼此之间的匀速平移运动吗?大自然与我们的坐标系及其运动状态有什么关系呢?如果为了描述自然界而必须使用一个由我们随意引入的坐标系,那么对这个坐标系运动状态的选择就不应受到任何限制。定律应与这种选择完全无关(广义相对性原理)。
人们早已知晓的一个经验事实能使这条广义相对性原理更容易建立起来,那就是:物体的重量和惯性受制于同一个常数(惯性质量与引力质量相等)。设想有一个坐标系相对于另一个牛顿意义上的惯性系做匀速转动。根据牛顿的教导,相对于这个坐标系所显示出来的离心力应被视为惯性的效应。但就像重力一样,这些离心力与物体的质量成正比。在这种情况下,我们为什么不能把这个坐标系看成静止的,而把离心力看成引力呢?这种观点似乎是显而易见的,却不为经典力学所容。
以上简短的思考暗示,广义相对论必须给出引力定律,而对这种想法的持续探索已经证明我们的希望是合理的。
不过,这条道路的困难程度超出了我们的预想,因为它要求放弃欧几里得几何学。也就是说,物体在空间中的排列所遵循的定律,并不完全符合欧几里得几何学为物体指定的空间定律。这就是我们所谓“空间弯曲”的意思。“直线”“平面”等基本概念也因此失去了在物理学中的精确含义。
在广义相对论中,关于空间和时间的学说即运动学已不再与物理学的其余部分无关。物体的几何行为和时钟的运转都依赖于引力场,而引力场又是由物质产生的。
从原理上看,新的引力论与牛顿理论相去甚远,但实际结果却与牛顿理论的结果非常接近,以至于很难找到经验判据来区分它们。迄今为止,我们找到的这种判据有:
1.行星椭圆轨道的绕日旋转(在水星的例子中已经得到证实)。
2.引力场所引起的光线弯曲(已为英国人的日食照片所证实)。
3.从大质量的恒星发射到我们这里的光,其谱线朝着光谱的红端移动(尚未证实)。[115]
该理论的最吸引人之处在于逻辑的完备性。只要有一个它所推出的结论被证明是错误的,它就必须被放弃。不摧毁其整个结构而对它进行修改,似乎是不可能的。
然而,不要以为牛顿的伟大工作果真能被这种理论或任何其他理论所取代。作为整个近代自然哲学概念结构的基础,他那些伟大而明晰的观念将永葆其独特意义。
[114]应《伦敦时报》(The London Times)之邀撰写,发表于1919年11月28日。
[115]此判据后来已被证实。
几何学与经验[116]
数学之所以比其他一切科学享有特殊的声誉,一个原因在于,它的命题是绝对确定和不容置疑的,而其他所有科学的命题在某种程度上都是有争议的,而且总有被新发现的事实推翻的危险。不过,其他科学领域的研究者也没有必要羡慕数学家,因为数学命题只涉及我们想象中的对象,而不涉及实在对象。如果已就基本命题(公理)以及由此推导出其他命题的方法达成一致,那么得出一致的逻辑结论不足为奇。但数学之所以有这么高声誉,还因为数学赋予了精确自然科学以某种程度的确定性,如果没有数学,这些科学是达不到这种确定性的。
这里有一个谜激起了古往今来研究者的兴趣。数学既然是人类思想的产物,而不依赖于经验,它为何能够如此成功地符合实在对象呢?那么,是不是不要经验只靠思想,人的理性就能彻底了解实际事物的性质呢?
我认为,对这个问题的回答简要说来就是:数学命题只要涉及实在,就不是确定的;只要是确定的,就不涉及实在。在我看来,只有通过数学中所谓的“公理学”倾向,这种事态才能完全清晰起来。公理学取得的进步在于把“逻辑的–形式的”东西同事实的或直观的内容清楚地分离开来。根据公理学的说法,数学对象仅仅是“逻辑的–形式的”东西,而不涉及直观的或与“逻辑的–形式的”东西有关的其他内容。
我们暂且从这个观点来考察任何几何学公理,比如:过空间中的两点总有一条而且只有一条直线。如何在较早的意义和较为现代的意义上来解释这条公理呢?
较早的解释:人人都知道什么是直线,什么是点。这种知识究竟来自人的心灵能力还是来自经验,来自这两者的共同作用还是来自其他来源,无须由数学家来决定,他把这个问题留给了哲学家去探讨。上面那条公理以这种先于一切数学的知识为依据,它和其他一切公理一样是自明的,也就是说,它所表达的是这种先验知识的一部分。
较为现代的解释:几何学处理的对象由“直线”“点”等一些词来称呼。这些对象并不预设任何知识或直观,而只以公理(比如上面那条公理)的有效性为前提,这些公理需要在缺乏一切直观或经验内容的纯形式意义上来理解。这些公理是人类心灵的自由创造。其他一切几何学命题都是这些(从唯名论意义上来理解的)公理的逻辑推论。公理定义了几何学处理的对象。因此,石里克在他的一本认识论著作中非常恰当地将公理称为“隐定义”。
现代公理学所倡导的这种公理观清除了数学的一切外在要素,从而也驱散了以前笼罩着数学基础的神秘疑云。但这样一种经过删减的阐释也清楚地表明,数学本身对于直观想象的对象或实在对象不能作出任何断言。在公理几何学中,只能把“点”“直线”等词理解成没有内容的概念框架。至于是什么东西赋予了它们内容,则与数学无关。
但另一方面,一般的数学尤其是几何学之所以产生,肯定是为了了解实际物体的行为。“几何学”一词的原义“土地测量”已经证明了这一点,因为土地测量涉及某些自然物(即土地的部分、量线、量杆等)彼此之间排列的可能性。仅有公理几何学的概念体系显然无法对这种实际对象(我们将称之为“准刚体”)的行为作出任何断言。为了能够作出这种断言,几何学必须把实际的可经验对象与公理几何学空的概念框架协调起来,从而去掉其纯逻辑–形式特征。为了做到这一点,我们只需加上这样一个命题:刚体之间可能的排列关系就像三维欧几里得几何学中的形体一样。这样一来,欧几里得几何学的命题就包含了关于准刚体行为的断言。
这样补充的几何学显然是一门自然科学,我们甚至可以把它看成最古老的物理学分支。它的断言实质上基于经验归纳,而不仅仅基于逻辑推理。我们把这样补充的几何学称为“实用几何学”,并把它同“纯公理几何学”区分开来。宇宙的实用几何学究竟是不是欧几里得几何学,这个问题有着明确的意义,其答案只能由经验来提供。如果采用光沿直线传播这条经验定律,即光在实用几何学的意义上沿直线传播,那么物理学中的一切长度测量都属于这种意义上的实用几何学,测地学和天文学中的长度测量也是如此。
这种对几何学的看法对我有特殊的意义,因为没有它我就提不出相对论。也就是说没有它,以下考虑就不可能:在一个相对于惯性系转动的参照系中,由于洛伦兹收缩,刚体的排列定律不再符合欧几里得几何学的规则;于是,如果承认非惯性系也有同等地位,就必须放弃欧几里得几何学。如果没有上述解释,就一定不会采取通往广义协变方程的决定性步骤。如果拒绝承认欧几里得公理几何学的形体与实际的准刚体之间的关系,我们就很容易得出敏锐而深刻的思想家彭加勒所主张的观点:欧几里得几何学以其简单性胜过了所有其他可以设想的公理几何学。现在,由于仅凭公理几何学并不能对可经验的实在做出断言,而只有结合物理定律才能做到这一点,因此无论实在的本性如何,保留欧几里得几何学应当是可能的,而且也是合理的。因为一旦理论与经验之间出现矛盾,我们宁可改变物理定律,也不愿改变欧几里得的公理几何学。事实上,如果拒绝承认准刚体与几何学之间的关系,我们就难免会约定,应把欧几里得几何学当作最简单的几何学予以保留。
彭加勒等研究者为何拒不承认准刚体与几何形体之间如此明显的等价性呢?那是因为经过进一步考察可以发现,自然之中的实际固体并不是刚性的,因为它们的几何行为(即它们相对排列的各种可能性)依赖于温度、外力,等等。于是,几何学与物理实在之间原初的直接关系似乎遭到了破坏,我们不得不倾向于以下更一般的观点,这也是彭加勒观点的典型特征:几何学(G)并不断言实际物体的行为,只有几何学加上全部物理定律(P)才能做到这一点。如果用符号来表示,我们可以说:只有(G)+(P)才能得到实验验证。于是,(G)可以任意选取,(P)的某些部分也可以任意选取,所有这些定律都是约定。为了避免矛盾,需要注意的是如何选取(P)的其余部分,使得(G)与全部(P)合起来能够符合经验。根据这种理解,公理几何学和已经约定的那部分自然定律在认识论上似乎是等价的。
我认为,从永恒的观点来看,彭加勒是正确的。量杆的观念以及在相对论中与之协调的时钟的观念在现实世界中是找不到与之完全对应的东西的。同样明显的是,在物理学的概念大厦中,固体和时钟并非不可还原的要素,而是有着复合的结构,它们在理论物理学中不能扮演任何独立角色。但我相信,在现阶段的理论物理学中,这些概念仍要作为独立概念来使用,因为我们还不够了解原子结构的理论原理,使我们能从理论上由基本概念构造出固体和时钟。
此外,有人反驳说,自然之中没有真正的刚体,因此所讲的刚体性质并不适用于物理实在。初看起来,这种反驳似乎很深刻,但其实不然。因为我们不难精确地确定测量物体的物理状态,使之相对于其他测量物体的行为清晰到足以用它来代替“刚”体。关于刚体的陈述正是相对于这种测量物体而言的。
整个实用几何学都基于一条为经验所能及的原理,我们现在就来回想一下。假设在一个准刚体上标出两个记号,并把这样一对记号称为一个截段。我们设想有两个准刚体,在每一个上面都标出一个截段。如果一个截段的两个记号能与另一个截段的两个记号永远重合,那么就说这两个截段“彼此相等”。我们现在假定:
如果两个截段在某时某地相等,那么不论在何时何地都永远相等。
不仅欧几里得的实用几何学,而且它最近的推广即黎曼的实用几何学以及广义相对论,也都以这一假定为基础。我只讲一个实验根据来证明这一假定是正确的。光在真空中的传播为每一段局域时间都指定了一个截段,即相应的光程,反之亦然。因此,上述关于截段的假定在相对论中也必定适用于时钟的时间间隔。因此可以作如下表述:如果两个理想时钟在某时某地走得同样快慢(那时它们相互紧靠),那么无论何时何地,当它们再在同一地点进行比较时,它们都将走得同样快慢。如果这条定律对于自然时钟无效,那么同一种化学元素的各个原子的本征频率就不会像经验显示的那样完全一致。锐谱线的存在是对上述实用几何学原理的令人信服的实验证明。归根结底,这个理由使我们能够有意义地谈论四维空–时连续体的黎曼度规。
根据这里主张的观点,这个连续体的结构究竟是欧几里得的、黎曼的还是其他的,是一个必须由经验来回答的物理学问题,而不是一个为求方便而进行选择的约定问题。如果所考察的空–时区域越小,准刚体的排列定律就越接近于欧几里得几何形体的定律,那么黎曼几何学就是适用的。
这里提出的对几何学的物理解释虽然在直接应用于亚分子量级的空间时失败了,但即使在那些关于基本粒子构成的问题中,它也仍然有部分意义。因为即使是对构成物质的带电基本粒子进行描述,也仍然可以尝试把物理意义赋予那些原本为了描述比分子大的物体的几何行为而进行物理定义的场的概念。要求黎曼几何的基本概念在其物理定义的范围之外仍然有物理实在性,这种尝试是否正当,只有靠成功与否来判断。也许结果会表明,这种外推并不比把温度概念外推到分子量级的物体部分上去更恰当。
把实用几何学的概念扩展到宇宙量级的空间上去似乎不太成问题。也许有人会反驳说,由固体杆组成的结构的空间范围越大,它距离刚性理想就越远。但这种反驳大概很难有什么根本意义。在我看来,宇宙在空间上是否有限,是完全有意义的实用几何学问题。我甚至认为,天文学可能不用多久就能回答这个问题。让我们回忆一下广义相对论在这方面的教导。它提供了两种可能性:
1.宇宙在空间上是无限的。这只有当宇宙中集中在星体里的物质的平均空间密度等于零时才有可能,也就是说,只有让所考察的空间变得越来越大,使得星体的总质量与散布着星体的空间体积之比无限地趋近于零时,才有可能。
2.宇宙在空间上是有限的。如果宇宙空间中有重物质的平均密度不等于零,则这种可能性必然成立。平均密度越小,宇宙的体积就越大。
必须指出,支持有限宇宙假说有一个理论根据。广义相对论告诉我们,物体近旁的有重物质越多,它的惯性就越大。因此,将一个物体总的惯性归结为它与宇宙中其他物体的相互作用似乎是很自然的,事实上,自牛顿以来,重力已被完全归结为物体之间的相互作用。由广义相对论的方程可以推出,只有当宇宙在空间上有限时,才能把惯性完全归结为质量之间的相互作用(如马赫所要求的)。
许多物理学家和天文学家并不看好这种论证。归根结底,只有经验才能决定这两种可能性中哪一种在自然界中得到了实现。经验如何能够提供答案呢?初看起来,似乎可以通过可观察的那部分宇宙来测定物质的平均密度。这种希望是不现实的。可见星体的分布是极不均匀的,没有理由认为,宇宙中星体物质的平均密度等于比如说银河系中的平均密度。无论如何,不论所考察的空间有多大,都不能确定在这个空间之外没有更多的星体。因此,估算平均密度似乎是不可能的。
但还有一条道路在我看来是更加可行的,尽管它也存在着很大困难。如果研究广义相对论的可由经验验证的推论与牛顿理论的推论之间的偏差,那么我们首先会在引力物质附近发现偏差,这已在水星的例子中得到了确证。但如果宇宙在空间上是有限的,那么就会与牛顿理论有第二个偏差,用牛顿理论的语言可以这样表述:引力场似乎不仅由有重物质产生,还由均匀分布于空间中的带负号的质量密度产生。由于这个虚设的质量密度必定极小,只有在非常巨大的引力系统中才觉察得到。
假定已知星体在银河系中的统计分布和质量,然后根据牛顿定律,就可以计算出引力场,以及为使银河系在其各个星体的相互吸引下不会坍塌而是保持其实际大小,这些星体所必须具有的平均速度。如果星体实际的平均速度——它们能被测量出来——小于计算出来的速度,我们就能证明,在远距离处的实际吸引力小于根据牛顿定律计算出来的结果。由这样一个偏差就可以间接证明宇宙是有限的,甚至可以估计它的空间大小。
我们能否想象一个有限但无界的三维宇宙呢?
对于这个问题,通常的回答是“不能”,但这是错误的。接下来我要向大家说明,回答应该是“能”。我们不难用一种心灵图像来说明有限宇宙的理论,经过一些练习,我们很快就能习惯。
首先要考察一下认识论的性质。几何–物理理论本身是无法直接描绘的,它仅仅是一组概念。但这些概念能将心灵中各种实际的或想象的感觉经验联系起来。因此,“想象”一种理论,就意味着想起理论为之提供示意排列的大量感觉经验。就目前的例子而言,我们必须问,如何描述固体相互排列(接触)的行为,才能符合有限宇宙的理论。对此我要说的其实并没有什么新东西,但向我提出的无数问题都表明,对这些事情有兴趣的人的好奇心尚未完全得到满足。因此,对于我所要讲的众所周知的内容,还望内行谅解。
当我们说空间是无限的时候,我们是想表达什么呢?这仅仅是说,我们可以一个挨一个地摆放任意数量的同样大小的物体,而永远填不满空间。假定我们有许许多多同样大小的方盒。按照欧几里得几何学,我们可以把它们上下、左右、前后地堆放起来,以填满空间的任意大小的部分。但这样的构造永远不会结束。无论我们添加多少个方盒,都有地方再放。这就是我们说空间是无限的意思。更好的说法是,假定这些物体的排列定律是由欧几里得几何学所规定的,那么空间对于准刚体就是无限的。
平面是无限连续体的另一个例子。我们可以在一个平面上摆放许多方卡片,使任一张卡片的每一边都是另一张与之相邻的卡片的边。这种构造永无止境。我们可以一直摆放卡片,只要其排列定律符合欧几里得几何学的平面图形的排列定律。因此,对于这些方卡片来说,平面是无限的。相应地可以说,平面是二维的无限连续体,空间是三维的无限连续体。至于这里所说的维数是什么意思,我想大家都是知道的。
现在我们举一个有限但无边界的二维连续体的例子。我们设想有一个大球的表面和一些大小相同的小圆纸片。将一张纸片放在球面上的任何地方。如果在球面上随意移动纸片,那么在此过程中是碰不到边界的,因此我们说,球面是一个无界的连续体。同时,球面又是一个有限的连续体,因为如果将纸片贴在球上,使各个纸片不互相重叠,则球面最后会被贴满,无法再多贴一张纸片。这正意味着球面对于纸片来说是有限的。此外,球面还是一个二维的非欧几里得连续体,也就是说,球面上的刚性图形所依据的排列定律并不符合欧几里得平面的那些定律。这可以用以下方式来说明。用六张纸片围住一张纸片,其中每一张再用六张纸片围住,这样继续下去。如果在平面上进行这种构造,则这个过程没有尽头,除了最外圈,每一张纸片都与六张纸片相接触。而在球面上,这种构造起初似乎也有成功的希望,纸片半径相对于球的半径越小,这种希望似乎就越大。但随着构造的进行,情况变得越来越明显,不可能没有间断地按照上述方式将纸片排列下去。然而按照欧几里得的平面几何学,这种构造应当是可能的。这样一来,那些无法离开球面、甚至也无法从球面窥入三维空间的生物,只要用纸片来做实验,就能发现自己的二维“空间”不是欧几里得空间,而是球面空间。
根据相对论的最新研究成果,我们的三维空间或许也近似于球面空间。也就是说在这个空间里,刚体的排列定律不是由欧几里得几何学规定的,而是近似地由球面几何规定,只要我们考察的那部分空间足够大。到了这里,读者可能会难以接受。“没有人能想象这种东西,”他会愤怒地喊道,“它可以这样说,但不能这样想。我完全可以想象一个球面,但想不出三维的与球面类似的东西。”
图1
我们必须尝试克服这种心理障碍。耐心的读者会发现,做到这一点并非特别困难。为此,我们再来看看二维球面的几何学。在附图中,设K是球面,它在S处与平面E相接触。为方便起见,这里把平面E画成一个有边界的表面。设L是球面上的一个圆纸片,想象球面上与S径向相对的点N有一个发光点,它在平面E上投下纸片L的影子L'。球上每一点在平面上都有影子。球K上的纸片如果移动,则平面E上的影子L'也会移动。当纸片L移动到S时,它几乎与影子完全重合。如果纸片L在球面上从S向外移动,则平面上纸片的影子L'也会从S向外移动,并且变得越来越大。随着纸片L接近发光点N,影子将移向无穷远的地方,变得无限大。
图2
现在我们提出这样一个问题:纸片在平面E上的影子L'的排列定律是怎样的呢?显然,它们与纸片L在球面上的排列定律是完全一样的。因为对于K的每一个图形,E上都有一个对应的影子图形。如果K上的两张纸片彼此接触,则它们在E上的影子也彼此接触。平面上的影子几何学与球面上的纸片几何学完全一致。如果把纸片影子称为刚性图形,那么对于这些刚性图形,球面几何同样适用于平面E。特别是,平面对于纸片影子是有限的,因为只有有限个数的纸片影子可以在平面上占到位置。
这里,有人会说:“那是胡说。纸片影子不是刚性图形。只要拿一根尺子在平面E上移动,就能使我们确信,当影子在平面上从S移向无穷远时,影子的大小一直在增长。”但如果这根尺子也和纸片影子L'一样可以在平面上伸缩,那又将怎样呢?那样一来,就不可能表明影子离开S时大小会增长,这种断言将不再有任何意义。事实上,关于纸片影子只能作这样一个客观断言:纸片影子的相互关系与欧几里得几何学意义上的球面上的刚性纸片完全相同。
我们必须谨记,只要无法把纸片影子与那些能在平面E上运动的欧几里得刚体做比较,关于纸片影子增长(随着它们从S移向无穷远处)的陈述本身就没有客观意义。无论认为S点在平面上还是在球面上,都不会影响影子L'的排列定律。
将球面几何在平面上表示,对我们来说很重要,因为很容易把它转换到三维的情况。
想象空间中有一个点和很多小球L',所有这些小球都能彼此重合。但这些球并不是欧几里得几何学意义上的刚性球,当它们从S移向无穷远处时,其半径会增长(在欧几里得几何学的意义上),这种增长所遵循的定律与平面上纸片影子L'的半径增长定律完全一样。
在对我们这些L'球的几何行为获得一幅生动的心理图像之后,让我们假定这个空间里根本不存在欧几里得几何学意义上的刚体,而只存在具有这种L'球的行为的形体。于是,我们将得到一幅关于三维球面空间的清晰图像,或者说关于三维球面几何的清晰图像。这里必须把我们这些球称为“刚性”球。当它们离开S时,其大小的增长无法用量杆量度出来,就像平面E上纸片影子的情况一样,因为量度标准的行为与这些球是相同的。空间是均匀的,也就是说,每一点的附近可以有同样的球的排列。[117]我们的空间是有限的,因为由于球的“增长”,只有有限个球能在空间中占到位置。
于是,借助于欧几里得几何学所赋予的思考和想象,我们获得了一幅关于球面几何的心理图像。通过特殊的想象构造,不难使这些观念更富深度和活力。同样,也不难描述所谓椭圆几何的情形。我今天唯一的目的就是表明,人的想象能力对于非欧几里得几何学绝非无能为力。
[116]1921年1月27日在普鲁士科学院的演讲。
[117]如果再次回到球面上圆纸片的情况,那么这一点无须计算就能理解——不过只限于二维情形。——作者注
关于相对论[118]
有幸在贵国首都发表演讲,我感到特别高兴。贵国是理论物理学许多最重要基本概念的发源地,比如牛顿关于物体运动和引力的理论,还有法拉第和麦克斯韦的电磁场概念,都把物理学置于新的基础之上。事实上,可以说相对论为麦克斯韦和洛伦兹宏伟的思想大厦画上了最后一笔,因为它试图把场物理学扩展到包括引力在内的一切现象。
回到相对论本身,我想请大家注意,这个理论并非起源于思辨,发明它完全是为了让物理学理论尽可能地符合观察到的事实。相对论并无革命之举,而只是自然地延续了一条可以往前追溯几个世纪的线索。放弃与空间、时间和运动有关的某些既定的基本概念绝非武断随意,而是由观察事实决定的。
电动力学和光学的发展确证了真空中的光速不变定律,迈克尔孙的著名实验则以特别精确的方式证明,所有惯性系都有平等的合理性(狭义相对性原理)。这两者使时间概念必须成为相对的,每一个惯性系都要有自己的特殊时间。随着这一观念的发展,我们已经看得很清楚,直接经验与坐标和时间之间的关联此前从未得到足够精确的思考。
总体而言,相对论的本质特点之一在于更清楚地揭示一般概念与经验事实之间的关系。这里的基本原则是,一个物理概念是否正当,完全取决于它与所经验的事实之间是否有清晰明确的关系。根据狭义相对论,空间坐标和时间仍然有一种绝对性,因为它们都可以用静止的时钟和物体来直接测量,但就其依赖于所选择惯性系的运动状态而言,则是相对的。根据狭义相对论,由空间和时间结合而成的四维连续体(闵可夫斯基)仍然保持着绝对性,而根据之前的理论,这种绝对性分别属于空间和时间。(相对于坐标系的)运动对物体形状和时钟运转的影响,以及能量与惯性质量的等价性,都源于把坐标和时间解释成测量的产物。
广义相对论之所以产生,首先是因为物体的惯性质量与引力质量在数值上相等,而这个经验事实是经典力学所无法解释的。把相对性原理扩展到彼此相对加速的坐标系,就可以得到这样的解释。引入相对于惯性系加速的坐标系,就会出现相对于惯性系的引力场。其结果是,以惯性与重量相等为基础的广义相对论提供了一种引力场理论。
正如惯性与重量相等所决定的那样,将彼此相对加速的坐标系作为同样合法的坐标系引入进来,并与狭义相对论的结论相结合,便可得到以下结论:有引力场存在时,支配固体在空间中排列的定律并不符合欧几里得几何学的定律。对于时钟的运转也可得到类似的结果。于是,我们不得不对空间和时间理论做另一种推广,因为通过用量杆和时钟而获得的测量结果来直接解释空间和时间坐标现在站不住脚了。对度规的这种推广——高斯和黎曼的研究已经在纯粹数学领域实现了这一点——本质上基于以下事实:在一般情况下仍然可以声称,狭义相对论的度规对于小区域是有效的。
这里概述的发展过程剥夺了空间–时间坐标的一切独立实在性。现在,只有把空间–时间坐标与描述引力场的数学量相结合,才能给出实际度规。
广义相对论的演进背后还有另一个因素。正如恩斯特·马赫所强调的,牛顿理论在以下方面不能让人满意:如果从纯粹描述的观点而不是从因果的观点来考察运动,那么就只存在物体彼此之间的相对运动。但如果从相对运动的概念出发,那么出现在牛顿运动方程中的加速度就无法理解了。它迫使牛顿构想出一种物理空间,据说加速度是相对于它而存在的。这种对绝对空间概念的特设性引入虽然在逻辑上无可指摘,但似乎无法令人满意。于是,马赫曾试图修改力学方程,使得物体的惯性不是追溯到这些物体相对于绝对空间的运动,而是追溯到它们相对于所有其他有重物体的运动。在当时的认识情况下,马赫的努力必定会失败。
但提出这个问题似乎是完全合理的。这条论证线索因广义相对论而大大增强了自己的力量,因为根据广义相对论,空间的物理性质会受到有重物质的影响。在我看来,只有认为宇宙在空间上是封闭的,广义相对论才能令人满意地解决这个问题。如果相信宇宙中有重物质的平均密度有一个有限的值,那么无论这个值有多小,广义相对论的数学结果也会迫使我们接受这种观点。
[118]1921年在伦敦国王学院的演讲,收录于1934年《我的世界观》。
河道蜿蜒的成因和所谓拜尔定律[119]
众所周知,水流往往会弯弯曲曲地前进,而不是沿着坡度最大的线下降。地理学家也都知道,北半球的河道右侧往往侵蚀得比较厉害,而南半球的河道则相反,这就是所谓的拜尔定律。许多人都曾尝试解释这种现象,我不知道我接下来要讲的东西对于专家来说是否新鲜。其中一些思考前人肯定已经知道,但大家可能还不太清楚这其中涉及的因果关系,所以在此给出一个简短的定性解释。
首先,水流在触碰河堤的地方速度越大,或者说在河堤的某个位置更陡峭地趋近于零,侵蚀显然就越强。无论这种侵蚀依赖于力学因素还是物理–化学因素(地表的溶解),情况都是如此。因此,我们必须专注于影响河堤处流速梯度的因素。
在这两种情况下,相关速度下降的不对称性间接缘于形成了一种圆周运动,我们接下来就来讨论这种圆周运动。
我先谈一个很容易重复的小实验。想象一个装满茶水的平底杯。杯底有茶叶沉淀,因为它们比被其挤走的液体更重。如果用勺子搅拌茶水,则茶叶很快会聚集在杯底中心。这种现象的原因如下:液体的旋转会造成一个离心力作用于它。如果液体像固体一样旋转,则离心力不会对液体的流动产生任何影响。但液体在杯壁附近受到摩擦的阻碍,因此它的旋转角速度会比中心附近更小。特别是,底部附近的旋转角速度和离心力会比高处更小。结果,液体会做图1所示的那种圆周运动。它会继续增加,直到在杯壁摩擦的影响下趋于停止。茶叶会被圆周运动扫到杯子中心,可以证明这种圆周运动的存在。
图1
弯曲的水流也会发生类似的事情(图2)。在弯曲河道的任一横截面处,都有一个离心力朝着曲线外侧的方向(从A到B)起作用。这个力在底部附近要小于高处,因为底部附近的水流速度因摩擦而减小。这便产生了图2所示的那种圆周运动。但由于地球的旋转,即使河道没有弯曲,图2所示的那种圆周运动也仍然会发生,只不过是小规模的。地球的旋转会产生一个与水流方向垂直的科里奥利力,其向右的水平分量是每单位流体质量2vΩsin,其中v是水流的速度,Ω是地球旋转的速度,是地理纬度。由于河底摩擦导致这个力朝底部减小,所以这个力也产生了图2所示的那种圆周运动。
图2
经过以上初步讨论,我们又回到了水流横截面的速度分布问题,它对于侵蚀起着决定性的作用。为此,我们必须先知道河流中的(湍流)速度分布是如何产生和得到维持的。如果河道中此前静止的水突然被一个均匀分布的加速力所发动,那么横截面上的速度分布起初将是均匀的。在河堤摩擦的影响下,将会逐渐形成一个从河堤朝着横截面中心逐渐增加的速度分布。横截面上(大体上)定态的速度分布只会在河流摩擦的影响下逐渐重新搅乱。
流体动力学以如下方式描述了这个静态速度分布的建立过程:在平面流(势流)的情况下,所有涡线都集中在河堤上。它们分离开来,朝着水流的横截面中心慢慢移动,分布于一个厚度不断增加的层上。河堤处的速度梯度因而逐渐减小。在液体内摩擦的作用下,水流横截面内部的涡丝被逐渐消耗,并且被河堤处形成的新的涡丝所取代,这样便产生了一种准静态的速度分布。对我们来说重要的是,获得静态速度分布是一个缓慢的过程。这就是为什么不太明显的、一直在起作用的因素能对横截面上的速度分布产生很大影响。现在我们考虑一下,图2所示的因河道弯曲或科里奥利力所引起的圆周运动会对河流横截面上的速度分布产生什么样的影响。运动最快的液体微粒距离河堤将会最远,也就是说在底部中心的上方。圆周运动将会驱策着河水速度最快的部分朝右堤移动,而左堤则会接收来自底部附近的速度特别低的水。因此在图2所示的情况下,对右侧的侵蚀必然比对左侧更强。应当注意,这种解释本质上基于这样一个事实,即河水缓慢的圆周运动会对速度分布产生相当大的影响,因为通过内摩擦(抵消了这种圆周运动的后果)所做的速度调整也是一个缓慢的过程。
我们现在已经揭示了河道蜿蜒的成因。由这些事实不难推出一些细节。侵蚀不仅在右堤较强,而且在底部右半边也比较强,因此往往会形成图3所示的轮廓。
图3
此外,由于表面的河水将来自左堤,因此尤其在左侧,河水移动得不会像更深的河水那样快。事实上,这个现象已经被观察到了。还应注意,圆周运动具有惯性。因此,它只有在弯曲最大的地方以外才能达到最大,当然,这也适用于侵蚀的不对称。因此在侵蚀过程中,河道弯曲形成的波浪线必定沿着水流的方向前进。最后,河流的横截面越大,圆周运动被摩擦消耗得就越慢,因此,河道弯曲形成的波浪线会随着河流横截面的增加而增加。
[119]1926年1月7日在普鲁士科学院宣读,发表于德文期刊《自然科学》(Die Naturwissenschaften, Vol. 14, 1926)。
牛顿力学及其对理论物理学发展的影响[120]
二百年前的今天,牛顿与世长辞。此时此刻,我们缅怀这位卓越的天才,他空前绝后地决定着西方思想、研究和实践的走向。他不仅天才地发明了一些关键的方法,而且善于掌握当时已知的经验材料,在发明详细的数学物理证明方法上更是极富创造性。因此,他理应得到我们最高的尊敬。然而,牛顿的重要性不仅在于他的天才,更在于命运把他置于人类思想发展史的一个转折点上。为了看清楚这一点,我们需要意识到,在牛顿以前并没有一个完备的物理因果性系统,能够描述经验世界更深的特征。
虽然古希腊那些伟大的唯物论者主张,一切物质事件都应归因于有严格规律的原子运动过程,而不允许将任何生物的意志当作独立的原因。笛卡尔也曾以自己的方式重新研究过这个问题,但它始终只是一种大胆的愿望、一派哲学家的可疑理想。在牛顿以前,支持人们相信存在着完整的物理因果链条的实际成果还几乎不存在。
牛顿旨在回答这样一个问题:是否存在着一条简单的规则,当所有天体在某一时刻的运动状态皆为已知时,能用这条规则完全计算出我们行星体系中天体的运动?摆在他面前的是由开普勒、第谷·布拉赫的观测结果推导出来的关于行星运动的经验定律,而这是需要解释的。[121]虽然这些定律已经完整地回答了行星如何绕太阳运转:轨道的椭圆形,半径在相等时间扫过相等的面积,半长轴与旋转周期之间的关系,但这些规则并不满足因果解释的要求。这三条规则在逻辑上彼此独立,没有显示出内在关联。如果中心星体不是太阳,第三定律就不再定量地适用。(例如,行星围绕太阳运转的周期与卫星围绕行星运转的周期之间就毫无关系。)但最重要的是,这些定律关心的是整体的运动,而不是一个系统在这一时刻的运动状态如何产生下一时刻的运动状态。用现在的话来说,它们是积分定律而不是微分定律。
只有微分形式的定律才能完全满足现代物理学家对因果性的要求。牛顿最伟大的思想成就之一就在于清晰地构想了微分定律。所需要的不仅是这种观念,还有一种数学的形式体系,它当时还很初步,但需要获得一种系统形式。牛顿在微积分中也找到了这种形式体系。这里我们不必考察莱布尼茨是否独立于牛顿发现了这种数学方法。无论如何,对牛顿来说,发展出这种方法是绝对必要的,因为只有借助于这种方法才能表达他的思想。
伽利略已经朝着认识运动定律迈出了重要一步。他发现了惯性定律以及地球引力场中的自由落体定律:一个质量(或者更精确地说是一个质点)在不受其他质量影响时做匀速直线运动。自由落体在引力场中的竖直速度随时间而均匀增加。今天我们也许会以为,从伽利略的认识到牛顿的运动定律只有一步之遥。但要注意,上面这两则陈述都只与整个运动有关,而牛顿的运动定律则回答了这样一个问题:在外力的影响下,一个质点的运动状态在无限短的时间内是如何变化的?只有考虑了无限短的时间内发生了什么(微分定律),牛顿才能得到一个适用于任何运动的公式。他从当时已经相当成熟的静力学中借用了力的概念。只有引入新的质量概念,他才能把力与加速度联系起来。说来也奇怪,支撑这个新概念的竟然是一个虚构的定义。今天我们已经非常习惯于形成那些对应于微商的概念,以至于我们已经很难理解,通过二次极限过程得到普遍的微分定律需要怎样非凡的抽象能力了,而且在这个过程中,还必须发明出质量概念。
然而,对于运动的因果理解还远未达成。因为只有当力已经给定时,才能由运动方程确定运动。大概是受到了行星运动定律的启发,牛顿设想,作用于一个质量上的力,由与该质量距离足够近的所有质量的位置来决定。只有知道了这种关联,才能完全从因果上理解运动。大家都知道,牛顿从开普勒的行星运动定律出发解决了引力问题,从而发现作用于星体的推动力和引力本质上是相同的。正是“运动定律与引力定律的结合”才形成了一个美妙的思想结构,它使我们可以根据系统在某一时刻的状态计算出它在过去和未来的状态,只要一切事件只在引力的作用下发生。牛顿概念体系的逻辑完备性就在于,一个系统中各个质量的加速度仅仅由这些质量本身所引起。
根据这里概述的基础,牛顿成功地解释了行星、卫星和彗星的运动,直至最小的细节,还有潮汐和地球的进动——这是无比辉煌的演绎成就。认识到天体运动的原因就是我们日常经验中非常熟悉的重力,这一发现必然令人惊叹不已。
但牛顿成就的重要性并不只是为实际的力学创造出一种逻辑上令人满意的切实可行的基础。在19世纪末以前,它一直是所有理论物理学家的纲领。所有物理事件都应追溯到那些服从牛顿运动定律的物体。只需扩展力的定律,使之适用于所考察的那类事件就可以了。牛顿本人曾试图把这一纲领用于光学,他预先假定光由惯性微粒所组成。当牛顿运动定律被用于连续分布的质量之后,光的波动说也利用了牛顿运动定律。牛顿的运动方程也是热的运动论的唯一基础,这种理论不仅为发现能量守恒定律做了思想上的准备,还给出了一种直至最终细节都能得到确证的气体理论,以及关于热力学第二定律本质的一种更深刻的看法。电学和磁学也一直沿着牛顿的基本思想发展到现代(电性物质、磁性物质、超距作用力)。甚至连法拉第和麦克斯韦的电动力学和光学革命也完全是在牛顿思想的引导下发生的,这是牛顿以后理论物理学基础的第一次重大根本进展。麦克斯韦、玻耳兹曼和开尔文勋爵不厌其烦地把电磁场及其动力学相互作用归因于假想的连续分布质量的机械作用。但由于这些努力没有成效或至少是没有显著成效,所以自19世纪末以来,我们的基本观念逐渐发生了转变。理论物理学的发展超出了牛顿的框架,在将近二百年的时间里,此框架一直使科学稳定发展并且给予思想上的引领。
从逻辑的观点看,牛顿的基本原理是如此令人满意,以致更新它们的动力只能源自经验事实的要求。在讨论这一点之前,我必须强调,牛顿本人比他之后的几代学者更清楚自己思想结构中固有的弱点。这总是让我对他怀有深深的敬意,因此我想花点时间谈谈这个问题:
1.尽管牛顿处处竭力把他的思想体系表现为由经验必然决定,并且尽可能少地引入不直接指涉经验对象的概念,但他还是提出了绝对空间和绝对时间的概念。为此,近年来他常常受到批评。但恰恰在这一点上,牛顿特别前后一致。他已经认识到,可观察的几何量(质点的间距)及其时间进程并不能在物理上完全刻画运动。他以著名的水桶实验来证明这一点。因此,除了质量及其随时间而变化的距离,还要有另一种东西来决定运动。他认为,这种“东西”就是与“绝对空间”的关系。他认识到,要想让他的运动定律有任何意义,空间就必须拥有一种物理实在性,就像质点及其距离的实在性一样。
这种清楚的认识既显示了牛顿的智慧,也暴露了他理论的弱点。因为如果没有这个模糊的概念,其理论的逻辑结构必定会更令人满意;在那种情况下,只有同知觉的关系完全清晰的东西(质点、距离)才会进入定律。
2.引入不需要中介、瞬时传递的超距作用力来表示引力的作用,并不符合我们日常经验中所熟知的大多数过程的特征。对于这种反驳,牛顿指出,他的引力相互作用定律不应被视为最终的解释,而应视作一条从经验中归纳出来的规则。
3.物体的重量和惯性是由同一个量(质量)来决定的。对于这个极为引人注目的事实,牛顿的理论并没有给出解释。牛顿也意识到了这一事实的不同寻常。
以上三点都不构成对于理论的逻辑反驳。在某种意义上,它们只是代表着科学家在努力从概念上完整和统一地把握自然现象的过程中那些未能满足的愿望。
被视为整个理论物理学纲领的牛顿运动学说,从麦克斯韦的电学理论那里遭受了第一次打击。事实表明,物体之间的电磁相互作用并非由瞬时传递的超距作用力所引起,而是由一种以有限速度穿过空间传播的过程所引起。根据法拉第的构想,除了质点及其运动,还有一种新的物理实在,那就是“场”。起初人们依照力学的思维方式,试图把场解释为一种充满空间的假想介质(以太)的力学状态(运动状态或应力状态)。然而经过顽强的努力,这种力学解释依然不管用,此时人们便渐渐习惯于把“电磁场”看成物理实在的最终不可还原的组分。我们要感谢海因里希·赫兹有意使场的概念摆脱了来自力学概念库的一切附属物,还应感谢洛伦兹使场的概念摆脱了物质载体。按照洛伦兹的说法,唯一能够充当场之载体的东西就是物理真空(或以太),而真空即使在牛顿力学中也不是完全没有物理功能的。等到认识了这一点,就再也没有人相信直接而瞬时的超距作用了,甚至在引力领域也是如此,虽然由于缺乏足够的事实知识,关于引力的场论还没有清晰地勾勒出来。牛顿的超距作用力假说一旦被抛弃,电磁场理论的发展就会引导人们尝试用电磁方式来解释牛顿的运动定律,或者说用一种建立在场论基础上的更加精确的运动定律来取代牛顿运动定律。虽然这种努力尚未完全成功,但力学的基本概念已经不再被视为物理世界观的基本组分。
麦克斯韦和洛伦兹的理论必然会导向狭义相对论,而狭义相对论既然放弃了绝对同时性概念,也就排除了超距作用力的存在。由狭义相对论可知,质量并非不变,而是依赖于(事实上是等价于)能量含量。它也表明,牛顿的运动定律只能被视为对低速有效的极限定律;它确立了一条以真空中的光速为极限速度的新运动定律来取代牛顿定律。
广义相对论构成了场论纲领发展中的最后一步。从量上来说,它对牛顿的理论只做了很小的修改,但在质上却要深刻得多。惯性、引力以及物体和时钟的度规行为都被归结为场的性质,而这个场本身又被认为依赖于物体(推广了牛顿的引力定律,或如泊松所表述的那样,推广了对应于牛顿引力定律的场定律)。由此空间和时间虽然未被剥夺实在性,但却被剥夺了因果绝对性(所谓因果绝对性,是指产生影响但不受影响),为了能够表述当时已知的定律,牛顿不得不把这种绝对性归于空间和时间。广义的惯性定律接管了牛顿运动定律的角色。这一简短论述足以表明,牛顿理论的要素如何逐渐变成了克服上述三个缺点的广义相对论。在广义相对论的框架中,运动定律似乎能够从对应于牛顿力定律的场定律中推导出来。只有完全达到了这个目标,我们才能谈及纯粹的场论。
在一种更加形式的意义上,牛顿力学也为场论开辟了道路。将牛顿力学应用于连续分布的质量,必然会导向偏微分方程的发现和应用,而这些方程第一次提供了场论定律的语言。在这种形式方面,牛顿的微分定律观念构成了后来发展的第一个决定性步骤。
到目前为止,我们谈论的都是我们关于自然过程的观念的整个发展,它可以被视为对牛顿思想的一种系统发展。然而,正当对场论的完善还在如火如荼地进行的时候,热辐射、光谱、放射性等事实却揭示出整个思想体系适用性的限度。虽然该体系在许多情况下都已经取得巨大成就,但在我们今天看来,这种限度似乎仍然无法克服。许多物理学家断言(这有不少有力的论据),在这些事实面前,不仅微分定律,甚至是因果律本身(迄今为止它一直是所有自然科学最终的基本假定)也已经失效。甚至连建立一个能与物理事件明确对应的时空结构的可能性也被否定了。力学体系只能有分立的稳定能量值或稳定状态(正如经验几乎直接表明的那样),初看起来,这似乎很难从场论的微分方程中推导出来。基于一组考虑了共振条件的微分方程,具有场论特征的德布罗意–薛定谔方法的确推出了只存在分立的状态,这与经验事实惊人地一致,但它必须放弃质点的定域性和严格的因果律。牛顿自然观的两条最终前提,即因果律和微分定律,是否一定要明确放弃?我们现在还不得而知。
[120]牛顿逝世二百周年纪念演讲,发表于德文期刊《自然科学》(Die Naturwissenschaften, Vol. 15, 1927)。
[121]今天人人都知道,要由这种经验确定的轨道来发现这些定律需要何种辛劳。但很少有人认真思考过,开普勒使用了什么天才方法才根据从地球上观测的视轨道推导出了真轨道。——作者注
论科学真理[122]
一、很难赋予“科学真理”一词以确切的含义。“真理”一词的含义根据我们处理的是经验事实、数学命题还是科学理论而有所不同。对我来说,“宗教真理”根本没有什么清楚的意思。
二、通过鼓励人们从因果的角度来思考和看待事物,科学研究可以减少迷信。所有高阶的科学工作背后都有一种类似于宗教感情的信念,即相信世界是合理的或可理解的。
三、我坚信有一个高超的心灵在经验世界里展现出来,这种与深挚的感情密切相关的坚定信念代表着我的上帝观。按照通常的说法,或可称之为“泛神论”(斯宾诺莎)。
四、至于教派传统,我只能从历史和心理上加以考量,对我别无意义。
[122]回答一位日本学者的问题,收录于1929年纪念爱因斯坦五十寿辰的限量版文集。
约翰内斯·开普勒[123]
在这个焦虑不安的时代,人世沉浮中难寻乐趣,此时想起开普勒这般卓越而宁静的人,特别感到欣慰。在开普勒生活的时代,还不能确定自然受定律的支配。在无人支持和极少有人了解的情况下,他数十年如一日,孤独地投身于艰苦繁重的工作,对行星的运动及其数学定律进行经验研究。他对自然定律的存在该是怀有多么坚定的信念,才能获得这种力量啊!若想好好缅怀他,我们应尽可能地看清楚他的问题以及解决问题的各个步骤。
哥白尼已经让最有才智的人看到,要想清楚地把握行星在天空中的视运动,最好的办法是把这些运动看成行星围绕静止的太阳所做的转动。倘若行星围绕一个以太阳为中心的圆做匀速运动,那么查明这些运动从地球上看是怎样的就比较容易了。然而,所要处理的现象远比这复杂,任务也就艰巨得多。首先要根据第谷·布拉赫的行星观测结果从经验上确定这些运动,然后才能发现这些运动所满足的一般定律。
要想了解确定围绕太阳的实际运转有多么困难,需要弄清楚以下这些事情:我们永远也看不到行星在某一时刻实际所处的位置,而只能从地球上看到它那时在什么方向,而地球本身又以未知的方式围绕太阳运动。于是,这些困难几乎显得无法克服。
为了给这种混乱带来秩序,开普勒不得不另辟蹊径。他意识到,必须首先设法确定地球本身的运动。倘若只有太阳、地球和恒星,而没有别的行星,这根本是做不到的。因为在那种情况下,除了日地连线方向在一年中的变化情况(太阳相对于恒星的视运动),我们无法从经验上确定任何别的东西。即使当时还没有望远镜,肉眼的观测精度已经能够发现,日地连线的这些方向全都位于一个相对于恒星静止的平面上。由此也能确定日地连线是以何种方式围绕太阳旋转的。他发现,这种运动的角速度在一年中呈现出规律性的变化。但这没有多大用处,因为我们还不知道日地距离在一年中是如何变化的。只有知道这个变化,才能确定地球轨道的真实形状及其运行方式。
开普勒找到了一个奇妙的方法来摆脱这种困境。首先,对太阳的观测表明,在一年的不同时间里,太阳在相对于恒星背景的视路径上的速度各不相同,然而在天文年的同一时间,这种运动的角速度却总是相同。也就是说,当日地连线指向同一恒星区域时,该直线的转动角速度也总是相同。因此应当假定地球轨道是封闭的,地球每年都沿着它做相同的运转,这绝非理所当然。对于哥白尼体系的追随者来说,几乎可以肯定,其他行星轨道也有同样的性质。
这无疑使问题变得更容易了。但如何确定地球轨道的真实形状呢?设想在轨道平面的某处有一盏明亮的灯M。我们知道,若是这盏灯永远固定在这个位置上,它就能成为对地球轨道进行三角测量的一个定点,地球上的人在每年的任何时候都能看到它。假设这盏灯M距离太阳比地球距离太阳还要远,借助这盏灯就能按照以下方式确定地球轨道:
首先,每年都有这样一个时刻,地球E恰好处于太阳S与灯M的连线上。如果此时从地球E看灯M,我们的视线就会与SM(太阳–灯)这条线重合。想象把后者在天穹上标记下来,再设想地球处在不同的时间和位置上。既然太阳S和灯M从地球上都可以看见,三角形SEM中的角E便是已知的。然而通过对太阳的直接观测,也可以知道SE相对于恒星的方向,而此前SM连线相对于恒星的方向也已经确定。我们也知道三角形SEM在S处的角度。于是,我们在纸上随意画出底边SM,凭借我们对角E和角S的认识,就可以作出三角形SEM。我们可以在一年中重复这样做,每一次都在纸上画出地球E相对于那条永远固定的底边SM的位置,并且给它注上日期,由此便可以从经验上确定地球的轨道,当然,这还不是它的绝对尺寸。
但你们会说,开普勒到哪里去找这盏灯M呢?他的天才以及此时仁慈的大自然给予了他这盏灯。他注意到,火星年即火星围绕太阳走一圈的时间是已知的。太阳、地球和火星有可能在某一时刻恰好排成一条直线。由于火星沿一个封闭的轨道运转,所以每过一个火星年,火星就会出现在这个位置上。因此,在这些已知时刻,SM总是固定的底边,而地球总是处在轨道的不同位置上。于是在这些时刻,火星就起着我们前面设想的那盏灯的作用,可以通过观测太阳和火星来确定地球的真轨道。就这样,开普勒发现了地球轨道的真实形状以及地球的运转方式。我们这些后来者——欧洲人、德国人甚至是我故乡的施瓦本人——都因此而钦佩和尊敬他。
地球轨道既已由经验确定下来,SE直线在任一时刻的真实位置和长度也就知道了。现在开普勒要从行星观测结果计算出其他行星的轨道和运动已经不再过于困难,至少原则上是如此。但这仍然是一项极为艰巨的工作,尤其是考虑到当时的数学状况。
现在我们来谈谈开普勒人生中第二项同等艰巨的工作。行星轨道已经从经验中知晓,但其定律还必须从经验数据中猜测出来。他必须首先猜测轨道曲线的数学性质,然后用一大堆图形去试验。如果不合适,就必须再想出一种假说去试验。经过无数次尝试,他终于发现符合事实的假定是:行星轨道是一个椭圆,而太阳位于它的一个焦点上。开普勒也发现了行星在运转过程中速度变化的定律,即太阳与行星的连线在相等时间内扫过相等的面积。最后他还发现,行星运转周期的平方与椭圆长轴的立方成正比。
我们在赞叹这位卓越人物的同时,另一种赞叹和敬畏也油然而生。不过这种感情的对象不是人,而是孕育我们的那个神秘和谐的大自然。古人已经设计出一些曲线来表示可以设想的最简单的规律性。其中除了直线和圆,最重要的就是椭圆和双曲线。我们看到,最后这两种曲线在天体的轨道中得到了实现,至少近乎得到实现。
看来,在事物中找到形式之前,人的心灵应当先把形式独立地构造出来。开普勒的惊人成就特别彰显了一个真理:知识不可能单纯来源于经验,而只能将理智的发明与观察到的事实相比较才能得到。
[123]为纪念开普勒逝世三百周年所写的文章,发表于1939年11月9日德国《法兰克福日报》(Frankfurter Zeitung)。
麦克斯韦对物理实在观念发展的影响[124]
相信有一个外在世界独立于知觉主体而存在,这是一切自然科学的基础。然而,由于感官知觉只能间接提供关于这个外在世界或“物理实在”的信息,我们只能通过思辨的方式来把握它。由此可知,我们关于物理实在的观念永远也不可能是最终的。为了以逻辑上最完美的方式来正确处理知觉到的事实,我们必须随时准备改变这些观念,也就是说,改变物理学的公理基础。事实上,从物理学的发展就可以看出,其公理基础在历史进程中已经发生了深远的改变。
自从牛顿奠定了理论物理学的基础以来,物理学的公理基础——亦即我们对实在结构的构想——发生的最大变化源于法拉第和麦克斯韦对电磁现象的研究。接下来,我们将同时关注物理学早期和后来的发展,以使这一点变得更加清楚。
根据牛顿的体系,物理实在由空间、时间、质点和力(质点的相互作用)等概念来刻画。在牛顿看来,物理事件应被视为受不变的定律支配的质点在空间中所做的运动。在处理实在中发生的变化时,我们只能以质点的方式来表示实在,质点是实在的唯一代表。质点概念显然源于可感知的物体。人们将质点设想成类似于运动物体,但剥夺了它们的广延、形状、空间方位等特征以及一切“内在”性质,只保留了惯性、位移,并且添加了力的概念。物体曾引导我们在心理上形成“质点”概念,而现在却不得不把物体本身看成质点系。应当注意,这种理论框架本质上是原子论和机械论的。一切事件都应做纯粹机械的解释,也就是说,按照牛顿运动定律把它们完全解释成质点的运动。
除了最近被再次提出的“绝对空间”概念所涉及的困难,这个体系最不能让人满意的地方在于它对光的描述,在牛顿体系中,光也被设想为由质点组成。那么当光被吸收时,组成光的质点会变成什么呢?这个问题甚至在当时就已经亟待解决了。不仅如此,为了分别描述有重物质和光,不得不假定有两种完全不同的质点并把它们引入讨论,这无论如何不能令人满意。后来又加入了第三种质点即带电粒子,它同样具有完全不同的特征。此外,决定事件的相互作用力必须以完全任意的方式进行假定,这也是一个根本弱点。这就是为何虽然牛顿的实在观取得了很大成就,人们还是感到不得不抛弃它的原因。
为了用数学形式来表达自己的体系,牛顿必须发明微商概念,并以全微分方程的形式来表述运动定律,这也许是一个人在思想领域所能做出的最大贡献。偏微分方程对于这个目的并不是必需的,牛顿也没有系统地使用过它们,但对于表述可变形物体的力学却是必需的,这是因为物体如何由质点组成的问题起初并不重要。
因此,偏微分方程进入理论物理学时还是婢女,但渐渐变成了主妇。这始于19世纪,那时观察到的事实已经迫使光的波动说建立起来。真空中的光被解释为以太的振动,当然在这一阶段,把以太看成质点的聚集体似乎毫无用处。微分方程在这里第一次显示为对物理学基本实在的自然表达。于是,在理论物理学的一个特殊分支中,连续的场和质点都被视为物理实在的代表。这种二元论至今仍然存在,任何讲求条理的人都必定会对此感到不安。
即使物理实在的观念已经不再是纯粹原子论的,它在当时也仍然是纯粹机械论的。人们仍然试图把一切事件都解释成惯性质量的运动。的确,似乎也想不出其他方式来看待事物了。然后发生了一场伟大变革,它将永远与法拉第、麦克斯韦和赫兹的名字联系在一起。这场革命主要归功于麦克斯韦。他表明,当时关于光和电磁现象的所有知识都可以用他那两组著名的微分方程来表示,在这些方程中,电场和磁场作为因变量出现。
麦克斯韦的确曾试图用理智构造的一种机械论模型来解释这些方程或为之辩护。但他同时使用了若干种这样的构造,而没有认真对待其中任何一种。因此只有这些方程才显得是本质性的,方程中出现的场是最终实体,不能还原为任何其他东西。到了世纪之交,人们已经普遍把电磁场看成最终实体,严肃的思想家也不再相信有理由或者有可能对麦克斯韦方程做出机械论解释。没过多久,他们反倒借助于麦克斯韦理论,试图以场论来解释质点及其惯性,虽然没有完全成功。
如果不考虑麦克斯韦的工作在重要的物理学分支所产生的个别重要结果,而是集中于他给我们的物理实在观所带来的变革,那么也许可以说:在麦克斯韦之前,人们设想物理实在(指自然中的事件)是质点,质点的变化完全归因于那些服从全微分方程的运动;而在麦克斯韦之后,人们认为物理实在由不能作机械论解释的、服从偏微分方程的连续场来代表。实在观的这一变革乃是自牛顿以来物理学发生的最为深刻和最富有成果的变革。但同时必须承认,这一纲领还远未完全实现。毋宁说,自那以后发展起来的成功的物理学体系都是这两个纲领的折中,因此这些体系都有一种过渡性的、逻辑上不完备的特征,尽管在某些细节上也许已经取得了很大进展。
这其中首先要提到洛伦兹的电子论,在这种理论中,场和带电粒子一起被视为对于理解实在有同等价值的要素。后来又出现了狭义相对论和广义相对论,它们虽然完全基于与场论有关的观念,但迄今为止还无法避免独立引入质点和全微分方程。
量子力学是理论物理学最新与最成功的创造,它从根本上不同于我们所谓的牛顿纲领和麦克斯韦纲领。因为出现在量子力学定律中的各种量并不必然描述物理实在本身,而只是描述了我们所考察的物理实在出现的概率。在我看来,对这种理论所作的逻辑上最完备的解释要归功于狄拉克。他正确地指出,比如要对光子作一种理论描述,使它提供的信息足以决定光子是否会通过斜放在其通路上的偏振器,这大概很困难。
我仍然倾向于认为,物理学家不会长期满足于对实在做出这种间接描述,即使这种理论最终能以令人满意的方式符合广义相对论的假设。我相信,到头来我们必将回到所谓的麦克斯韦纲领,即通过满足偏微分方程而不带有奇点的场来描述物理实在。
[124]纪念麦克斯韦一百周年诞辰,收录于1931年《麦克斯韦纪念文集》(James Clerk Maxwell: A Commemoration Volume, Cambridge University Press)。
论理论物理学的方法[125]
若想从理论物理学家那里了解他们使用什么方法,我建议坚持这样一条原则:不要听其言,而要观其行。对于这个领域的发现者而言,其想象力的产物是如此必然和自然,以至于他会认为并且希望别人也认为,它们不是思想的创造,而是既定的实在。
这些话听起来像是让大家离开这个讲堂。因为你们可能会心想,这个人是从事实际工作的物理学家,因此应把理论科学的结构问题留给认识论者去研究。
针对这种批评,我可以从个人观点为自己辩护,向大家保证我不是自己要来的,而是应别人的友好邀请才登上这个为纪念一个毕生追求知识统一性的人而设立的讲坛。但事实上,我站在这里是有正当理由的:了解一个毕生致力于澄清和改进科学基础的人是如何思考他的科学的,也许会让人感兴趣。他对这门科学的过去与现在的看法,也许太过依赖于他对未来的期待和目前的追求,但这是任何一个深深地沉浸在思想世界中的人所不可避免的命运。类似的情况也发生在历史学家身上,历史学家也以同样的方式——尽管可能是无意识地——根据自己对人类社会所形成的理想把实际事件组织起来。
现在让我们浏览一下理论体系的发展,同时特别注意理论内容与经验事实总和之间的关系。它涉及这个领域里两个不可分割的知识的组成部分,即经验与理性之间的永恒对立。
古希腊被誉为西方科学的摇篮。这里第一次见证了欧几里得几何学这个逻辑系统的奇迹,该体系一步步地精确产生出来,以至于它的每一个命题都是绝对不容置疑的。理性的这项惊人成功使人的理智有信心做出后来的成就。倘若欧几里得未能激起你少年时代的热情,你就不是一个天生的科学思想者。
但科学要想成熟到能将整个实在包含在内,还需要另一种基本认识,这种认识直到开普勒和伽利略的出现才成为哲学家的共识。单凭逻辑思维无法使我们获得关于经验世界的知识,一切关于实在的知识都是从经验出发,以经验结束。通过纯逻辑手段得到的命题对于实在来说是完全空洞的。伽利略认识到了这一点,尤其是因为他向科学界反复灌输这一点,他才成为近代物理学之父,事实上也是整个近代科学之父。
然而,如果经验是我们关于实在的一切知识的起点和终点,那么纯粹理性在科学中又起什么作用呢?
完整的理论物理学体系是由概念、对这些概念有效的基本定律以及通过逻辑演绎而导出的结论所组成的。这些结论必须符合我们单独的经验。在任何理论著作中,对它们的逻辑推导几乎要占据全部篇幅。
在欧几里得几何学中,情况正是如此,只不过那里的基本定律被称为公理,而且也没有结论必须符合经验的问题。但如果认为欧几里得几何学研究的是准刚体在空间中可能的相互关系,也就是将它看成一门物理科学,而不是抽出它原初的经验内容,那么几何学与理论物理学在逻辑上的同质性就完整无缺了。
这样我们就指定了理性和经验在一个理论物理学系统中的位置。理性给出了该系统的结构,而经验内容及其相互关系则应在理论的结论中得到表达。整个系统,尤其是它的基本概念和基本原理,其唯一的价值和理由就在于这样一种表达的可能性。此外,这些基本概念和基本原理都是人类理智的自由发明,既不能通过人类理智的本性、也不能以任何先验的方式来证明。
这些在逻辑上无法进一步还原的基本概念和假设构成了理论不可或缺的部分,它们是理性所无法把握的。所有理论的崇高目标都在于让这些不可还原的基本要素尽可能简单,数量尽可能少,同时不必放弃对任何经验内容的恰当表达。
我刚才概述的关于科学理论基础具体纯虚构性的观点在18-19世纪绝不占主导地位,然而它目前却日渐流行,因为逻辑结构越简单,也就是支撑整个结构所需的逻辑上独立的概念要素越少,基本概念和定律与必须同我们的经验相联系的那些结论在思想上的距离就越大。
牛顿第一次创造出一个全面可行的理论物理学系统,他仍然相信其系统的基本概念和定律可以从经验中推导出来。这无疑就是他所说的“我不杜撰假说”的意思。
事实上,时间和空间概念在那时似乎还没有什么问题。质量、惯性和力的概念以及把它们联系起来的定律似乎都直接来自经验。然而,一旦接受这个基础,引力的表达式似乎就可以从经验中推导出来,而且可以合理地期待别的力也是如此。
从牛顿的表述中可以看出,包含着绝对静止概念的绝对空间概念使他感到不安。他意识到,绝对静止概念在经验中似乎没有对应。对于引入超距作用力,他也感到不安。但他的学说在实践上取得的巨大成功很可能阻碍了他和18-19世纪的物理学家认识到其系统基础的虚构性。
恰恰相反,当时的自然哲学家大都认为,物理学的基本概念和假设并非人的心灵在逻辑意义上的自由发明,而是可以通过“抽象”——即通过逻辑方式——从经验中推导出来。事实上,直到广义相对论出现,人们才清楚地认识到这种看法是错误的。广义相对论表明,可以在完全不同于牛顿的基础上,以更加令人满意和更加完备的方式来解释更广的经验事实。然而,撇开理论的优越性问题不谈,基本原理的虚构性是非常明显的,因为我们可以指出两条与经验大体符合但本质上不同的原理。由此可以证明,任何以逻辑方式从基本经验中导出力学的基本概念和假设的努力都注定要失败。
如果理论物理学的公理基础不能从经验中抽取出来,而必须是自由发明,那么还是否有希望找到正确的道路呢?这条正确的道路难道仅存于我们的幻想吗?如果一些理论(比如经典力学)能在很大程度上恰当地处理经验,但没有从深层次把握事物,那么我们还能否指望把经验当作我们可靠的向导呢?对此我会毫不犹豫地回答:我认为的确存在着这样一条正确的道路,并且有能力找到它。根据已有的经验,我们有理由相信,大自然是可以设想的最简单数学观念的实现。我深信,通过纯粹的数学构造,我们能够发现那些概念以及把它们联系起来的定律,它们为理解自然现象提供了钥匙。经验也许可以暗示恰当的数学概念,但数学概念绝不可能从经验中推导出来。当然,经验始终是判断数学构造是否有物理用处的唯一标准,但创造性原则却在数学之中。因此在某种意义上我认为,纯粹思维能够把握实在,就像古代人所梦想的那样。
为了证明这种信念是正当的,我不得不使用一个数学概念。物理世界被表示为一个四维连续体。若假定其中有一种黎曼度规,并探究这种度规可以满足哪些最简单的定律,那么我就得到了真空中的相对论性引力论。若假定从空间中可以导出一个矢量场或反对称张量场,并探究这种场可以满足哪些最简单的定律,那么我就得到了真空中的麦克斯韦方程。
在这里,我们仍然缺少理论来描述空间中电荷密度不为零的那些部分。德布罗意曾推测有一种波场存在,可以解释物质的某些量子性质。狄拉克发现旋量是一种新的场量,其最简单的方程使人能基本上推出电子的性质。现在,我与我的同事瓦尔特·迈尔博士合作发现,这些旋量构成了一种在数学上与四维相联系的新的场的特例,我们称之为“半矢量”。这种半矢量可能服从的最简单方程为理解具有不同静止质量和相反等量电荷的两种基本粒子的存在提供了钥匙。除了通常的矢量,这些半矢量就是四维度规连续体里数学上最简单的场,它们似乎能够自然地描述带电粒子的某些根本性质。
对我们来说重要的是,所有这些构造以及把它们联系起来的定律都可以通过寻求数学上最简单的概念及其联系这一原则来得到。在数学上存在的简单的场的类型以及它们之间可能存在的简单方程,两者的数目都很有限,这正是理论家们深入把握实在的希望所在。
同时,这种场论最大的困难在于理解物质和能量的原子结构。因为该理论只使用空间的连续函数,所以就其基础而言是非原子的,这与经典力学相反,经典力学最重要的要素是质点,它本身就已经恰当地处理了物质的原子结构。
现代量子论与德布罗意、薛定谔和狄拉克等人的名字联系在一起,并且使用连续函数,它用一种由马克斯·玻恩最早清晰给出的大胆解释克服了这些困难:方程中出现的空间函数并不是原子结构的数学模型。这些函数据说只决定了测量时这种结构处于特定地点或特定运动状态下的数学概率。这种想法在逻辑上是无可非议的,而且已经取得了重大成功。但不幸的是,它迫使人们使用一种连续体,其维数并不是迄今为止物理学的空间维数(即四维),而是随着组成系统的粒子数目而无限增加。必须承认,我认为这种解释只有一种暂时的意义。我仍然相信可能有一种实在模型,即这样一种理论:它描述的是事物本身,而不仅仅是它们出现的概率。
另一方面,我认为必须放弃理论模型中粒子完全定域的想法。在我看来,这是海森伯不确定性原理的最终结果。但完全可以设想一种真正意义上的原子理论(而不仅仅是基于一种解释),不赋予粒子在数学模型中的定域性。例如,为了解释电荷的原子特征,只需使场方程导出以下结论:边界上电荷密度处处为零的三维空间区域永远包含总量为整数的总电荷。在连续体理论中,原子特征可以由积分定律令人满意地表示出来,而不必确定组成原子结构的那些东西的位置。
直到以这种方式将原子结构成功地表示出来,我才会认为量子之谜得到了解决。
[125]1933年6月10日在牛津所作的斯宾塞讲座,收录于1934年《我的世界观》。
物理学中空间、以太和场的问题[126]
科学思想是对前科学思想的发展。由于空间概念在前科学思想中已经起着基础作用,所以我们必须从前科学思想中的空间概念开始。有两种考察概念的方式,对于理解概念是不可或缺的。首先是逻辑分析。它回答这样一个问题:概念与判断是如何相互依存的?回答这个问题将使我们站在较为可靠的基础上。数学之所以备受尊敬,就是因为这种可靠性。但这种可靠性是以空无内容为代价而获得的。概念只有与感觉经验相联系才能获得内容,无论这种联系是多么间接。但这种联系无法被逻辑研究所揭示,而只能被经验揭示。然而,正是这种联系决定了概念体系的认知价值。
举例来说,假定未来的考古学家发现了一本没有图形的欧几里得几何学教科书,他会看到“点”“直线”“平面”等词项是如何在命题中使用的,也会看到这些命题是如何相互推导的,甚至还能按照他所了解的规则构造出新的命题。但只要“点”“直线”“平面”等词项没有向他传达某种东西,那么对他来说,构造出这些命题仍然只是一种空洞的文字游戏。只有当这些词项传达了某种东西时,几何学对他来说才会有实际内容。对于分析力学来说也是如此,事实上对于任何逻辑演绎科学都是如此。
说“直线”“点”“相交”等词项传达了某种东西,这是什么意思呢?它的意思是,我们能够指出这些词项所涉及的感觉经验内容。这个超出逻辑的问题正是几何学的本质问题,这位考古学家只能凭直观来解决它,即对他的经验进行考察,看能否发现某种东西对应于理论中的原始词项以及为这些词项所设定的公理。只有在这个意义上,才能合理地讨论概念系统的本质。
如果使用前科学概念,我们就和这位考古学家一样要面临本体论问题。可以说,我们已经忘记了是经验世界中的哪些特征使我们能够提出这些概念,而且如果不戴上旧有概念解释的眼镜,我们很难回想起经验世界。此外还有一个困难:我们的语言不得不使用那些与原始概念密不可分地联系在一起的词项,这使我们很难阐明前科学的空间概念究竟是什么。
在转到空间问题之前,我们先一般地谈谈对概念的看法。概念与感觉经验有关,但永远不可能在逻辑意义上从感觉经验推导出来。因此,我始终未能理解对康德意义上先验之物的追求。对于任何本体论问题,我们永远只能在复杂的感觉经验中寻求与概念有关的那些特征。
现在回到空间概念:它似乎预设了物体的概念。人们常常描述大概能引起物体概念的那些复杂的感觉经验和感觉印象的本质。其中一些特征包括,某些视觉印象和触觉印象之间有对应,这些印象(触觉、视觉)可以在时间中持续追随下去,在任何时候都可以重复,等等。一旦借助上述经验形成物体概念(物体概念绝没有预设空间或空间关系概念),从思想上把握这些物体之间关系的愿望就必然会引起一些同它们的空间关系相对应的概念。两个物体可以相互接触,也可以彼此远离。在后一种情况下,两者之间可以插进第三个物体而丝毫不会改变它们,而在前一种情况下却不可能如此。这些空间关系显然和物体本身一样实在。如果两个物体对于填满一个这样的间隔是等效的,那么它们对于填满其他间隔也会是等效的。由此可见,间隔与选择何种特殊物体来填满它无关,这对于空间关系来说也是普遍正确的。显然,这种无关性(这是构造纯粹几何概念之所以有用的一个主要条件)不一定是先验的。在我看来,这种与选择何种特殊物体来填满它无关的间隔概念乃是整个空间概念的出发点。
于是,从感觉经验的观点来看,空间概念的发展似乎遵循以下图式:物体→物体的排列关系→间隔→空间。这样看来,空间似乎和物体一样是某种真实的东西。
显然,作为一种真实事物的空间概念已经存在于科学以外的概念世界中。但欧几里得的数学却不诉诸这种概念,它只限于讨论对象以及对象之间的排列关系。点、平面、直线、线段都是理想化的物体。一切排列关系都可以归结为接触关系(直线与平面相交,点在直线上,等等)。作为连续体的空间根本没有出现在这个概念体系中。这个概念最早是笛卡尔用空间坐标来描述空间中的点时引入的。这里,几何图形第一次显示为被理解成三维连续体的无限空间的一部分。
笛卡尔对空间处理的卓越之处绝不只是把分析应用于几何学,更重要的一点在于,希腊人在几何描述中偏爱一些特殊对象(直线、平面),若要对别的对象(如椭圆)做这种描述,只能借助于点、直线和平面进行构造或定义。而在笛卡尔的处理中,所有表面似乎都具有同等地位,建立几何学时不会随意地偏爱平直构造。
若把几何学看成关于支配准刚体彼此之间排列关系的定律的科学,则它可以被视为最古老的物理学分支。正如我所指出的,这门科学可以没有空间概念本身,点、直线、平面、线段等理想的物质形式已经足以满足它的需要。而笛卡尔所设想的整个空间却是牛顿物理学所绝对必需的,因为单凭质点以及质点之间随时间可变的距离,是无法建立动力学的。在牛顿的运动方程中,加速度概念发挥着基础作用,它不能只靠质点之间随时间可变的距离来定义。只有相对于整个空间,牛顿的加速度才能被设想或定义。于是,除了空间概念的几何实在性,空间又有了一种确定惯性的新功能。当牛顿说空间是绝对的时候,他无疑是指空间的这种实在意义,这使他必须赋予空间一种非常明确的运动状态,而这种运动状态似乎不能由力学现象完全决定。这种空间在另一种意义上也被认为是绝对的:空间确定惯性的作用被认为是自主的,也就是说不受任何物理环境的影响;它影响物体,但没有什么东西能够影响它。
但直到不久以前,物理学家仍然认为空间只不过是所有事件的被动容器,本身并不参与物理事件。直到光的波动说以及法拉第和麦克斯韦的电磁场理论出现,这种思想才开始发生改变。人们渐渐发现,真空中不仅存在着以波的形式传播的状态,而且存在着定域的场,能对移到那里的带电质量或磁极施加力的作用。在19世纪的物理学家看来,把物理功能或物理状态赋予空间本身是完全荒谬的,于是他们就以有重物质为模型,设想有一种以太介质充满了整个空间,它充当着电磁现象的载体,因此也是光现象的载体。这种介质被认为构成了电磁场,其状态起初是以固体的弹性变形为模型而机械地想象的。但以太的这种机械理论一直不太成功,所以人们渐渐不再尝试对以太场的本性做更详细的解释。于是,以太就成了这样一种物质,它的唯一功能就是充当电场的基质,而不能做进一步分析。由此得到了以下图像:空间被以太所充满,有重物质的微粒或原子浸游其中。而物质的原子结构在世纪之交的时候已经牢固确立了。
既然物体之间的相互作用据说是通过场来实现的,那么以太中也一定有引力场,但当时引力场的定律还没有确切的形式。以太仅仅被看成所有跨越空间起作用的力的场所。人们认识到,运动中的带电质量会产生磁场,磁场的能量为惯性提供了一种模型,因此惯性显得像是一种位于以太中的场作用。
以太的力学性质起初让人琢磨不透,然后出现了洛伦兹的伟大发现。当时所有已知的电磁现象都可以基于以下两条假定来解释:以太牢牢地固定在空间中,也就是说完全不能运动,而电牢牢地固定在可运动的基本粒子中。今天,洛伦兹的发现可以表述如下:物理空间和以太只不过是对同一个东西的两种不同表达罢了,而场则是空间的物理状态。如果不能把特殊的运动状态赋予以太,似乎就没有理由把它当作一种与空间并列的特殊之物引入进来。但这种思路与当时的物理学家还相距甚远。在他们看来,空间仍然是一种刚性的、同质的东西,不会变化,也没有各种不同的状态。只有像黎曼这种不世出的孤独天才,才在19世纪中叶提出了一种新的空间观,这种空间观剥夺了空间的刚性,而且认识到空间有可能参与物理事件。更值得钦佩的是,这项思想成就出现在法拉第和麦克斯韦的电场理论之前。然后出现了狭义相对论,它认为一切惯性系都在物理上等价。时间与空间变得不可分离,并与电动力学或者光的传播定律相联系。此前人们一直暗中假定,事件的四维连续体能以客观的方式分成空间和时间,也就是说在事件的世界里,“现在”被赋予了绝对意义。随着“同时”的相对性被发现,空间和时间融合成一个连续体,就像空间的三维曾经融合成一个连续体一样。就这样,物理空间被扩展为一个包含着时间维度的四维空间。狭义相对论的四维空间就像牛顿的空间一样严格和绝对。
相对论是一个很好的例子,可以说明现代理论科学发展的基本特征。理论科学的初始假说变得越来越抽象,离经验也越来越远。而另一方面,它又离一切科学的伟大目标越来越近,即通过逻辑演绎,用尽可能少的假说或公理来涵盖尽可能多的经验事实。与此同时,从公理导向经验事实或可证实结论的思路也变得越来越冗长和复杂。理论科学家在寻求理论时,只能越来越仰赖纯粹数学的形式思考,因为实验家的物理经验无法把他引到最抽象的领域。适用于科学幼年的以归纳为主的方法正在让位于试探性的演绎法。在推导出那些可与经验做比较的结论之前,需要对这种理论结构做出非常详尽的阐述。这里,观察到的事实无疑也是最高的仲裁者,但只有通过紧张而艰巨的思考将公理与可证实的结论之间的宽阔鸿沟弥合起来,它才能做出裁决。理论家在从事这项艰巨的工作时应当充分意识到,他的努力也许只会使他的理论受到致命打击。对于承担这项工作的理论家,不应指责其“异想天开”,而应使他有权去自由幻想,因为达到目标别无他途。他的幻想并非徒劳的白日梦,而是在寻求逻辑上最简单的可能性及其推论。为使听众或读者更愿意追溯由此产生的一连串想法,需要做这样一个辩解。正是这条思路将我们从狭义相对论引到了广义相对论,再从广义相对论引到了它的最近分支,即统一场论。在做这种阐释时不可避免要用到数学符号。
让我们从狭义相对论开始讲起。该理论仍然直接基于光速不变这条经验定律。设P是空间中的一点,P'是无限接近的一点,与它相距dσ。假定在时刻t从P发出一道闪光,在时刻t+dt到达P',那么
如果dx₁、dx₂和dx₃是dσ的正交投影,并且引入虚时间坐标,则上述光速不变定律有如下形式:
由于这个公式表达了一种实际情况,我们可以赋予ds这个量以一种实在的意义,只要对四维连续体中两个邻近点的选择使得相应的ds不等于零。这可以表达为:狭义相对论的四维空间(带有虚时间坐标)拥有一种欧几里得度规。
之所以把这种度规称为欧几里得度规,与下面这件事情有关。在三维连续体中假定这样一种度规,与假定欧几里得几何学的公理完全等价。于是,定义度规的方程不过是应用于坐标微分的毕达哥拉斯定理罢了。
狭义相对论所容许的坐标改变(通过变换)是这样的:在新坐标系中,ds²这个量(基本不变量)也等于坐标微分的平方和。这种变换被称为洛伦兹变换。
狭义相对论的启发性方法可由以下原理来刻画:自然定律的方程在洛伦兹变换下必须保持形式不变(方程对洛伦兹变换的协变性)。
这种方法使我们发现了动量与能量之间、电场强度与磁场强度之间、静电力与动电力之间以及惯性质量与能量之间的必然联系,物理学中独立概念和基本方程的数目因此减少了。
这种方法影响深远。表达自然定律的方程真的只对洛伦兹变换协变,而对其他变换不协变吗?如果这样表述,那么这个问题实在没有意义,因为任何方程组都能用广义坐标来表示。我们应当问:自然定律是不是要求所有坐标系都等价,而不会让某个特殊坐标系中的方程有实质性的简化?
对此我们只是简略提一下,惯性质量与引力质量相等的经验定律告诉我们,这个问题的答案是肯定的。如果将所有坐标系对于表述自然定律都等价提升为一条原理,我们就得到了广义相对论,只要保留光速不变定律,或者说假定欧几里得度规至少对于四维空间的无穷小部分仍然有客观意义。
这意味着对于有限的空间区域,假定存在着一种广义黎曼度规(具有物理意义),其形式如下:
其中的求和要扩展到从1, 1到4, 4的全部指标组合。
这种空间的结构在一个方面与欧几里得空间的结构有根本不同。系数gμν是坐标x₁到x₄的任何函数,实际知道这些gμν函数之后才能实际确定空间的结构。我们也可以说,空间的结构本身完全没有确定。只有指明了gμν的度规场所满足的定律,空间的结构才能进一步确定下来。基于物理上的理由可以认为,度规场同时就是引力场。
既然引力场取决于质量的分布,并且随之而变化,那么空间的几何结构也取决于物理因素。于是按照这种理论,正如黎曼所猜测的那样,空间不再是绝对的,其结构依赖于物理影响。(物理)几何学不再像欧几里得几何学那样是一门孤立而自足的科学。
这样一来,引力问题就归结为一个数学问题:找到最简单的基本方程,使之对于任何坐标变换都是协变的。这是一个非常明确的问题,至少是可以解决的。
这里我不想讨论对广义相对论的实验证实,但想解释一下为什么这种理论不能因此而自我满足。引力固然已从空间结构中推导出来,但除了引力场还有电磁场。首先,必须把电磁场作为一种独立于引力的东西引入该理论。解释电磁场存在的项必须加入基本的场方程。但认为存在着两种彼此独立的空间结构,即度规–引力结构和电磁结构,这种想法对于理论家来说是无法容忍的。我们相信,这两种场必定对应于统一的空间结构。
[126]收录于1934年《我的世界观》。
论广义相对论的起源[127]
我很高兴应你们之邀,讲讲我自己科学工作的历史。这倒不是因为我觉得自己的研究有什么了不起,而是因为书写别人工作的历史需要吸收别人的想法,这更多是训练有素的历史学家擅长的事情,而要说明自己的思想历程,显然会容易得多。既然有得天独厚的优势,我不应出于谦虚而放弃这个机会。
在狭义相对论(1905年)中,我得出一切惯性系对于表述自然定律都等价,于是自然产生了一个问题:是否各个坐标系也是等价的?换句话说,如果速度概念只有相对的意义,为什么还要坚持把加速度当成绝对概念呢?
从纯粹运动学的观点来看,所有运动无疑都是相对的。但从物理学上说,惯性系似乎具有一种优越地位,使用以其他方式运动的坐标系都会显得不自然。
我当然很熟悉马赫的观点,他认为,惯性阻力所反抗的并不是加速度本身,而是相对于所有其他物体质量的加速度。对我来说,这个想法颇为迷人,但它并没有为新的理论提供切实可行的基础。
当我试图在狭义相对论的框架内处理引力定律时,我第一次朝着这个问题的解决迈进了一步。和当时大多数物理学家一样,我也试图给出引力的场定律。由于绝对同时性的概念已经废除,直接的超距作用已不再可能引入,或至少是不能以任何自然的方式引入。
最简单的办法当然是保留拉普拉斯的引力标量势,在泊松方程中引入一个时间微分项,以满足狭义相对论。引力场中质点的运动定律也必须根据狭义相对论调整。这里并没有明确无误地标示出道路,因为物体的惯性质量也许依赖于引力势能。事实上,由于能量也有惯性,这是可以预料的。
然而,这些研究所得到的结果却让我大为怀疑。根据经典力学,物体在竖直引力场中的竖直加速度与速度的水平分量无关。因此,在这样的引力场中,一个力学系统或其重心的竖直加速度与它内部的动能无关。然而在我提出的理论中,落体的加速度却与它的水平速度或系统的内能有关。
这不符合一个古老的实验事实,即引力场中的物体皆有同样的加速度。这条定律或许也可以表述为惯性质量与引力质量相等,现在我认识到了它的深刻意义。对于它的存在,我感到极度惊异,猜想其中必定隐藏着更深入理解惯性和引力的关键。我从未怀疑过这条定律的严格有效性,尽管当时我还不知道厄缶[128]那些令人赞叹的实验结果(如果没有记错,我是后来才知道的)。如今,我已经不再尝试按照上述方式在狭义相对论的框架内处理引力问题了,它显然没有正确处理引力最基本的性质。惯性质量与引力质量相等这一原理现在可以清楚地表述如下:在均匀引力场中,所有运动的发生方式与没有引力场时相对于匀加速坐标系的运动方式完全相同。如果这条原理对于所有事件都成立(“等效原理”),那么这就表明,要想得到自然的引力场理论,需要把相对性原理扩展到相对做非匀速运动的坐标系。从1908年到1911年,我一直在思索,试图从中推出一些特定的结论,这里不去多谈。当时一件重要的事情是认识到,只有把相对性原理加以扩展,才可能得到合理的引力论。
因此,需要建立一种理论,使它的方程在非线性的坐标变换下保持形式不变。至于它适用于任何(连续的)坐标变换,还是只适用于某些坐标变换,那时我还不清楚。
我很快就发现,将等效原理所要求的非线性变换包括进来,比如会使对坐标的简单物理解释出现致命困难。也就是说,我们不再能把坐标差解释为用理想标尺或理想时钟所得到的直接测量结果。这种认识使我深感不安,我花了很长时间才明白坐标在物理学中究竟有什么意义。直到1912年,我才通过以下思考找到了摆脱困境的出路:
必须重新表述惯性定律,使得在没有“实际的引力场”并且把惯性系用作坐标系的情况下,该表述会变成伽利略对惯性原理的表述。伽利略的表述相当于说:不受力的质点在四维空间中的轨迹是一条直线,也就是最短的线,或者更准确地说是极值线。这个概念预先假定了线元长度的概念,亦即度规概念。正如闵可夫斯基所表明的,在狭义相对论中,此度规是一种准欧几里得度规,也就是说,线元“长度”ds的平方是坐标微分的某个二次函数。
如果通过非线性变换引入其他坐标,那么ds²仍然是坐标微分的一个齐次函数,但这个函数的系数(gμν)不再是常数,而是成了坐标的某些函数。用数学语言来说,这意味着物理(四维)空间有一种黎曼度规。只受引力作用的质点,其轨迹是一条类时的极值线。与此同时,此度规的系数(gμν)相对于所选的坐标系描述了引力场。这样便找到了一种对等效原理的自然表述,将它扩展到任何引力场就构成了一个完全自然的假说。
于是,上述难题的解决方案是:坐标的微分没有物理意义,只有与之对应的黎曼度规才有物理意义。这样便找到了广义相对论的一个可行的基础。但还有两个问题没有解决:
1.如果场定律是用狭义相对论的语言来表述的,如何将它转换到黎曼度规?
2.决定黎曼度规(即gμν)本身的微分定律是什么?
从1912年到1914年,我和我的朋友格罗斯曼一起研究这些问题。我们发现,里奇和列维–契维塔的绝对微分学已经给出了解决问题1的数学方法。
问题2的解决则显然要求(由gμν)构造二阶的微分不变量。我们很快就发现,黎曼已经给出了这些东西(曲率张量)。在广义相对论发表的两年前,我们已经考虑了正确的引力场方程,但那时我们还不知道如何把它们运用于物理学。当时我坚信它们不能正确地处理经验。我甚至还相信,在任何坐标变换下都不变的引力定律必然违反因果律。这些错误想法让我多花了两年苦工,直到1915年底我才最终醒悟,重新回到黎曼曲率,并成功地把理论与天文学的经验事实联系在一起。
从最终结果来看,广义相对论几乎是理所当然的,任何聪明学生不用费很大气力就能掌握它。但是,在黑暗中焦急探索的岁月里,怀着热烈的渴望,时而充满自信,时而精疲力竭,最后终于看到了光明,所有这些只有亲身经历过的人才能体会。
[127]收录于1934年《我的世界观》。
[128]厄缶(Loránd Eötvös,1848-1919),匈牙利物理学家,主要贡献是关于重力和表面张力的研究,以及扭转摆的发明。——译者注
物理学与实在[129]
一、科学方法总论
人们常说,科学家是蹩脚的哲学家,这句话肯定不是没有道理的。那么,物理学家是不是干脆把哲学思考留给哲学家就好了?当物理学家相信他可以自行支配一套无可置疑的严格的基本定律和基本概念时,这样说也许是对的,但是像现在这样,物理学本身的基础已经问题重重,经验迫使我们去寻求更新、更可靠的基础,此时物理学家就不能将认真考察理论基础的任务拱手让给哲学家了,因为穿鞋的人自己最清楚哪里不合脚。在寻找新的基础时,物理学家必须尽力弄清楚,他使用的概念有多少根据和有多大的必要性。
整个科学不过是对日常思维的一种改进。正因如此,物理学家的批判性思考就不能只限于考察他自己特殊领域的概念。他必须认真思考一个困难得多的问题,即分析日常思维的本性。
我们的心理经验包括感觉经验、对它们的记忆、意象和感情等一连串事物。与心理学不同,物理学只直接处理感觉经验以及对其关联的“理解”。但即使是日常思维中的“实际外在世界”概念,也完全基于感觉印象。
首先要指出,感觉印象和意象是无法区分的,或者说,至少不可能绝对确定地区分。这个问题也涉及实在概念,这里我们不去讨论,而会把感觉经验的存在当作既定的,也就是说,把它当作一种特殊的心理经验。
我认为,建立“实际外在世界”的第一步就是形成物体和各种物体的概念。我们从诸多感觉经验当中任意取出某些反复出现的感觉印象的复合体(部分是与被解释为别人感觉经验之标记的感觉印象结合在一起),并把“物体”概念与之相关联。从逻辑上讲,这个概念并不等同于上述感觉印象的总和,但却是人类(或动物)心灵的自由创造。另一方面,这个概念的意义和根据则要完全归于与之相关联的感觉印象的总和。
第二步可见于这样一个事实:我们在思维中(它决定着我们的期望)赋予物体概念以一种意义,它在很大程度上独立于那些起初产生它的感觉印象。这就是我们把“实际存在性”赋予物体时所指的意思。这样一种处置的理由完全在于,凭借这些概念及其之间的心理关系,我们得以在感觉印象的迷宫中找到方向。这些概念和关系虽然都是心灵的自由创造,但对我们来说,却比个体感觉经验本身更强大、更不可改变,个体感觉经验永远都有可能是幻觉或错觉的产物。另一方面,这些概念和关系,以及假定实际物体和“实际世界”的存在性,其根据仅仅在于与感觉印象相关联,而它们则构成了感觉印象之间的心灵联系。
我们永远也无法理解的一个令人惊叹的事实是:借助于思维(运用概念,创造并使用概念之间明确的函数关系,并把感觉经验与概念对应起来),我们所有的感觉经验就能得到整理。可以说,“世界的永恒秘密就在于世界的可理解性”。如果没有这种可理解性,假定有一个实际的外在世界就是毫无意义的,这正是康德的伟大认识之一。
这里所说的“可理解性”是在最谦虚的意义上用的,其含义是:在感觉印象之间产生某种秩序,这种秩序是通过创造一般概念、这些概念之间的关系,以及概念与感觉经验之间的某种确定关系而产生的。正是在这个意义上,我们的感觉经验世界才是可理解的。它是可理解的,这是一个奇迹。
在我看来,概念的形成和关联方式,以及如何将概念与感觉经验对应起来,都不是先验的。在引导我们创造这种感觉经验的秩序时,全看理论是否成功。我们只需定下一套规则,倘若没有这样的规则,就不可能获得想要的知识。这些规则与游戏规则类似,虽然游戏规则本身是任意的,但正是其严格性才使游戏成为可能。然而,对规则的固定永远也不会是最终的,它只有对于一个特殊的应用领域才能有效(也就是不存在康德意义上的终极范畴)。
日常思维的基本概念与感觉经验复合体之间的关联只通过直觉来把握,而不能由科学逻辑来规定。正是这些关联(所有关联都不能用概念术语来表达)将科学大厦与空洞的逻辑概念框架区分开来。借助于这些关联,科学的纯粹概念命题就成了描述感觉经验复合体的一般陈述。
我们将那些与典型的感觉经验复合体直接直觉地联系在一起的概念称为“原始概念”。从物理的观点看,所有其他概念只有通过命题与原始观念联系在一起时才有意义。这些命题,部分是对概念的定义(以及按照逻辑由定义推出的陈述),部分是无法由定义导出的命题,后者至少表达了“原始概念”之间的间接关系,这样一来也表达了感觉经验之间的间接关系。后一种命题乃是“关于实在的陈述”或自然定律,当它们被用于原始概念所涵盖的感觉经验时,必须显示出有效性。至于哪些命题应被看作定义,哪些应被看作自然定律,则主要取决于所选择的表示法。只有从物理学的观点来考察整个概念系统在多大程度上并非空洞时,做这种区分才变得绝对必要。
科学体系的分层
科学的目标一方面是尽可能完整地理解所有感觉经验之间的关联,另一方面则是用最少的原始概念和关系来达到这个目标。(尽可能地寻求世界图像中的逻辑统一性,即逻辑要素最少。)
科学使用所有原始概念(即与感觉经验直接关联的那些概念)以及将它们联系起来的命题。在第一个发展阶段,科学并不包含任何别的东西。对我们的日常思维来说,这种水平大体上已经足够。但这种情况无法满足真正有科学头脑的人,因为这样得到的所有概念和关系完全缺乏逻辑统一性。为了弥补这一缺陷,人们发明了一个概念和关系较少的体系,该体系保留着“第一层”的原始概念和关系,作为可由逻辑导出的概念和关系。这个新的“第二层体系”因为有基本概念(第二层的概念)而具有更高的逻辑统一性,但不再与感觉经验复合体有直接关联。如果进一步追求逻辑统一性,就会得到第三层体系,为了导出第二层(以及间接导出第一层)概念和关系,该体系的概念和关系数目就更少。如此继续下去,直到我们得到这样一个体系,它拥有可能设想的最大统一性和最少的逻辑基础概念,但仍然与我们的感觉经验相容。我们不知道,这种志向最终能否让我们得到一个明确的体系。科学家的回答往往是否定的。不过,在与这些问题角力时,他们决不轻言放弃希望,相信这个最高目标在很大程度上的确能够实现。
抽象理论或归纳理论的拥护者也许会把各个层次称为“不同程度的抽象”,但我并不认为掩盖概念对于感觉经验的逻辑独立性是合理的。这种关系并不像汤与肉的关系,而是像点寄存牌上的数字与大衣的关系。
而且,层与层之间也没有清楚地分开,甚至哪些概念属于第一层也不是绝对清楚的。事实上,我们处理的是自由形成的概念,这些概念与感觉经验复合体有直觉上的联系,对于实际应用有足够的确定性,以至于在任何既定的经验情况下,结果的有效性都是确定的。关键在于,要把许多与经验接近的概念和命题表示成由尽可能窄的基础通过逻辑推导出来的命题,而构成此基础的正是自由选择的基本概念和基本关系(公理)。但这种选择的自由很特别,它完全不同于小说家的自由,倒更像是猜一个设计巧妙的字谜时的自由。猜谜者固然可以尝试任何字作为谜底,但只有一个字才能真正解开整个字谜。相信我们的五种感官所知觉的大自然具有这样一种巧妙字谜的特征,这是信念问题。不过,迄今为止科学取得的成功的确给了这种信念以某种激励。
前面所讲的几个层次对应于科学发展过程中寻求统一性的几个阶段。就终极目标而言,中间层次仅仅是暂时的,它们最终会消失。然而在我们今天的科学中,这些层次代表着问题的部分成功,它们既相互支持,又相互威胁,因为今天的概念体系包含着根深蒂固的不协调,这一点我们后面会讲到。
接下来的内容旨在表明,为了达到逻辑上尽可能一致的物理学基础,构造性的人类心灵走上了哪些道路。
二、力学以及将全部物理学基于力学的尝试
我们的感觉经验,以及更一般地,我们的一切经验都有一个重要性质,那就是都有时间秩序。这种秩序引出了主观时间的心理概念,对我们的经验加以整理。然后,主观时间又经由物体和空间的概念引出了客观时间概念。我们后面会讨论这些内容。
然而在客观时间概念之前,必须先有空间概念;而在空间概念之前,又要先有物体概念。物体概念直接与感觉经验复合体相关联。我们已经说过,“物体”概念的典型特征是这样一种性质,它使我们将一种既不依赖于(主观)时间,也不依赖于是否被我们的感官知觉到的存在性赋予物体,尽管我们觉察到它会随时间变化。彭加勒曾经正确地强调,可以区分物体的“状态变化”和“位置变化”,位置变化可以通过我们身体的主动运动而反过来。
有这样一些物体,在某种知觉范围内,我们不能把状态变化而只能把位置变化归于它们。这个事实对于空间概念的形成(甚至对于物体概念本身的根据)至关重要。我们称这种物体为“准刚性的”。
如果把两个准刚性的物体当作我们的知觉对象一同(也就是当成一个单元)考虑,那么这个整体就有一些改变是不可能被看成整体位置的变化的,尽管这两个组分中的每一个都发生了位置变化。这就引出了两个物体“相对位置的变化”这个概念,由此也引出了两个物体的“相对位置”概念。我们还发现,在不同的相对位置当中有一种特殊的相对位置,我们称之为“接触”。[130]两个物体在三个或三个以上的“点”上永久接触,就意味着它们结合成了一个准刚性的复合体。可以说,第二个物体由此形成了第一个物体的(准刚性)延展,而第二个物体又可以继续做准刚性的延展。物体的准刚性延展可以无限继续下去。物体B₀的所有这种可以设想的准刚性延展的全体,就是该物体所决定的无限“空间”。
在我看来,处于任意状况的每一个物体都能与某个给定的物体B₀(参照体)的准刚性延展相接触,这个事实就是我们空间概念的经验基础。在前科学思维中,坚固的地壳起着B₀及其延展的作用。“几何学”(geometry)[131]这个名称就暗示,空间概念与作为始终存在的参照体的地球有着心理上的联系。
“空间”这个大胆的概念先于一切科学上的几何学,它把我们关于物体位置关系的心理概念转变为这些物体在“空间”中的位置的观念。这个概念本身代表着形式上的极大简化。通过这个空间概念还可以得到一种态度:任何对位置的描述都隐含地是一种对接触的描述。说物体的一个点位于空间的P点,意思是该物体在P点与标准参照体B₀(假定做了适当延展)的P点相接触。
在希腊人的几何学中,空间只扮演定性的角色,因为物体相对于空间的位置虽然被视为既定的,但并不是用数来描述的。笛卡尔最早引入了这种方法。用他的话说,欧几里得几何学的全部内容都可以公理化地建立在以下陈述的基础上:(1)刚体上两个定点确定一个截段。(2)可以把三个数X₁,X₂,X₃与空间的点联系起来,对于所考察的任何一个截段P'–P'',其端点的坐标X₁'、X₂'、X₃',X₁''、X₂''、X₃'',表达式为:
与该物体的位置无关,也与任何其他物体的位置无关。
(正)数s被称为截段的长度,或者空间的两点P'和P''(这两点与截段的点P'和P''重合)之间的距离。
我们有意选择这样的表述,使它不仅清楚地表达了欧几里得几何学的逻辑和公理的内容,而且也表达了经验内容。对欧几里得几何学的纯逻辑的(公理的)表示固然更为简单清晰,但也因此而失去了概念构造与感觉经验之间的联系,而几何学对于物理学的意义完全建立在这种联系之上。认为先于一切经验的逻辑必然性是欧几里得几何学以及属于它的空间概念的基础,这是一个致命的错误,它源于欧几里得几何学的公理构造的经验基础已经遭到遗忘。
只要能说自然中存在着刚体,欧几里得几何学就是一门必须由感觉经验来证实的物理科学。它关系到一些对于刚体之间的相对位置必定永远成立的定律的全体。可以看到,物理学中原先使用的那种物理的空间概念也与刚体的存在密切相关。
从物理学家的观点来看,欧几里得几何学的核心要点在于,其定律与物体的特定性质无关,它所讨论的是物体的相对位置。其形式上的简单性由同质性和各向同性(以及诸如此类的事物的存在)来刻画。
空间概念固然有用,但对于几何学本身,即对于表述刚体之间相对位置的规则,却并非不可或缺。而客观时间的概念却是与空间连续体的概念联系在一起的,没有客观时间的概念,就不可能表述经典力学的基础。
客观时间的引入涉及两个彼此独立的假设:
1.将经验的时间序列与“时钟”(即周期性重现的封闭系统)的读数联系起来,引入客观的当地时间。
2.对于整个空间中的各个事件引入客观时间概念,只要通过这个概念,就可以把当地时间的概念扩展成物理学中的时间概念。
先来讨论1。在我看来,它并不意味着一种“乞题”[132],只要在澄清时间概念的起源和经验内容时,把周期性重现这个概念放在时间概念之前就可以了。这种观念恰恰对应于刚性(或准刚性)物体的概念在空间概念解释中的优先地位。
再来讨论2。相对论问世之前流行着一种错觉,认为从经验的观点看,空间上分离的事件的同时性的意义,从而物理时间的意义,都是先验自明的。这种错觉来源于在日常经验中可以忽略光的传播时间。因此,我们习惯于不去区分“同时看见”和“同时发生”,结果导致时间与当地时间之间的差别被模糊了。
从经验意义的观点来看,这种明确性的缺乏是与经典力学的时间观分不开的。以公理化的方式来表示与感觉经验无关的空间和时间,掩盖了这种不明确性。独立于概念赖以存在的经验基础来使用概念并不必然会损害科学。但这很容易使人错误地相信,这些被遗忘了来源的概念在逻辑上是必然的,因此是不可变动的。这种错误可能会严重威胁科学的进步。
以前的哲学家始终没有看到,客观时间概念就其经验解释而言是缺乏明确性的。这对于力学的发展,因此对于一般物理学的发展是幸运的。他们完全相信空间–时间构造的实在意义,并且发展了力学的基础,这些基础可以扼要地表示如下:
(a)质点概念:可以足够准确地将物体——就其位置和运动而言——描述成一个点,其坐标为X₁,X₂,X₃,它(相对于“空间”B₀)的运动由作为时间函数的X₁,X₂,X₃来描述。
(b)惯性定律:一个质点距离所有其他质点足够远时,其加速度的各个分量就消失了。
(c)(质点的)运动定律:力=质量×加速度。
(d)力(质点之间的相互作用)的定律。
这里,(b)仅仅是(c)的一个重要特例。只有给出了力的定律,实际的理论才能存在。为了让一个通过力彼此关联的质点系可以像一个质点那样行为,这些力必须首先只服从作用与反作用相等的定律。
这些基本定律和牛顿的引力定律共同构成了天体力学的基础。在牛顿力学中,空间B₀并不像上文所述是由刚体的延展所导出,而是包含着新的想法。对于给定的力的定律,(b)和(c)并非对于任何B₀都有效,而是只对一种具有特定运动状态的B₀(惯性系)才有效。坐标空间由此获得了一种独立的物理性质,这种性质并不包含在纯粹几何的空间概念中,这又让牛顿有了全新的想法(旋转水桶实验)。[133]
经典力学仅仅是一般性的方案,只有明确给出力的定律(d)才能成为一种理论,就像牛顿在天体力学方面非常成功地做到的那样。科学家总是希望使基础达到最大的逻辑简单性,从这个目标来看,这种理论方法是有缺陷的,因为力的定律无法逻辑地推导出来,对力的定律的选择是先验的,在很大程度上甚至是任意的。牛顿的引力定律与其他可设想的力的定律的唯一区别就在于它的成功。
虽然我们今天知道,经典力学无法充当整个物理学的基础,但它在我们的物理思考中仍然占据着核心地位。这是因为,无论自牛顿时代以来取得了什么重大进展,我们仍然没有找到物理学的最终基础,由它可以逻辑地推导出所有已知现象,以及成功的部分理论体系。接下来我想简要描述一下事情是怎样的。
首先我们要厘清,经典力学体系在多大程度上能够充当整个物理学的基础。由于这里只讨论物理学的基础和发展,我们无须关注力学在纯形式方面的进展(拉格朗日方程、正则方程等)。但有一点似乎是不可或缺的。“质点”这个概念对于力学是非常基本的。对于不能当作质点来处理的物体(严格说来,任何“可以用感官感知的”对象都属于这个范畴),应当如何提出一种力学呢?我们如何设想物体由质点构成以及质点之间的作用力呢?要使力学完备地描述物体,提出这个问题就是不可避免的。
在力学中,我们常常假定质点以及在质点之间起作用的力的定律是不变的,因为它们随时间的变化无法做力学解释。由此可以看出,经典力学必定会引入物质由原子构成这一观念。我们现在特别清楚地意识到,相信理论是从经验中归纳出来的,这是多么错误的想法。甚至连伟大的牛顿也未能摆脱这种错误(“我不杜撰假说”)。
为了避免无望地专注于这种思路(原子论),科学首先以如下的方式发展。如果一个系统的势能是其位形的函数,则该系统的力学就确定了。现在,如果作用力可以保证系统位形的某些结构性质得以维持,那么这种位形就可以用少数几个位形变量qr来足够准确地描述。在这种情况下,势能被认为只同这些变量有关(比如用六个变量来描述准刚体的位形)。
力学应用的另一种方法同样不把物质再分为“实在的”质点,那就是所谓的连续介质力学。这种力学的典型特征是,假想物质的密度和速度都连续地依赖于坐标和时间,而没有明确给出的那部分相互作用可以被视为表面力(压力),后者亦为位置的连续函数。流体动力学理论和固体弹性理论就是这样。这些理论避免直接引入质点,而是代之以从经典力学的基础来看只可能有近似意义的虚构。
除了有应用方面的伟大意义之外,这些科学范畴还提出了新的数学概念,创造出偏微分方程,这种形式工具对于日后寻求整个物理学的新基础是必不可少的。
力学应用的这两种方式都属于所谓“唯象的”物理学。这种物理学的典型特征是尽量使用与经验接近的概念,但也不得不因此而牺牲基础的统一性。热、电和光都要用不同的状态变量和物质常数来描述,而不能用力学量。至于这些变量的相互关系和时间关系,则主要只能由经验来确定。麦克斯韦的许多同时代人都把这种表述方式看成物理学的终极目标,并认为物理学应当使用与经验接近的概念,再从经验中归纳出定律。从知识论的观点来看,密尔和马赫的立场大体如此。
在我看来,牛顿力学最伟大的成就在于,其一致的应用已经超越了这种唯象的观点,特别是在热现象方面。气体运动论和一般的统计力学都很成功。气体运动论将理想气体的状态方程、黏性、扩散、热传导和辐射度观象从逻辑上联系起来,而从直接经验的观点来看,这些现象似乎毫不相干。统计力学则对热力学的观念和定律给出了力学解释,由此发现了经典热理论的概念和定律的适用范围。这种运动论不仅在基础的逻辑统一性上远远超出了唯象的物理学,而且还得出了原子和分子的明确大小。这些数值是由几种独立的方法分别得到的,因此是无可怀疑的。这些重大成就所付出的代价是把原子与质点对应起来,而这些东西显然具有高度的臆测性。没有人会指望“直接感知”原子。那些与实验事实有更直接关系的变量(如温度、压力、速率)的各种定律,都是通过复杂的计算从这些基本观念中推导出来的。这样一来,原先更多是唯象地构造的物理学(至少是其中一部分),通过基于原子和分子的牛顿力学,都被归结到虽然远离直接实验但性质上更加一致的基础上。
三、场的概念
在解释光和电的现象时,牛顿力学远不如在上述领域那样成功。诚然,牛顿试图在其光的微粒说中把光归结为质点的运动。但是后来,随着光的偏振、衍射和干涉等现象的发现,微粒说不得不做出越来越多不自然的修改,惠更斯的光的波动说渐渐占了上风。当时晶体光学和声学已经发展到一定程度,光的波动说可能本质上起源于此。应当承认,惠更斯的理论起初也是基于经典力学,无处不在的以太被视为波的载体,但任何已知现象都无法暗示以太是如何由质点构成的。支配以太的内力,以及以太与“有重”物质之间的作用力,始终没有得到清晰认识。因此,这种理论的基础一直模糊不清。它所依据的偏微分方程,似乎无法归结为力学要素。
在电磁现象方面,人们再次引入了一种特殊的物质,并且假定这些物质之间存在着一种类似于牛顿引力的超距作用力。但这种特殊的物质似乎缺乏惯性这种基本性质,而且与有重物质之间的作用力仍然模糊不清。除了这些困难,这些物质的极性特征也无法纳入经典力学的框架。电动力学现象发现之后,磁现象可以用电动力学现象来解释,于是不再需要假设磁性物质。但该理论的基础变得更不能让人满意,因为现在,运动的带电物质之间被认为存在着非常复杂的相互作用力。
法拉第和麦克斯韦的电场理论使人摆脱了这种让人不满意的状况,这也许是自牛顿时代以来物理学的基础发生的最深刻转变。此外,这种转变还朝着构造上的思辨迈出了一步,增加了理论基础与感觉经验之间的距离。事实上,只有当带电物体出现时,场的存在才会显示出来。麦克斯韦的微分方程把电场和磁场的空间、时间微分系数联系在一起。带电物体不过是电场中散度不为零的地方罢了,而光波则是电磁场在空间中的振荡。
诚然,麦克斯韦仍然试图用机械的以太模型来机械地解释他的场论。但随着赫兹对这种理论做出新的表示,清除了一切多余的附加物,这些尝试逐渐销声匿迹了。在这种理论中,场最终获得了基础地位,就像牛顿力学中的质点那样。然而,这主要只适用于真空中的电磁场。
起初,物质内部的电磁场理论是非常不能令人满意的,因为在那里必须引入两个电矢量,而两种的关系依赖于介质的本性,无法做任何理论分析。关于磁场,以及电流密度与磁场之间的关系,也有类似的问题。
在这方面,洛伦兹找到了一条通往运动物体的电动力学理论的出路,或多或少避免了随意的假定。他的理论基于以下几个基本假说:
无论在什么地方,包括在有重物体内部,场的载体都是真空。物质之所以参与电磁现象,仅仅是因为物质的基本粒子带有不变的电荷,因此一方面受到有质动力的作用,另一方面又会产生场。基本粒子服从牛顿的质点运动定律。
正是以此为基础,洛伦兹综合了牛顿力学和麦克斯韦的场论。这个理论的缺点在于,它试图结合偏微分方程(真空中的麦克斯韦场方程)和全微分方程(质点的运动方程)来描述现象,这种做法显然是不自然的。其不恰当性表现在,它必须假定粒子的大小有限,以防粒子表面的电磁场变成无穷大,而且无法解释将各个粒子上的电荷保持在一起的巨大的力。洛伦兹清楚并接受自己理论中的这些缺点,不过至少可以大体上正确地解释各种电磁现象。
此外,还有一种考虑超出了洛伦兹的理论框架。带电物体周围有一个对它的惯性做出(明显的)贡献的磁场,难道不可能以电磁作用来解释粒子的总惯性吗?显然,只有把这些粒子解释成电磁偏微分方程的正则解,才能令人满意地解决这个问题。然而,原有的麦克斯韦方程并不允许对粒子做这样一种描述,因为与之对应的解包含一个奇点。理论物理学家一直试图修改麦克斯韦方程来达到这个目标,但并没有成功。于是,我们至今仍然无法建立物质的纯电磁场理论,尽管没有理由达不到这个目标。由于缺乏解决问题的系统方法,人们不再有勇气朝这个方向继续努力。不过在我看来,可以肯定的是,在任何自恰的场论的基础中,除了场这个概念以外,粒子概念不能被额外加入。整个理论必须完全基于偏微分方程,而且它的解不能带奇点。
四、相对论
任何归纳法都导不出物理学的基本概念。不理解这个事实是19世纪的许多研究者犯下的基本哲学错误。也许正是由于这个缘故,分子理论和麦克斯韦理论直到较晚的时候才确立起来。逻辑思维必然是演绎的,它基于假设的概念和公理。应当如何选择这些概念和公理,才能确证由它们导出来的推论呢?
最理想的情况显然是,新的基本假说能够由经验世界本身暗示出来。作为热力学的基本假说,“永动机不存在”便是由经验暗示出来的。伽利略的惯性原理也是如此。而且,相对论的基本假说也是出于同一范畴。相对论使场论得到了意想不到的推广,也使经典力学的基础被取代。
麦克斯韦–洛伦兹理论的成功使人们对真空中电磁学方程的有效性深信不疑,因此特别相信光以恒定的速度c“在空间中”行进。这个光速不变的断言是否对于任何惯性系都有效呢?如果不是这样,那么一个特殊的惯性系,或者更准确地说,(一个参照体的)一种特殊的运动状态就应区别于所有其他运动状态。然而,这似乎与所有力学的和电磁学–光学的实验事实相矛盾。
因此,我们必须把光速不变定律对一切惯性系都有效提升为原理。由此,空间坐标x₁、x₂、x₃和时间x₄必须按照“洛伦兹变换”来变换,它由以下表达式的不变性来刻画:
(如果时间单位的选择使光速c=1)。
通过这种程序,时间便失去了绝对性,而与“空间”坐标结合在一起,在代数上具有(近乎)类似的特征。时间的绝对性,特别是同时的绝对性被破坏了,四维描述作为唯一恰当的描述被引入进来。
同样,为了解释所有惯性系对于所有自然现象都等价,必须假设所有表达一般定律的物理方程组对于洛伦兹变换都是不变的。对这个要求作出详细阐述,正是狭义相对论的内容。
这个理论与麦克斯韦方程相容,但与经典力学的基础不相容。虽然可以修改质点的运动方程(以及质点动量和动能的表达式),使之满足这个理论,但相互作用力的概念以及系统的势能概念却失去了基础,因为这些概念都基于绝对同时性的观念。由微分方程决定的场取代了力。
由于上述理论只允许相互作用由场来产生,因此需要一种引力场论。事实上,提出一种能像牛顿理论那样把引力场归结成一个偏微分方程的标量解的理论并不困难。然而,牛顿的引力理论所表达的实验事实却引向了另一个方向,即广义相对论的方向。
经典力学有一个不能让人满意的特征,那就是在它的基本定律中,同一个质量常数以两个不同的角色出现,即作为运动定律中的“惯性质量”和作为引力定律中的“引力质量”。结果,物体在纯引力场中的加速度与它的材料无关;或者说,在匀加速的坐标系中(相对于一个“惯性系”加速),运动就像在一个均匀的引力场(相对于一个“不动的”坐标系)中一样。如果假定这两种情况完全等效,我们的理论思考就符合了引力质量等于惯性质量这一事实。
由此可知,我们原则上不再有任何理由偏爱惯性系,而且必须承认,坐标(x₁,x₂,x₃,x₄)的非线性变换也有同等地位。如果我们对狭义相对论的坐标系作这样的变换,那么度规
就转换成具有如下形式的广义(黎曼)度规:
其中gμν对于μ和ν是对称的,是x₁,x₂,x₃,x₄的某些函数,它们既描述度规性质,又描述相对于新坐标系的引力场。
这是对力学基础进行解释的重大改进,但经过更加细致的考察就会发现,它所付出的代价是,我们不再能像在原先的坐标系(没有引力场的惯性系)中那样,将新坐标解释成刚体和时钟量度的结果。
广义相对论之路是通过以下假设实现的:这样一种用函数gμν(即用黎曼度规)来表示空间场性质的做法也适合于一般情况,即相对于任何坐标系,度规都不会有狭义相对论的简单的准欧几里得形式。
现在,坐标本身不再表示度规关系,而仅仅表示坐标彼此略有不同的物体“附近”。只要没有奇点,一切坐标变换都是容许的。只有用那些对于这个意义上的任意变换都协变的方程来表达,一般自然定律才有意义(广义协变假设)。
广义相对论的第一个目标是提出一个初步版本,它虽然构不成一个封闭体系,却能以尽可能简单的方式与“可直接观察的事实”相联系。如果这种理论只限于纯粹的引力力学,则牛顿的引力理论就能充当模型。这个初步版本可以这样刻画:
1.保留质点及其质量的概念,给出它的运动定律,也就是把惯性定律翻译成广义相对论的语言。该定律是一个具有测地学性质的全微分方程组。
2.牛顿的引力相互作用定律被一组能由gμν张量组成的最简单的广义协变微分方程组所取代。此方程组是让缩并一次之后的黎曼曲率张量等于零(Rμν=0)而形成的。
这种表述使我们可以处理行星问题,更准确地说,它使我们能够处理质量几乎可以忽略不计的质点在(中心对称的)引力场中的运动问题,这种引力场是由一个假定“静止”的质点所产生的。它不考虑“运动的”质点对引力场的反作用,也不考虑中心质量是如何产生这个引力场的。
与经典力学的类比表明,下面的做法可以使理论完整。我们这样来构造场方程:
其中R是黎曼曲率的标量,Tik是以唯象方式表示的物质的能量张量。选择方程左边,使它的散度恒等于零,于是右边的散度也等于零,这样便产生了偏微分方程形式的物质的“运动方程”。用来描述物质的Tik只引入了另外四个独立的函数(比如密度、压力和速度分量,其中速度分量之间有一个恒等式,而压力与密度之间有一个状态方程)。
通过这种表述,我们将整个引力力学归结成求一个协变的偏微分方程组的解。这种理论避免了经典力学基础的所有那些缺点。据我们所知,它足以表示天体力学观察到的事实。然而,它就像一幢左右不对称的建筑,一侧是用精致的大理石砌成的(方程的左边),另一侧则是用劣质的木材制成的(方程的右边)。事实上,对物质的唯象表示仅仅是一种粗糙的代用品,无法正确处理物质的所有已知性质。
在没有有重物质和电密度的空间中,把麦克斯韦的电磁场理论与引力场理论联系起来并不困难。只要把真空中电磁场的能量张量代入上述方程右边的Tik,并把真空中的麦克斯韦场方程改写成广义协变形式即可。在这些条件下,所有这些方程之间会有足够多的微分恒等式,以确保它们的一致性。还要补充一句,整个方程组的这种必然的形式性质使Tik的符号可以任意选择,这一点后来变得很重要。
人们希望理论的基础尽可能达到最大的统一性,遂多次尝试把引力场和电磁场纳入同一幅统一的图像。这里必须特别提到卡鲁扎和克莱因的五维理论。我认真考虑过这种可能性,觉得宁可接受原有理论的内在不一致,因为构成五维理论基础的全部假说所包含的任意性并不比原有的理论更少。同样的意见也可用于这种理论的投影形式,冯·丹奇克和泡利对此曾作过精心阐述。
以上讨论只涉及没有物质的场的理论。如何从这一点出发,得到关于物质原子构成的完整理论呢?这种理论必须把奇点排除在外,否则微分方程就无法完全决定总的场。广义相对论的场论在这方面的问题与纯粹的麦克斯韦理论对物质的场论表示所面临的问题相同。
这里,对粒子的场论构造似乎再次导致了奇点。人们同样试图通过引入新的场变量以及精心阐述和扩展场方程组来克服这个缺点。然而近来,我与罗森博士合作发现,上述引力场方程与电场方程最简单的结合产生了可以表示为不带奇点的中心对称解(施瓦茨希尔德关于纯粹引力场的著名中心对称解,以及莱斯纳关于电场及其引力作用的解)。我将在第六节简要讨论它。这样似乎就能得到没有附加假说的关于物质及其相互作用的纯粹场论,而且除了纯粹数学上的困难(尽管非常严重),对它作经验检验不会导致别的什么困难。
五、量子理论和物理学的基础
我们这一代的理论物理学家正期待为物理学建立新的理论基础,它所使用的基本概念会与迄今考察的场论概念大相径庭。这是因为人们发现,对所谓量子现象的数学表示必须采用全新的方法。
正如相对论所揭示的,经典力学的失败与光的有限速度(它不是无穷大)有关,另一方面,在20世纪初又发现了力学推论与实验事实之间的其他各种不一致,这些不一致与普朗克常数h的有限大小(它不是零)有关。特别是,分子力学要求固体的热量和(单色的)辐射密度应当随着绝对温度的下降而成比例地减少,然而经验却表明,它们的减少要比绝对温度的下降快得多。要想对这种现象作出理论解释,必须假定力学系统的能量不能取任意值,而只能取某些分立的值,其数学表示式总与普朗克常数h有关。而且,这种观念对于原子论(玻尔的理论)是至关重要的。无论是否有辐射的发射或吸收,关于这些状态彼此之间的跃迁无法给出因果定律,而只能给出统计定律。对于大约在同一时间得到认真研究的原子的放射性衰变,也可得出类似的结论。物理学家曾花了20多年时间,试图对系统和现象的这种“量子特性”作出统一解释,但没有成功。大约10年前,物理学家终于用两种完全不同的理论方法取得了成功。第一种方法归功于海森伯和狄拉克,另一种归功于德布罗意和薛定谔。没过多久,薛定谔就认识到,这两种方法在数学上是等价的。这里我将尝试概括出德布罗意和薛定谔的思路,因为它比较接近物理学家的思想方法,并附上一些一般思考。
首先,对于一个在经典力学意义上被指定的系统(能量函数是坐标qr以及对应动量pr的给定函数),如何为之指定一系列分立的能量值Hσ呢?普朗克常数h将频率Hσ/h与能量值Hσ联系起来。因此,它足以为该系统指定一系列分立的频率值。这让我们想起一个事实:在声学中,一系列分立的频率值是与一个线性偏微分方程(对于给定的边界条件),即与正弦的周期解相对应的。相应地,薛定谔认为自己的任务是把一个关于标量函数ψ的偏微分方程与给定的能量函数ε(qr,pr)对应起来,其中qr和时间t都是独立变量。这样一来,他便成功地由(对于复函数ψ)方程的周期解实际得出了统计理论所要求的能量Hσ的理论值。
诚然,不可能把薛定谔方程的一个明确解ψ(qr,t)与质点力学意义上的一种明确的运动联系起来。这意味着ψ函数并不能精确地决定qr与时间t的关系。然而依照玻恩的看法,ψ函数的物理意义可以解释如下:(复函数ψ的绝对值的平方)是系统在时刻t位于qr的位形空间中所考察的那个点上的概率密度。因此,薛定谔方程的内容可以简单但不十分精确地概括如下:它决定着系统的统计系综的概率密度在位形空间中随时间的变化。简而言之,薛定谔方程决定着qr的ψ函数随时间的变化。
必须提到,该理论在极限值会回到粒子力学的结果。若薛定谔问题的解所涉及的波长处处都很小,以至于在位形空间中一个波长的距离内,势能的变化几乎无限小,我们就可以在位形空间中选取一个区域G₀,虽然在任何方向都比波长大,但却比位形空间的相关尺寸小。在这些条件下,对于初始时刻t₀,可选择函数ψ,使它在区域G₀之外为零,并且按照薛定谔方程以如下方式变化:在以后的一段时间里至少近似保持着这种性质,但在时刻t,区域G₀移动到另一个区域G。这样就能近似地谈论整个区域G的运动,并且用位形空间中一个点的运动来近似这种运动。于是,这种运动就与经典力学方程所要求的运动相符了。
以粒子射线进行的干涉实验出色地证明,理论所假定的运动现象的波动特征的确符合事实。此外,该理论还轻而易举地证明了一个系统在外力作用下从一个量子态跃迁到另一个量子态的统计定律,而这在经典力学看来仿佛是奇迹。这里的外力由势能的一些与时间有关的微小附加项来表示。在经典力学中,这些附加项只能产生微小的系统改变,而在量子力学中却能产生任何量级的变化,无论这些变化有多大,但相应的概率却很小,这种结果与经验完全符合。甚至是放射性衰变的定律,该理论也能提供至少是概括性的解释。
也许从来没有一种理论像量子理论那样,能为解释和计算如此纷繁复杂的经验现象提供一把钥匙。但尽管如此,在寻求物理学的统一基础时,我认为这种理论容易诱使我们误入歧途,因为虽然只有量子理论能用力和质点这些基本概念建构出来(对经典力学的量子修正),但我相信它是对实在事物的一种不完备的描述。这种描述的不完备性必然导致定律的统计性(不完备性)。接下来我就来谈谈这种观点的理由。
首先要问,ψ函数能在多大程度上描述力学系统的实际状态?假定ψr是薛定谔方程的一系列周期解(按照能量值递增的顺序排列)。至于单个ψr在多大程度上是对物理状态的完备描述,这个问题我暂不考虑。一个系统先是处于状态ψ₁,对应于最低的能量ε₁,然后在有限的时间内受到小的外力扰动,那么在稍后的某个时刻,由薛定谔方程可以得到如下形式的ψ函数:
其中cr是(复)常数。如果ψr是“归一化的”,那么|c₁|近乎等于1,|c₂|等等则远小于1。我们现在会问:ψ描述了系统的真实状态吗?如果答案为是,我们就不得不赋予这个状态以确定的能量ε[134],且此能量略大于ε₁(在任何情况下都有ε₁<ε<ε₂)。然而,如果考虑到密立根对电荷分立本性的证明,这个假定与弗兰克和赫兹所做的电子碰撞实验是矛盾的。事实上,这些实验引出了这样的结论:介于量子值之间的能量值是不存在的。由此得知,函数ψ无法描述系统的同质状态,而只能代表一种统计描述,其中cr表示单个能量值出现的概率。因此,情况似乎很清楚,玻恩关于量子理论的统计诠释是唯一可能的诠释。ψ函数不可能描述单个系统的状态,而是涉及多个系统,或者说统计力学意义上的“系综”。如果说除了某些特殊情形,ψ函数只提供关于可测量量的统计数据,这不仅是因为测量操作引入了只能在统计上把握的未知要素,而且也因为ψ函数在任何意义上都不描述单个系统的状态。不论单个系统是否受到外界的作用,薛定谔方程都决定着系综所经历的时间变化。
这种诠释也消除了我和两位同事最近证明的那个悖论,它与下面这个问题有关。
考虑由两部分系统A和B所组成的力学系统,这两部分系统只在有限时间内发生相互作用。假设发生相互作用前的ψ函数是已知的,则相互作用后的ψ函数由薛定谔方程决定。现在让我们通过测量来尽可能完备地确定部分系统A的物理状态,则根据量子力学,我们可以由所做的测量和整个系统的ψ函数来确定部分系统B的ψ函数。然而,这种确定所给出的结果却要依赖于被测量的是A的哪个(可观测的)物理量(比如是坐标还是动量)。既然相互作用后B只可能有一个物理状态,而且不能认为它依赖于我们对与B分隔开的系统A所做的测量,因此可以断言,ψ函数与物理状态并非明确对应。几个ψ函数与系统B的同一物理状态的这种对应再次表明,不能把ψ函数解释成对单个系统物理状态的(完备)描述。这里同样是ψ函数与系综的对应消除了所有困难。[135]
量子力学以这种简单的方式提供了从一个状态(表观上)不连续地跃迁到另一个状态的陈述,却不实际描述具体过程,这与该理论不能描述单个系统而只能描述多个系统的总和有关。我们第一个例子中的系数cr在外力作用下其实变动很小。根据对量子力学的这种诠释,我们就可以理解,为什么这种理论很容易说明,微弱的扰动力就能使一个系统的物理状态发生任意大小的改变。事实上,这种扰动力只会使系综中的统计密度发生相应的微小变化,因此只会使ψ函数发生无限微弱的变化,对它的数学描述要比对单个系统所经历的有限变化进行数学描述容易得多。当然,这种思考方式完全弄不清楚单个系统发生了什么事情,统计进路的描述完全消除了这个谜一样的事件。
近年来,威尔逊云室和盖革计数器等令人惊异的发明已经把这些单个事件带到我们眼前。现在我要问,在这种情况下,难道真有哪位物理学家会相信,我们永远也无法理解单个系统的这些重要变化、结构和因果关系吗?这在逻辑上不仅可能,而且无矛盾,但与我的科学本能格格不入,我无法放弃追求更完备的观念。
除了这些考虑,还有另一种思考也表明,量子力学所引入的方法不大可能为整个物理学提供有用的基础。在薛定谔方程中,绝对时间和势能扮演着决定性的角色,而由相对论已经认识到,这两个概念在原则上是不能容许的。要想摆脱这种困难,就需要把理论建立在场和场定律而不是相互作用力的基础上。这引导我们把量子力学的统计方法应用于场,也就是说,应用于有无穷多自由度的系统。虽然迄今为止所做的尝试仅限于线性方程,从广义相对论的结果可以知道这是不够的,但即使是这样,目前面临的复杂性已经非常惊人。若要服从广义相对论的要求(原则上没有人会怀疑这种要求的合理性),复杂性肯定还会增加。
诚然,有人已经指出,鉴于一切在小尺度上出现的东西都有分子结构,可以认为引入空间–时间连续体是违反自然的。他们主张,海森伯方法的成功也许暗示,可以用一种纯代数方法来描述自然,也就是从物理学中取消连续函数。但那样一来,我们也必须原则上放弃空间–时间连续体。可以设想,人类的聪明才智有朝一日真能找到这样的方法,不过目前,这种纲领还像空中楼阁。
毫无疑问,量子力学已经把握住了许多真理,对于未来的任何理论基础来说,它都是一块试金石,因为它必须能作为极限情况从那个基础中推导出来,就像静电学能从麦克斯韦电磁场方程中推导出来,或者热力学能从经典力学中推导出来一样。但我不相信量子力学能作为寻求这种基础的出发点,就像不能相反地从热力学(关系到统计力学)出发找到力学的基础一样。
考虑到这种情况,认真考虑场物理学的基础是否无论如何都无法与量子现象协调起来,就显得完全合理了。采用目前的数学工具,难道不是只有以场论为基础,才能适应广义相对论的要求吗?今天的物理学家往往认为,这种尝试是没有希望的,这种信念也许来源于一个没有根据的看法,即认为这种理论在一级近似中必须导出粒子运动的经典力学方程,或者至少要导出全微分方程。事实上,到目前为止,所有以场来描述粒子的理论都含有奇点,我们无法就这些粒子的行为先验地说出任何东西。但有一件事情是确定的:如果一种场论可以不带奇点地描述粒子,那么这些粒子随时间的行为就完全由场的微分方程来决定了。
六、相对论与粒子
我现在要表明,根据广义相对论,场方程存在着不带奇点的解,可以解释为代表粒子。这里我只限于中性粒子,因为在最近发表的与罗森博士合作的另一篇论文中,我已经详细讨论了这个问题,而且因为在这种情况下,问题的实质可以完整地显示出来。
引力场完全由张量gμν描述。在三指标符号Γσμν中也出现了逆变张量gμν,它被定义为gμν的子行列式除以行列式g(=|gαβ|)。要使Rik能被定义且有限,不仅连续体每一点的邻近都要有一个坐标系,在这个坐标系中,gμν及其一阶微分系数是连续和可微的,而且行列式g必须处处不为零。但如果用g²Rik=0来代替微分方程Rik=0,那么最后一个限制就不再需要,因为方程左边是gik及其导数的有理整函数。
这些方程有施瓦茨希尔德给出的中心对称解:
这个解在r=2m处有一个奇点,因为dr²的系数(即g11)在这个超曲面上变成无限大。但如果用下列方程定义的ρ来代替变量r:
我们就得到
这个解对于ρ的所有值都是正则的。对于ρ=0,dr²的系数(即g44)也等于零,由此固然可以推出行列式g等于零,但根据我们实际采用的场方程的写法,这并不构成奇点。
如果ρ从-∞变到+∞,则r就从+∞变到r=2m,然后又回到+∞。而当r<2m时,并没有对应的ρ的实数值。因此,通过把物理空间表示成沿着超曲面ρ=0(也就是r=2m)相接触的两个相同的“薄片”,在这个超曲面上,行列式g等于零,施瓦茨希尔德解就成了一个正则解。我们把两个(相同的)薄片之间的这种连接称为“桥”。于是,有限区域内两个薄片之间的这种桥的存在就对应于物质中性粒子的存在,这种粒子可以用不带奇点的方式来描述。
解决中性粒子的运动问题,显然就相当于发现引力方程(写成不带分母的形式)的包含多个桥的解。
由于“桥”本质上是分立的,因此,上述观念先验地对应于物质的原子论结构。我们还看到,中性粒子的质量常数m必然为正,因为没有一个不带奇点的解能与m是负值的施瓦茨希尔德解相对应。只有考察多桥问题才能表明,这种理论方法能否解释为什么自然界的粒子具有相等的质量,以及能否说明量子力学已经如此美妙地理解的那些事实。
以类似的方式也可以表明,引力方程与电方程相结合(在引力方程中恰当选取电的部分的正负号)会产生对带电粒子的不带奇点的桥表示。在这种解当中,最简单的是无引力质量的带电粒子的解。
只要没有克服与多桥问题的解相关的巨大的数学困难,从物理学家的观点来看,就不能说这种理论有什么用处。但事实上,它第一次尝试以场论对物质的性质作出一致的解释。这种尝试的另一个优点是,它所基于的是今天已知最简单的相对论性场方程。
总结
物理学构成了一个不断演化的逻辑思想系统,它的基础无法用归纳法从经验中提取出来,而只能靠自由发明而得到。这种系统的正当性(真理内容)在于导出的命题可以用感觉经验来证实,而感觉经验与基础的关系只能直觉地把握。物理学的演化使逻辑基础变得越来越简单。为了进一步接近这个目标,我们必须容许逻辑基础越来越远离经验事实,而从基础到那些与感觉经验相关联的导出命题的思想道路,也变得越来越艰难和漫长了。
我们的目标是尽可能简要地概述基本概念的发展及其与经验事实的关系,以及为达到系统的内在完美性而付出的努力。这些考虑旨在阐明在我看来目前的事态。(扼要的历史阐述难免会有主观色彩。)
我试图表明,物体、空间、主观时间和客观时间这些概念是如何彼此关联以及与我们的经验相关联的。在经典力学中,空间和时间概念是相互独立的。在这个基础中,物体概念被质点概念所取代,从而使力学从根本上成为原子论的。在试图使力学成为整个物理学的基础时,光和电产生了无法克服的困难。由此我们被引到电的场论,随后又尝试把物理学完全建立在场的概念的基础上。这种尝试引出了相对论(空间和时间概念演化成有度规结构的连续体的概念)。
此外我还试图表明,为什么我认为量子理论似乎无法为物理学提供恰当的基础:若把理论的量子描述当成对单个物理系统或事件的完备描述,就会陷入矛盾。
另一方面,场论尚不能解释物质的分子结构和量子现象。但我已经表明,相信用场论的方法无法解决这些问题,这乃是基于偏见。
[129]载《富兰克林研究所学报》(The Journal of the Franklin Institute, Vol. 221, No. 3. March, 1936)。
[130]事物的本性决定我们只能通过自己创造的概念来谈论这些物体,而这些概念本身是无法定义的。然而重要的是,我们使用的概念与我们的经验无疑是对应的。——作者注
[131]“geometry”一词的字面意思是测地术。——译者注
[132]“乞题”(petitio principii),即“以假定作为论据来辩论”,它与循环论证高度相关但并不完全一样。——译者注
[133]只有找到一种对所有B₀都有效的力学,才能消除该理论的这个缺陷。这是通向广义相对论的一个步骤。第二个缺陷在于,牛顿力学本身解释不了质点的引力质量与惯性质量相等,这同样要通过引入广义相对论才能消除。——作者注
[134]因为根据相对论的一个已经充分证实的结论,一个静止的完整系统的能量等于它的整个惯性,而这必须有确定的值。——作者注
[135]例如,对A的测量会涉及向较小系综的跃迁。后者(因此它的ψ函数)依赖于对系综的这种缩小所根据的是哪种观点。——作者注
理论物理学的基础[136]
科学试图将我们杂乱无章的感觉经验与逻辑一致的思想体系对应起来。在这种体系中,个别经验与理论结构的对应关系必须是唯一且令人信服的。
感觉经验是给定的,而解释感觉经验的理论却是人为的,是极其艰苦费力的适应过程的结果:假设性的,永远不会有最终结论,始终受到质疑和挑战。
形成概念的科学方法与我们日常生活中使用的方法之间的区别不是根本上的,而只在于概念和结论有更精确的定义,实验材料的选择更加谨慎和有系统性,以及逻辑上更加经济。最后这一点指的是,努力将所有概念和关系都归结为尽可能少的逻辑上独立的基本概念和公理。
我们所说的物理学包括这样一组自然科学,它们的概念建立在测量的基础上,其概念和命题可以作数学表述。相应地,我们全部知识中能用数学方式来表达的部分就被界定为物理学的领域。随着科学的进步,物理学领域已经大大扩张,似乎只受方法本身界限的限制。
物理学有很大一部分研究是致力于发展物理学的各个分支,每一个分支都旨在对有限范围的经验做理论上的理解,而且每个分支的定律和概念都尽可能与经验保持密切的联系。这门科学不断地专门化,在过去几个世纪里使实际生活发生了革命,使人类有可能从辛苦劳动的重负中解放出来。
另一方面,从一开始就一直有人试图找到所有这些学科的统一的理论基础,它由最少的概念和基本关系所组成,使各门学科的所有概念和关系都能逻辑地推导出来。这就是我们寻求整个物理学基础的意义所在。深信这个终极目标可以达到,是鼓舞研究者热情投入的主要源泉。因此,下面专门来讨论物理学的基础。
由前所述可以清楚地看到,这里所谓的“基础”与建筑物的基础并不相似。当然,从逻辑上看,物理学的各个定律都建立在这种基础上。建筑物会被风暴或洪水严重毁坏,而基础却安然无恙,然而在科学中,逻辑基础受到的来自新经验或新知识的威胁却总是大于与实验接触更为密切的分支。理论基础的重大意义就在于它与各个部分都有联系,但其最大的危险也正在于面临任何新因素。然而,在所谓物理学的革命时代,其基础的改变并没有那么频繁和彻底,这是为什么呢?
牛顿的工作第一次试图奠定统一的理论基础。他的体系可以归结为以下几个概念:(1)具有不变质量的质点;(2)任何两个质点之间的超距作用;(3)质点的运动定律。严格说来,并不存在包含一切的基础,因为它所列出的明确定律只针对引力的超距作用,而对于别的超距作用,除了作用与反作用相等这条定律,并没有先验地确立任何东西。此外,牛顿本人也充分意识到,空间和时间作为具有物理效力的因素,是其体系的关键要素,但他对此并未明说。
事实证明,这种牛顿基础是卓有成效的,直到19世纪末一直被视为最终的。它不仅给出了天体运动最详细的细节,还给出了关于分立质量和连续质量的力学理论、对能量守恒原理的简单解释,以及完整而出色的热理论。在牛顿体系中,对电动力学事实的解释是比较勉强的,而自始至终最不能让人信服的就是光的理论。
牛顿不相信光的波动说是不足为奇的,因为这种理论极不适合他的理论基础。假定空间中充满了一种由质点组成的介质,传播光波却不显示任何其他力学性质,这在牛顿看来必定非常不自然。恒定的传播速度、干涉、衍射、偏振等支持光的波动性的最有力的经验证据,当时要么还不知道,要么还未整理清楚。因此他坚持光的微粒说是有道理的。
在19世纪,这场争论以波动说的胜利而告终。但人们并未对物理学的力学基础产生认真的怀疑,这首先是因为没有人知道到哪里还能找到另一种基础。只是在无法抗拒的事实压力下,才慢慢发展出一种新的物理学基础,即场物理学。
从牛顿时代起,超距作用理论就一直被认为是不自然的。不少人曾力图通过一种运动论,即基于假设质点的碰撞力来解释引力。但这些尝试都浅尝辄止,无果而终。空间(或惯性系)在力学基础中扮演的奇特角色已被清晰地认识到,并且受到了马赫的犀利批判。
法拉第、麦克斯韦和赫兹带来了伟大的变革,事实上这种变革多半是在不自觉的甚至违反当事人意愿的情况下实现的。这三个人终其一生都认为自己是力学理论的信徒。赫兹发现了电磁场方程的最简单形式,并宣称任何导出这些方程的理论都是麦克斯韦理论。然而在他短暂的一生即将结束时,他写了一篇论文,提出物理学的基础是一种摆脱了力的概念的力学理论。
法拉第的思想可以说是我们从小就在摄取的养料食粮,它的伟大和大胆是怎样形容都不为过的。对于要把电磁现象归结为带电粒子之间超距作用的种种尝试,法拉第必定以准确无误的直觉看出了它们的人为性。散布在一张纸上的许多铁屑,怎么会知道附近导体中有带电粒子在到处跑呢?所有这些带电粒子似乎共同在周围空间中创造了一种状态,让铁屑排成某种秩序。这些空间状态今天被称为场,他深信,如果正确掌握了它们的几何结构和相互依存的作用,就可以找出神秘的电磁相互作用的线索。他把这些场设想为一种充满空间的介质中的机械应力状态,类似于弹性膨胀体中的应力状态。因为在当时,这是设想空间中连续分布状态的唯一可能的方式。从法拉第时代的力学传统来看,在背后为这些场保留独特的力学解释,这是对科学良知的某种安慰。借助于这些新的场概念,法拉第成功地对他和前人发现的全部电磁效应形成了定性的概念。麦克斯韦对这些场的时间–空间定律给出了精确的表述。当他用自己建立的微分方程,证明电磁场以偏振波的形式以光速传播的时候,该是怎样的感觉啊!世上很少有人有如此幸运。在那个激动人心的时刻,他肯定猜不到,光的谜一般的本性似乎已经完全解决,竟还会继续困扰以后好几代人。与此同时,物理学家花了好几十年时间才理解了麦克斯韦发现的全部意义,他的天才迫使其同行必须在观念上做出大胆的跳跃。直到赫兹用实验证明了麦克斯韦电磁波的存在之后,对新理论的抗拒才告一段落。
但如果电磁场可以作为一种波独立于物质源而存在,那么就再也不能把静电的相互作用解释成超距作用了。既然电的作用是如此,那么引力的情况也是如此。牛顿的超距作用处处都让位于以有限速度传播的场。
现在,牛顿的基础只剩下受运动定律支配的质点了。但汤姆逊指出,按照麦克斯韦的理论,运动的带电物体必定具有磁场,磁场能量正好是物体增加的动能。既然一部分动能是由场能组成的,难道全部动能就不能由场能组成吗?作为物质的基本属性,惯性或许能用场论来解释呢?这就引出了用场论来解释物质的问题,其解答可望提供对物质原子结构的解释。人们很快就意识到,麦克斯韦的理论无法实现这个纲领。从那以来,许多科学家都曾热情地试图通过某种推广,来寻求一种包含物质理论的完整场论。但迄今为止,这些努力都没有成功。要想构造一种理论,仅仅目标明确是不够的,还必须有一种形式观点,对无穷多种可能性加以充分限制。到目前为止,这种观点还没有找到,因此场论还没有成功地为整个物理学提供基础。
数十年来,大多数物理学家都坚信可以找到麦克斯韦理论的力学基础。但由于他们的努力没有获得令人满意的结果,人们渐渐承认,新的场概念是不可还原的基本要素。换句话说,物理学家不得不放弃力学基础的想法。
于是,物理学家持一种场论纲领。但它不再能被称为基础,因为谁也不敢说是否有一种一致的场论既能解释引力,又能解释物质的基本组分。在这种情况下,有必要把物质粒子看成服从牛顿运动定律的质点。洛伦兹在创建其电子理论和运动物体电磁现象理论时,使用的就是这种方法。
这就是世纪之交时基本概念的情况。当时,对于全部新现象的理论洞察和认识取得了巨大进展,但物理学统一基础的建立却似乎遥遥无期。这种事态又因为随后的发展而更加恶化。20世纪物理学的发展可以由相对论和量子论这两个本质上相互独立的理论体系来刻画。这两个体系并不直接相抵触,但似乎很难融合成统一的理论。接下来我想简要讨论这两个体系的基本观念。
相对论是在世纪之交时,为了在逻辑经济性上改进物理学的基础而产生的。所谓的狭义相对论基于一个事实,即在洛伦兹变换下,麦克斯韦方程(因此真空中光的传播定律)变换成同一形式的方程。麦克斯韦方程的这种形式上的性质可由一项十分可靠的经验知识来佐证:物理定律对于一切惯性系都相同。由此引出结论,洛伦兹变换(用于空间和时间坐标)必定支配着惯性系之间的转换。因此,狭义相对论的内容可以用一句话来总结:所有自然定律都必须对于洛伦兹变换协变。由此得知,两个相隔事件的同时性并不是固定不变的概念,刚体的大小和时钟的快慢都与运动状态有关。另一个推论是,一旦物体速度接近光速,就需要修改牛顿运动定律。它还导出了质能等效原理,质量守恒与能量守恒合为一个定律。一旦表明同时性是相对的,与参照系有关,物理学的基础就不再可能保留超距作用了,因为这个概念是以同时的绝对性为前提的(即必须能够说出两个相互作用的质点“在同一时刻”所处的位置)。
广义相对论的起源是,试图解释一个从伽利略和牛顿时代就已知晓,但一直无法做任何理论解释的事实:物体的惯性和重量本身是两种完全不同的东西,却用同一个常数(质量)去度量。由这种对应性可以得知,不可能通过实验来发现某个坐标系究竟是在加速,还是在做匀速直线运动,而观察到的结果是由引力场引起的(这就是广义相对论的等效原理)。一旦引力进入,它就粉碎了惯性系的概念。这里需要指出的是,惯性系是伽利略–牛顿力学的一个弱点,因为它预先假定物理空间有一种神秘的性质,限制着惯性定律和牛顿运动定律在其中成立的那种坐标系。
这些困难可以通过以下假设来避免:对自然定律的表述须使其形式对于任何运动状态的坐标系都相同。做到这一点正是广义相对论的任务。另一方面,由狭义相对论可以推出,时间–空间连续体中存在着黎曼度规,按照等效原理,它既描述了引力场,又描述了空间的度规性质。若假定引力的场方程是二阶微分方程,场定律就可以确定下来。
和牛顿力学一样,场物理学也把独立的物理性质赋予了空间,这些性质一直因为使用惯性系而被掩盖起来。广义相对论使场物理学摆脱了无能为力的状态。但还不能宣称,广义相对论的那些今天可被视为定论的部分,已为物理学提供了完整而令人满意的基础。首先,理论中出现的场是由两个逻辑上无关的部分组成的。其次,和以前的场论一样,该理论尚未提出关于物质原子结构的解释。这种失败或许与它至今无法理解量子现象有些关系。为了理解量子现象,物理学家被迫采用了全新的方法,现在我们就来讨论这些方法的基本特征。
1900年,在纯理论研究的进程中,普朗克做出了一项非常引人注目的发现:作为温度函数的物体辐射定律,不能只由麦克斯韦的电动力学定律推导出来。为了得到与有关实验相一致的结果,必须把特定频率的辐射当成由一些能量原子所组成,单个能量原子的能量为hν,其中h是普朗克的普适常数。随后几年又发现,光处处都以这种能量子的形式被产生和吸收。特别是,尼尔斯·玻尔大体上理解了原子的结构,他假定原子只能有分立的能量值,原子之间不连续的跃迁与这种能量子的发射或吸收有关。这有助于说明,元素及其化合物在气态时为什么只辐射和吸收某些特定频率的光。所有这些现象都无法在先前的理论框架中得到解释。至少在原子论现象的领域中,任何事物的特征显然都由分立状态以及它们之间不连续的跃迁所决定,普朗克常数h扮演着决定性的角色。
下一步则是德布罗意迈出的。他问自己,借助于现有的概念,如何来理解分立的状态呢?他想起了与驻波的类比,比如在声学中,风琴管和弦的固有频率就是如此。诚然,这里要求的波动作用类型是未知的,但用普朗克常数h可以把它们构造出来,提出它们的数学定律。德布罗意设想,电子围绕原子核旋转与这种假想的波列有关,并通过对应波的停驻特征来理解玻尔“容许”轨道的分立特征。
既然力学中质点的运动是由作用于它们的力或力场来决定的,因此可以预期,那些力场也会以类似的方式来影响德布罗意的波场。薛定谔表明了如何解释这种影响,他用一种巧妙的方法重新解释了经典力学的某些公式。他甚至成功地拓展了波动力学理论,以至于无须引入任何附加假说,它就能运用于由任意多个质点(即拥有任意多个自由度)组成的任何力学系统。这之所以可能,是因为由n个质点组成的力学系统在数学上基本等价于一个在3n维空间中运动的单个质点。
基于这种理论,用其他理论似乎完全无法理解的大量事实都得到了很好的解释。但奇怪的是,事实证明,这些薛定谔波竟然无法与质点的明确运动联系起来,而这毕竟是整个构造原本的目标。
这个困难似乎是无法克服的,直到玻恩以意想不到的简单方式克服了它。不能把德布罗意–薛定谔的波场解释成对一个事件如何在时间和空间中实际发生的数学描述,尽管它们与这个事件当然是有关系的。毋宁说,它们是对我们关于该系统实际上所能知道的东西的数学描述,它们只能用来在统计上陈述和预测我们对该系统所能做的所有测量的结果。
让我用一个简单的例子来说明量子力学的这些一般特征。考虑一个质点,它被有限强度的力限制在一个有限的区域G内。若质点的动能低于某一界限,那么根据经典力学,质点永远也无法离开区域G。然而根据量子力学,一段无法直接预测的时间过后,该质点却能沿一个不可预测的方向离开区域G,逃入周围的空间。按照伽莫夫的说法,这个例子就是放射性蜕变的简化模型。
对这个例子的量子理论处理如下:在时刻t₀,薛定谔的波系统完全在区域G内。但从时刻t₀往后,这些波沿四面八方离开区域G内部,离开波的波幅要小于G内波系统的初始波幅。外面的波越是扩散,G内的波幅就越是减小,后来从G发出的波的强度也相应地减小。只有经过无限的时间,G内的波才耗尽,而外面的波则扩散到越来越大的空间中。
但这种波动过程与我们原本关心的对象,即起初包围在G内的粒子有什么关系呢?要回答这个问题,必须设想某种装置,让我们能对该粒子进行测量。例如,设想周围空间的某处有一块屏幕,粒子一碰到它就会粘住。于是,根据撞击屏上某一点的波的强度,就能推断粒子当时撞击屏上那一点的概率。粒子一撞击屏上某一点,整个波场就失去了全部的物理意义。它的唯一目的就是对粒子撞击屏幕的位置和时间(或者撞击屏幕时的动量)作出概率预测。
其他例子也是类似。该理论的目标是确定某一时刻对系统进行测量所得结果的概率。但它并不试图对空间和时间中实际存在或发生的事情作出数学描述。在这一点上,今天的量子理论与之前的所有物理学理论都有根本不同,无论是机械论的理论还是场的理论。它不对实际的空间–时间事件作出模型描述,而是对可能的测量给出作为时间函数的概率分布。
必须承认,新的理论构想并非凭空杜撰,而是源于经验事实的强迫力。迄今为止,所有通过直接诉诸空间–时间模型来描述光和物质现象中显示的粒子特征和波动特征的努力都以失败而告终。海森伯已经令人信服地表明,从经验的观点看,由于实验仪器的原子论结构,我们不可能对自然的严格决定论结构做出判断。因此,希望未来的知识能迫使物理学再度放弃目前的统计性理论基础,而支持能直接处理物理实在的决定论的理论基础,也许是做不到的。从逻辑上讲,这个问题似乎提供了两种可能性,我们原则上必须在两者之间进行选择。最终的选择取决于哪种描述的逻辑基础最简单。目前,我们完全没有任何决定论的理论既能直接描述事件本身,又能与事实符合。
我们暂时不得不承认,物理学还没有任何一般的理论基础可以被当作其逻辑基础。到目前为止,场论在分子领域已经失败。各方都同意,唯一可能充当量子理论基础的原理将能把场论翻译成量子统计学的形式。至于这最终能否让人满意,现在谁也不敢说。
包括我自己在内的一些物理学家都不相信,我们必须永远放弃那种直接描述空间和时间中的物理实在的想法,或者说必须接受这样一种观点,认为自然中的事件就像靠碰运气取胜的游戏。每个人都可以自由选择努力的方向,每个人也都可以从莱辛的一句名言中得到慰藉:追寻真理比占有真理更可贵。
[136]载《科学》(Science, Washington, D. C. May 24, 1940)。
科学的共同语言[137]
通向语言的第一步是将声音或其他可交流的符号与感觉印象联系起来。至少在一定程度上,所有群居的动物很可能已经实现了这种原始的交往。语言发展的更高阶段是引入另一些符号,在表示感觉印象的符号之间建立起关系,并为人所理解。在这个阶段已经可以表达一连串较为复杂的印象,可以说语言已经产生了。如果说语言要让大家理解,那么一方面符号之间的关系必须有规则,另一方面,符号与印象之间必须有稳定的对应。使用同一种语言的人在童年时期主要靠直觉来把握这些规则和关系。当人们意识到符号之间的规则时,所谓的语法就建立起来了。
在早期阶段,词可以直接对应于印象。在后来的阶段,由于某些词只有与其他词连用时才能表达知觉之间的关系(比如“是”“或”“事物”这样的词),这种直接的关联就消失了。此时,指称知觉的是词组,而不是单词。当语言由此变得部分独立于印象背景时,其内在的融贯性就变得更大了。
只有进一步发展,经常使用所谓的抽象概念时,语言才成为真正意义上的推理工具。但也正是这种发展,使语言成为错误和欺骗的危险来源。词和词的组合在多大程度上对应于印象世界,能完全决定语言的效果。
语言为什么与思维有这样一种密切关联呢?是不是不使用语言就没有思维,也就是说,在不一定需要想到词的概念和概念组合中,是不是就没有思维呢?我们每个人不是都有过这样的经历,虽然“事物”之间的关系已经清楚,但还是要绞尽脑汁琢磨词的使用吗?
如果一个人不受周围语言的指引就能形成自己的概念,我们就可能倾向于认为,思维活动是完全独立于语言的。然而,在这种情况下成长起来的人的心智能力很可能非常贫乏。因此可以断言,一个人的心智发展和形成概念的方式在很大程度上取决于语言。这使我们意识到,语言相同多多少少就意味着心智相同。在这个意义上,思维和语言是联系在一起的。
科学语言和我们通常理解的语言有何不同呢?科学语言为何是国际性的呢?科学追求尽可能清晰敏锐地描述概念之间的关系以及概念与感觉材料的对应。让我们以欧几里得几何和代数的语言为例来说明这一点。它们以少数独立引入的概念和符号进行操作,比如整数、直线、点,以及表示基本运算的符号,也就是那些基本概念之间的关联。这是构造或定义所有其他陈述和概念的基础。概念和陈述与感觉材料之间的关联是通过足够完善的计数和测量活动而建立的。
科学概念和科学语言的超国家性,缘于它们是由一切国家、一切时代最优秀的人建立起来的。他们独自进行着研究,但从最后的结果来看又像是通力合作,为技术革命创造了精神工具,在过去的几个世纪改变了人类的生活。他们的概念体系在杂乱无章的知觉中充当着向导,使我们学会从特殊观察中把握一般真理。
科学方法带给人类哪些希望和恐惧呢?我并不认为这是正确的提问方式。这种工具在人类手中会产生什么,完全取决于人类追求什么样的目标。一旦有了这些目标,科学方法就会提供实现目标的手段。但它提供不了目标本身。科学方法本身不会把我们引到任何地方,若不是热忱地追求清晰的理解,科学方法甚至根本就不会产生。
在我看来,完美的手段和混乱的目标似乎是这个时代的典型特征。如果我们真诚热情地追求安全、幸福,希望所有人的才能都能得到自由发展,那么我们并不缺少实现这个目标的手段。这样的目标即使只有一小部分人追求,最后也会证明比别的目标更好。
[137]1941年9月28日为伦敦科学大会录制的广播,发表于《科学的进展》(Advancement of Science, London, Vol. 2, No.5)。
E=MC2[138]
为了理解质能等效定律,我们必须回到在相对论之前的物理学中占有很高地位的两条彼此独立的守恒原理或“平衡”原理,那就是能量守恒原理和质量守恒原理。前者早在17世纪就由莱布尼茨提出,到了19世纪则本质上作为力学原理的推论发展起来。
以单摆为例,摆锤在A、B两点之间来回摆动。质量为m的摆锤在这两点比路程中最低的点C高出h(见图1)。另一方面,虽然在C点,升起的高度消失了,但摆锤却有了速度v。就好像升起的高度可以完全转变成速度似的,反之亦然。两者之间的精确关系可以表示成,其中g代表重力加速度。有趣的是,这个关系与摆长以及摆锤运动路径的形状都无关。
图1 爱因斯坦博士手绘图
重要的是,在整个过程中有某种东西保持不变,那就是能量。在A处和B处,它是位置的能量或“势”能,在C处,它是运动的能量或“动”能。如果这个概念是正确的,那么无论摆处于什么位置,都应具有同样的值,其中h是超过C的高度,v是在摆的路径上那一点上的速度。实际情况也的确如此。将这条原理推广即得到机械能守恒定律。但如果摩擦使摆停下来呢?
答案是在研究热现象时找到的。这项研究假定热是一种从较热物体流向较冷物体的不可毁灭的物质,由此似乎引出了一条“热守恒”原理。但另一方面,自古以来人们就知道摩擦可以生热,比如印第安人就懂得钻木取火。物理学家曾经长期无法说明这种热的“产生”,直到后来得知,由摩擦产生的热必须消耗同等数量的能量时,困难才得以克服。这样我们就得到了“功热相当”原理。拿摆这个例子来说,机械能逐渐由摩擦转化成热。
这样一来,机械能守恒原理与热能守恒原理就合二为一了。于是物理学家相信,守恒原理能进一步扩充,将化学过程和电磁过程也包括进去,简而言之,将守恒原理应用于一切领域。我们的物理系统似乎有一个能量总和,无论经历什么变化都保持不变。
现在谈谈质量守恒原理。质量被定义为物体对其加速度的反抗(惯性质量)。它也可以由物体的重量来量度(重力质量)。这两个完全不同的定义却导出物体有相同的质量,这真是令人惊讶。根据质量守恒原理,即无论发生任何物理变化或化学变化,物体的质量都保持不变,质量似乎是物质的根本(因为固定不变)性质。加热、融化、汽化或结合成化合物,都不会改变总质量。
直到数十年前,物理学家都还接受这条原理。但在面对狭义相对论时,它却显得不再恰当,因此它与能量守恒原理合并,就像大约60年前,机械能守恒原理与热守恒原理合并一样。也许可以说,能量守恒原理曾经吞并了热守恒原理,现在又吞并了质量守恒原理,从而独占整个领域。
我们习惯上用公式E=mc²来表示质能等效(尽管不太精确),其中c代表光速,约为每秒300000公里,E是静止物体所含的能量,m是它的质量。质量m所含的能量等于这个质量乘以光的巨大速度的平方,也就是说,每单位的质量都含有巨大的能量。
但如果每一克物质都含有这样巨大的能量,为什么长期以来没有人注意到呢?答案非常简单:只要没有能量向外释放,就不会观察到。就好比一个非常有钱的人,他从来不花钱也不捐钱,就没有人知道他究竟多有钱。
现在可以把这种关系反过来,说能量增加E,必定伴随着质量增加。很容易把能量给物体,比如把它加热10度,那为什么不去测量与这种变化相关的质量增加或重量增加呢?这里的麻烦在于,在质量增加中,分数分母里出现了巨大的因子c²。在这种情况下,质量的增加太小了,无法直接测量,即使最灵敏的天平也测不出来。
要使质量增加到能被测量出来,每单位质量的能量变化必须非常巨大。我们只知道有一个领域,每单位质量会释放出这么多能量,那就是放射性蜕变。简要地说,这个过程如下:质量为M的原子分裂成质量分别为M'和M"的两个原子,它们分开时各自具有巨大的动能。如果设想让这两个原子静止下来,也就是将动能取走,那么合起来看,它们的能量会比原来的原子少得多。根据质能等效原理,蜕变产物的质量之和M' + M"必定也小于原来的质量M,这与旧的质量守恒原理相矛盾,两者的相对差值约在千分之一的数量级。
虽然我们无法实际称量出单个原子的重量,但却有间接方法可以精确测量出它们的重量。我们同样也能测定传给蜕变产物M'和M"的动能,这样就有可能检验和确证质能等效公式。而且,这条定律也能使我们从精确测定的原子量,预先计算出任何原子蜕变会释放出多少能量。当然,这条定律并没有告诉我们蜕变反应能否发生或者如何发生。
借助于那个有钱人的例子可以说明上述情况。原子M是一个有钱的守财奴,终其一生都不花一分钱(能量)。但在遗嘱中,他将财产留给了两个儿子M'和M",条件是回馈给社会少量的钱,数目不超过全部财产(能量或质量)的千分之一。两个儿子的钱加在一起要比父亲少些(质量之和M'+M"比放射性原子的质量略小)。回馈社会的那部分虽然相对较小,但也已经非常巨大(作为动能来看),以致带来了严重的祸害威胁。避免这种威胁已经成为我们这个时代最紧迫的问题。
[138]载《科学画刊》(Science Illustrated, New York, April, 1946)。
论广义引力论[139]
《科学美国人》的编辑要我谈谈最近发表的工作成果,就是关于场物理学基础的数学研究。
有些读者可能会纳闷,我们在学校里不是已经学过物理学的基础吗?根据解释的不同,可以回答“是”或“不是”。我们熟知的概念和一般关系使我们能够理解很大范围的经验,并且用数学来处理这些经验。在某种意义上,这些概念和关系甚至可能是最终的,比如光的折射定律,建立在压力、体积、温度、热和功等概念基础上的经典热力学关系,以及永动机不存在的假说,都是如此。
那么,是什么迫使我们设计出一个又一个理论呢?我们究竟为什么要设计理论呢?后一问题的答案简单说来就是:因为我们喜欢“理解”,即通过逻辑过程把现象归结为某种已知的或(看起来)明显的东西。当我们碰到不能用现有的理论“解释”的新事实时,首先就需要新理论。但这种建立新理论的动机可以说是平凡的,是从外面强加的。还有一种更加微妙的动机也同样重要,那就是追求整个理论前提的统一和简化(即马赫的经济原理,它被视为一条逻辑原则)。
对理解的热情就像对音乐的热情一样。许多小孩子都有那种热情,但多数人长大后就失去了。如果没有这种热情,就不会有数学和自然科学。对理解的热情一再导致一种幻觉,以为人无须任何经验基础,就可以通过纯粹的思想——简而言之通过形而上学——来理性地理解客观世界。我相信每一位真正的理论家都是一种温顺的形而上学家,无论他自认为是多么纯粹的实证主义者。形而上学家相信,逻辑上简单的东西也是实在的东西。温顺的形而上学家相信,并非所有逻辑上简单的东西都能在经验到的实在中体现出来,但基于一个建立在最简单前提之上的概念体系,所有感觉经验都能得到“理解”。怀疑论者会说这是“奇迹信条”,但科学的发展已经有力地证实了这个“奇迹信条”。
原子论的兴起是一个很好的例子。留基伯是如何想出这个大胆观念的呢?水结成冰时,看起来与水完全不同,然而冰融化之后,又成了与原来的水一模一样的东西,这是为什么呢?留基伯对此感到困惑,并寻求“解释”。他不得不得出结论:在这些转变中,事物的“本质”没有任何变化。也许事物是由不变的粒子组成的,变化只是它们在空间上的重新排列罢了。所有以近乎相同的性质反复出现的物体,难道不也是这样的吗?
这个观念在西方思想的漫长休眠中并未完全消失。留基伯之后两千年,伯努利好奇为什么气体会对容器壁施加压力。这应当用牛顿力学意义上气体各部分的相互排斥来“解释”吗?这个假说看起来很荒谬,因为在其他情况不变时,气体压力与温度有关。而假定牛顿的相互作用力与温度有关,这违反了牛顿力学的精神。既然伯努利知道原子论概念,他必然会断言,原子(或分子)与容器壁碰撞,从而产生了压力。毕竟,必须假定原子在运动,否则如何解释气体的温度变化呢?
简单的力学考察表明,这种压力只依赖于粒子的动能和它们在空间中的密度。这应当使当时的物理学家得出结论:热是由原子的无规则运动造成的。倘若真能认真对待这种考虑,热理论的发展本应大大加快,特别是发现热与机械能的等效。
这个例子可以说明两点。理论观念(这里是原子论)并非脱离经验而独立产生;它也不能靠纯逻辑的程序从经验中推导出来,而是创造性活动的产物。一旦获得理论观念,不妨坚持它,直到引出站不住脚的结论为止。
至于我最近的理论工作,我认为尚不适合向对科学有兴趣的广大读者作详细说明。只有那些已经得到经验充分确证的理论才应当那样做。到目前为止,有利于这个理论的主要是其前提的简单性以及与已知事实(即纯引力场定律)的密切关联。不过,广大读者也许有兴趣了解这种极富思辨性的努力是经由何种思路导出的。此外还将表明,我们碰到了什么类型的困难,这些困难在何种意义上得到了克服。
在牛顿物理学中,对物体的理论描述所基于的基本理论概念是质点或粒子。于是,物质被先验地看作是不连续的,质点彼此之间的作用也就必然被视为“超距作用”。由于“超距作用”的概念显得与日常经验格格不入,与牛顿同时代的人(也包括牛顿自己)自然觉得很难接受它。然而,由于牛顿体系取得了惊人的成功,接下来几代物理学家已经习惯于超距作用的观念。久而久之,任何怀疑都被淹没了。
但在19世纪后半叶,人们知道了电动力学定律,结果无法将这些定律令人满意地纳入牛顿体系。这不禁引人深思:倘若法拉第受过正规的大学教育,他会发现电磁感应定律吗?他不受传统思维方式的拖累,觉得把“场”当作一个独立的实在要素引入进来,可以帮助他整理经验事实。麦克斯韦完全理解了场概念的意义,他做出了一项基本发现,即电动力学定律可以在电磁场的微分方程中得到自然表达。这些方程暗示着波的存在,其特性对应于当时已知的光的特性。
像这样把光学纳入电磁理论是物理学的基础迈向统一的重大胜利。早在被赫兹的实验工作确证之前很久,麦克斯韦就通过纯粹的理论论证而达到了这种统一。这种新的看法使人们有可能抛弃超距作用的假说,至少是在电磁现象领域。居间的场现在像是物体之间电磁相互作用的唯一载体,而场的行为则完全取决于用微分方程来表达的邻近过程。
现在问题来了:既然场即使在真空中也存在,那么应当把场理解成“载体”的一种状态,还是应当赋予它一种不能归结为任何别的东西的独立存在性呢?换句话说,是否存在一种负载着场的“以太”呢?例如,以太在负载光波时,被认为处于波动状态。
这个问题有一个自然的答案:既然场的概念不可或缺,所以最好不要另外引入带有假说性质的载体。然而,最早认识到场概念不可或缺的那些开拓者,仍然深陷机械论的思想传统,无法毅然决然地接受这种简单的观点。不过在接下来的几十年里,这种观点不知不觉被采纳了。
把场作为基本概念引入进来,使整个理论产生了不一致性。麦克斯韦理论虽然能恰当描述带电粒子之间的相互作用,却不能解释电密度的行为,也就是说,无法提供粒子本身的理论。因此,必须基于旧理论把这些粒子当作质点来处理。连续场的观念与在空间中不连续的质点的观念相结合,似乎是不一致的。一致的场论要求所有理论要素都是连续的,不仅在时间上,而且在空间上,以及在空间的所有点上。因此,物质粒子无法作为场论的基本概念。因此,即使不考虑引力尚未包括进来,也不能认为麦克斯韦的电动力学是完备的理论。
如果空间坐标和时间都服从一种特殊的线性变换——洛伦兹变换,那么真空的麦克斯韦方程就保持不变(对于洛伦兹变换的“协变性”)。当然,对于由两个或两个以上这种变换所组成的变换,协变性也成立,这被称为洛伦兹变换的“群”性质。
麦克斯韦方程蕴涵着“洛伦兹群”,但洛伦兹群并不蕴涵麦克斯韦方程。事实上,可以独立于麦克斯韦方程,将洛伦兹群定义成使某个特殊速度——光速——的值保持不变的线性变换群。这些变换适用于从一个“惯性系”向另一个相对于它作匀速运动的惯性系的过渡。此变换群最明显的新奇特性在于,它抛弃了空间上彼此分离的事件的同时性概念的绝对性。因此可以期待,所有物理方程对于洛伦兹变换都是协变的(狭义相对论)。于是,由麦克斯韦方程引出了一条启发性原理,其有效性远远超出了这些方程本身的适用范围甚至是有效范围。
狭义相对论与牛顿力学有一个共同点,两种理论的定律据信都只适用于某些坐标系,即所谓的“惯性系”。惯性系的运动状态使得“不受力”的质点相对于这个坐标系没有加速度。然而,如果没有独立的方法来确认力不存在,这个定义就是空洞的。但如果把引力看作一种“场”,这种确认方法就不存在了。
设A是一个相对于“惯性系”I做匀加速运动的系统。但凡相对于I不是加速的质点,相对于A都是加速的,所有质点的加速度的大小和方向都相同。其行为就好像相对于A存在着一个引力场,因为引力场的一个典型特征就是,加速度与物体的特性无关。没有理由不将这种行为解释成“真”引力场的作用(等效原理)。这种解释意味着A是一个“惯性系”,即使它相对于另一个惯性系是加速的。(对这个论证来说至关重要的是,引入独立的引力场被认为是合理的,即使产生这个场的质量并未得到界定。因此,这个论证对牛顿来说不会有什么说服力。)于是,惯性系、惯性定律和运动定律等概念都失去了具体意义,不仅在经典力学中,在狭义相对论中也一样。而且,循着这个思路走下去就会看到,相对于A,时间不能用相同的时钟来测量,甚至连坐标差也失去了直接的物理意义。考虑到所有这些困难,人们难道不应坚持惯性系概念,不再尝试对引力现象的基本特征(在牛顿体系中表现为惯性质量与引力质量等效)作出解释吗?凡是相信自然可以理解的人,一定会回答:不。
这正是等效原理的要点:为了说明惯性质量与引力质量的相等,理论中必须允许四个坐标的非线性变换。也就是说,洛伦兹变换群和因此“容许的”坐标系集,必须加以扩展。
那么,什么样的坐标变换群能够替代洛伦兹变换群呢?根据高斯和黎曼的基础研究,数学提供了一个答案:合适的替代者是坐标的一切连续(解析的)变换群。在这些变换下,保持不变的仅仅是,邻近的点有近乎相同的坐标;坐标系只表达了点在空间中的拓扑秩序(包括它的四维特征)。表示自然定律的方程,对于坐标的一切连续变换都必须是协变的。这就是广义相对性原理。
刚才讲的这套做法克服了力学基础的一个缺陷。牛顿已经注意到了这个缺陷,莱布尼茨和两百年后的马赫都曾批评过,那就是:惯性抵抗加速度。但这是相对于什么的加速度呢?在经典力学的框架中,唯一的回答是:惯性抵抗相对于空间的加速度。这是空间的一种物理性质——空间作用于物体,物体却不作用于空间。这也许就是牛顿主张“空间是绝对的”的更深含义。但这种观念引起了一些人特别是莱布尼茨的不安,他并不认为空间是独立存在的,而是认为,空间仅仅是“事物”的一种性质(物体的邻近性)。即使他的这些合理怀疑当时能够胜出,也很难说就有益于物理学,因为把他的观念探究到底所需的经验基础和理论基础在17世纪尚不存在。
根据广义相对论,抽掉任何物理内容的空间概念并不存在。空间的物理实在由一个场来表示,场的分量是四个独立变量——空间和时间的坐标——的连续函数。正是这种特殊的依赖性表达了物理实在的空间特征。
既然广义相对论意味着用一个连续的场来表示物理实在,粒子或质点概念甚至是运动概念就不能起基础作用了。粒子只能表现为空间中场强或能量密度特别高的有限区域。
相对性理论必须回答两个问题:(1)场的数学特征是什么?(2)适用于这种场的方程是什么?
关于第一个问题:从数学的观点来看,坐标变换时场的各个分量的变换方式本质上决定了场的特征。关于第二个问题:在满足广义相对论假设的同时,这些方程必须充分决定场。至于这种要求能否得到满足,取决于选择何种类型的场。
初看起来,试图基于这种高度抽象的纲领来理解经验材料之间的关联几乎毫无希望。事实上,这种做法等于问:在坚持广义相对性原理的情况下,什么最简单的对象(场)必须具有什么最简单的性质?从形式逻辑的立场来看,且不说“简单”这个概念的模糊性,问题的双重性就已经像是灾难。而从物理学的立场来看,没有什么东西可以保证“逻辑简单的”理论便是“真的”。
然而,任何理论都有思辨性。当理论的基本概念比较“接近于经验”时(比如力、压力、质量等概念),其思辨性不大容易识别出来。但如果某种理论需要运用复杂的逻辑过程,才能从前提中推出可观察的结论,那么任何人都能意识到这种理论的思辨性。在这种情况下,那些对认识论分析没有经验的人,以及在熟知的领域觉察不到理论思维的不可靠性的人,几乎不可避免会感到厌恶。
另一方面也必须承认,如果理论的基本概念和基本假说“接近于经验”,则该理论就有重大优势,对它怀有更大信心就是理所当然的。完全走错路的危险比较小,因为由经验来否证这种理论所花的时间精力要少得多。但随着知识深度的增加,在追求物理理论基础的逻辑简单性和统一性时,我们必须放弃这种优势。必须承认,在放弃“接近于经验”的基本概念来获得逻辑简单性方面,广义相对论已经超出了之前的物理理论。引力理论已经是如此,试图包括所有场性质的新的推广就更是如此了。在这个广义的理论中,从理论前提导出可与经验材料对应的结论,其中的程序非常困难,至今还没有得出这样的结果。目前支持该理论的是它的逻辑简单性和“刚性”,这里的“刚性”是指该理论非对即错,且不可修改。
妨碍相对论发展的最大内在困难是问题的双重性,就像刚才问的两个问题所指明的那样。这种双重性说明了为什么这种理论分两个阶段发展,而且相隔那么久。第一个阶段是引力理论,它基于前面讨论的等效原理,并且依赖于以下考虑:根据狭义相对论,光有恒定的传播速度。如果光从真空中的一点出发,该点由三维坐标系中的坐标x₁,x₂,x₃表示,它在时刻x₄以球面波传播,在时刻x₄+dx₄到达邻近点(x₁+dx₁,x₂+dx₂,x₃+dx₃)。引入光速c,可以写出表示式:
它也可写成这样的形式:
这个表示式代表四维时空里两个邻近点之间的一种客观关系。只要坐标变换仅限于狭义相对论,它就对一切惯性系都有效。但根据广义相对性原理,如果允许坐标任意连续变换,这种关系就有了更一般的形式:
其中gik是坐标的某种函数,若进行连续的坐标变换,它们会以确定的方式变换。依据等效原理,这些gik函数描述一种特殊的引力场,一种可以通过“无场”空间的变换而得到的场。gik满足特殊的变换法则,从数学上被称为一个“张量”的分量,张量拥有在一切变换中都保持的对称性。这种对称性可以表达如下:
gik=gki
这引起了如下想法:即使场不能仅仅通过坐标变换得自于狭义相对论的真空,我们难道就不能赋予这样一个对称张量以客观意义吗?虽然不能指望这种对称张量能够描述最一般的场,但它完全可以描述“纯引力场”这种特殊情况。于是,至少对一个特殊情况而言,广义相对论显然必须假设一个对称张量场。
因此还剩下第二个问题:对于一个对称张量场,能够假定何种广义协变的场定律呢?
在我们这个时代,这个问题并不难回答,因为必要的数学概念是现成的,那就是一个世纪前由高斯创立的曲面的度规理论,后来被黎曼扩展到任意维数的流形上。这种纯形式研究有许多惊人的成果。对于gik,能被假定为场定律的微分方程不能低于二阶,也就是说,它们必须至少包含gik对于坐标的二阶导数。假定场定律中没有出现高于二阶的导数,那么广义相对性原理在数学上就决定了场定律。这个方程组可以写成如下形式:
Rik=0
Rik的变换方式和gik一样,也会形成一个对称张量。
只要将物体表示为场的奇点,这些微分方程就完全取代了牛顿的天体运动理论。换句话说,它们既包含运动定律,又包含力的定律,同时消除了“惯性系”。
物体以奇点形式出现,暗示物体本身不能由对称的gik场或“引力场”来解释。甚至连只存在正引力物体这个事实,也无法从这个理论中推导出来。显然,完备的相对论性场论必须基于更复杂的场,也就是对称张量场的一种推广。
在考察这种推广之前,有两点与引力理论有关的看法对于接下来的解释至关重要。
第一点看法是,广义相对性原理对理论的可能性施加了极为严格的限制。如果没有这条限制性的原理,几乎不可能有人找到引力方程,甚至用狭义相对性原理也找不到,即使知道必须用对称张量来描述场。除非采用广义相对性原理,否则无论积累多少事实也导不出这些方程。这就是为什么在我看来,若非从一开始就让基本概念符合广义相对性,任何更深入认识物理学基础的努力都注定没有希望。这种情况使我们很难用经验知识(无论多么全面)来寻找物理学的基本概念和关系,它迫使我们大量运用自由思辨,远超目前大多数物理学家所能接受的程度。我看不出有任何理由要假定广义相对性原理只对引力有启发意义,而物理学的其余部分可以基于狭义相对论来分开处理,并希望日后整个物理学可以被一致地纳入广义相对论的方案。我不认为这种态度有客观的合理性,尽管从历史上看是可以理解的。我们今天已知的引力效应比较小,但这绝非在基础理论研究中可以忽视广义相对性原理的决定性理由。换句话说,我不认为提出这样的问题是正当的:如果没有引力,物理学会是什么样子?
我们必须注意的第二点是,引力方程是对称张量gik的十个分量的十个微分方程。在非广义相对论的理论中,若方程的数目等于未知函数的数目,则系统通常不会被过度决定。这些解使得在通解中,有一定数目的三变量函数可以任意选取。在广义相对论的理论中,这不能被视作理所当然。坐标系的自由选取意味着,在一个解的十个函数(或场的分量)中,能通过适当选取坐标系而让四个函数有规定的值。换句话说,广义相对性原理意味着,由微分方程决定的函数数目不是10,而是10–4=6。对于这六个函数,只能假定有六个独立的微分方程。在引力场的十个微分方程中,应当只有六个是彼此独立的,其余四个必须通过四个关系(恒等式)与那六个相联系。在十个引力方程的左边Rik当中,的确存在着四个恒等式——“毕安基恒等式”——保证了这十个方程的“相容性”。
当场变量的数目等于微分方程的数目时,如果方程可由变分原理得到,那么相容性总是可以保证的。引力方程的情况就是如此。
然而,十个微分方程不能完全由六个微分方程所取代。这个方程组的确被“过度决定”了,但由于这些恒等式的存在,这种过度决定并不会使它的相容性消失,也就是说,这些解不会受到严格限制。引力方程蕴含着物体的运动定律,这与这种(允许的)过度决定密切相关。
做了这番准备之后,不必深入数学细节就可以理解目前研究的本质了。问题在于建立关于总场的相对论性理论。解决它的最重要的线索是,对于纯引力场这种特殊情况,解已经存在了。因此,我们正在寻求的理论必定是引力场理论的推广。第一个问题是:什么是对称张量场的自然推广?
这个问题不能单独回答,而必须同另一个问题一起回答,那就是:要对这种场做怎样的推广,才能提供最自然的理论体系?目前讨论的理论所基于的回答是:对称张量场必须由一个非对称张量场来取代。这就意味着,场分量必须放弃gik=gki的条件。在那种情况下,场就有十六个而不是十个独立分量了。
余下的任务是建立非对称张量场的相对论性微分方程。在尝试解决这个问题时,我们碰到了对称场所没有的困难。广义相对性原理并不足以完全确定场方程,这主要是因为,场的对称部分的变换定律并不包含反对称部分的分量,反之亦然。也许这就是以前几乎没有尝试过场的这种推广的原因。只有在这个理论的形式体系中总场起作用,而不是对称部分和反对称部分分别起作用,才能表明将场的这两部分结合起来是自然程序。
结果是,这个要求的确能以自然的方式得到满足。但即使是这个要求与广义相对性原理合起来,仍然不足以唯一地确定场方程。我们还记得,这个方程组必须满足另一个条件,即方程必须相容。前面提到,如果这些方程能由变分原理推导出来,这个条件就得到了满足。
这的确已经做到了,尽管不像对称场的情况那么自然。发现能以两种不同方式做到这一点,让人感到不安。这些变分原理提供了两个方程组,让我们记作E₁和E₂,它们彼此不同(尽管相差甚微),各自都有不完美之处。结果,甚至连相容性条件也不足以唯一地确定这个方程组。
事实上,正是E₁和E₂这两个方程组的形式缺陷暗示了一条可能的出路。存在着第三个方程组E₃,它没有E₁和E₂这两个方程组的形式缺陷。E₃代表两者的结合,E₃的每一个解也都是E₁和E₂的解。这暗示,E₃也许就是我们一直在寻找的方程组。那么,为什么不假设E₃就是这个方程组呢?如果不做进一步的分析,这种做法并不妥当,因为E₁的相容性和E₂的相容性并不蕴涵较强的方程组E₃的相容性,E₃的方程数目比场的分量多四个。
撇开相容性问题不谈,独立的考量表明,较强的方程组E₃是引力方程唯一真正自然的推广。
但E₃并不是一个相容的方程组,E₁和E₂这两个方程组的相容性由足够数目的恒等式来保证,这意味着,每一个对明确的时间值满足这些方程的场都有一个连续的广延,代表四维空间中的一个解。然而,E₃方程组却不能以同样方式扩展开。用经典力学的语言来说,在方程组E₃的情况下,“初始条件”不能自由选择。真正重要的是回答这样一个问题:方程组E₃的解是否必须和对物理理论的要求同广延呢?这个纯数学问题至今尚未解决。
怀疑论者会说:“从逻辑的观点看,这个方程组也许是合理的。但这并不能证明它符合自然。”亲爱的怀疑论者,您是对的。唯有经验才能判定真理。但如果我们已经成功地提出一个有意义的严谨问题,我们就算有所成就了。无论已知的经验事实有多么丰富,证实或驳斥都不会容易。从方程中导出可与经验对应的结论需要艰苦的努力,也许还需要新的数学方法。
[139]发表于《科学美国人》(Scientific American, Vol. 182, No.4. April,1950)。
致意大利科学促进会的贺信[140]
首先,衷心感谢你们邀请我参加“科学促进会”的会议。倘若健康允许,我很乐意接受这次邀请。在目前的情况下,我只能远隔重洋从家里发来一封简短的贺信。我这样做,并非幻想我有什么真知灼见,能够增进大家的见解。但我们生活在一个内外交困、纷乱不安的时代,它是如此缺乏明确目标,仅是表白信念或许就有意义,尽管和所有价值判断一样,这些信念无法通过逻辑演绎来证明。
这里立刻就出现了一个问题:追求真理,或者更谦虚地说,通过构造性的逻辑思想去理解这个可以认识的宇宙,是否应当作为我们工作的独立目标?抑或,追求真理是否应当从属于其他目标,比如从属于某个“实用的”目标?这个问题不能基于逻辑来决定。然而,只要此决定出自深挚而坚定的信念,就会对我们的思想和道德判断产生很大影响。那么就让我作一告白:对我自身而言,努力获得更深入的见识和理解是一些独立目标之一,倘若没有这些目标,有思想的人就不会秉持积极自觉的生活态度。
我们追求理解的本质就在于:一方面,它试图包含纷繁复杂的人类经验;另一方面,它又寻求基本假设的简单和经济。考虑到我们的科学知识还处于原始状态,认为这两个目标可以并存只是出于信念。倘若没有这种信念,我就不可能坚信知识的独立价值。
从事科学工作的人所秉持的这种类似宗教的态度,对其整个人格也会产生影响。对于科学人来说,除了积累的经验和逻辑思维的规则所提供的知识,原则上没有什么权威可以把自己的决定和说法宣称为“真理”。这便导致了悖谬的状况:科学家致力于研究客观事物,但从社会的观点来看,他却沦为极端的个人主义者,至少在原则上,他除了自己的判断什么也不信。几乎可以断言,思想上的个人主义与科学时代在历史上是同时出现的,而且至今形影不离。
也许有人会说,就像古典经济学中的“经济人”一样,这里描绘的“科学人”只不过是一种抽象,实际上并不存在于这个世界上。但在我看来,要不是古往今来有许多人已经非常接近这种理想,今天的科学就不可能出现并持续下去了。
当然,并不是每一个学会使用似乎是“科学的”工具和方法的人,都是我心目中的科学人。我仅指心中真正持有科学精神的人。
那么,今天的科学人作为社会成员的地位如何呢?显然,他非常自豪科学家的工作几乎完全淘汰了体力劳动,彻底改变了人类的经济生活。但另一方面,他又感到忧虑,因为科学研究成果已经落入盲目追求政治权力的人手里,从而对人类构成了威胁。他意识到,他的工作所造就的技术方法已经导致政治经济权力集中在少数人手中,他们渐渐完全支配了日益涣散的大众的生活。更糟糕的是,政治经济权力集中在少数人手中不仅使科学人产生经济依附,而且也威胁他的精神独立。在思想和精神上施加种种不当影响,会阻碍真正独立人格的发展。
因此,正如我们亲眼所见,科学人遭遇到一种真正悲惨的命运。他通过超乎寻常的努力,真心诚意地追求思想的清晰和内心的独立,结果却造出了被用来奴役他、又从内心毁灭他的工具。那些掌握着政治权力的人使他不得不噤若寒蝉。作为士兵,他不得不牺牲自己的生命和消灭别人的生命,尽管他确信这种牺牲是荒谬愚蠢的。他清楚地知道,普遍的毁灭不可避免,因为历史的发展已经使经济、政治和军事的全部权力都集中在国家手中。他也认识到,只有创建一种基于法律的超国家制度来永久消灭武力手段,人类才能获得拯救。但科学人却自甘堕落,居然把国家强加给他的奴役当作不可避免的命运接受下来,甚至俯首帖耳地帮助完善注定会毁灭全人类的工具。
难道科学家真的无法逃脱吗?他真的必须容忍和遭受所有这些侮辱吗?他以内心的自由和思想研究的独立所唤醒的时代,那个曾经使他有机会启迪同胞、丰富生命的时代,难道真的一去不复返了吗?把工作过分置于理智的基础上,岂不是忘记了他的责任和尊严吗?我的回答是:一个天生自由和严谨的人固然可以被消灭,但这样的人绝不可能被奴役,或者被用作盲目的工具。
如果今天的科学人能有时间和勇气,诚恳认真地思考自己的处境和面临的任务,并相应地采取行动,那么目前危险的国际局势就可望找到合理妥善的解决办法。
[140]致1950年在卢卡举办的意大利科学促进会第42届会议的贺信,以英文发表于联合国教科文组织的期刊《影响》(Impact,Autumn,1950)。
在哥白尼逝世410周年纪念会上的讲话[141]
今天,我们怀着愉快和感激之情来纪念一个人,对于使西方从教权和学术统治的枷锁中解放出来,他的贡献也许比任何人都要大。
诚然,在古希腊时期就已经有一些学者相信,地球不是世界的自然中心。但这种对宇宙的理解在古代并未得到真正认可。亚里士多德和希腊天文学派继续坚持地心观念,几乎没有人提出过质疑。
要想令人信服地阐明日心观念的优越性,不仅要掌握在那个时代不易得到的天文学事实,还必须拥有罕见的思想独立性和直觉。哥白尼的这项伟大成就不仅铺平了通往近代天文学的道路,也使人类的宇宙观发生了重大变革。一旦认识到地球不是世界的中心,而只是一颗小小的行星,以人类为中心的幻觉也就站不住脚了。因此,哥白尼通过他的工作和伟大的人格教导人类要谦卑。
没有一个民族可以为他们中间出了这样一个人而骄傲。因为民族骄傲是一种非常狭隘的癖好,在哥白尼这样内心独立的人面前是毫无道理的。
[141]1953年12月在纽约哥伦比亚大学纪念会上的讲话。
相对性和空间问题[142]
牛顿物理学的典型特征是,除了物质,空间和时间也有独立的实际存在性,这是因为牛顿的运动定律中出现了加速度的概念。但是在这种理论中,加速度只可能指“相对于空间的加速度”。因此,要使牛顿运动定律中出现的加速度能被看成一个有意义的量,就必须把牛顿的空间看成“静止的”或至少是“非加速的”。对于同样进入加速度概念的时间而言,情况也是类似。牛顿本人以及当时最具批判性的人都感到,认为空间本身和空间的运动状态都具有物理实在性是令人不安的;但为使力学具有明确的意义,当时没有其他出路。
把物理实在性一般地归于空间尤其是空的空间,的确是一种过分的要求。自古以来的哲学家已经一再拒绝做这样的苛求。笛卡尔大体上是这样论证的:空间与广延本质上是同一的,但广延是与物体相联系的,因此没有物体就没有空间,亦即没有空的空间。这个论证的弱点主要在于:他认为广延概念起源于我们放置固体或使固体接触的经验,这一点固然是对的,但不能由此推出,广延概念在不能形成广延概念的情况下就是不合理的。对概念的这样一种推广的合理性也可以通过它对于理解经验的价值来间接证明。因此,断言广延与物体相联系本身肯定是没有根据的。不过我们后面会看到,广义相对论迂回地确证了笛卡尔的看法。笛卡尔之所以能够得出他那非同寻常的看法,必定是由于感觉到,除非迫不得已,我们不应认为像空间这样无法“直接体验”[143]的东西具有实在性。
空间概念的心理起源或这一概念的必然性绝非我们通常认为的那样明显。古代几何学家处理的是思想对象(直线、点、面),而没有像解析几何后来所做的那样真正处理空间本身。不过经由某些原始经验,空间概念仍然容易被人想到。假定我们造了一个箱子。我们可以按照某种方式把物体排列在箱子里,将它装满。这种排列的可能性是箱子这个物体的属性,这是某种随箱子而给定的东西,是被箱子“包围的空间”。这个“被包围的空间”因不同的箱子而异,我们很自然地认为它在任何时候都不依赖于箱子里面是否有物体存在。当箱子里面没有物体时,箱子的空间似乎就是“空的”。
到目前为止,我们的空间概念是与箱子联系在一起的。然而,构成箱子空间的存放可能性并不依赖于箱壁的厚薄。难道不能把箱壁厚度缩减为零而又不使这个“空间”消失吗?这样一种极限过程当然是很自然的。于是我们的思想中就有了一个没有箱子的空间,一种自存的东西;虽然如果我们忘记这个概念的起源的话,它会显得很不实在。我们看到,认为空间不依赖于物体而且可以没有物质而存在,这与笛卡尔是格格不入的。[144](但这并没有妨碍他在其解析几何中把空间作为基本概念来处理。)当人们指出水银气压计中的真空时,肯定已经消除了最后一批笛卡尔主义者的疑虑。但不可否认,即使在这个原始阶段,空间概念或者被视为独立的实在之物的空间就已经不太令人满意了。
用何种方式能把物体置于空间(箱子)之中是三维欧几里得几何学的研究对象,后者的公理结构很容易使人忘记它所涉及的仍然是可以实现的情况。
如果空间概念是按照上述方式形成的,并且从“填满”箱子的经验推论下去,那么这个空间首先是一个有界的空间。但这种有界性似乎是无关紧要的,因为我们似乎总能用一个较大的箱子把较小的箱子包含进去。这样看来,空间又像是某种无界的东西。
这里我不准备讨论关于空间的三维性和“欧几里得性”的观念如何能够追溯到(较为原始的)经验,而是先从其他角度考察一下空间概念在物理思想发展过程中所起的作用。
当一个小箱子s在一个大箱子S空的空间内部处于相对静止时,s的空的空间就是S的空的空间的一部分,把这两个空的空间包括进去的同一个“空间”属于这两个箱子。然而,当s相对于S运动时,这个概念就不那么简单了。那样一来,人们就倾向于认为s总是包围着同一空间,不过是空间S的一个可变部分。这样就需要为每一个箱子分配其特殊的(被认为无界的)空间,并且假定这两个空间彼此做相对运动。
在这种复杂状况引起注意之前,空间就像是物体在其中游来游去的一种有界的介质(容器)。但现在必须认为,有无限多个空间彼此做相对运动。认为空间是一种不依赖于物质的客观存在,这种概念已经属于前科学思想,而认为存在着无限多个做相对运动的空间却并非如此。后一观念虽然在逻辑上是不可避免的,但在科学思想中远未起过重要作用。
那么,关于时间概念的心理起源又是什么情况呢?时间概念无疑是与“回忆”联系在一起的,而且也与感觉经验和对这些感觉经验的回忆之间的区分相联系。感觉经验与回忆(或纯粹的想象)之间的区分是否在心理上被我们直接把握到,这一点本身就是有疑问的。每一个人都有过这样一种体验,即怀疑某件事是真正通过感官经验到的,抑或仅仅是一个梦。这种区分的产生可能最初缘于创造秩序的心灵的一种活动。
“回忆”是与一个经验联系在一起的,此经验与“当下经验”相比是“较早的”。这是一种关于(被思想的)经验的概念排序原则,而实现这个原则的可能性就产生了主观的时间概念,即关于个人经验秩序的时间概念。
那么,时间概念是如何变得客观的呢?让我们思考一个例子,甲(“我”)有一个“打闪了”的经验,同时甲还体验到乙的这样一种行为,它将乙的行为与他本人的经验“打闪了”联系起来。这样甲就把“打闪了”的经验归于乙。甲会认为其他人也参与了“打闪了”的经验。现在,“打闪了”不再被理解成完全个人的经验,而是理解成其他人的经验(或者最终仅仅理解成一种“潜在经验”)。这样就产生了这样一种理解:“打闪了”原本是作为“经验”进入意识的,现在也被理解成一个(客观的)“事件”了。当我们谈到“实在的外部世界”时,所指的就是所有事件的总和。
我们已经看到,我们感到必须为经验规定这样一种时间次序:如果β迟于α,而γ又迟于β,则γ也迟于α(“经验次序”)。在这方面,我们已经与经验联系起来的“事件”的情况又如何呢?初看起来,似乎显然可以假定事件的时间次序是存在的,它与经验的时间次序是一致的。人们一般已经不自觉地作出了这个假定,直到产生怀疑为止。[145]
为使世界客观化,还需要有一种建设性的观念:事件不仅位于时间中,而且也位于空间中。
前面我们试图描述空间、时间和事件诸概念如何能在心理上与经验联系起来。从逻辑上说,这些概念都是人类理智的自由创造,是思维的工具,它们能把经验联系在一起,以便更好地看清楚这些经验。尝试认识这些基本概念的经验起源,应当表明我们实际上在多大程度上受这些概念的约束。这样我们就可以意识到我们的自由,在必要的情况下理智地运用这种自由总是一件困难的事情。
关于空间-时间-事件诸概念(我们将把它们简称为“类空”概念,以有别于心理学领域的概念)的心理起源,我们还要补充一些重要内容。我们曾用箱子和在箱内排列物体的例子把空间概念与经验联系起来。因此,这种概念形成已经预设了物体(如“箱子”)的概念。同样,在这方面人也起着物体的作用,要想形成客观时间概念就必须引入人。因此在我看来,物体概念的形成必须先于我们的时间空间概念。
与痛苦、目标和目的等心理学领域的概念一样,所有这些类空概念已经属于前科学思想。和一般自然科学思想一样,现在物理思想的特点是力求原则上只用“类空”概念来说明事物,努力用这些概念来表达一切具有定律形式的关系。物理学家试图把颜色和音调还原为振动,生理学家试图把思想和疼痛还原为神经过程。这样心理因素就从事物的因果联系中消除了,因此从不构成因果联系中的一个独立环节。目前“唯物主义”(在“物质”已经失去了作为基本概念的地位之后)无疑指的正是这种观点,即认为只用“类空”概念来把握一切关系在原则上是可能的。
为什么必须把自然科学思想的基本概念从柏拉图的奥林匹斯上拖下来,试图揭示它们的尘世来源呢?回答是,为了使这些概念从与之相联系的禁令中解放出来,从而在概念形成方面获得更大的自由。休谟和马赫最先提出这种批判性的思考,这是他们的不朽功绩。
科学将空间、时间和物体(尤其是重要的特殊情形“固体”)的概念从前科学思想中接过来加以修正和精确化。这方面的第一项重要成就是欧几里得几何学的发展。我们绝不能只看到欧几里得几何学的公理表述而看不到它的经验起源(固体的存放可能性)。特别是,空间的三维性和欧几里得特征都起源于经验(空间可以用结构相同的“立方体”完全填满)。
由于发现完全刚性的物体是不存在的,空间概念变得更加微妙了。一切物体都可以发生弹性形变,温度变化时体积会发生改变。因此不能脱离物理内容来表示形体(其可能的存放由欧几里得几何学来描述)。但由于物理学必须利用几何学来确立其概念,因此几何学的经验内容只有在整个物理学的框架中才能陈述和检验。
在这方面还必须考虑原子论及其对物质有限可分性的看法,因为亚原子广延的空间是无法量度的。原子论还迫使我们原则上不再认为可以静态地清晰确定固体的界面。严格说来,甚至在宏观领域也没有关于固体存放可能性的独立定律。
尽管如此,没有人想过要放弃空间概念。因为在极为有效的整个自然科学体系中,空间概念似乎是不可或缺的。在19世纪,只有马赫认真思考过消除空间概念,他试图用所有质点当前距离的总和的概念来代替它。(他这样做是为了获得对惯性的令人满意的理解。)
场
在牛顿力学中,空间和时间起着双重作用。首先,空间和时间是物理事件发生的框架,相对于此框架,事件由空间坐标和时间来描述。物质原则上被视为由“质点”所构成,质点的运动构成了物理事件。如果物质被看成连续的,我们只能在不愿或不能描述不连续结构的情况下暂时这样做。在这种情况下,物质的微小部分(体积元)可以像质点一样做类似的处理,至少在只涉及运动、而不涉及暂时不可能或者没有必要追溯到运动的那些事件(例如温度变化、化学过程)时是如此。空间和时间的第二个作用是作为“惯性系”。在所有可设想的参照系中,惯性系被认为具有优先性,因为惯性定律相对于惯性系是有效的。
这里重要的是,不依赖于经验主体而被设想的“物理实在”曾经被认为由两方面所构成,一方面是空间和时间,另一方面则是相对于空间和时间运动的持续存在的质点,至少原则上是如此。这种关于空间和时间独立存在的观念可以毫不掩饰地表达如下:如果物质消失了,余下的将只有空间和时间(作为物理事件的一种舞台)。
理论的发展克服了这种观点,这种发展最初似乎与空间时间问题毫不相干,那就是场的概念的出现以及它最终要求原则上取代粒子(质点)概念。在经典物理学的框架中,场的概念是在物质被看成连续体的情况下作为辅助概念出现的。例如在考察固体的热传导时,物体的状态是由物体每一点在每一个确定时刻的温度来描述的。在数学上这意味着将温度T表示为空间坐标与时间t的一个数学表达式(函数),即温度场。热传导定律被表示成一种局部关系(微分方程),其中包括热传导的所有特殊情况。这里,温度就是场的概念的一个简单例子。这样一个量(或量的复合体)是坐标和时间的函数。另一个例子是对流体运动的描述。在每一点上每一时刻都有一个速度,它由该速度相对于一个坐标系的轴的三个“分量”来作定量描述(矢量)。这里,每一个点的速度分量(场分量)也是坐标(x, y, z)和时间(t)的函数。
上面所提到的场的特性是它们只存在于有质之中;它们仅仅用来描述这种物质的状态。按照场概念的历史发展看来,没有物质的地方就不可能有场存在。但是,在19世纪的前25年里,人们证明,如果把光看作一种波动场——与弹性固件的机械振动场完全相似,那么光的干涉和运动现象就能够解释得极为清楚。因此人们就感到有必要引进一种在没有物质的情况下也能存在于“空的空间”中的场。
这一情况产生了一个自相矛盾的局面。因为,按照其起源,场概念似乎仅限于描述有质体内部的状态。由于人们确信每一种场都应看作此场概念只应限于描述有质体内部的状态这一点就显得更加确切了。因此人们感到不得不假定,甚至在一向被认为是一无所有的空间中也到处存在着某种形式的物质,这种物质称为“以太”。
将场概念从场必须有一个机械载体与之相联系的假定中解放出来,这在物理思想发展中是在心理方面最令人感兴趣的事件之一。19世纪下半叶,从法拉第和麦克斯韦的研究成果中越来越清楚地看到,用场描述电磁过程大大胜过了以质点的力学概念为基础的处理方法。由于在电动力学中引进场的概念,麦克斯韦成功地预言了电磁波的存在,由于电磁波与光波在传播速度方面是相等的,它们在本质上的同一性也是无可怀疑的了。因此,光学在原则上就成为电动力学的一部分,这个巨大成就的一个心理效果是,与经典物理学的机械唯物论体制相对立的场概念逐渐赢得了更大的独立性。
但是最初人们还是认为理所当然地必须把电磁场解释为以太的状态,并且极力设法把这种状态解释为机械性的状态。由于这种努力总是遭到失败,科学界才逐渐接受了放弃此种机械解释的主张。然而人们仍然确信电磁场必然是以太的状态,19世纪和20世纪之交,情况就是这样。
以太学说带来了一个问题:相对于有质体而言,以太的行为从力学观点看来是怎样的呢?以太参与物体的运动呢?还是以太各个部分彼此相对地保持静止状态呢?为了解决这个问题,人们曾经做了许多巧妙的实验,这方面应提到下列两个重要事实:由于地球周年运动而产生的恒星的“光行差”和“多普勒效应”——即恒星相对运动对其发射到地球上的光的频率上的影响(对已知的发射频率而言)。对于所有这些事实和实验的结果,除了迈克耳孙-莫雷实验以外,洛伦兹根据下述假定都作出了解释。这个假定就是以太不参与有质体的运动,以太各个部分相互之间完全没有相对运动。这样,以太看来好像就体现一个绝对静止的空间。但是洛伦兹的研究工作还取得了更多的成就。洛伦兹根据下述假定解释了当时所知道的在有质体内部发生的所有电磁和光学过程。这就是,有质物质对于电场的影响以及电场对于有质物质的影响完全是由于:物质的组成粒子带有电荷,而这些电荷也参与了粒子的运动,洛伦兹证明了,迈克耳孙-莫雷实验所得出的结果至少与以太处于静止状态的学说并不矛盾。
尽管有这些辉煌的成就,以太学说的这种光景仍然不能完全令人满意,其理由有如下述:经典力学(无可怀疑,经典力学在很高的近似程度上是成立的)告诉我们,一切惯性系或惯性“空间”对于自然律的表达方式都是等效的;亦即从一惯性系过渡到另一惯性系,自然律是不变的。电磁学和光学实验也以相当高的准确度告诉我们同样的事实。但是,电磁理论基础却告诉我们,必须优先选取一个特别的惯性系,这个特别的惯性系就是静止的光以太,电磁理论基础的这一种观点实在非常不能令人满意,难道不会有像经典力学那样去支持惯性系的等效性(狭义相对性原理)的修正理论吗?
狭义相对论回答了这个问题。狭义相对论从麦克斯韦-洛伦兹理论中采用了关于在真空中光速保持恒定的假定。为了使这个假定与惯性系的等效性(狭义相对性原理)相一致,必须放弃“同时性”的绝对特性的观念;此外,对于从一个惯性系过渡到另一个惯性系,必须引用时间和全向坐标的洛伦兹变换。狭义相对论的全部内容包括在下述假设中:自然定律对于洛伦兹变换是不变的。这个要求的重要实质在于它用一种确定的方式限定了所有的自然律。
狭义相对论对于空间问题的观点如何?首先我们必须注意不要认为实在世界的四维性是狭义相对论第一次提出的新看法。甚至早在经典物理学中,事件就由四个数来确定,即三个空间坐标和一个时间坐标。因此全部物理“事件”被认为是存在于一个四维连续流形中的。但是,根据经典力学,这个四维连续体客观地分割为一维的时间和三维的空间两部分,而只有三维空间才存在着同时的事件。一切惯性系都做了同样的分割。两个确定的事件相对于一个惯性系的同时性也就含有多个事件相对于一切惯性系的同时性。我们说经典力学的时间是绝对的就是这个意思。狭义相对论的法则与此不同。所有与一个选定的事件同时的诸事件就一个特定的惯性系而言确实是存在的,但是这不再能说成为与惯性系的选择无关的了的了。于是四维连续体不再能够客观地分割为两个部分,而是整个连续体包含了所有同时事件;所以“此刻”对于具有空间广延性的世界失去了它的客观意义。由于这一点,如果要表述客观关系的意义而不带有不必要的任意性的话,那么空间和时间必须看作是具有客观上不可分割性的一个四维连续体。
狭义相对论揭示了一切惯性系的物理等效性,因而也就证明了关于静止的以太的假设是不能成立的、因此必须放弃将电磁场看作物质载体的一种状态的观点。这样,场就成为物理描述中不能再加以分解的基本概念,正如在牛顿的理论中物质概念不能再加以分解一样。
到目前为止,我们一直把注意力放在探讨狭义相对论在哪一方面修改了空时概念,现在我们来看看狭义相对论从经典力学中吸取了哪些基本观念。在狭义相对论中,自然律也是仅在引用惯性系作为空时描述的基础时才是有效的。惯性原理和光速恒定原理只有对于一个惯性系才是有效的。场定律也是只有对于惯性系才能说是有意义和有效的。因此,如同在经典力学中一样,在狭义相对论中,空间也是表述物理实在的一个独立部分。如果我们设想把物质和场移走,那么惯性空间(或者说得更确切些,这个空间连同联系在一起的时间)依然存在。这个四维结构(闵可夫斯基空间)被看作是物质和场的载体。各惯性空间连同联系在一起的时间,只是由线性的洛伦兹变换联系在一起的一种特选的四维坐标系。由于在这个四维结构中不再存在着客观地代表“此刻”的部分,事物的发生和生成的概念并不是完全用不着了,而是更为复杂化了。因此,将物理实在看作一个四维存在,而不是像直到目前为止那样,将它看作一个三维存在的进化,似乎更加自然些。
狭义相对论的这个刚性四维空间,在某种程度上类似于洛伦兹的刚性三维以太,只不过它是四维的罢了。对于狭义相对论而言,下述陈述也是合适的:物理状态的描述假设了空间是原来就已经给定的,而且是独立存在的。因此,连狭义相对论也没有消除笛卡尔对“空虚空间”是独立存在的、或者竟然是先验性存在的这种见解所表示的怀疑。这里做初步讨论的真正目的,就是要说明广义相对论在多大的程度上解决了这些疑问。
广义相对论的空间概念
广义相对论的起因主要是力图对惯性质量和引力质量的同等性有所了解。我们从一个惯性系S₁来说起,这个惯性系的空间从物理的观点看来是空虚的。换句话说,在所考虑的这部分空间中,既没有物质(按照通常的意义),也没有场(按照狭义相对论的意义)。设有另一个参照系S₂相对于S₁做匀加速运动。这时候S₂就不是一个惯性系。对于S₂来说,每一个试验物体的运动都具有一个加速度,这个加速度与试验物体的物理性质和化学性质无关。因此,相对于S₂,最少就第一级近似而言,就存在着一种与引力场无法区分的状态。因此,下述概念是与可观察的事实相符的:S₂也可以相当于一个“惯性系”;不过相对于S₂又存在一个(均匀的)引力场(关于这个引力场的起源,这里不必去管它)。因此,当讨论的体系中包括引力场时,惯性系就失去了它本身的客观意义(假定这个“等效原理”可以推广到参照系的任何相对运动)。如果在这些基本观念的基础上能够建立起一个合理的理论,那么这个理论本身将满足惯性质量与引力质量相等的事实,而这个事实是已被经验所充分证实的。
从四维的观点来考虑,四个坐标的一种非线性变换对应于从S₁到S₂的过渡。这里产生了一个问题:哪一种非线性变换是可能的,或者说,洛伦兹变换是怎样推广的?下述考虑对于回答这个问题具有决定性的意义。
设早先的理论中的惯性系具有这个性质:坐标差由固定不移的“刚性”量杆测量,时间差由静止的钟测量。对第一个假定还须补充以另一个假定,即对于静止的量杆的相对展开和并接而言,欧几里得几何学关于“长度”的诸定理是成立的。这样,经过初步的考虑,就可以从狭义相对论的结果得出下述结论:对于相对于惯性系(S₁)做加速运动的参照系(S₂)而言,对坐标做此种直接的物理解释不再是可能的了,但是,如果情况是这个的话,坐标现在就只能表示“邻接”的级或秩,也就是只能表示空意愿维级,但一点也不能表示空意愿度规性质。这样我们就意识到从已有的变换推广到任意连续变换的可能性。[146]而这里就已具有广义相对性原理的含义:“自然律对于任意连续的坐标变换必须是协变的。”这个要求(连带着自然律应具有最大可能的逻辑简单性的要求)远比狭义相对性原理更为有力地限制了一切自然律。
这一系列的观念主要是以场作为一个独立的要领为基础的。因为,对于S₂有效的情况被解释为一种引力场,而并不问其是否存在着产生这个引力场的质量。借助于这一系列的观念,还可以理解到为什么纯引力场定律比起一般的场(例如在有电磁场存在的时候)的定律来,它与广义相对论有更为直接的联系。也就是说,我们有充分的理由假定,“没有场”的闵可夫斯基空间表示自然律中可能有的一种特殊情况,事实上这是可以设想的最简单的特殊情况。就其度规性质而言,这样的空间的特性可由下述的方式表示:等于一个三维“类空”截面上无限接近的两点的空间间隔的实测值(用单位标准长度量度)的平方(毕达哥拉斯定律);而是指用适当的计时标准量度测出的具有共同的(x₁, x₂, x₃)的两个事件的时间间隔。这一切只不过是意味着将一种客观的度规意义赋予下面这个量:
这点也不难借助于洛伦兹变换来予以证明。从数学的观点来看,这个事实对应于这个条件:ds²对于洛伦兹变换是不变的。
如果按照广义相对性原理的意义,令这个空间[参照方程(1)]作一任意连续的坐标变换,那么这个具有客观意义的量ds在新的坐标系中即以下列关系式表示:
此式的右边要对指标i和k从11,12,……直到44的全部组合求和。这里诸gik项也并不是新坐标的任意函数,而是必须正好使形式(1a)经过四个坐标的连续的变换仍能还原为形式(1)的这样一类函数。为了使这一点成为可能,诸函数gik必须满足某些普遍协变条件方程,这些方程是在广义相对论建立半个多世纪以前由黎曼导出的(“黎曼条件”)。按照等效原理,当诸函数gik满足黎曼条件时,(1a)就以普遍协变形式描述了一种特殊的引力场。
由此推论,当黎曼条件被满足时,一般的纯引力场的定律即必然被满足;但这个定律必然比黎曼条件弱或限制得较少。这样,纯引力的场定律实际上即可完全确定。这个结果不想在这里详加论证。
现在我们已有可能来考察一下,对空间概念要做多么大的修改才能过渡到广义相对论去。按照经典力学以及按照狭义相对论,空间(空时)的存在不依赖于物质或场。为了能够描述充满空间并依赖于坐标的东西,必须首先设想空时或惯性系连同其度规性质是已经存在的,否则,对于“充满空间的东西”的描述就没有意义。[147]而根据广义相对论,与依赖于坐标的“充满空间的东西”相对立的空间是不能脱离此种“充满空间的东西”而独立存在的。这样,我们知道,一个纯引力场是可以用从解引力方程而得到的gik(作为坐标的函数)来描述的。如果我们设想将引力场亦即诸函数gik除去,剩下的就不是(1)型的空间,而是绝对的一无所有,而且也不是“拓扑空间”,因为诸函数gik不仅描述场,而且同时也描述这个流形的拓扑和度规结构性质。由广义相对论的观点判断,(1)型的空间并不是一个没有场的空间,而是gik场的一种特殊情况,对于这种特殊情况,诸函数gik——指对于所使用的坐标系而言(坐标系本身并无客观意义)——具有不领带于坐标的值。一无所有的空间,亦即没有场的空间,是不存在的。空时是不能独立存在的,只能作为场的结构性质而存在。
因此,笛卡尔认为一无所有的空间并不存在的见解与真理相去并不远。如果仅仅从有质物体来理解物理实在,那么上述观念看来的确是荒谬的。将场视为物理实在的表象的这种观念,再把广义相对性原理结合在一起,才能说明笛卡尔观念的真义所在;“没有场”的空间是不存在的。
广义引力论
根据以上所述,以广义相对论为基础的纯引力场论已不难获得,因为我们可以确信,“没有场”的闵可夫斯基空间的度规若与(1)一致,一定会满足场的普遍定律。而从这个特殊情况出发,加以推广,就能导出引力定律,并且在此推广过程中,实际上可以避免任意性。至于理论上进一步的发展,则广义相对性原理并没有十分明确地做出决定;在过去几十年中,人们曾经朝着各个不同方向进行探索。所有这些努力的共同点是将物理实在看成一个场,而且是作为由引力场推广出来的一个场,因而这个场的场定律是纯引力场定律的一种推广。经过长期探索之后,对于这一推广我认为我现在已经找到了最自然的形式,但是我还不能判明这个推广的定律能否经得起经验事实的考验。
在前面的一般论述中,场定律的个别形式问题还是次要的。目前的问题主要是这里所设想的这种场论究竟能否达到其本身的目标。也就是说,这样的场论能否用场来透彻地描述物理实在,包括四维空间在内。目前这一代的物理学家对这个问题倾向于作否定的回答。依照目前形式的量子论,这一代的物理学家认为,一个体系的状态是不能直接确定的,只能对从该体系中所能获得的测量结果给予统计学的陈述而作间接的确定。目前流行的看法是,只有物理实在的概念被这样削弱之后,才能体现已由实验证实了的自然界的二重性(粒子性和波性)。我认为,我们现有的实际知识还不能作出如此深远的理论否定;在相对论性场论的道路上,我们不应半途而废。
[142]选自《狭义与广义相对论浅说》(Relativity, the Special and the General Theory: A Popular Exposition.Translated by Robert W. Lawson. London: Methuen, 1954)修订版。
[143]对于这一表述需要持一种怀疑态度。——作者注
[144]康德曾试图通过否认空间的客观性来消除这个困难,但这种努力几乎无法认真对待。由箱内空间所体现的存放可能性是客观的,正如箱子本身以及可放入箱子的物体是客观的一样。——作者注
[145]例如,通过声音获得的经验的时间次序与通过视觉获得的时间次序可以不一致,因此我们不能把事件的时间次序简单等同于经验的时间次序。——作者注
[146]这种不精确的表述方式在这里也许已经足够了。——作者注
[147]如果考虑将充满空间的东西(比如场)移除,那么仍然会留下符合(1)的度规空间,它还将决定所引入的检验物体的惯性行为。——作者注